作為一個資料科學家,我為我的日常工作總結開發出15項原則,這些是我本人也遵循的:
1、不要用資料說謊或吹牛: 對經驗性證據要誠實坦率。最重要的是不要用資料自欺欺人。
2、建立永久工具並分享給他人: 花費一些日常工作時間去建立一些能使自己和他人生活變得輕鬆的工具(譯者補充:我為人人,人人為我)。我們可是該死的人類,我們應該是工具的製造者!
3、不斷自我教育: 看在佛祖的份上,你可是個科學家哦。去閱讀研究生水平的核心數學和統計方法教材吧,永遠不要安逸於你在走廊裡從同事那得到的對某個方法的拙劣解釋,學習基本原理可以讓你玩出花樣來。閱讀最近的論文,參加研討會,發表和評論論文。對此沒有捷徑。
4、提高你的技能: 學好一種語言,這樣你才能被稱為行家裡手。其他語言也要學到能與別人溝通。不要忘記,SQL和英語很象,這個星球上每個白痴都能說,但你只有真正掌握它才可以寫出優美的詩篇。學習一種編譯性語言、一種解釋性語言,和R語言。或者只需要學習R!它是醜陋的,但它會給你一個優勢。搞透Matlab,你已經不再是沒畢業的學生了。學習Unix,即使你平時使用Windows,學習sed和grep等所有那些東西,你可以用bash和powershell做些奇妙的事情。如果你願意,也學學Hadoop,但要知道它是一個蹩腳的系統。
5、明白資料科學家有個生存意義 “踢人們屁股並讓他們震驚”: 每天做一件與此相關的事。(譯者注:kick ass在一般情況下指“很厲害;很拽”,但對於資料科學家來說,通常是用資料來揭示人們錯誤或具有危險性的行為,以此引起關注,所以用本意“踢屁股”反而比較合適)
6、通過向別人展示工作來經常挑戰自我:不要害怕一些惡棍會批評你的工作,粉碎他們。如果你想害怕蟑螂的話,那你就不要走路了!
7、不要吝惜知識,也不要害怕問問題: 有些人對他們的知識缺乏信心,不去分享它,原諒他們,但不要成為他們中的一個。
8、先開發出一些思路,然後聽取別人的看法,利用他們關於這一領域所知道的知識,但不要讓你自己被其束縛: 如果他們真牛到可以用他們所知道的來解決問題,他們就不會來找你要解決方案了。
9、出去和人們在一起,與之交談,互通有無,他山之石可以攻玉。
10、為你溫和的程式碼建立個令人印象深刻和互動性強的使用者介面: 程式碼是我們的語言(譯者注:但不是使用者的,所以……),讓你的程式碼通過好的UI來閃耀光輝吧。
11、有效使用視覺化技術,避免難以理解的圖形: 視覺化的唯一用途是使資料易於理解而非令人困惑。
12、學習新技術,努力理解經典技術的原理
13、多攬多做: 這就是天才工作的方式。不要害怕提出創造性的想法。你聽說過“低調說話,高調做事”?不要覺得這很華麗,這其實是無能鼠輩工作的方式,不要成為他們中的一個。
14、保持創造力和關注: 你可以通過創造力和關注取得成功(咖啡因對這個有點幫助,但別過頭兒)。
15、積極起來,努力工作。如果有人想阻止你,只管碾碎他們。
via:15 Principles for Data Scientists