資料科學家準則(轉載)

margiex發表於2013-11-20
資料科學家們不應該做的事情:

1. 在資料分析時,不採用科學的分析方法;

2. 以不合理且難以理解的方式,為客戶做證明資料的質量評級;

3. 斷言那些壞的、不明確的證明資料為典型的資料證明資料;

4. 錯誤地將不典型、不明確的證明資料應用於模擬現實中或做出誤導;

5. 以不合理且難以理解的方式,為客戶做資料的質量評級;

6. 斷言那些壞的、不明確的資料為明確的資料;

7. 錯誤地將壞的、不明確的資料應用於模擬現實中或做出誤導;

8. 沒有選擇一個正確的方式公開部分或全部資料科學分析結果;

9. 沒有試圖複製資料科學分析結果;

10. 沒有公開那些不能被複制的資料科學分析結果;

11. 錯誤的將資料科學分析結果應用於模擬現實中或做出誤導;

12. 沒有公開失敗的實驗或那些被證明不成立的資料論證,而這可能會對客戶不利;

13. 明知是錯誤的結果卻仍然提供這樣的結果。

 

ref:

http://www.36dsj.com/archives/4552

相關文章