如何檢查你的專案是不是真的需要用到 AI?

dicksonjyl560101發表於2018-11-26

如何檢查你的專案是不是真的需要用到 AI?

 

https://blog.csdn.net/weixin_42137700/article/details/84523512

 

 

作者|Cassie Kozyrkov譯者|Sambodhi編輯|Debra

 

導讀: 過去幾年,機器學習和人工智慧日新月異,在各行業都呈現火爆的態勢。你是不是也躍躍欲試,想在自己的專案裡也用上人工智慧呢?且慢,讓我們聽聽來自 Google 的首席決策情報工程師 Cassie Kozyrkov 的看法,她興趣愛好廣泛,涵蓋了統計、機器學習 / 人工智慧、資料、決策科學、藝術、戲劇等等,在自己的部落格發表了大量的觀點。相信看完她的文章後,你就能夠評估自己的專案,到底需不需要加上人工智慧。

這是一份現狀核實清單,可以幫助你避免學習困難的痛苦。

如果你要深入研究機器學習或人工智慧專案,在深入研究演算法、資料和工程之前,你需要先參考這份清單。你可以把這份清單想象成盒子裡友好的顧問。

注:機器學習可參閱作者的另一篇文章:The simplest explanation of machine learning you’ll ever read(《機器學習極簡解釋》)()關於人工智慧,可參閱作者的這篇文章:Are you using the term ‘AI’ incorrectly?(《你是否用錯了“人工智慧”這詞?》) ()

記住,千萬不要浪費時間,不要為了 AI 而 AI。促使你想要應用人工智慧的原因,應該是它能夠為你做什麼,而不是為了聽上去有多麼科幻。

 

本文是作者的博文 The ultimate guide to starting AI (《啟動 AI 專案的終極指南》)()的超短版本。如果你準備使用機器學習或人工智慧,我們希望,對於本文所列的所有問題,你的回答都是 “Yes”。

注:為什麼要使用機器學習或人工智慧,作者寫了一篇文章 Machine learning Is the emperor wearing clothes? 《機器學習其實只是“皇帝的新衣”》 娓娓道來,深入淺出,你可以看看。

 

如果這份清單裡有任何一個問題你的回答是 No,那麼你都不適合將 AI 用到你的專案中,否則你的專案就會像這幅圖片裡的牛一樣被卡住。

  開始機器學習 / 人工智慧的第一步:輸出、目標和可行性。


1. 把做決策的工作交給正確的人: 負責你的專案並完成這份清單的人員是否真正瞭解你的業務?

將決策權委託 ¹ 給精通業務的人員,而不是平庸的演算法書呆子。  

2. 以輸出為中心的構思:你是否能夠解釋你的系統輸出 ² 是什麼,以及為什麼這些輸出是值得去做的?

首先關注你在做什麼,而不是怎麼做;不要把目標和手段混為一談。  

3. 靈感來源:你是否至少考慮過將資料探勘 ³ 作為從潛在的使用案例中獲取靈感的一種方法?

雖然這不是強制性的要求,但是它可以有助於找到一個好的方向。  

4. 適合機器學習 / 人工智慧的任務:你是否自動化了許多決策 / 標籤?是否每次當你無法找到完美的答案時,都要使用機器學習 / 人工智慧來幫忙?

如果你的答案是 “No”,那麼這就是一個相當清晰的訊號,表明機器學習 / 人工智慧不適合你。  

5. 使用者體驗視角:你是否能夠明確誰是你的目標使用者?他們將如何使用你的輸出?

如果你沒有及早考慮使用者,那麼你將會受到低劣設計的影響。  

6. 倫理發展:你是否考慮過你創造出來的東西可能會影響到哪些人群?

這點對於具備快速擴充套件潛力的技術尤為重要。  

7. 合理預期:你是否理解你的系統可能非常出色,但它不會是完美無瑕的?你是否能夠忍受你的系統偶爾會出錯?

從倫理學的角度來看,你有沒有想過這點意味著什麼?  

8. 生產中可能的情況:無論這些決策 / 標籤來自何處,你是否能夠在生產中為其提供服務?你是否能夠按照預期的規模來集中工程資源?

 

9. 需要學習的資料:是否存在潛在有用的資料?你能獲得它們的訪問許可權嗎?

如果資料不存在,也沒有關係,只要你有儘快獲得資料的計劃就好。  

10. 足夠的樣本:你是否諮詢過統計學家或機器學習工程師 ,你所擁有的資料量是否足夠用來學習?

這裡說的足夠,不是以位元組來衡量的,所以要與那些直覺良好的人多聊聊,由他們來操作。  

11. 計算機:你是否有足夠的處理能力來處理資料集大小?

對於任何願意考慮使用雲技術的人來說,雲技術都是自動的,無需考慮計算機處理能力的問題 ⁽⁵⁾  

12. 團隊:你是否有信心元件一支具備必要技能的團隊? ⁽⁶⁾  

13. 真相:除非你使用無監督學習 ⁽⁷⁾ ,否則,你是否能夠獲得輸出?

如果不能,你是否願意支付薪水,僱傭人員為你一遍又一遍地執行任務?  

14. 日誌完整性:你是否可以判斷哪些輸入與哪些輸出相匹配?  

15. 日誌質量:你是否相信資料集實際上就是其提供者所聲稱的資料集?

要從樣本中學習,你需要質量很好的樣本來源。  

16. 無差異曲線:由於你的系統會出錯,你是否考慮過一種錯誤相對於另一種錯誤更槽糕 ⁽⁸⁾  

17. 模擬:你是否考慮過與模擬 ⁽⁹⁾ 專家合作,以幫助你將你所要求的的內容進行視覺化?

這不是強制性的,但是很有用。  

18. 度量標準建立:你是否將單個輸出的得分拼接為多個例項中系統業務效能的度量標準? ¹º  

19. 度量評估:你的業務績效是否經過評估,以確保不會以某種有悖常理和有害的方式 ¹¹ 獲得良好的得分?  

20. 度量損失比較:(可選)你的業務績效是否與標準損失函式 ¹² 相關 ¹³

如果不相關,你的要求可能會很難達成。  

21. 總體:你是否仔細考慮過你的系統正常工作需要包含哪些例項 ¹

被測量的總體 ¹ ⁵⁾ 定義了系統效能測試將涵蓋的廣泛例項集合。  

22. 最低效能:你是否為測試定義了嚴格的最低效能標準 ¹ ⁶⁾ ,如果你的系統沒有達到這個標準,你就會摧毀這個系統。

如果上面所有的這 22 個問題,你的回答都是 “Yes”,那麼,你就可以開始機器學習 / 人工智慧的下一步了!這將涉及到資料和硬體(還有工程師)。我很快就會發布後續步驟的指南,敬請期待。

 

 

如果你覺得這個極簡版的指南不夠過癮,那麼啟動人工智慧專案的完整指南的網址是: 你大可以盡情閱讀。

 

 

[1]: The first step in AI might surprise you

[2]: Imagine a drunk island … Advice for finding AI use cases

[3]: What on earth is data science?

[4][6]: Top 10 roles in AI and data science

[5]: Getting Started with Google Cloud Platform

[7]: Unsupervised learning demystified

[8][9][10][11][13][16]: Getting started with AI? Start here!

[12]: Machine learning Is the emperor wearing clothes?

[14][15]: Populations You ’re doing it wrong

原文連結:

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2221560/,如需轉載,請註明出處,否則將追究法律責任。

相關文章