目前機器學習技術正在對世界各地的企業產生重大影響,但很多機構依然對在何時、何處最優的使用機器學習感到困惑。為了成功的運用這門技術,企業首先要明確,哪些問題最適合應用機器學習,並確保有評估其影響的方案。

一般來說,機器學習演算法是利用資料的統計屬性建立輸出與輸入之間的關係。當研究人員把更多的資料輸入演算法時,它能夠不斷地學習並適應。最終,演算法所建立的輸入和輸出的關係變的足夠準確,它可以用於從新的輸入預測輸出。企業便可以運用這些預測發現新的洞察,以及賦能商業自動化。

找出那些可以用機器學習技術解決的問題。

如何確立一個可以用機器學習去解決的業務目標呢?以下步驟可供參考。

1)目標是實質性的、可量化的、可衡量的嗎?

首先,利用機器學習技術實現的目標,應該對業務非常有意義。確定這樣的目標通常需要業務負責人的參與,因為他們對業務有足夠的瞭解,可以真正評估機器學習帶來的價值。

其次,預測目標應該是可量化和明確定義的。例如,在最常見的機器學習框架——監督學習中,研究人員會給演算法一個X輸入和一個Y輸出,並要求它找到X和Y之間對映的函式 Y=F(X)。

如果你希望網站對使用者的吸引力達到最大化,你優化的目標Y可能是點選率、瀏覽總時長或它們的組合。監督學習要求業務負責人明確的量化他們需要優化的功能。

最後,機器學習演算法的輸出應該是持續的可衡量的。完美的機器學習演算法需要不斷適應新資料,以儘量減少預測的錯誤率。這使系統能夠不停地學習和調整演算法以優化其業務目標。

2)機器學習是正確的方法嗎?

從廣義上理解,企業可以通過兩種方式開發智慧系統(AI人工智慧系統):專家系統和機器學習。

在專家系統中,人們明確地基於‘如果A,那麼B’規則來制定行動計劃。一般情況下,這樣的系統並不像機器學習演算法一樣對資料有需要,而是依賴開發者對於問題的理解。

機器學習技術則需通過資料來學習規則。對於那些不能用嚴格規則進行編碼的細微問題,機器學習能發現專家系統中可能錯過的某種關係。但這種靈活性是有代價的:需要資料。

3)你有所需要的資料嗎?

如果機器學習是解決業務問題的可行方式,資料必不可少,且數量和質量都十分重要。歷史資料可以建立一種可靠的輸入和輸出關係來訓練模型。但除了模型訓練階段之外,也需要基礎架構不斷的收集新資料,以便能持續學習。

評估機器學習在業務中的價值

在確定一個機器學習專案後,評估機器學習是否對業務有更廣泛的影響力是很重要的。

機器學習研究中的一個活躍領域是解釋演算法輸出結果的原因,研究人員可以對很多演算法進行分解,從而為結果提供洞察。例如,知道使用者為什麼流失,就可以幫助企業加強產品或者開發自動化機制以防流失。在業務中主動尋找‘為什麼’,對優化機器學習技術是非常重要的。

衡量機器學習演算法對更深廣的業務目標的影響尤為重要。例如,Facebook資訊流提高使用者互動度的目標,最初可能專注於提高內容的點選。但此目標可能會造成意想不到的後果,即通過增加內容噱頭來吸引使用者,最終可能導致整個使用者群的CLV(使用者終身價值)降低。隨著時間的推移,可能有必要將目標從使用者互動度調整為與長期客戶留存相關的量化指標。

最近一項對1000位商界領袖的調查發現,66%的組織機構在用人工智慧自動完成日常工作;80%的高管們表示人工智慧技術創造的機會將引導企業的未來。而想要充分抓住技術帶來的商業機遇,則需要企業負責人有效識別和衡量機器學習技術的影響力。

本文來自【友盟+】編譯   原作者 | Alex Holub,Vidora聯合創世人及CEO