為什麼說基於機器學習的AI預測更智慧?

觀遠資料發表於2019-03-08

為什麼說基於機器學習的AI預測更智慧?在觀遠資料“AI+BI”的服務模式中,AI技術作為跨越敏捷分析到智慧決策的關鍵推力,一直以來引起了眾多企業客戶的好奇與關注。因此我們推出了這一特別企劃,希望藉此機會與大家分享觀遠團隊關於AI技術的各項認知,並結合我們與500強企業合作的最佳實踐案例,為AI技術在零售行業落地提供建議指導。

接下來,就跟著我們一起進入AI的神祕世界吧!

趨勢

當下,人工智慧已成為科技領域最熱門的技術。機器學習、深度學習、人臉識別、無人駕駛、NLP,各種名詞不絕於耳。人工智慧的應用一方面在不斷改變我們每個人的生活方式,另一方面也在逐漸改變著企業的經營模式、決策方式。越來越多的企業經營者、高階管理人員、決策者都在這場瞭解人工智慧的競賽中感到焦慮,他們意識到,人工智慧即將從根本上改變他們的行業。

在這場轟轟烈烈的人工智慧浪潮中,我們發現,對於商業企業來說,人工智慧並沒有給他們帶來太多所謂的智慧,它帶來的是智慧的一個關鍵組成部分——AI預測。

預測是根據事物以往和現今的資料,通過一定的科學方法和邏輯推理,對事物未來發展的趨勢作出預計、推測和判斷,尋求事物的未來發展規律。預測不僅研究事物的本身,而且還要研究它和環境之間的相互作用、相互影響。預測的過程就是在調查研究或科學試驗的基礎上的分析過程,簡稱為預測分析。

預測實際上是一種填補缺失資訊的過程。比如將非常規的信用卡交易歸類為盜刷,將醫學影像中的腫瘤分類為惡性,或是判斷當前拿著手機的人是否是真正的機主,即運用你現在掌握的資訊(通常稱為資料),生成你尚未掌握的資訊。這既包含了對於未來資料的時序預測,也包含了對當前與歷史資料的分析判斷,是更廣義的預測。

在人工智慧技術介入前,預測早已隨處可見,小到個人股票投資,大到企業經營決策、國家制訂國民經濟發展規劃,社會的方方面面無不體現著預測的重要性。而人工智慧的飛速發展,將為預測技術提供了更多可行的思路和方案,使得預測的準確度能夠得到有效提升,為各行各業提供超越傳統統計學分析的決策支援能力

這當中,更為重要的是,AI預測更廉價“如果某樣東西的價格下降,那麼我們會更多地使用它。”——這是最簡單的經濟學,如今這種情況正出現在預測領域。運算的成本變得足夠低,繼而幫助我們快速找到成千上萬種應用方式。預測成本的下降也將影響其他東西的價值:比如提高互補品(資料、判斷和行動)的價值,以及降低替代品(人類預測)的價值。

為什麼說基於機器學習的AI預測更智慧?

智慧

那麼,預測技術發展到如今,何以稱得上智慧呢?回過頭來看,應該歸功於更好的資料、模型和計算能力,它們促使預測技術飛速發展,從而走上“智慧”之路。機器學習便是功臣之一。

歷史上,預測的主流分析方法是使用資料探勘的一系列技術,而這其中被經常使用的是一種被稱為“迴歸”的統計技術。迴歸做的是什麼?它主要是根據過去發生時間的“平均值”來尋找一種預測。當然,迴歸也有很多種實現方式,有簡單的線性迴歸,多項式迴歸,也有多因素的Logistic迴歸,本質上都是一種曲線的擬合,是不同模型的“條件均值”預測。

在機器學習之前,多元迴歸分析提供了一種處理多樣條件的有效方法,可以嘗試找到一個預測資料失誤最小化,“擬合優度”最大化的結果。但是,迴歸分析中,對於歷史資料的無偏差預測的渴求,並不能保證未來預測資料的準確度,這就是所謂的“過渡擬合”。

與迴歸分析不同,機器學習的預測不追求平均值的準確性,允許偏差,但求減少方差。過去,由於資料和計算能力的匱乏,機器學習的表現不如迴歸分析來得好。但如今,一切都不一樣了,隨著資料體量的不斷增長,計算能力的不斷提升,使用機器學習和(神經網路)深度學習來做預測效果比其他所有方法表現得都要更好,這使得我們利用統計學進行預測的方法發生了徹底的轉變。把人工智慧與機器學習的最新發展作為傳統統計學的延伸與加強這是非常誘人的想法!你會發現,這其實跟觀遠資料AI+BI核心戰略是一致的。

為什麼說基於機器學習的AI預測更智慧?

那麼,如果僅僅是預測,為什麼能稱得上“智慧”呢?這是因為,某些情況下,我們預測的效果已經好到我們可以直接用來做決策,而無需再應用基於規則的邏輯。這其實也在改變著計算機程式設計的方式。

想象一下,原先複雜的業務場景下,基於“if...then...”以及傳統的統計學方法來實現的程式碼邏輯,總是無法覆蓋所有的條件組合。而近年來,支撐預測方法進步的一種黑科技叫做“深度學習”,它與人類大腦有著類似的工作方式,利用“反向傳播”的方法從資料中不斷訓練、反饋、學習,獲取“知識”。就預測而言,隨著不斷的訓練、自我學習,預測模型會得到不斷優化,預測準確性也在隨著學習而改進,而越來越高的預測準確性為商業決策提供了可信賴的基礎。

為什麼說基於機器學習的AI預測更智慧?

預測支援決策

一個完整的預測支援決策的迴路包括下圖所示8個組成部分。這中間,資料在整個歷史資料輸入、模型訓練、資料預測、決策、執行、結果收集、資料反饋的完整迴路中流轉。

為什麼說基於機器學習的AI預測更智慧?

▧ 資料清洗與特徵工程是有效輸入的核心。實際情況中,由於預測專案開始前對資料的統一管理不夠重視,對歷史資料進行清洗整理會佔掉整個預測專案的近一半時間。資料質量的優劣,其實是預測專案成敗極其重要因素。而有了優質的資料,提取恰當的特徵也是預測成功與否的重中之重。

▧ 足夠豐富的帶特徵資料是預測模型得以訓練的基礎。

▧ 預測是決策的核心輸入。依賴訓練得到的模型與未來有限的確定因素,來為決策提供資料預測支援。

▧ 而決策執行的結果又將反饋到訓練模型,優化預測。

小結

本文主要給大家介紹了AI發展的趨勢,AI預測的應用邏輯,何為智慧預測,以及“資料——預測——決策——反饋”完整鏈路。

下一篇我們會跟大家聊聊AI預測在零售業銷售場景的應用及效益,敬請關注!


相關文章