為什麼說靠吃“大資料”才能養出AI?

玄學醬發表於2018-04-16

2017-03-31-109d216cc1-731d-4212-abc9-4ea


我們現在已經邁入了AI與機器人逐漸取代人類工作的年代,在不知不覺間,AI的相關技術已經開始滲透每個人生活的角落,從Google與Facebook依照興趣投放的廣告、可以幫你找資料設定日曆的語音助理Siri,背後都含有AI的概念與技術。未來的生活無論是投資、交通、醫療、學習、生產,將無處不是AI的蹤影,這個技術也將徹底改變人們的生活模式。

是什麼讓AI從“科幻”變“科技”?

AI其實是個龐大而複雜的概念,但大都奠基於一項基礎的關鍵技術,這個技術叫做“機器學習MachineLearning”。

機器學習技術,就是讓機械擁有自主學習的能力,說起來很簡單,但在1950年代技術萌芽期間,演演算法和硬體條件都不夠成熟,是直到近年來日益優異的演演算法,與強勁的硬體運算能力,才讓機器學習的能力有突破性進展,而其中帶進展最為快速的一項關鍵技術,就是大家最耳熟能詳的──“深度學習”。

我們來看看這個資料:2015年機器學習的周邊市場規模約3.6億美元,至2020年預估將突破29億美元,並在AI整體市場的50億美元中佔了約六成比重,可以說機器學習的技術突破,就是AI市場發展的原動力。

既然機器學習重要,那麼它究竟是什麼?為何能進展神速?

“大資料”提高了深度學習精準度

演演算法及硬體條件的大幅躍進提供了機器學習發展的優良條件,再加上數字化聯網的蓬勃下帶來的“大資料”,便引爆了科技大廠爭相投入深度學習技術的浪潮。目前不管是NVIDIA這類的晶片商,或擅長演演算法的Google、Facebook等軟體商,最常提到從事的機器學習的主流技術,就是深度學習。

舉個例子描述深度學習如何進行。想像一下,要讓一臺搭載深度學習能力的車輛進行自動駕駛,面對陌生的路線、隨時有行人衝出馬路的危險路況,機器怎麼判斷?透過深度學習,你可先一次提供機器海量的資料資訊,包含路標、號誌、路樹、行人、等,讓它學會辨識環境中的物體為何,學會了,便有助於它在行進過程中快速而精準地避開障礙、找出最佳路徑,並順利抵達目的地。只要資料越豐富完整,機器就越能夠提高一切辨識的精準度,以加強判斷能力。

這麼說來,要能讓AI靠“深度學習”發展思考能力,很大程度是依賴大資料所賜,不過,這時候我們就會面臨一個問題:沒有大資料,深度學習就毫無用武之地了嗎?

“小資料”的機器學習方案也蓄勢待發

大資料帶給深度學習強而有力的判斷能力,但其實機器若要做到“學習”這件事,深度學習並不是唯一方法。

回到自動駕駛的例子,倘若這次我們先不將海量的資料提供給機器,而是隻告訴他“目的地”、“禁止碰撞”兩項指令,然後任憑他不斷的Trial&Error,在失敗中汲取“經驗”以達到學習的效果,最終也能抵達目的地(前提當然是沒有遭遇嚴重車禍影響行進能力)。這樣在初始階段不仰賴大資料的學習方式,可以歸類為“強化學習”。

強化學習的方法能補足機器在突發狀況下的應變能力,AlphaGO的開發商DeepMind也深諳這項方法的優點,因此讓AlphaGO也藉著深度學習與強化學習的組合,在對手下出意料之外的棋步時,隨即建立新的經驗,以做為未來在相同局勢下能克敵制勝的判斷依據。

為什麼我們需要“小資料”的AI培養方案?

事實上,“獲取足夠大量的資料”就是極耗成本的一件事,此外,有些資料如罕見疾病的病歷、症狀等本身就具稀有性,因此像是強化學習等低資料依賴度機器學習方案逐漸開始受到青睞,許多公司與研究機構也以此作為研發的努力方向。日前就有一間名為Gamalon的新創公司發表新技術,表示其AI系統可僅用很少量的資料訓練機器學習,就達到媲美進行深度學習後的精準辨識能力,成功吸引市場關注。

除了一般仰賴大資料的深度學習外,其他可降低資料量依賴度的機器學習方案正不斷醞釀中。在不遠的未來,我們開車出門只要安穩的在後座休息,不須擔心安全與塞車問題,AI自然會幫我們找到最佳路徑;彈指輕點,手機便會幫我們挑選出最適合的購物選擇;還可能有貼身的虛擬健康顧問可諮詢,並隨時告知我們每天的飲食是否均衡、甚至幫我們設計健康選單。

AI深入生活的程度,說不定會比我們想像中來得更快。

本文出處:暢享網
本文來自雲棲社群合作伙伴暢享網,瞭解相關資訊可以關注vsharing.com網站。


相關文章