編者按:知名創投研究機構CB Insights調研了25種最大的AI趨勢,以預測2019年該技術的下一步趨勢,他們根據行業採用率和市場優勢評估了每種趨勢,並將其歸類為必要性、實驗性、威脅性、暫時性四類。
膠囊網路將挑戰最先進的影像識別演算法
1、開源框架(Open-Source Frameworks)
人工智慧進入門檻比以往任何時候都低,這要歸功於開源軟體。2015年穀歌開放了其機器學習庫TensorFlow,越來越多的公司,包括Coca-Cola、e Bay等開始使用TensorFlow。2017年Facebook釋出caffe2和 Py Torch(Python的開源機器學習平臺),而Theano是蒙特利爾學習演算法研究所(Mila)的另一個開源庫,隨著這些工具的使用越來越廣泛,Mila公司已經停止了對Theano的開發。
2、膠囊網路(Capsule Networks)
眾所周知,深度學習學習(Deep Learning)推動了今天的大多數人工智慧應用,而膠囊網路(capsule networks)的出現可能會使其改頭換面。深入學習界領航人Geoffrey Hinton在其2011年釋出的論文中提到“膠囊”這個概念,於2017年-2018年論文中提出“膠囊網路”概念。
針對當今深度學習中最流行的神經網路結構之一:卷積神經網路(CNN),Hinton指出其存在諸多不足,CNN在面對精確的空間關係方面就會暴露其缺陷。比如將人臉影像中嘴巴的位置放置在額頭上面,CNN仍會將其辨識為人臉。CNN的另一個主要問題是無法理解新的觀點。黑客可以通過製造一些細微變化來混淆CNN的判斷。
經測試,膠囊網路可以對抗一些複雜的對抗性攻擊,比如篡改影像以混淆演算法,且優於CNN。膠囊網路的研究雖然目前還處於起步階段,但可能會對目前最先進的影像識別方法提出挑戰。
3、生成式對抗網路(Generative Adversarial Networks)
2014年,谷歌研究員Ian Goodfellow提出“生成式對抗網路”(GAN)概念,利用“AI VS AI”概念,提出兩個神經網路:生成器和鑑別器。谷歌DeepMind實習生Andrew Brock與其他研究人員一起合作,對Gans進行了大規模資料集的培訓,以建立“BigGANs”。
GANs面對的主要挑戰就是計算能力,對於AI硬體來說必須是並行縮放。研究人員用GANs進行“面對面翻譯”,還有利用GANs將視訊變成漫畫形式,或者直接進行繪畫創作等,但GANs也被一些不懷好意的人利用,包括製作假的政治錄影和變形的色情製品。
4、聯合學習(Federated Learnnig)
我們每天使用手機或平板會產生大量資料資訊,如果使用這個本地資料集來訓練AI演算法可以極大地提高它們的效能,可是使用者資訊是非常私人和隱祕的。谷歌研發的聯合學習(Federated Learning)方法旨在使用這個豐富的資料集,同時保護敏感資料。谷歌正在其名為Gboard的Android鍵盤上測試聯合學習。
聯合學習方法與其他演算法的不同在於考慮了兩個特徵:非獨立恆等分佈(Non-IID)和不均衡性(Unbalanced)。聯合學習已運用於搜尋引擎Firefox、人工智慧創業公司OWKIN等。
5、強化學習(Reinforcement Learning)
當谷歌DeepMind研發的AlphaGo在中國圍棋遊戲中擊敗世界冠軍後,強化學習(Reinforcement Learning)獲得了廣泛關注。基於強化學習,DeepMind接著又研發了AlphaGo Zero。UC Berkeley 研究人員利用計算機視覺和強化學習來教授YouTube視訊中的演算法雜技技能。
儘管取得了進步,但強化學習與當今最流行的人工智慧正規化監督學習相比,還算不上成功,不過關於申請強化學習的研究越來越多,包括 Microsoft,Adobe,FANUC等。
2025年自動駕駛利潤達800億美元 物流率先應用
6、人工智慧終端化
人工智慧技術快速迭代,正經歷從雲端到終端的過程,人工智慧終端化能夠更好更快地幫助我們處理資訊,解決問題,我們捨棄了使用雲端控制的方法,而是將AI演算法載入於終端裝置上(如智慧手機,汽車,甚至衣服上)。
英偉達(NVIDIA),高通(Qualcomm)還有蘋果(Apple)等諸多公司加入了對終端側人工智慧領域的突破和探索,2017和2018年是眾多科技公司在人工智慧終端化進入快速發展期的兩年,同時他們也在加緊對人工智慧晶片的研發。但AI依然面臨著儲存和開發上的困境,亟需更豐富的混合模型連線終端裝置與中央伺服器。
7、人臉識別
從手機解鎖到航班登機,人臉識別的應用範圍愈發廣泛,各國對於人臉識別的需求逐漸升高,不少創業公司開始關注這一領域,利用該技術,可以通過臉部特點從而還原蒙面嫌疑犯完整的人臉。但人臉識別仍有待改進。這一技術仍會對人臉真假存在誤判。人臉識別中所包含的資料遠比我們想象要多,其中的安全問題也應引起我們關注。
8、語言處理
自然語言處理(NLP)是人工智慧的一個子領域,對於翻譯技術而言,NLP就像一個潘多拉魔盒——除了豐富的市場機會,還有巨大的挑戰。機器翻譯就是其中一個等待開發的寶庫,從後臺自動化,客戶支援,到新聞媒體,其應用廣泛。
人機共生也是翻譯領域未來的大方向,不少初創公司也期待從中分一杯羹,但要完成基於自然語言處理工作的翻譯系統並不容易,單單中文裡的各種方言和書面語就能把眾多科技公司難住,據相關資料顯示,除了熱門的高資源語言,如中文,阿拉伯語,歐洲語言等,低資源語言和少數民族語言的開發和應用依然存在缺口。
9、車輛自動化駕駛
儘管自動化駕駛的汽車市場潛力巨大,但實現全自動的未來依然不明朗。自動化駕駛成為了科技公司和初創公司互相競爭的新領域,他們為此注入的不僅有新的活力,還有大量的投資。投資者對他們的決定十分樂觀,數個自動駕駛汽車品牌所獲得的投資總額已超百億,預計2025年其市場利潤能達800億美元,物流等相關行業會成為首批應用全自動駕駛的行業,預計可縮減三分之一的成本。
10、AI聊天機器人
儘管許多人把聊天機器人看成是AI的代名詞,但兩者依然存在差別。如今的AI聊天機器人已經進化得十分完善,與真人對話時甚至還會應用“嗯...”這一類口頭語和停頓,但人們擔憂這些機器人的行為過於逼真,開始考慮在對話時對其聊天機器人的身份進行確認說明的需要。國外的科技巨頭FAMGA(Facebook,Apple,Microsoft,Google與Amazon)以及國內的BAT都把目光投向了這一領域。
AI診斷前景巨大 製藥巨頭押注AI演算法
11、醫學成像與診斷
美國食品與藥物管理局(FDA)正加速推進“AI即醫療裝置”趨勢。2018年4月,FDA批准了AI軟體IDx-DR,它可以在不需要專家干預的情況下篩查糖尿病視網膜病變患者,準確率超過87.4%。FDA還批准了Viz LVO(可用於分析CT掃描結果以預測患者患中風危險)和Oncology AI套件(專注於發現肺部和肝臟病變),監管機構的快速審批為80多家AI成像和診斷公司開闢了新的商業道路。自2014年以來,這些公司共融資149筆。
在消費者方面,智慧手機的普及和影像識別技術的進步正在把手機變成強大的家庭診斷工具,名為Dip.Io的應用使用傳統尿液檢測試紙來監測各種尿路感染。使用者可以用智慧手機給試紙拍照,計算機視覺演算法會根據不同的光照條件和攝像頭質量對結果進行校正。除此之外,許多“ML即服務”平臺正整合到FDA批准的家庭監控裝置中,發現異常時即可向醫生髮出警報。
12、下一代假肢
早期的研究正在興起,結合生物學、物理學和機器學習來解決假肢面臨的最困難問題之一,即靈活性。這是個十分複雜的問題,比如要讓截肢者能夠在假肢手臂上活動單個手指,需要解碼其背後的大腦和肌肉訊號,並將其轉化為機器人控制指令,這些都需要多學科配合。最近,研究人員開始使用機器學習來解碼來自人體感測器的訊號,並將其轉換成移動假肢裝置指令。
還有些論文探討了新媒介解決方案,比如使用肌電訊號(殘肢附近肌肉的電活動)來啟用攝像頭,以及執行計算機視覺演算法來估計他們面前物體的抓取方式和大小。年度機器學習大會NeurIPS’18已經發起“AI假肢挑戰賽”,進一步突顯了AI社群對該領域的興趣,2018年的挑戰是使用強化學習預測假肢的效能,有442名參與者試圖教AI如何跑步,贊助商包括AWS、英偉達以及豐田等。
13、臨床試驗患者招募
臨床試驗的最大瓶頸之一是招募合適的患者,蘋果或許能夠解決這個問題。儘管人們在努力將醫療記錄數字化,但互操作性(在機構和軟體系統之間共享資訊的能力)仍是醫療保健領域最大的問題之一。理想的AI解決方案是從患者的病歷中提取相關資訊,並與正在進行的試驗進行比較,為進行匹配研究的AI軟體提供建議。
然而,像蘋果這樣的科技巨頭已經成功地為他們的醫療保健計劃引入了合作伙伴,蘋果正在改變醫療資料的流動方式,併為AI開闢了新的可能性,尤其是圍繞臨床研究人員招募和監測患者的方式。自2015年以來,蘋果推出了兩個開源框架——ResearchKit和CareKit,以幫助臨床試驗招募患者,並遠端監控他們的健康狀況,消除了地理障礙,蘋果還與Cerner和Epic等流行的EHR供應商合作,解決互操作性問題。
14、先進醫療生物識別技術
利用神經網路,研究人員開始研究和測量以前難以量化的非典型危險因素,使用神經網路分析視網膜影像和語音模式可能有助於識別心臟病的風險。比如,谷歌的研究人員使用受過訓練的視網膜影像神經網路來發現心血管疾病的危險因素,如年齡、性別和吸菸等,梅奧診所通過分析聲音中的聲學特徵,可以發現冠心病患者的不同語音特徵。
不久的將來,醫療生物識別技術將被用於被動監控,比如谷歌的專利希望通過膚色或皮膚位移來分析心血管功能,這些感測器甚至可能被放置在病人浴室的“感應環境”中,通過識別手腕和臉頰的皮膚顏色變化,用來確定心臟健康指標,如動脈僵硬或血壓。亞馬遜也申請了被動監測專利,將面部特徵識別與心率分析結合起來。AI發現模式的能力將繼續為新的診斷方法和識別以前未知的危險因素鋪平道路。
15、藥物發現
隨著AI生物技術初創企業的興起,傳統制藥公司正尋求AI SaaS初創企業為漫長的藥物研發週期提供創新解決方案。2018年5月,輝瑞與XtalPi建立了戰略合作伙伴關係,預測小分子藥物的性質,開發“基於計算的理性藥物設計”。諾華(Novartis)、賽諾菲(Sanofi)、葛蘭素史克(GlaxoSmithKline)、安進(Amgen)和默克(Merck)等頂級製藥公司,最近幾個月都宣佈與AI初創企業建立合作關係,以發現腫瘤和心臟病等領域的新藥。
雖然像遞迴製藥(Recursion Pharmaceuticals)這樣的生物技術AI公司正在投資AI和藥物研發,傳統制藥公司正在與AI SaaS初創公司合作。儘管這些初創公司中有許多仍處於融資的早期階段,但它們已經擁有自己的製藥客戶。在藥物研發階段,成功的衡量標準很少,但製藥公司正把數百萬美元押在AI演算法上,以發現新的治療方案,並改變曠日持久的藥物研發過程。
合成資料集用以解決AI的資料依賴
16、預測性維護
從製造商到裝置保險公司,AI-IIoT可以在在故障損害發生之前,提出防範措施。現場和工廠裝置會產生大量的資料,然而,未預料到的裝置故障是製造業停機的主要原因之一。預測裝置或單個部件何時失效將使資產保險公司和製造商受益。
在預測性維護中,感測器和智慧攝像機收集來自機器的連續資料,如溫度、壓力等。實時資料的數量和變化形式使機器學習成為IIoT不可分割的組成部分。隨著時間的推移,演算法可以在故障發生之前預測可能出現的隱患。隨著工業感測器成本的降低、機器學習演算法的進步,以及對邊緣計算的推動,預測性維護會更加廣泛。
17、後臺自動化
人工智慧正在推動管理工作走向自動化,但資料的不同性質和格式使其成為一項具有挑戰性的任務。根據行業和應用程式的不同,自動化“後臺任務”的挑戰可能是獨一無二的,例如,手寫的臨床筆記對自然語言處理演算法來說就是一個獨特的挑戰。機器人過程自動化(RPA)一直是熱門話題,雖然並非所有的機器人過程自動化都基於機器學習,但許多都開始將影像識別和語言處理整合到它們的解決方案中。
18、綜合訓練資料
對於訓練人工智慧演算法來說,訪問大型的、標記的資料集是必要的,合成資料集可能會成為解決瓶頸問題的關鍵,人工智慧演算法依賴資料,當一些型別的現實世界資料不易被訪問時,合成資料集的用武之地就體現出來,一個有趣的新興趨勢是使用AI本身來幫助生成更“逼真”的合成影像來訓練AI,例如,英偉達使用生成對抗網路(GAN)來建立具有腦腫瘤的假MRI影像。GAN被用於“增強”現實世界資料,這意味著AI可以通過混合現實世界和模擬資料進行訓練,以獲得更大更多樣化的資料集。此外,機器人技術是另一個可以從高質量合成資料中獲益的領域。
19、網路優化
人工智慧正在開始改變電信,電信網路優化是一套改進延遲、頻寬、設計或架構的技術——能以有利方式增加資料流的技術,對於通訊服務提供商來說,優化可以直接轉化為更好的客戶體驗,除了頻寬限制之外,電信面臨的最大挑戰之一是網路延遲,像手機上的AR / VR等應用,只有極低的延遲時間才能達到最佳的功能。
電信運營商也在準備將基於AI的解決方案整合到下一代無線技術中,即5G,三星收購了基於AI的網路和服務分析初創公司Zhilabs,為5G時代做準備,高通認為人工智慧邊緣計算是其5G計劃的重要組成部分(邊緣計算可減少頻寬限制並與雲進行頻繁通訊,這是5G的主要關注領域)。
20、網路威脅狩獵
對網路攻擊做出反應已經不夠了,使用機器學習主動“搜尋”威脅正在網路安全中獲得動力。顧名思義,威脅搜尋是主動尋找惡意活動的做法,而不僅僅是在發生警報或違規後做出反應,狩獵開始於對網路中潛在弱點的假設,以及手動和自動化工具,以在連續的迭代過程中測試假設,網路安全中龐大的資料量使機器學習成為流程中不可分割的一部分,威脅狩獵很可能會獲得更多的動力,然而它也面臨著自身的一系列挑戰,比如應對不斷變化的動態環境和減少誤報。
訓練演算法 指紋追蹤 人工智慧防範假貨
21、電子商務搜尋
對搜尋詞的上下文理解正在走出“實驗階段”,但要廣泛採用搜尋詞還有很長的路要走,當使用電子商務搜尋來顯示相關結果時,使用適當的後設資料來描述產品是一個起點。僅僅描述和索引是不夠的,許多使用者用自然語言搜尋產品(比如“沒有鈕釦的洋紅色襯衫”),或者不知道如何描述他們在尋找的商品,這使得電子商務搜尋的自然語言成為一個挑戰。
22、汽車索賠處理
保險公司和初創公司開始使用人工智慧來計算車主的“風險得分”,分析事故現場的影像,並監控駕駛員的行為,Ant Financial在其“事故處理系統”中使用深度學習演算法進行影像處理,過去,車主或司機會把他們的車送到“理算師”那裡,理算師負責檢查車輛的損壞情況,並記錄下詳細情況,然後將這些資訊傳送給汽車保險公司。如今,影像處理技術的進步使得人們可以拍下這輛車的照片並將其上傳,神經網路對影像進行分析,實現損傷評估的自動化,另一種方法是對駕駛員進行風險分析,從而影響汽車保險的實際定價模型。
23、防偽
假貨越來越難被發現,網購使得購買假貨比以往任何時候都容易。為了反擊,品牌和典當商開始嘗試人工智慧,在網路世界和現實世界兩條戰線上與假貨作戰。不過,網上假冒偽劣產品的範圍和規模龐大複雜,造假者使用與原始品牌列表非常相似的關鍵詞和圖片,在假冒網站上銷售假貨,在合法市場上銷售假貨,在社交媒體網站上推廣假貨,隨著“超級假貨”或“aaa假貨”的興起,用肉眼分辨它們幾乎變得不可能。
現在,建立一個假冒偽劣商品的資料庫,提取其特徵,並訓練人工智慧演算法來分辨真偽,雖是一個繁瑣的過程,但對於奢侈品牌和其他高風險零售商來說非常有必要,下一步的解決方案還可能是在實體商品上識別或新增獨特的“指紋”,並通過供應鏈對其進行跟蹤。
24、零售
走進一家商店,挑選你想要的東西,然後走出去,這幾乎“感覺”就像在行竊,人工智慧可以杜絕真正的盜竊行為,並讓免結賬手續零售變得更加普遍。盜竊一直是美國零售商的一大痛點,然而,當你掌握進出商店的人,並自動向他們收費時,有人入店行竊的可能性就會降到最低。其餘一些需要考慮的事情是如何利用建築空間,特別是在擁擠的超市,確保攝像機被最佳地放置來追蹤人和物品。
在短期內,問題將歸結為部署成本和由潛在技術故障造成的庫存損失成本,以及零售商能夠承擔這些成本和風險的程度。
25、農作物監測
無人機可以為農民繪製農田地圖,利用熱成像技術監測溼度,識別蟲害作物並噴灑殺蟲劑。
初創公司正專注於為第三方無人機捕獲的資料新增分析。還有人使用計算機視覺使地面上的農業裝置變得更智慧,按照需要噴灑個別作物,就會減少對非選擇性除草劑的需求,而非選擇性除草劑會殺死附近的一切,精確噴灑意味著減少除草劑和殺蟲劑的使用量。在實地調查之外,利用計算機視覺分析衛星影像提供了對農業實踐的巨集觀理解,地理空間資料可以提供關於全球作物分佈模式和氣候變化對農業影響的資訊。