AI行業七大趨勢:合成資料、多模態AI崛起

龍騰AI技術發表於2022-09-02

2021 年,虛擬世界和網路遊戲成為熱門話題,Facebook 將公司改名為“Meta”,使得元宇宙一度破圈,網際網路企業紛紛入局。為了保護隱私,醫療行業、電信以及金融業開始利用 synthetic data(合成資料),為資料共享提供更多的機會。

人工智慧賦能產業,正成為引領經濟、科技發展的重要驅動力。

在較為低迷的投融資大環境下,全球投資者對於 AI 的關注度有增不減。2021 年,全球 AI 初創企業融資破紀錄達到 668 億美元,是 2020 年融資總額的兩倍之多。2022 年 Q1 相較於 2021 年 Q4 融資額下降了12%,但仍低於同期全球風險投資整體下降幅度。

新的一年,人工智慧會朝著什麼方向發展?CB Insights 提出了 2022 年值得關注的七大 AI 趨勢。

合成資料,保護隱私

目前,由於 AI 技術呈指數級發展,變得更加先進,但其侷限性仍然存在。例如,某些行業缺乏足夠的真實資料來訓練 AI 模型,又或者合規隱私成為一些行業技術發展的痛點。

企業紛紛開始部署 Synthetic data (合成資料),即由計算機人工生成的資料,可用於替代自現實世界中採集的真實資料集。

雖然有人質疑合成資料模擬真實資料的準確性,但仍有一些大公司將賭注押在了這項技術上。

illumina 正在使用由創業公司 Gretel 開發的合成基因資料進行醫學研究。在一項聯合研究中,兩家公司均強調了,取得患者的知情同意權等舉措限制了部分醫學研究的速度和規模。Gretel 便使用真實的基因型和表型資料進行 AI 演算法訓練,生成人工基因組合成資料。

在金融領域,J.P. Morgan 正在利用合成資料訓練金融 AI 模型。而在電信行業,由於無法獲得客戶同意,預計高達 85% 的真實客戶資料無法獲取,這給行為分析和預測造成了極大障礙。西班牙電信公司 Telefónica 與 Most AI 合作,模擬真實客戶資料的統計模式,建立 GDPR 合規的客戶合成資料檔案。

現階段,基於 GANs 的影像合成技術和影片合成技術發展迅猛,但高效且可行的表格資料合成技術仍處於初級階段。整體來看,資料匿名化、隱私合規和糾正演算法偏見等優勢使得合成資料技術成為吸引各行業公司的關鍵要素。

晶片追逐戰

隨著 AI 技術不斷進步,加速在各行業落地應用。無論是雲資料中心還是像照相機這樣的智慧邊緣裝置,適用於計算密集型的專業硬體需求激增。

Nvidia(英偉達)的圖形處理器曾一度主導著價值 670 億美元的 AI 晶片市場,如今多家公司相繼入局。

谷歌最新推出的 Pixel 手機搭載了自研的 Tensor 處理器,強化了軟體應用,而Amazon(亞馬遜)也在 2021 年 Q4 推出了自研晶片 Graviton3。

除了這幾家大公司外,一些初創企業也紛紛殺入。曾聲稱造出世界最大晶片的明星創企 Cerebras Systems 在 2021 年 Q4 融資 2.5 億美元,估值達到 40 億美元。

AI行業七大趨勢:合成資料、多模態AI崛起

圖 | 截至 2022 年 5 月 13 日,融資前十的全球 AI 晶片供應商(來源:CB Insights)

由於空間和能源的限制,大型晶片並不適用於許多日常的 AI 應用場景。考慮到這一點,越來越多的公司開始研發可以用於汽車感測器、照相機、自動化工廠機器人等低功耗裝置的 AI 晶片。

On-device AI processing(端側 AI)能夠實現低延遲以及資料隱私的保護。Mythic、Syntiant 和 Kneron 等初創公司分別籌集了超過 1 億美元研發該項技術。

像 Untether AI 和 HOUMO.AI(後摩智慧)這樣的初創公司正致力於研發“in-memory computing”(存內計算)技術。與傳統方法相比,存內計算把計算和儲存合二為一實現高度整合,能夠大幅度提升效能。Samsung 公司報告稱,採用存內計算技術後,語音識別神經網路的速度提高了一倍以上,資源消耗削減了一半。

AI 晶片獨角獸公司 Graphcore 採用3D 封裝技術極大提高了效能。3D封裝技術,簡單來說,就是指在不改變封裝體尺寸的前提下,在同一個封裝體內,在垂直方向上疊放兩個或者更多晶片的技術。

其他公司則拋棄了傳統 AI 晶片,轉而使用光子晶片,即利用光而不是電訊號來傳輸資料。光子學最大的優勢是速度,與依靠電纜傳輸的電子相比,光可以以更快的速度、更大的頻寬和更少的能量傳輸資訊。隨著人們對 AI 工具的需求呈指數級增長,光子學有望成為破除 AI 硬體侷限性的方法。

多年來,研究人員一直在研發通用性光子晶片。像 Lightmatter 和 Luminous Computing 等初創公司都希望構建更快、更節能的晶片,支援機器學習以及能夠處理繁瑣演算法的“AI 超級計算機”。

新的技術層出不窮,新一代晶片在提高效能的同時降低功耗。展望未來,像量子機器學習這樣的前沿科技將不斷改變 AI 發展的面貌。

AI 賦能內容稽核

在美國,玩電子遊戲的人數達到了史上前所未有的最高水平。76% 的 18 歲以下的青少年沉迷於電子遊戲,這讓家長們擔心孩子們極有可能接觸到不合時宜或者充滿仇恨的資訊。

處理網路仇恨言論是一個老生常談的問題。據悉,在 2016 年至 2021 年間,Meta 花費了 130 億美元用於內容審查,而 TikTok 聲稱在 2020 年有近萬人從事內容審查工作。TikTok 和 Meta 都曾被內容管理員起訴,因為他們在圖文審查工作中遭受了心理創傷。

隨著元宇宙的火熱以及網路遊戲生態系統的迅速發展,有害資訊已經從社交媒體蔓延到新的陣地,即網路遊戲和虛擬世界。


網路遊戲環境惡劣,充斥著各種仇恨言論、網路霸凌以及故意退出。反誹謗聯盟的一項研究發現,在比較受歡迎的多人遊戲中,高達 80% 的玩家都曾受到騷擾。

一些初創公司正著眼於利用 AI 技術進行內容稽核。Spectrum Labs 稱,其 NLP 平臺可以將音訊和文字的內容稽核工作減少 50% ,有害資訊檢測能力提高 10 倍。

美國初創公司 GGWP 透過 AI 監控聊天記錄和遊戲資料來打擊遊戲中的有害行為。此前,這家初創公司已經籌集了 1200 萬美元的種子資金,投資者包括 BITKRAFT Esport Ventures、Sony Innovation Fund(索尼創新基金)和 Riot Games。

2021 年 4 月,美國 Hive 公司募集了 5000萬美元的 D 輪融資,估值達到 20 億美元。Hive 公司成立於 2013 年,是一個專注於 AI 培訓資料的智慧眾包平臺,提供自動內容稽核服務,幫助像 HighRise 和 Naver Z 這樣的元宇宙公司解決玩家發表的仇恨言論、網路欺凌等問題。


為了提高稽核能力,大型科技公司收購了一些 AI 初創公司。例如,2021 年 10 月,微軟收購了 AI 內容稽核服務公司 Two Hat,該公司的客戶包括 Roblox、 Epic Games 和微軟旗下的 Minecraft。

利用 AI 技術實現完美的內容稽核是不可能的。線上使用者能夠不斷適應審查規則,逃避平臺的審查。但是,在 NLP 和基於深度學習的影像分類等關鍵領域取得的突破,以及以內容審查為業務方向的 AI 初創企業獲得多輪融資,在一定程度上表明瞭 AI 稽核將成為未來的方向之一。

Deepfakes檢測

Deepfakes(深度偽造)不僅能創造出極其逼真的影像,還能生成“假”聲音和影片。

利用 AI 學習演算法,Deepfakes 的技術愈發精進,效果十分逼真。網路上公開發布的影片和錄音數量之多,容易獲取,這使得訓練 AI 演算法和 Deepfakes 容易許多。研究人員表示,對於人們來說,區分 AI 偽造的人像、物體和影片與真實情況十分困難。

2022 年,Deepfakes 在媒體上大量湧現,尤其是在政治領域。2022 年 3 月,《華爾街日報》報導了韓國總統大選候選人 Yoon Suk-yeol 利用 Deepfakes 技術改善自己在年輕選民中的公眾形象的新聞。這個名為“AI Yoon”的數字人看起來十分風趣幽默。


Deepfakes 衍生出的假新聞和假訊息是一個大問題。對於消費者來說。Deepfakes 還有可能成為網路釣魚和勒索詐騙的工具。

微軟認為,AI 防禦體系無法完全打擊 Deepfakes 生成的假冒產品,於是推出了 Project Origin(起源專案),允許出版商使用防篡改後設資料對媒體進行認證的服務。

美國加州的一家創業公司 Truepic 使用加密和區塊鏈技術打造影像影片真實驗證平臺。Truepic 一直在與高通公司合作,為高通公司應用晶片組的智慧手機拍攝的照片加上水印。去年 Truepic 獲得 Adobe、微軟 M12、Sony Innovation Fund(索尼創新基金)等 2700 萬美元的融資。

為了應對日益增長的網路安全威脅,一些科技公司開始嘗試各種解決方案,包括裝置端認證軟體和 API、區塊鏈等。去年,Meta 的研究人員聲稱他們不僅可以確定影像是否是偽造的,還可以剖析用於深度偽造的 AI 模型。但是 Deepfakes 技術還將持續演進、無處不在,人們需要尋找新的方法將其摧毀。

低程式碼/零程式碼開發

演算法能將自然語言命令翻譯成計算機程式碼,特別是對公民開發者來說,這意味著軟體開發新一股的浪潮。

2021 年 6 月,GitHub(2018 年該公司被微軟收購)和 OpenAI(微軟持有其10 億美元的少數股權)聯合推出了 Copilot。Copilot 最大的一個功能就是可以將英語註釋轉換為程式碼。


微軟並不是唯一一家涉獵該領域的科技巨頭。2022 年 2 月,谷歌 DeepMind 釋出了新的程式設計系統 AlphaCode,作為讓其 AI 世界的代表競逐程式設計比賽。在透過 Codeforces 平臺上的程式設計競賽後,DeepMind 表示其 AI 的表現已到達中等水平。

初創公司則更關注軟體測試:自動化質量檢查和程式碼單元測試。其中包括,得到 CRV 和 Google Ventures 融資的 Mabl、獲 Salesforce Ventures 融資的 Autify、2022 年 Q1 獲 1000 萬 B 輪融資以及牛津大學的衍生公司 Diffblue。

自動程式設計仍處於初級階段。但該領域技術進步促使一些初創公司不斷擴充零程式碼/低程式碼解決方案,讓非技術使用者能夠參與資料科學專案,縮小技能差距,並加快生產週期。

多模態 AI 崛起

多模態 AI 正在打破單一感官的藩籬,使用一個通用 AI 模型科技將多種型別的資料所蘊含的語義資訊概念化並作出預測。

在 2021 年初,OpenAI 釋出了可以根據文字資訊生成影像的 AI 模型 DALL-E。

圖 | AI 根據文字提示生成牛油果形狀的扶手椅(來源:Open AI)

2022 年 1 月,OpenAI 釋出了升級版 DALLE-2,生成影像的畫質提升了 4 倍。

2022 年 5 月,谷歌推出了影像生成器 Imagen。據稱,Imagen 在生成影像的質量以及輸入文字和生成的影像的一致性方面要優於 OpenAI 模型。


今年早些時候,Meta 發表了一篇名為 “不同視覺模態都能通吃的雜食者”的論文,其中詳細介紹瞭如果對一種 AI 模型進行識別 2D 影像的預訓練,不經過額外的模態訓練,該模型也能可以識別影片或三維影像中的南瓜。

多模態 AI 正在從實驗室走到實際應用。例如,谷歌正在使用多模態 AI 來改進搜尋體驗。未來,如果使用者上傳了一張登山靴的照片,並附上“我能穿著這雙靴子去富士山徒步旅行嗎?”的文字,搜尋引擎將識別上傳的影像,從文字、影像和影片資料中挖掘網路上關於富士山的資訊,並將這些瑣碎的資訊連線起來,提供一個貼切的答案。

多模態 AI 正在走出實驗室,為搜尋服務和內容生成等應用提供驅動力。


AI for AI

隨著 AI 技術應用延展,企業正在尋求徹底改變現有的資料管理模式的解決方案,轉向“AI 優先”策略。

說起來容易做起來難。從採集資料、執行資料質量檢查到開發模型和監測後期生產表現,一個專案從原始資料轉變為生產準備是一個多步驟的過程。

市場上湧現出數以百計的公司研發各階段的解決方案。


端到端的機器學習公司將 AI 生命週期管理過程中的多步驟融合成一個 SaaS 產品,這將為那些希望快速高效構建 AI 系統的企業提供絕佳選擇。

2021 年 5 月,谷歌釋出了端到端開發平臺 Vertex AI,該公司稱 Vertex AI 能為沒有機器學習經驗的資料科學團隊提供一站式服務。

DataRobot 是一家市值 63 億美元的公司,多年來透過併購積極擴大產品規模。去年,DataRobot 進行了 3 筆收購,擴大市場份額。

無程式碼和低程式碼趨勢也擴充套件至機器學習平臺,以彌合 AI 技能差距,plug-and-play(即插即用)的功能激勵非專家人員參與到 AI 專案中。為此,2021 年,全球第二高估值 AI 獨角獸公司 Databricks 收購了低程式程式碼工具供應商 8080 Labs。

隨著大多數老牌廠商開始佈局 Auto ML(自動機器學習)功能,“AI for AI”也成為增長的領域。企業開始使用 AI 技術將 AI 開發過程的各環節自動化,如資料質量檢查或部分模型開發環節。

持續分化,未來已來,“AI for AI”將迎來更廣闊的發展空間。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70021344/viewspace-2913110/,如需轉載,請註明出處,否則將追究法律責任。

相關文章