看懂2020年智慧浪潮,我們從百度和谷歌的AI足跡出發

naojiti發表於2021-01-20

2020年已經過去,無論我們過得順遂平安,還是過得無比艱難,我們應該都會記住這一年。

回顧2020年,在這個不同尋常的疫情之年,科技成為人類抗擊疫情的關鍵,而人工智慧技術投入抗疫戰爭之中,可以說是人類有史以來的第一次。而與此同時,AI技術已經在我們的生產生活、公共管理等方方面面得到深入應用。

人工智慧應用場景的爆發,其背後是全球AI科技企業從後端走向前臺,從實驗室走向產業縱深的努力和實踐。

最近,百度和谷歌不約而同都發釋出了長文,來總結2020的AI發展。

谷歌首席AI科學家Jeff Dean在谷歌部落格上刊出了Google Research: Looking Back at 2020, and Forward to 2021的萬字長文,詳細介紹了谷歌在2020年AI技術在多個領域取得的應用進展。

而更早一點時間,百度先後釋出了長達萬字的《百度AI的2020》和《百度研究院2021年十大科技趨勢預測》,同樣細數了百度過去一年裡在AI技術業務體系和產業賦能體系中的各項成果,同時也對2021年的AI技術和應用領域做出清晰判斷。

如果仔細對比谷歌和百度在AI技術和產業應用的實踐,我們就會驚訝地發現,兩家幾乎同時以搜尋引擎業務起家的公司已經將AI技術應用到自身產品體系的方方面面。

我們同時也看到,谷歌和百度正在構建一幅千行百業智慧化的全球AI圖景,不過兩家巨頭的不同之處在於,相較於谷歌更多進行多領域、多嘗試性的產業AI合作,百度則是更系統地推動產業智慧化的應用落地。

站在2020和2021的時間交匯處,我們想要了解全球AI技術的整體樣貌和發展程式,深入谷歌和百度的AI體系之中,無疑是一次非常好的契機。

技術基石:谷歌和百度的AI基礎研究

AI技術之所以能夠持續推動產業的智慧升級,為企業、行業和社會帶來價值,其核心就在於AI基礎技術的持續進化。

我們看到,在2020年穀歌和百度的AI基礎研究中,都在關注無監督學習、AutoML(自動機器學習)、機器感知這三大領域,其中谷歌在這些領域都提出了一些基礎性演算法的創新。

比如在機器學習(ML)演算法領域,谷歌的無監督學習領域取得了一定的發展。去年,谷歌開發了名為SimCLR的自監督和半監督學習技術,可以實現同時最大化同一影像的不同變換檢視之間的一致性和最小化不同影像的變換檢視之間的一致性。

在AutoML上,谷歌正在嘗試從AutoML-Zero的學習程式碼運算中採取一種由原始運算(加減法、變數賦值和矩陣乘法)組成的搜尋空間,以期用來從頭開始演繹現代的機器學習演算法。而在機器感知領域,也就是機器如何感知、理解我們周圍世界的多模態資訊上,谷歌也取得眾多成果,包括CvxNet、3D形狀的深層隱式函式、神經體素渲染和CoReNet等演算法模型的推出,在戶外場景分割、三維人體形狀建模、影像視訊壓縮等場景的實際應用。

而百度的AI技術的底層創新則是通過百度大腦6.0的大幅進化所推動。2020年,百度大腦6.0核心技術突破了“知識增強的跨模態深度語義理解”能力,結合知識圖譜與深度學習技術,使得人工智慧不僅能具備知識,還能持續學習,像人一樣“活到老學到老”。

目前在AI技術週期中非常重要的多模態語義理解領域,百度大腦推出了多模態預訓練模型 ERNIE-ViL,顯著增強了跨模態的語義理解能力,重新整理了5 項多模態經典任務的世界最好效果,並登頂視覺常識推理任務(VCR)榜首。在對話智慧領域,百度大腦釋出超大規模開放域對話生成網路PLATO-2,該模型引數規模上升到 16 億,在內容豐富性和連貫性上達到新高度,能夠就開放域話題進行流暢深入的聊天。在端到端問答方面,百度大腦提出RocketQA訓練方法,大幅提升了對偶式檢索模型效果,為實現端到端問答邁出了重要一步。

而在前沿技術上,谷歌和百度都在積極佈局量子計算技術,量子計算被視為面向未來的計算正規化與生產力。

在2020年,谷歌對新的量子演算法進行了驗證,在Sycamore處理器上執行了精準校準,顯示量子機器學習的優勢或測試量子增強優化;通過QSIM模擬工具,在Google Cloud上開發和測試了多達40個量子位元的量子演算法。接下來谷歌將按照技術路線圖,建立通用的糾錯量子計算機,證明量子糾錯可以在實踐中發揮實際作用。

同樣在去年,百度釋出了國內首個雲原生量子計算平臺量易伏Quantum Leaf,提供QCompute等量子開發套件,縮短量子程式設計全生命週期,實現量子工具鏈閉環;此外,量子脈衝計算服務量脈Quanlse、量子機器學習工具集量槳Paddle Quantum全面升級,構建起百度量子平臺為核心的量子生態,開啟屬於中國的量子時代。

在AI技術開源和開發,推動AI生態發展上面,谷歌和百度同樣在持續行動。谷歌通過TensorFlow社群推動了一系列特殊興趣組、TensorFlow使用者組、TensorFlow證書、AI服務合作伙伴的出現和成長;谷歌還投資了一個開源的、專注於研究的ML系統JAX,可以廣泛應用於差異隱私、神經渲染、物理資訊網路、快速注意、分子動力學、張量網路、神經切線核和神經ODEs等技術領域。此外,谷歌通過TFRC專案向世界各地的研究人員免費提供了超過500petaflops的雲TPU計算能力,以幫助拓寬對機器學習研究前沿的訪問。今年,TFRC專案除了支援TensorFlow之外,還將支援JAX和PyTorch。

而在去年,百度飛槳推進了“AI開發基線”,提升了軟硬體體系的適配能力。目前,飛槳已經凝聚了265萬開發者,服務了10萬家企業,創造了34萬個模型,在城市、工業、電力、通訊等很多關乎國計民生的領域都有飛槳在發揮作用。

根據權威資料調研機構IDC公佈的2020年下半年深度學習框架平臺市場份額報告中,百度與Google、Facebook居於中國深度學習平臺市場綜合份額前三,其中,百度綜合市場份額位列第二,與位列第一的Google幾乎持平。

業務生長:谷歌和百度的AI應用圖景

我們看到,在AI的基礎技術研發上,谷歌和百度在整體的技術路線和技術生態上有許多重合之處,不過兩家各有側重的AI技術則構成了谷歌和百度在其各自龐大的產品體系上的差異化應用。

過去的一年中,谷歌正在將一系列AI的技術創新應用在其產品系統的方方面面。

通過機器學習演算法的改進,谷歌在移動裝置上的體驗得到大幅改善。在裝置上執行復雜的NLP技術,實現更加自然的對話功能,比如,基於transformer這一神經網路模型,去年穀歌正建立了一個對話機器人Meena,幾乎可以實現任何挑戰的自然對話。此外,還有像利用雙工技術給企業打電話,確認疫情下是否臨時關閉之類的事情,實現在全球範圍內對商業資訊進行300萬次更新,在地圖和搜尋上資訊顯示次數超過200億次。

通過機器翻譯和語音識別技術的升級,谷歌還使用了文字到語音技術,通過支援42種語言的Google Assistant可以大聲朗讀網頁,從而更方便地訪問網頁。藉助多語言傳輸、多工學習等多種技術,谷歌在100多種語言的翻譯質量上評價提高5個BLEU點,能夠更好地利用單語資料來改進低資源語言,為那些少數族裔的人們提供翻譯。

從Jeff Dean的介紹中,我們還看到谷歌的AI技術正在無數的谷歌產品的細節中得到應用。

比如,結合跨模態推理以及有效感知方法的開發,谷歌在MediaPipe中開發了多種新的感知推理功能和解決方案,如裝置上的人臉、手和姿勢預測、實時身體姿勢跟蹤、實時虹膜跟蹤和深度估計以及實時3D目標檢測。在YouTube上,識別潛在的有害內容,提高人工審查效率;通過自動增強聲音和減少背景噪音,幫助YouTube創作者製作更好的視訊。在Google Meet中,通過模糊背景來改進線上虛擬會議。

AI技術賦能業務,業務又反向推動AI技術升級,同樣是百度AI帶給百度產品業務體系的發展路線。

在移動生態中,百度展示了AI技術與移動服務的高度結合。在AI技術的加持下,百家號、智慧小程式和託管頁,三大支柱產品迅速發展成為國內領先的內容和服務接入平臺。

基於自然語言處理、知識圖譜、語音、視覺、深度學習等AI技術能力,百度搜尋也在持續智慧化。今年9月,百度推出虛擬助手“度曉曉”App,擁有二次元虛擬人物形象和獨特的情感互動系統,可以像真人一樣跟使用者溝通,提供更好的個性化服務。

在地圖領域,百度地圖堅守“新一代人工智慧地圖”的AI優勢和創新能力。目前百度地圖90%以上的資料生產環節實現AI化,輸出九大行業解決方案,全景地圖覆蓋全國95%以上的城市,覆蓋里程超過300萬公里。與此同時,語音互動場景實現迅速增長,百度地圖智慧語音助手使用者量已破4億。

(百度地圖AI室內通)

在輸入法領域,在AI技術的賦能下,百度輸入法實現了市場份額與活躍使用者量躍居行業第一。百度輸入法的語音輸入能力持續突破,成為業內首個日均語音請求量破10億次大關的輸入法產品,實現了98.6%的語音識別準確率、離線中英自由說新功能、方言自由說升級等功能或技術突破,目前已成為語音輸入滲透率最高的第三方手機輸入法;語音輸入與手寫輸入等AI功能取得重大行業突破,使用者認可程度高,手寫識別準確率提升至96%居行業首位、AI滑行輸入精準率超越行業最高水平15%。

對於小度來說,2020年則是依靠領先智慧化技術持續“破圈的一年。目前,小度第一方裝置語音互動次數達到33億次;截至9月,小度助手技能商店提供4300個技能,開發者數量也已達到45000人,使用場景也從家庭、酒店、汽車擴充到移動場景。硬體方面,國際權威調研機構Canalys資料顯示,2020年上半年小度智慧音響全品類出貨量位居國內第一;前三季度,小度智慧屏出貨量穩居全球第一。618和雙十一期間,小度均斬獲全平臺智慧音響品類銷售額冠軍,全平臺智慧屏品類銷量&銷售額雙冠王。

而在自動駕駛與智慧交通領域,百度Apollo 也迎來了持續爆發。2020年,百度先後在長沙、滄州、北京開放Apollo Go自動駕駛出行服務。10月12日當天北京地區呼單量突破2600單,百度也成為中國唯一一家在多城開啟Robotaxi試運營的公司。5月26日,百度位於北京亦莊經濟開發區的全球最大的自動駕駛和車路協同應用測試基地Apollo Park建造完成,這將加速推進Apollo自動駕駛、車路協同技術產品的成熟和應用。

2020年,百度的AI技術不僅有效支撐了百度業務體系的全線向好,同時也開始廣泛賦能各產業,在B端市場掀起智慧化升級的浪潮。

產業賦能:谷歌和百度AI產業化的不同路向

在AI產業化和產業智慧化上面,我們也可以看到,谷歌同樣在展開一些跨行業、跨地區的AI技術應用落地,特別是在新冠疫情之下對社群大資料管理、流行病防控以及醫學研究等領域提供了一系列解決方案,但並未形成體系化的產業級應用實踐。

比如,去年疫情之下,谷歌破天荒的和蘋果合作,聯合推出了支援藍芽隱私保護技術的暴露通知系統(ENS),以及時通知使用者避免接觸檢測呈現陽性的感染者人群中。同時,谷歌也在利用使用者的匿名搜尋資料來預測新冠病毒傳播和症狀搜尋相關的資料。

在生物醫學領域,谷歌去年實現了對果蠅的半腦連線體大型突觸解析度圖的大規模機器學習模型重建,從而幫助神經科學家更好地瞭解大腦的功能;與製藥公司合作,通過ML對有前景的分子化合物進行“虛擬篩選”。

同樣,谷歌的深度學習模型已經應用在醫學領域,去識別疾病的發生率;在城市治理中,去預測一個具體地區的降水量,也能幫助一些洪水頻發的國家來進行更準確的水位預測和洪水預報。

與谷歌不同的是,百度不僅在疫情防治中貢獻了眾多的AI方案,也正在通過體系化產業戰略,全方面與不同領域的實體產業結合,形成聯接更為廣泛的AI產業方案。

在疫情之下,百度的AI測溫、AI問診、智慧外呼、服務機器人等創新應用開始大規模普及,體現著AI技術在服務社會、科技向善上的技術溫度和企業的社會責任。

而在疫情之後,AI將進一步與城市、交通、工業等基礎產業融合,推動復工復產,促進社會經濟發展。

基於這一業務戰略,百度在去年5月,明確提出了 “以雲端計算為基礎,以AI為抓手,聚焦重要賽道”的“雲智一體”的百度智慧雲的全新發展戰略。

為了更好地執行新戰略,百度智慧雲對業務架構進行了調整。新架構分為三層,底層是百度核心技術引擎百度大腦。中間是平臺,包括通用的基礎雲平臺、AI中臺、知識中臺,以及針對場景的平臺和其他關鍵元件。在基礎層和平臺的支援下,上層的智慧應用和解決方案將為各行各業賦能。

為了滿足產業應用的規模化生產,百度智慧雲提出了AI-Native的雲端計算架構。在基礎設施的AI計算叢集、AI晶片到工程平臺的飛槳、雲原生以及到應用平臺的視訊雲、區塊鏈等,通過雲智一體,端到端的方式,便捷高效的支援產業的智慧應用。基於“壯智凌雲”加速產業智慧化,將AI技術無縫接入千行百業,成為了眾多產業這一年發展的全新契機。

基於此,我們可以看到百度AI技術創新實現了與社會經濟、產業智慧化升級之間的外迴圈建設,打造了不同行業的智慧化樣板與融合基礎。

在智慧城市領域,百度智慧城市解決方案以自主創新的基礎設施為底座,包括城市的感知中臺、AI中臺、資料中臺、知識中臺以及城市智慧互動中臺,幫助城市提升智慧化的水平,賦能公共安全、應急管理、智慧交通、城市管理、智慧教育等場景。目前這一解決方案在北京海淀、重慶、成都、蘇州、寧波、麗江等10+省市落地應用。

在數字金融領域,百度智慧雲已經服務了近200家金融客戶,其中包括國有6大銀行、9大股份制銀行、21家保險機構,涉及營銷、風控等十幾個金融場景。並且構建了超過30家的合作伙伴生態,躋身中國金融雲解決方案領域第一陣營。

在智慧醫療領域,百度智慧醫療“靈醫智惠”已經服務300+家醫院和1500+家基層醫療機構,輔助數萬名醫生,惠及超過千萬患者。

在工業網際網路領域,百度工業網際網路助力企業及上下游產業實現數字化、網路化、智慧化。百度智慧雲提供的智慧製造解決方案,覆蓋14大行業,100多家企業,30多個合作伙伴,觸達50多類垂直場景,在3C、汽車、鋼鐵、能源等行業已規模落地。

在智慧辦公領域,2020年5月百度宣佈依託“AI中臺”和“知識中臺”,釋出“智慧辦公”的企業智慧應用“如流”,構建 AI時代的辦公流水線,打造新一代人工智慧辦公平臺。百度如流已經全面升級為新一代智慧工作平臺,用AI賦能企業實現智慧化轉型,實現對企業工作模式的全方位、智慧化的支撐,從個人到組織,從業務到運營的全場景服務。

AI技術的賦能,不僅體現在對實體產業的智慧化升級上,同樣也體現在服務社會的共同責任上面。

正如谷歌在對視聽障礙人士所設計的物品包裝識別應用、視訊會議的自動手語檢測系統已於,AI技術也正在顯示其造福社會、服務大眾的“科技向善”的倫理精神。

同樣,百度也秉承“科技為更好”的理念,踐行企業公民的社會責任。比如,百度早已將AI技術用於尋人的公益事業中,截止到2020年12月,百度AI尋人已經累計幫助了近12000個家庭團聚。再比如,百度AI持續支援文化保護、動物保護,例如百度和國際愛護動物基金會IFAW合作,推出全球首個利用人工智慧技術打擊野生動物製品非法貿易的平臺。與國家地理達成合作,通過百度AI影像識別能力提高蝴蝶物種識別效率,為蝴蝶物種的保護和研究提供技術支援。百度和清華大學、中國古蹟遺址保護協會等機構合作,利用人工智慧技術識別國寶級古建築內外的微小變化,保證及時修繕;樂山大佛、廣元千佛崖等重要文物管理和保護已經開始應用百度的AI技術。

我們發現,隨著AI技術在全社會生產、生活中的普及應用,人工智慧作為推動經濟發展、社會進步的正向力量,其價值正在越發凸顯。

結語:同向前行,各美其美

2020年,對於世界來說是深刻影響政治經濟格局的一個年份,同時也是新技術浪潮引領下的全球科技產業發生鉅變的一年,通訊、出行、網際網路以及諸如能源、工業等傳統產業等領域都面臨新舊技術正規化和勢力範圍的對決和權力爭奪。

AI技術,儘管在這一年並沒有在基礎演算法領域出現多少顯著突破,但是AI技術正在從少數科技公司的研究成果全面向各行各業的產業縱深滲透。AI技術在2020年,成為各行業、產業進行數字化、智慧化升級的關鍵要素。

從對谷歌和百度的2020年AI技術的演進和產業化成果的梳理,我們可以得出以下結論:

第一,AI的基礎技術仍然在穩步推進,演算法、算力和開發工具的成熟演進仍然是AI平臺效率提升的有效手段。在這一層面,谷歌和百度保持了大方向上的同頻,只是根據兩家在產品體系和研發側重點的不同,呈現出具體的技術路線的差異。

第二,隨著AI技術和開發平臺的愈加成熟,AI進入正在滲透到雲、邊、端等數字化場景的方方面面,谷歌如此,百度更是如此。

第三,在AI產業化方面,谷歌尚未進行更為體系性地戰略制定和推廣,而是與不同領域的公司、結構保持零星、鬆散的合作,而在中國,由於面臨著更為緊迫的產業升級的競賽和AI企業之間的激烈競爭,AI產業化的推進速度和強度都可能遠超國外市場。率先在AI技術領域發力的百度成為這場產業數字智慧化變革的中堅推動力量。而構建“雲智一體”這樣的系統性AI產業戰略方案,成為百度在這場新技術產業變革下的核心機遇所在。

告別2020年,原來有如此多的AI景象值得我們盤點,而面向2021,AI技術在更多業務和產業場景的爆發,相信一定也不會讓我們失望。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2751553/,如需轉載,請註明出處,否則將追究法律責任。

相關文章