今年的谷歌I/O大會超「硬」,還展示了下一代AI模型

機器之心發表於2022-05-12

未來的電腦將不再是桌上型電腦、筆記本或手機,而是你身邊的一切。所有裝置服務和人工智慧協同工作,你可以隨時隨地獲得幫助,當不需要該技術時,它就會消失在後臺。裝置再不是系統的中心——你才是。

2022 年的谷歌 I/O 大會,觀眾席終於又坐滿了人,雖然其中大多數是谷歌自己的員工。

圖片

「去年我們分享了電腦科學的最新發展,而我們的目標一直是讓全世界的資訊變得讓全人類都能訪問,」谷歌 CEO 桑達爾 · 皮查伊(Sundar Pichai)開場說道。

今天的大會上,谷歌展示的也大多是人們都可以用到的,即將實裝且免費的應用。

如今機器學習工具已經讓這一願景很大程度上成為現實。谷歌翻譯中實用化的機器學習模型已經可以不需要雙語對應的語料庫即可自行學習新語言。

圖片

翻譯系統是人工智慧最經典的任務之一,谷歌的機器翻譯在多年發展過程中一直保持領先,還催生出了像 transformer 預訓練模型這樣的重要 AI 技術。在 I/O 大會上,谷歌宣佈自家的翻譯系統新增了 24 種新的語言,其中包括一些小眾的美洲原住民語言,覆蓋共計 3 億人。

圖片

計算機視覺領域,谷歌地圖則透過 3D 重建技術實現了完全自由的沉浸式檢視,天空的樣子是實時天氣,甚至還可以讓你「走進」一家餐館:

圖片

就像是在手機上玩一個模擬真實環境的遊戲。

在影片網站 YouTube 中,現在經過 DeepMind 訓練的 AI 已自動為 8000 萬個影片分出章節,讓觀看者可以自動跳轉到最感興趣的部分,還帶有 16 種自動翻譯字幕。

最先進的預訓練大模型現在進入了日常工作中。「當你有一個 25 頁的文件還沒看,卻馬上要和別人開始討論了,這時候該怎麼辦?」皮查伊說道。

谷歌文件現在有了自動總結功能,可以把幾十頁檔案總結成幾句話,這是自然語言處理(NLP)領域的重大飛躍,效果超過過去最好的機器學習的能力。除了文件,谷歌的 AI 還能為聊天內容提供摘要,自動轉錄和總結功能也引入了 Google Meet,以後也不需要寫會議記錄了。

圖片

谷歌副總裁 Prabhakar Raghavan 向我們介紹了谷歌最核心業務搜尋的改進:未來的搜尋應該是隨時隨地,使用任何輸入方式實現的。

圖片

谷歌搜尋不再滿足於輸入關鍵詞,而是透過更自然和有邏輯性的語言,以及語音和影片來完成。

上個月,谷歌推出了 Multisearch,它可以讓你透過拍照和提問的方式在谷歌應用中進行搜尋。這是一個強大的想法,能夠讓你搜尋無法描述的東西,比如拿手機一拍,「我要買這個,在哪裡可以買到這個?」。

圖片

或者「如何才能讓我種的花看起來和這個一樣?

Prabhakar Raghavan 表示,未來 Multisearch 還將提升本地搜尋功能,並在今年晚些時候覆蓋更多國家,推出多語言版本。

這並不只是簡單的拍照加描述文字搜尋,APP 會透過演算法拼接影片中的場景,然後透過知識圖譜分析得出影像中的內容,谷歌可以給出準確的物體識別,並提供有用的建議。如果你拿手機攝像頭掃一個貨架,它能顯示每種巧克力的使用者評分。

圖片

這種被稱為 Scene Exploration 的能力或許是 AR 領域裡迄今為止最好的 demo,就好像為現實世界裝上了一個 Ctrl+F 快捷鍵。

提升演算法公平性方面,谷歌與哈佛大學 Monk 教授合作開發了膚色量表(Monk Skin Tone Scale),能更準確地在搜尋結果中反映人們的膚色。

圖片

在谷歌的帶螢幕智慧音響 Nest Hub 上,現在不用每次都說 hey Google 了。新的注視功能,就像人們互相交流時眼神接觸一樣,你看著音響說話就可以免喚醒詞。

圖片

Quick Phrases 功能則更加直接:只要說關燈、拉窗簾等祈使句就能指揮谷歌助手完成任務。

為了讓人和語音助手之間的交流更順暢,更多的機器學習模型現在在本地執行,大幅度降低了響應延遲。

圖片

一切都在朝著人性化的方向發展。

下一代 AI 模型

在應用之下,谷歌一直在探索人工智慧的最前沿。谷歌的對話 AI 模型 LaMDA 今年升級到了第二代,新模型顯著提升了對話質量,在 AI test kitchen 中,你可以透過不斷選擇話題,讓模型自動生成一個故事。

它也可以用來為你提供建議,現場展示了一個「如何開墾一個小花園」的話題,AI 可以不斷提出建議,你也可以選擇自己想要了解的方向無限深入下去。

圖片

「它展示了語言模型未來的潛力,在你搬到了一個新城市之後,它可以幫你解決很多問題,」皮查伊表示。

去年,Jeff Dean 所帶領的團隊提出了「下一代通用 AI 架構」Pathways,旨在用一個架構同時處理多項任務,並且使其擁有快速學習新任務、更好地理解世界的能力。

在今年 4 月提交的論文《PaLM: Scaling Language Modeling with Pathways》中,谷歌研究人員用 Pathways 系統訓練了一個 5400 億引數的大型語言模型——PaLM(Pathways Language Model)。

圖片

這是一個只有解碼器的密集 Transformer 模型。可以完成的任務包括自動生成程式碼、解決數學問題、修復 bug,解釋笑話的梗等等。

皮查伊表示,該語言模型的優點在於可以區分因果關係,理解上下文中的概念組合。透過這種方法,模型在數學問題上的準確率提升到了 58%,接近 60% 的 9 到 12 歲兒童解決問題的水平。

圖片

PaLM 現在可以用孟加拉語提問和正確地回答問題,而該模型並沒有經過對應語料庫的訓練,也沒有經過新語言的問答訓練,甚至根本沒有被專門設計用於翻譯。

圖片

Jeff Dean 口中的理想通用 AI 模型,難道已經成為了現實?

全新安卓 13 系統:定製化你的使用體驗

每年的 I/O 大會都是安卓新版系統展示的舞臺,今年的重點在於覆蓋所有終端,谷歌也把所有硬體都造了出來。

圖片

多年來,安卓已經成為世界上最流行的作業系統。僅去年,消費者就啟用十億部新的安卓手機。隨著機器學習的進步,手機可以幫助我們完成超乎以往想象的工作。雖然手機仍是最受歡迎的計算形式,但人們越來越多地將各種連線技術新增到生活當中,比如汽車、電視、和手錶等。人們希望這些裝置之間相容、省事且不麻煩。

在谷歌 I/O 大會上,安卓 13 系統終於問世,它具有以下三個新特性:
  • 讓你成就更多,把手機置於中心;

  • 從手機延伸到各種形式的計算裝置,比如手錶、平板電腦等;

  • 讓各種裝置更好地一起工作。

先來看手機裝置。安卓 13 透過更多方式適應使用者的風格,所有的應用圖示都可以融入自己的顏色主題。安卓 13 還有一個新的媒體空間,使用者可以根據正在聽的音樂定製外觀。此外,使用者還可以為每個應用設定不同的語言,個性化使用體驗。

圖片

安卓 13 還加入了很多安全與隱私功能。當你給他人發資訊時,也需要確保他人的隱私和安全。為此,安卓 13 將簡訊升級到了一種名為「RCS」的新標準,使得端到端加密等重要隱私保護成為可能。這是移動生態系統向前邁出的一大步。目前,谷歌的訊息應用已經擁有了 5 億 RCS 月活使用者。谷歌希望每個移動裝置都可以升級這種 RCS 標準。

圖片

手機和錢包是人們日常生活中必帶的,那麼問題來了:手機能取代錢包嗎?谷歌推出了新一代 Google Wallet,這款安卓數字錢包讓你快速安全地獲取日常所需。Google Wallet 將安全地儲存你的信用卡資訊,只要是在接受 Google Play 的地方,就可以輕點支付。

Google Wallet 的功能遠不止支付,你還可以用它出示學生證、航班登記,發動汽車,把它當作迪士尼樂園門票。同時,谷歌還將在今年晚些時候將數字身份證帶入 Wallet。先從駕照開始,你可以分享自己的身份資訊,而不必將手機交給其他人,只要透過 NFC 點選或者掃描二維碼即可。

未來幾周,Google Wallet 將在全球範圍內面向安卓和 WearOS 裝置推出。

圖片

此外,今年晚些時候,安卓 13 還將緊急 SOS 帶入 WearOS 裝置,這樣你就可以立即聯絡信任的家人和朋友或者直接用手錶撥打救援電話。安卓 13 的地震預警系統也將擴充套件到世界上的高危地區,實現提前預警。

圖片

除了手機之外,谷歌還致力於在平板電腦、手錶等個人裝置上提供安卓的美妙體驗。WearOS 裝置比去年增加了兩倍,大屏裝置擁有 2.7 億活躍使用者。值得注意的是,安卓目前是唯一可以將類似平板電腦的體驗放入口袋的系統,可摺疊裝置提供了大屏裝置所有的優點,並具備手機的便攜性。

下一步要做的是使多裝置實現相容協同工作。為此,谷歌開發了 Fast Pair 技術,使使用者不用管理任何設定,讓手機、平板和電視輕鬆配對,實現與耳麥和智慧裝置的即時互聯。

圖片

不過,如果想要將如此方便的互聯功能普及到家裡的所有裝置,就要用到「matter」了。這是一項將在今年秋季釋出的開放行業標準,它連線了谷歌硬體以及數百種受支援的產品,比如燈泡、門鎖和智慧插頭。這些支援 matter 的裝置只需要幾秒鐘就能進入你的家居、網路和 Google Home,透過 Fast Pair 對接你喜歡的應用。

圖片

谷歌新手機:Pixel 6a 和 Pixel 7/7 Pro

2021 年 10 月,谷歌推出了全新的 Pixel 6 和 6 Pro 手機,其中首次採用了自研的 Tensor 晶片。Tensor 晶片的命名方式讓人想起了谷歌提出的深度學習框架 TensorFlow,以及谷歌伺服器晶片 TPU,它的設計宗旨是把谷歌最領先的 AI 技術直接帶入手機端。

圖片

在 I/O 大會上,谷歌釋出了全新的平價款手機 Pixel 6a,僅售 449 美元。谷歌表示,「這是有史以來該價位最好的智慧手機。」Pixel 6a 提供有三種顏色,包括炭黑、粉白和灰綠。7 月 21 日開啟預購,7 月 28 日到店購買。

圖片

Pixel 6a 的外觀風格與 Pixel 6 系列一脈相承,具有獨特的雙色外觀,纖細的邊框,6.1 英寸 AMOLED 1080p 螢幕,提供了 IP67 規格的防塵放水,60Hz 的重新整理率。相機方面,Pixel 6a 容納了雙後置相機系統,包括 1200 萬畫素的主鏡頭和超廣角鏡頭。前置自拍攝像頭則為 800 萬畫素。

更重要的是,Pixel 6a 搭載了與 Pixel 6/6 Pro 相同的 Tensor 處理器和 Titan M2 安全晶片,支援 5G 連線。Pixel 6a 以較低的價格提供更好的效能和更豐富 AI 賦能的體驗,使使用者享受與 Pixel 6/6 Pro 同樣出色的安卓體驗以及獨有的攝影、語音和安全等功能。

圖片

除了 Pixel 6a 之外,谷歌還透露了今年秋天要釋出的 Pixel 7 和 7 Pro 系列產品,搭載谷歌下一代自研 Tensor 晶片,在語音、攝影、影片和安全方面帶來更多 AI 驅動的突破和極其個性化的體驗。當然,Pixel 7/7 Pro 將預裝安卓 13 系統,享受最新移動作業系統所帶來的諸多好處。

圖片

其中,Pixel 7 Pro 將鋁製材料擴充套件到整個攝像頭上,這是 Pixel 設計語言的進一步進化。它的三重攝像頭系統為攝影、效能和設計樹立了全新的標準。

圖片

好的手機當然少不了好的耳機,I/O 大會上釋出了全新的無線耳機 Pixel Buds Pro。

圖片

Buds Pro 不僅嵌入了谷歌設計的最佳移動音訊硬體,還是第一款具備主動降噪功能的耳機。谷歌表示,它是當今耳機中噪音消除效果最好的產品之一,這得益於它圍繞新的定製音訊處理器設計。

圖片

每個人的耳朵都是獨一無二的,所以耳尖並不總是形成一個完美的密封,有可能導致聲音從外面漏進來。為了解決這一問題,谷歌的主動降噪使用了新的靜音密封技術來補償音訊洩露,有助於最大程度地消除噪音,得到身臨其境的優質聲音,不會分心。

圖片

不過有時,你確實想要聽聽周圍發生了什麼,這時透明模式將發揮作用。它可以讓外界的聲音進入,讓你體驗周圍世界,就好像根本沒有佩戴耳機一樣。

定製的音訊晶片是為了提高功率效率,為此 Pixel Buds Pro 的續航時間可達 11 小時,降噪模式下為 7 小時。這款耳機還提供了有用的擴音體驗,可以向助理詢問各種事情,比如獲得 40 多種語言的實時翻譯。同時支援多點連線,在相容的手機、平板電腦、膝上型電腦和電視之間切換使用。今年晚些時候還將更新以支援空間音訊,在相容 Pixel 手機上觀看電影或電視時會體驗到身臨其境的感覺。

新的 Pixel Buds Pro 提供有四種顏色,售價為 199 美元,7 月 21 日預購,7 月 28 日上市。

圖片

下面是一直在傳聞中的 Google Pixel Watch,它在今年秋天將隨著 Pixel 7 手機一同發售。

圖片

作為第一款完全由谷歌設計的智慧手錶,它有著最出色的 WearOS 體驗,帶有語言助手、NFC 等功能,可以獨立實現導航等功能,最重要的是不像很多同級產品一樣有過大的錶盤。

手機、手錶、無線藍芽耳機都齊全了,最後還差一塊大屏,谷歌宣佈,2023 年還要推出 Pixel Tablet 平板電腦。

圖片

在這些裝置釋出後,谷歌將會和現在的各家手機大廠一樣建立起較為完整的生態。


相關文章