結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204

RTE开发者社区發表於2024-05-15

開發者朋友們大家好:

這裡是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@CY@JLT,@ 鮑勃

01 有話題的新聞

1、結合自家多模態 AI 助手「Project Astra」,谷歌 I/O 大會展示 AI+AR 眼鏡原型機

今日凌晨,谷歌召開了其 2024 I/O 大會,本次大會核心圍繞 AI,並展示了 Gemini、AI Overviews、Ask Photos 等新產品或新能力。

在這過程中,谷歌展示了一個結合了自家多模態 AI 助手「Project Astra」的 AR 眼鏡演示影片片段。據瞭解,Project Astra 除了擁有常見多模態 AI 大模型的音訊、文字以及視覺處理能力外,它還能記住並且推理它所看到的一切。

谷歌表示,Astra 的工作原理是「連續編碼影片幀,將影片和語音輸入組合到事件時間線中,並快取這些資訊以進行有效呼叫」。(@ 陀螺科技)

2、OpenAI 聯合創始人兼首席科學家伊利亞·蘇茨克沃將離職

北京時間 5 月 15 日早間,OpenAI 聯合創始人伊利亞·蘇茨凱弗(Ilya Sutskever)在社交媒體平臺上宣佈,他將在近十年後離開公司。蘇茨凱弗稱:「我對接下來的事情感到興奮——這是一個對我個人非常有意義的專案,我將在適當的時候分享細節。」

在蘇茨凱弗離職之際,奧特曼在社交媒體上表達了自己的想法。他寫道:「這讓我感到很難過,伊利亞無疑是我們這一代最偉大的人之一,是我們這個領域的一盞指路明燈,也是一位親愛的朋友。他的才華和遠見是眾所周知的,但他的熱情和同情心同樣重要。」與此同時,奧特曼還宣佈了雅各布·帕奇科(Jakub Pachocki)為該公司新一任的首席科學家。(@ 騰訊科技)

3、傳 Meta 正開發內建攝像頭 AI 耳機,可識別物體翻譯外語

5 月 14 日訊息,據 The Information 報導,Meta 正在探索開發帶有攝像頭的 AI 耳機,希望這種裝置能用來識別物體和翻譯外語。

三位「內部人士」透露,該專案的內部代號為 Camerabuds,目前還不清楚該產品的最終設計會是入耳式耳機還是頭戴式耳機,不過 Meta 的 CEO 祖克伯已經嘗試過幾種可能的裝置設計,但他對這些產品原型都不滿意。內部人士表示,Meta 公司領導層原本預計在今年第一季度正式批准一款原型設計,但許多測試人員發現大量問題,包括長髮可能會遮擋耳機上的攝像頭、耳機重量太大、續航太短、發熱影響體驗等。

除了 Meta 外,幾家其他科技公司也在研發 AI 可穿戴裝置,包括 Humane 和 Rabbit 在內的幾家初創公司最近也推出了自家「AI 專用裝置」,Meta 內部人士表示,包括祖克伯等 Meta 領導層目前都希望加速 AI 耳機的開發過程,因為他們相信 Meta 的競爭對手也將開發類似的裝置。(@ 搜狐科技)

4、騰訊混元文生圖模型全面開源,包含模型權重、推理程式碼、模型演算法等完整模型

5 月 14 日,騰訊宣佈旗下的混元文生圖大模型全面升級並對外開源,目前已在 Hugging Face 平臺及 Github 上釋出,包含模型權重、推理程式碼、模型演算法等完整模型,可供企業與個人開發者免費商用。該模型支援中英文雙語輸入及理解,引數量 15 億。升級後的混元文生圖大模型採用了與 Sora 一致的 DiT 架構,不僅可支援文生圖,也可作為影片等多模態視覺生成的基礎。(@ CSDN)

5、位元組跳動自研大模型家族即將亮相

火山引擎宣佈,位元組跳動自研大模型家族將於今日 9:30 舉辦的「2024 春季火山引擎 FORCE 原動力大會」首次亮相。同時,火山引擎大模型服務平臺火山方舟也將迎來重大升級。鳳凰網科技此前曾報導,位元組跳動在 AI 方面的佈局,主要集中在 Flow 部門。該部門目前的核心產品有:

AI 對話助手豆包( 海外版為 Cici)
對標 GPTs 的 AI bot 開發平臺釦子(海外版為 Coze )
面向二次元群體的話爐

另外,在組建 Flow 部門前,位元組跳動還在大模型上部署了代號為「seed」的團隊,專注於模型層的研發。(@ 愛範兒)

6、蘋果 iOS 18 或將推出廣告遮蔽功能,英國報紙集團與新聞媒體協會對其發出警告

據外媒報導,蘋果正準備在 iOS 18 軟體更新中為 Safari 瀏覽器加入一個基於 AI 的隱私功能,該功能可以刪除廣告或其他不需要的網站內容。對此英國報紙集團警告蘋果公司,推出任何遮蔽廣告的「網路橡皮擦「(web eraser)工具,都將使新聞業的財務面臨可持續性風險。

NMA(News Media Association、英國新聞媒體協會)向蘋果英國政府事務主管表示,這個功能將影響新聞媒體行業在網路上的收入,新聞媒體行業需要資金來執行,而廣告是他們的主要收入來源。編輯們則擔心 AI 工具會選擇性更改或刪除文章內容,改變文章原意。目前一些新聞媒體已經在其網頁上增加了對廣告攔截外掛的檢測,若檢測到廣告攔截外掛,會要求使用者將其關閉,否則將不允許使用者繼續瀏覽。(@IT 之家)

02 有態度的觀點

1、朱嘯虎評 GPT-4o:稱大模型技術迭代曲線明顯放緩

金沙江創業投資基金主管合夥人朱嘯虎點評 GPT-4o,他認為:

1.大模型的技術迭代曲線明顯放緩。

2.開始卷免費,說明 GPT 的使用者和收入增長都已經碰到瓶頸,不是深度繫結大廠的模型公司基本已經出局。

3.應用會迅速爆發,推理成本再降一個數量級就會普及出現 AI 時代的國民應用。

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章