開發者朋友們大家好:
這裡是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@鮑勃
01 有話題的新聞
1、B 站已上線自研大模型 index 並應用於 AI 字幕,具備近 10 種語言實時翻譯能力
在 9 月 26 日的 2024 年中國國際智慧傳播論壇上,嗶哩嗶哩董事長兼 CEO 陳睿表示,B 站上線了自研大語言模型 index,並將其應用於 AI 字幕。目前,B 站具備中、英、韓、日、泰語等近 10 種語言的實時翻譯能力,準確度接近 90%。
陳睿表示,B 站更看重擁抱開源的生態,自研大模型就是建立在開源的基礎上,相信開源將會成為 AI 中的主流。同時,AI 是年輕人在 B 站上最關注的內容,也是增長最快的科技內容。作為一種普惠技術,AI 最終會讓所有人都從中受益。(@IT 之家)
2、《阿凡達》電影導演詹姆斯・卡梅隆加入 Stability AI 董事會
生成式人工智慧公司 Stability AI 於 9 月 24 日釋出博文,宣佈奧斯卡獲獎電影製片人詹姆斯・卡梅隆(James Cameron)加入 Stability AI 董事會。卡梅隆被認為是電影行業中最具創新精神的製片人之一,經常透過採用新技術推動電影的創新。他的代表作品包括《泰坦尼克號》、《阿凡達》系列等等。
Stability AI 公司執行長 Prem Akkaraju 表示:「Stability AI 的使命是透過為創作者提供全棧式 AI 平臺,將他們的創意變為現實,從而改變下個世紀的視覺媒體。在實現這一目標的過程中,我們擁有無與倫比的優勢,因為我們公司的最高層擁有像詹姆斯這樣的技術和創意遠見卓識的人才。」(@IT 之家)
3、Molmo 全開源視覺語言模型,小體積高效能,超越 GPT-4,打敗 Meta 新發 Llama 3.2
阿里的 Qwen2-VL-72B 才拿下開源多模態模型的王座沒多久,黑馬 Molmo 橫空出世,在多項學術測試和人類偏好測試中全面領先,成為目前最先進的開源多模態模型。
Molmo 是由 Allen Institute for AI 開發的一系列開放式視覺語言模型。Molmo 基於 Qwen2-72B,使用 OpenAI 的 CLIP 作為視覺骨幹,增強了模型處理影像和文字的能力。模型在 PixMo 上進行訓練,PixMo 是一個包含 100 萬個高度精選的影像-文字對的資料集。Molmo 模型在效能上優於體積大十倍的其他模型,旨在提高開源系統在效能上與專有系統(如商業模型)之間的競爭力,特別是在學術標準和人類評估方面的表現。(@機器之心 SOTA 模型)
4、Snapchat 聊天機器人 My AI 將整合 Gemini 模型
谷歌 Google Cloud 宣佈和 Snap 公司合作,在 Snapchat 的 AI 聊天機器人 My AI 中整合 Gemini,為使用者帶來更強的 AI 聊天體驗。Snapchat 將藉助谷歌 Gemini 聊天機器人的強大多模態功能,理解包括文字、音訊、影像、影片和程式碼等多種輸入型別並回答使用者提問。
谷歌表示此次合作給 Snapchat 使用者帶來更多創新功能。Snap 執行長埃文·斯皮格爾評論稱,與 Google Cloud 的合作強化了服務社群的重要性,透過整合 Gemini AI,Snapchat 使用者可以加速探索世界、快速完成任務並輕鬆分享給好友。(@曲速人工智慧研究)
5、OpenAI、微軟、谷歌等簽署歐盟《人工智慧公約》
歐盟委員會當地時間 9 月 25 日公佈了《人工智慧公約》(AI Pact)的首批 100 多家簽署方名單,該協議旨在促使企業就如何處理和部署人工智慧釋出「自願承諾」。雖然歐盟《人工智慧法案》(the AI Act)已於上月生效,但所有合規期限還需數年才能實施。這就造成了一個不合規的真空地帶,歐盟希望透過《人工智慧公約》來填補這一真空。目前歐盟委員會公佈的簽署方名單包括 OpenAI、微軟、谷歌等,但不包括蘋果公司和 Meta 公司。(@36 氪)
02 有態度的觀點
1、林凡對話面壁智慧李大海:端側大模型中國與美國差距較小甚至領先
9 月 24 日,脈脈創始人兼 CEO 林凡對話面壁智慧 CEO 李大海,深度探討 AI 手機背後的端側大模型進展、未來互動變革可能性、被 AI 接管的未來,普通人該如何快速適應等重要話題。
李大海認為,新一代 AI 手機、新一代智慧汽車都會變成「超級智慧體」,基於端側模型的智慧計算,貼身陪伴使用者、更懂使用者,並幫助使用者建立和世界的互動。但目前 iPhone 16 的 AI 功能遠遠沒有達到理想狀態。同時李大海透露,手機記憶體對端側模型的影響顯著。他同樣認為,未來的 AI 硬體將會分成 Copilot(助手)和 Agent(智慧體)兩種型別,Agent 能夠自主與環境互動,做出更自主的決策。未來,會出現很多的 Agent 型別的硬體。
此外,林凡和李大海均表示,在雲端大模型領域,中國相對落後於美國 1-2 年,但在端側大模型領域,雙方差距不大,在部分技術方面,中國已經處於國際領先水平。(@AI 科技評論)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞