Pi 母公司將開發情感 AI 商業機器人;Meta 科學家:Sora 不是影片生成唯一方向丨 RTE 開發者日報 Vol.214
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
01 有話題的新聞
1、 Inflection AI 計劃將情感 AI 嵌入商業機器人
AI 獨角獸 Inflection AI(情感型聊天機器人 Pi 的母公司),在經歷投資方微軟「挖角」之後,公佈了其由經驗豐富的矽谷老將組成的新領導團隊,計劃將情感 AI 嵌入商業機器人,憑藉其在 AI 情感智慧領域的領先地位進軍 2B 市場。(@ 新智元)
2、剪映字幕識別功能收費,從最初的 178 元漲到現在的 188 元,最新回應
近日,有網友發帖稱剪映更新後發現其字幕識別功能開啟了 VIP 收費模式,每個月只有 5 次免費使用機會。有網友反映此功能不僅開啟收費模式並且一週漲一次價,從最初的 178 元漲到現在的 188 元。網友們紛紛表示拒絕更新。對此剪映官方客服表示:因為市場環境和 app 規劃原因確實開啟了收費模式,但多次漲價這個情況並沒有查詢到相關資訊。(@ 網易科技)
3、前 OpenAI 安全負責人加入競爭對手 Anthropic
5 月 29 日訊息,據外媒報導,剛剛從 OpenAI 安全團隊(專注於長期風險)離職的前聯席主管 Jan Leike 宣佈將加入 OpenAI 人工智慧競爭對手 Anthropic。Leike 於 5 月 15 日凌晨宣佈辭去 OpenAI 職務,幾天後該公司解散了他共同領導的超級聯盟小組。
Leike 表示,他在 Anthropic 的工作重點與他在 OpenAI 的工作類似,即與所謂超人類人工智慧模型的控制相關的安全問題。此類人工智慧模型目前尚不存在,但 OpenAI 和 Anthropic 等公司正在研究如果未來建成這些模型,如何對其進行控制。Leike 表示:我很高興加入@AnthropicAI,繼續完成超級對齊任務。(@ 鞭牛士)
4、黃仁勳淨資產飆升至 910 億美元,明年有望超越馬斯克成全球首富,NVIDIA 暫無接班人
英偉達 CEO 黃仁勳個人淨資產過去五年急劇膨脹,其持有英偉達約 8676 萬股股票,佔該公司已發行股份的 3.5% 以上。根據最新資料,英偉達創始人、總裁兼 CEO 黃仁勳的個人財富已達到約 936 億美元(摺合人民幣約 6780 億元),在億萬富翁指數榜上升至全球富豪榜第 17 位。按照目前的增長速度,黃仁勳有望在 2025 年之前取代特斯拉 CEO 馬斯克,成為全球新首富。
然而,與公司業務和市值的蓬勃發展形成鮮明對比的是,英偉達目前並沒有明確的接班人計劃。黃仁勳在近期的一次對話中被問及退休問題時,以幽默的方式回應自己沒有其他事可做,暗示暫無退休計劃。(@ 騰訊科技)
5、首個未成年遊戲退費標準釋出:監護人與網遊服務提供者按錯比例擔責
中國網際網路協會發布首個未成年遊戲退費標準,明確了監護人和網遊服務提供者的責任比例。網遊服務提供者未接入國家認證系統導致未成年人無限制充值時,承擔 100% 責任;若已配置防沉迷措施但監護人幫助繞過,服務提供者根據情況承擔 30%-70% 責任,監護人承擔剩餘責任。(@ 北京商報)
02 有態度的觀點
1、Yann LeCun:如果你對下一代人工智慧系統感興趣,不要研究大型語言模型
雖然 Meta 推出了開源大型語言模型 Llama,但 Yann LeCun 作為 Meta 的首席人工智慧科學家及 FAIR(Facebook AI Research)負責人,對 LLM 的不看好卻是盡人皆知。
他最近還直接對學生喊話:如果你對下一代人工智慧系統感興趣,不要研究大型語言模型。
在近日與英國《金融時報》的一次訪談中,他反對依賴不斷發展的 LLMs 來追求人類級別的智慧,因為這些模型只有在被輸入正確的訓練資料時才能準確回答問題,因此「本質上是不安全的」。
谷歌 DeepMind 還花了幾年時間尋找構建 AGI 的替代方法,包括強化學習等方法,其中人工智慧代理在類似遊戲的虛擬環境中從周圍環境中學習。
所以他轉而專注於一種根本性的替代方法,正在努力開發一個全新的 AI 系統,希望這些系統能夠為機器提供人類級別的智慧,儘管他表示這一願景可能需要 10 年才能實現。
LeCun 認為,LLM 的自迴歸性質(根據之前的單詞預測下一個單詞)從根本上限制了它們實現真正智慧的能力。他主張聯合嵌入預測架構(JEPA)作為一種更有前景的 AGI 方法。LeCun 還批評了當前對基於文字的學習的關注,認為需要觀察物理世界並與物理世界互動,以建立對規劃和推理至關重要的全面世界模型。(@ 矽星人 Pro)
03 有思考的文章
《對話|Meta 科學家 Bichen Wu:在矽谷,Sora 不是影片生成的唯一方向》
影片生成效果最好的其實是圖形學(Graphics pipeline)的技術路線,並不是這一輪生成式 AI 的技術……在這一波生成式 AI 浪潮中,主要的技術路線分為兩條。一條是以 Diffusion 模型為基礎,OpenAI 的 Sora 和 Meta 的 Emu Video 都是這個路線;另一條是 Google 的 VideoPoet 模型所採用的路線,模型基於 Transformer 開發,用 LLM(大語言模型)的架構做影片生成,將影片拆解為多個小塊,每個小塊相當於一個 token,根據已有的 token 來預測下一個 token,最終這些小塊會被解碼器重新組合成影片。VideoPoet 模型把影片看作是由「許多詞」組成的「句子」或「文章」。
文章推薦人 @ 鮑勃:推薦這篇「新皮層」與 Bichen Wu 的對話。雖然他沒有透露在 Meta 做的具體專案,但是他表態:「儘管 Sora 將影片生成的潛力推向了新的高度,但這並不是影片生成的終極解決方案。無論是在訓練還是推理階段,我相信存在更高效的影片生成模型,能夠以更低的成本生成更高質量的內容。」
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 前 OpenAI 首席科學家建「安全超級智慧」實驗室;Meta 重組元宇宙團隊丨 RTE 開發者日報 Vol.228OpenAI元宇宙開發者日報
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- SpaceX 星艦發射「成功一半」;首位具身 AI 機器人面世丨 RTE 開發者日報 Vol.166AI機器人開發者日報
- OpenAI 再發 Sora 新短片,傳 Sora 兩週內推出;李飛飛團隊出品空間智慧版 ImageNet 丨 RTE 開發者日報OpenAISora開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨 RTE 開發者日報AI開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨RTE 開發者日報AI開發者日報
- 沒有方向盤和踏板,特斯拉釋出無人駕駛計程車;位元組豆包推出 AI 智慧體耳機 Ola Friend 丨 RTE 開發者日報AI智慧體開發者日報
- Meta 向第三方開放 MR 作業系統;黃仁勳:人形機器人成本可能比人們預期要低得多丨 RTE 開發者日報 Vol.190作業系統機器人開發者日報
- 位元組豆包釋出新模型,AI 一句話 P 圖;Google 正式推出 Vids,簡單提示即可生成影片演示丨 RTE 開發者日報模型AIGo開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- 狩獵者Hunter機器人系統開發丨夾子機器人開發邏輯(原理)機器人
- Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報OpenAI開發者日報
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- Runway 新增影片擴充套件畫面功能;Anthropic 再獲亞馬遜投資 40 億美元,聚焦 AI 晶片研發丨 RTE 開發者日報套件亞馬遜AI晶片開發者日報
- Sora AI影片生成器SoraAI
- 語音生成公司 ElevenLabs 估值達 30 億美元;OpenAI Realtime API 很好也很貴丨 RTE 開發者日報OpenAIAPI開發者日報
- (內含福利)Meta 釋出新開源模型 Llama 3;華為 Pura 70 系列一分鐘售罄丨 RTE 開發者日報 Vol.188模型開發者日報
- 星紀魅族宣佈 All in AI;歐盟將首次對蘋果處以罰款丨 RTE 開發者日報 Vol.146AI蘋果開發者日報
- YouTube 上線「用相機拍攝」標籤為真實影片「驗明正身」;美國被曝考慮限制向中東國家出口 AI 晶片丨 RTE 開發者日報AI晶片開發者日報
- 馬斯克的 xAI 融資 60 億美元;英偉達收購兩家 AI 創企丨 RTE 開發者日報 Vol.193馬斯克AI開發者日報
- 活動報名丨實時互動 AI 開發者年度聚會!RTE Open Day@RTE2024,10.25/26 北京AI