Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@ 鮑勃
01 有話題的新聞
1、OpenAI CTO Mira Murati 離職,高層動盪繼續
OpenAI 又迎來「地震級」高層人員變動。
今日凌晨三點半,OpenAI CTO Mira Murati 在 X 上發帖表示,在 OpenAI 工作了六年多後,她將離開公司進行自己的探索。
Mira 曾在去年 Sam Altman 被罷免之後短暫擔任臨時 CEO 的職位,同時在他返回 OpenAI 時發揮了重要作用。
如今 Mira 也離開了,加上正在休長假的 Greg Brockman 以及離職的首席科學家 Ilya Sutskever,曾經的 OpenAI「四大天王」,只剩 Sam Altman 一個人。(@ 機器之心)
2、國內首個影片大模型 Vidu 宣佈開放 API
9 月 25 日,生數科技旗下影片大模型 Vidu 宣佈正式開放 API,並同步接入百度智慧雲千帆大模型平臺,成為平臺接入的首個影片大模型。
作為國內首個純自研的影片大模型,Vidu 在高動態性、多風格化、極致推理等方面具備領先優勢,並上線全球首個「主體參照」功能,突破影片模型一致性生成難題。
透過 API 開放,Vidu 的影片生成能力可以快速融入各行業和應用場景,落地企業個性化的解決方案,滿足企業對規模化、低成本的影片內容生產需求,以及高度自由的創作需求。
另外,在技術研發方面,Vidu 在模型訓練環節選擇了百度百舸·AI 異構計算平臺。Vidu 藉助百舸的算力叢集和高效的資源排程系統,訓練效率得到大幅提升,模型最佳化也得到強有力的支援。(@APPSO)
3、Meta Connect 2024:Meta 首款全息眼鏡 Orion 釋出
今天凌晨,Meta Connect 2024 正式舉辦。此次大會正值釋出會十週年的重要節點,扎克·伯格也帶來了多款新品:
- Meta Orion 智慧眼鏡: 由眼鏡本體、手勢追蹤腕帶、遙控器大小的「計算模組」三部分組成;機身採用了鎂材料打造,Orion 眼鏡本體重量僅 98 克;據 The Verge 的測試,眼鏡視場角高達 70 度;互動層面, Meta Orion 支援眼動追蹤、手勢操控和 AI 語音操作,佩戴配套的腕帶能夠實現更精細的手勢操作。
- Meta Quest 3S 頭顯 MR 眼鏡: 搭載 Snapdragon XR2 Gen 2 處理器;新增 Hyperscale 功能,透過手機掃描房間的輪廓細節後,就能在 Quest 3S 重新構建出一個接近 1:1 的復原場景;推出沉浸式社交的增強功能。MetaQuest 3S 共提供 128GB/256GB 兩個版本,售價分別為 299.99 元/399.99 美元。
- Meta 首個開源大模型 Llama 3.2 : 包括兩個視覺模型(11B 和 90B)和兩個輕量級的純文字模型(1B 和 3B),可同時處理文字和影像。
- Meta Ray-Ban 迎來 AI 新功能: 藉助 Llama 3.2 的能力, Ray-Ban 現在可進行實時翻譯、個性穿搭建議等功能。(@APPSO)
4、「稚暉君」創業專案,智元自主研發的機器人中介軟體 AimRT 開源
9 月 25 日,智元自主研發的機器人中介軟體 AimRT 開源上線。官方表示,AimRT 是一個更現代、輕量易用,且高效穩定的通訊開發框架,具備機器人開發流程所必備的許多實用特性,並解決了主流開源中介軟體的一些痛點:
- 在軟體開發效率方面 ,AimRT 基於現代 C++ 新標準開發,輕量易部署,將現代化設計模式應用在資源管控、非同步程式設計、部署配置等方面,使得機器人應用的開發更加快捷和高效。
- 在工具鏈與調測效率方面 ,AimRT 提供了完善的除錯、效能分析工具,以及良好的可觀測性支援,有助於快速發現並解決系統中的問題,相比較傳統的通訊框架能夠更加有力的保證機器人系統的穩定執行。
- 在生態相容方面 ,AimRT 能夠相容 ROS2、Http、Grpc 等傳統機器人生態或雲服務生態,開發者可以根據需要選擇合適的通訊後端,並支援漸進式升級存量系統,可廣泛應用於機器人端側、邊緣端、雲端等多種部署場合,與最新的 AI 技術更親和。
- 在擴充套件性方面 ,AimRT 提供了全面的外掛開發介面,還提供了十餘種官方外掛,同時也支援開發者們進行二次開發以適配更多場景。
以「天才少年」身份加入華為的稚暉君於 2022 年底宣佈離職,創業智元機器人。今年 9 月 3 日,智元機器人完成 A++++++ 輪融資,估值已超過 70 億元,得到了包括北汽、上汽、比亞迪在內的國內汽車巨頭支援。(@IT 之家)
5、MIMO:給定一個參考影像 、影片 幾分鐘即可生成一個可以控制動作和場景的動畫人物
MIMO 是一個生成虛擬角色動畫的工具。它能夠讓使用者透過一張圖片和簡單的動作資訊(如圖片、動作序列或影片),生成一個可以控制動作和場景的動畫人物,而且這個人物可以與場景中的物體進行互動。
即給定一個參考影像,MIMO 能夠透過幾分鐘的推理生成可動畫的虛擬形象。
該模型突破了傳統 3D 角色影片生成方法的侷限,不需要多視角拍攝或針對每個角色單獨訓練。透過結合 2D 影片資訊和 3D 空間建模,MIMO 可以高效地生成角色動畫,並支援在真實世界的複雜場景中與物體進行互動。
MIMO 的核心優勢在於它可以根據使用者的需求自由控制動畫中的角色、動作和場景,適應不同的應用場景,如虛擬人動畫、電影特效、遊戲角色等。(@ 小互 AI)
02 有態度的觀點
1、百度李彥宏:智慧體是我最看好的 AI 應用方向
在昨日 2024 百度雲智慧大會上,百度創始人李彥宏發表頒獎致辭時指出,智慧體是他最看好的 AI 原生應用發展方向。李彥宏表示,「越來越多的人靠自然語言提示詞,就可以做出很有用的智慧體」,相當於 PC 時代的網站和自媒體時代的賬號。
李彥宏表示,智慧體最明顯的特點是門檻足夠低,誰都能上手,但同時天花板又足夠高,可以做出非常複雜,非常強大的應用,未來將會有數以百萬量級的智慧體出現,形成龐大的智慧體生態。在今年文心杯創業大賽中,有超過 60% 參賽團隊聚焦智慧體的應用,超過 30% 參賽團隊沒有專業程式設計師。
「面對新的技術週期,堅持長期主義的創業者必將脫穎而出。」現場,李彥宏重申堅持舉辦「文心杯」創業大賽的初衷。他說,大模型熱潮已經持續兩年,當度過最初的興奮,迴歸現實和落地時,許多創業者可能會感到失落、迷茫,甚至懷疑未來,「因為人們總是高估技術的短期價值,卻低估技術的長期價值。」在他看來,大模型是一次顛覆式的技術革命,長期前景非常樂觀,「悲觀者永遠正確,而未來卻是由樂觀者創造的」。
李彥宏表示,「百度希望能與所有的創業領域企業共建一個繁榮的 AI 產業應用和智慧生態,幫助創業者更早的找到 PMF,做出超級應用。」(@ 有新 Newin)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報AI3D開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨RTE 開發者日報AI3D開發者日報
- 百度釋出 AI 眼鏡:全球首搭中文大模型,支援邊走邊問;OpenAI 聯合創始人宣佈迴歸,主抓重大技術創新丨 RTE 開發者日報大模型OpenAI開發者日報
- OpenAI也要做消費類硬體了?Meta前AR眼鏡負責人加盟OpenAI
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- 語音生成公司 ElevenLabs 估值達 30 億美元;OpenAI Realtime API 很好也很貴丨 RTE 開發者日報OpenAIAPI開發者日報
- 前 OpenAI 首席科學家建「安全超級智慧」實驗室;Meta 重組元宇宙團隊丨 RTE 開發者日報 Vol.228OpenAI元宇宙開發者日報
- 特斯拉宣佈 10% 大裁員;劉強東數字人開啟直播首秀丨 RTE 開發者日報 Vol.185開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 蘋果 Vision Pro 產地首次公佈:原汁原味的中國製造丨 RTE 開發者日報 Vol.143蘋果開發者日報
- 平價 Vision Pro 需搭配 Mac/iPhone;OpenAI 收購實時分析資料庫公司丨 RTE 開發者日報MaciPhoneOpenAI資料庫開發者日報
- 首個被人類騙錢的 AI 誕生;微信公眾號後臺新增「AI 配圖」功能丨 RTE 開發者日報AI開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 星紀魅族宣佈 All in AI;歐盟將首次對蘋果處以罰款丨 RTE 開發者日報 Vol.146AI蘋果開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- Vidu 全球首發「主體參照」新功能,一鍵同步角色特徵;GPT-4o 實時音訊專案負責人離職創業丨 RTE 開發者日報特徵GPT音訊創業開發者日報
- 彙總 | AR眼鏡開發資源合集(建議收藏)
- OpenAI 收購桌面實時協作公司 Multi;iOS 18 開放 iPhone 映象測試丨 RTE 開發者日報 Vol.231OpenAIiOSiPhone開發者日報
- Fish Agent:多語言 Voice-to-Voice 開源語音模型;Runway 推出攝像機運鏡功能丨 RTE 開發者日報模型開發者日報
- OpenAI 再發 Sora 新短片,傳 Sora 兩週內推出;李飛飛團隊出品空間智慧版 ImageNet 丨 RTE 開發者日報OpenAISora開發者日報
- 佈局VRAR領域!歐菲光宣佈將投資AR眼鏡ODGVR
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 美眾議院透過強制要求 TikTok 剝離的法案; 首個 AI 軟體工程師上線丨 RTE 開發者日報 Vol.165AI軟體工程工程師開發者日報
- ODG釋出兩款AR眼鏡,將在CES 2017上展示
- (內含福利)Meta 釋出新開源模型 Llama 3;華為 Pura 70 系列一分鐘售罄丨 RTE 開發者日報 Vol.188模型開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 谷歌破解 OpenAI 模型關鍵資訊;微軟更改預設瀏覽器,不再主推 Edge 丨 RTE 開發者日報 Vol.163谷歌OpenAI模型微軟瀏覽器開發者日報
- Meta 向第三方開放 MR 作業系統;黃仁勳:人形機器人成本可能比人們預期要低得多丨 RTE 開發者日報 Vol.190作業系統機器人開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- 高通將支援 Meta Llama 3 在驍龍終端執行;特斯拉中國全系車型降價 1.4 萬元丨 RTE 開發者日報 Vol.189開發者日報
- 華為否認大模型演示造假;美國億萬富翁宣佈競購 TikTok 丨 RTE 開發者日報 Vol.206大模型開發者日報
- OpenAI 成功收購 Chat.com 域名;AI「電子舌頭」問世,可辨別味道、檢測食品安全丨 RTE 開發者日報OpenAI開發者日報
- Swarm 框架登場:OpenAI 第 3 階段「敲門磚」;馬斯克的 Teslabot 實際有人遠端操控丨 RTE 開發者日報Swarm框架OpenAI馬斯克開發者日報
- ODG釋出兩款AR眼鏡,將在CES2017上展示