前 OpenAI 首席科學家建「安全超級智慧」實驗室;Meta 重組元宇宙團隊丨 RTE 開發者日報 Vol.228
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
一、有話題的新聞
1、OpenAI 前首席科學家將建立「全球首個」安全超級智慧實驗室
北京時間 6 月 20 日訊息,原 OpenAI 聯合創始人、首席科學家 Ilya Sutskever 在 X 官宣了他正式創業的訊息——創辦了一家名為「安全超級智慧」(Safe Superintelligence,簡稱 SSI)的新公司,旨在創造一個「純粹的」安全超級智慧。
Ilya Sutskever 表示,公司將只有一個重點、一個目標和一個產品,透過一個小型團隊來取得「革命性」的突破,實現追求安全超級智慧的目標。同時,新公司自稱是「世界上第一個」直擊安全智慧的實驗室。
去年 11 月,Ilya Sutskever 曾作為推動者突然罷免了 Sam Altman 的 OpenAI CEO 一職。但此後,Ilya 又「反悔」將他請了回來。今年 5 月 15 日,Ilya Sutskever 宣佈離開工作 10 年的 OpenAI。(@IT 之家)
2、Meta 推出 AI 音訊水印工具,能鑑別 AIGC 音訊和真人音訊,已在 GitHub 開源
Meta 建立了一個名為「AudioSeal」的新系統,可以在 AI 生成的音訊中嵌入名為「水印」的隱藏訊號,旨在檢測網路上的 AI 生成內容。該工具能識別出一小時播客中可能由 AI 生成的音訊片段。工具已在 GitHub 上開源供人下載,並能為 AI 生成的音訊新增水印。
未來,這項技術可能用於社交媒體檢測和刪除深度偽造音訊。但該技術面臨的挑戰是水印往往容易被篡改、刪除或偽造。(@DeepTech 深科技)
3、Meta 重組 Reality Labs,成立新的可穿戴裝置組
北京時間 6 月 19 日,據 The Verge 報導,Meta 技術長宣佈將啟動該公司硬體部門自 2020 年更名為 Reality Labs 以來最大規模的重組。
根據 Meta 發給員工的內部備忘錄:Reality Labs 的所有團隊將合併為兩個部門,一箇中央「元宇宙」部門,包括 Quest 頭顯產品線;另一個新的「可穿戴裝置」部門涵蓋 Meta 的其他硬體產品,包括與 Ray-Ban 合作的智慧眼鏡。
Bosworth 提到組織架構重組的原因包括:要專注於 MR 軟體平臺,雷朋智慧眼鏡銷量遠超預期,創造更加整合的產品體驗,以及希望能夠減少管理費用,並允許跨團隊的人員聚集在一起。(@ 搜狐科技)
4、蘋果 iOS 18 允許第三方 App 錄製空間影片
IT 之家 6 月 19 日訊息,執行 iOS 17.2 及以上版本的 iPhone 15 Pro 和 iPhone 15 Pro Max 可以錄製空間影片,並支援在蘋果 Vision Pro 等裝置上觀看。
在此之前,空間影片錄製僅限於蘋果自帶的相機 App,但從 iOS 18 開始,第三方 App 也能提供這項功能。
在上週的 WWDC 2024 開發者大會編碼研討會上,蘋果透露他們已經發布了一個 API,允許開發者在任何 App 中加入空間影片錄製功能。蘋果表示,該 API 基於現有的相機框架,較易於實現。
據悉,當錄製空間影片時,iPhone 15 Pro 系列的主攝和超廣角會同時工作,兩顆攝像頭錄製的內容會合併成一個空間影片檔案。不過,要想觀看帶有 3D 景深效果的空間影片,還需要擁有一臺 Vision Pro 頭顯,因為此類影片在 iPhone 上只能以普通的 2D 格式播放。(@IT 之家)
5、百度曦靈數字人平臺升級,支援文生 3D 數字人、音色克隆等功能
新版平臺能夠在短時間內自動生成逼真的 3D 數字人,並提供了極速和精品兩種克隆選擇,以滿足不同需求。極速克隆可在半小時內完成,適用於效率追求的場景;精品克隆則能夠 1:1 還原真人,適合對真人還原要求較高的場合。
此外,曦靈平臺還推出了音色克隆功能,使用者僅需 30 秒的錄音即可生成專屬音色。(@AI 科技評論)
6、百度文庫新產品「橙篇」支援 10 萬字長文生成
昨日,百度文庫宣佈,全新產品「橙篇」首創 10 萬字長文生成及多模態編輯能力。
據官方介紹,在超長圖文理解上,橙篇可實現超長文字無損理解,支援使用者一次性上傳 100 個多種格式、單個最大 200MB 的檔案,並支援基於上傳內容進行快速總結、問答和創作。
「橙篇」於 5 月 30 日釋出,號稱「行業首個集專業知識檢索和問答、超長圖文理解和生成、深度編輯和整理、跨模態自由創作於一身」的 AI 產品,能夠在科研、學術等領域滿足使用者查閱、創作、編輯的需求。(@ 愛範兒)
二、有態度的觀點
1、李開復談報考 AI 專業:AI 專業很多工作也能被 AI 取代
創新工場創始人、AI 初創公司零一萬物 CEO 李開復近日接受採訪,談到了不少 AI 方面的話題。結合最近高考結束填報志願的熱點,李開復談到了「是否應該去報考人工智慧相關專業」的問題,表示每個人都去報考肯定是不適合的,應該是「適合的去做,不適合的不該去做」,不應該認為人工智慧專業裡面的每一個工作都是人工智慧不能取代的,實際上 AI 專業很多工作都可以被 AI 取代。
李開復建議,學 AI 先學程式設計,如果程式設計學得不是特別精,未來也會被 AI 取代。他也表示,無論報考什麼專業,都要把大模型當作自己最好的夥伴。
李開復也再次談到了最近大模型的「價格戰」,表示不應該賠錢地去推 API,因為這會破壞行業秩序。公司發現低成本可以做出一樣的效果,一樣能賺錢,那降價比較適合;跟風打價格戰,甚至賠錢也要降價「沒有意義」。
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- OpenAI 再發 Sora 新短片,傳 Sora 兩週內推出;李飛飛團隊出品空間智慧版 ImageNet 丨 RTE 開發者日報OpenAISora開發者日報
- Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報OpenAI開發者日報
- Pi 母公司將開發情感 AI 商業機器人;Meta 科學家:Sora 不是影片生成唯一方向丨 RTE 開發者日報 Vol.214AI機器人Sora開發者日報
- DAPP原力元宇宙系統開發丨Meta Force原力元宇宙開發技術丨PHP語言APP元宇宙PHP
- 達摩院以色列實驗室引入世界級AI科學家,構建機器智慧全球研發網路AI
- 平價 Vision Pro 需搭配 Mac/iPhone;OpenAI 收購實時分析資料庫公司丨 RTE 開發者日報MaciPhoneOpenAI資料庫開發者日報
- 蘋果挖走大量谷歌人才,建立神秘人工智慧實驗室;李飛飛創業成立「空間智慧」公司丨 RTE 開發者日報 Vol.197蘋果谷歌人工智慧創業開發者日報
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- OpenAI 收購桌面實時協作公司 Multi;iOS 18 開放 iPhone 映象測試丨 RTE 開發者日報 Vol.231OpenAIiOSiPhone開發者日報
- 馬斯克突擊訪華;谷歌 Python 基礎團隊全數被裁;丨 RTE 開發者日報 Vol.195馬斯克谷歌Python開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- NFT鏈遊元宇宙智慧合約系統開發(運營版)丨DAPP丨NFT丨元宇宙元宇宙APP
- 語音生成公司 ElevenLabs 估值達 30 億美元;OpenAI Realtime API 很好也很貴丨 RTE 開發者日報OpenAIAPI開發者日報
- OpenAI 成功收購 Chat.com 域名;AI「電子舌頭」問世,可辨別味道、檢測食品安全丨 RTE 開發者日報OpenAI開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- Swarm 框架登場:OpenAI 第 3 階段「敲門磚」;馬斯克的 Teslabot 實際有人遠端操控丨 RTE 開發者日報Swarm框架OpenAI馬斯克開發者日報
- OpenAI 釋出全新生成式模型 GPT-4o;位元組收購音訊裝置公司 Oladance 丨 RTE 開發者日報 Vol.203OpenAI模型GPT音訊開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 促進癌症治療,之江實驗室團隊開發端到端深度學習模型 DeepAEG深度學習模型
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- OpenAI與洛斯阿拉莫斯國家實驗室合作OpenAI
- 騰訊光子工作室群在加州組建新團隊:前暴雪成員加入。
- (內含福利)Meta 釋出新開源模型 Llama 3;華為 Pura 70 系列一分鐘售罄丨 RTE 開發者日報 Vol.188模型開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 谷歌破解 OpenAI 模型關鍵資訊;微軟更改預設瀏覽器,不再主推 Edge 丨 RTE 開發者日報 Vol.163谷歌OpenAI模型微軟瀏覽器開發者日報
- 高通將支援 Meta Llama 3 在驍龍終端執行;特斯拉中國全系車型降價 1.4 萬元丨 RTE 開發者日報 Vol.189開發者日報
- 前拳頭開發者組建新工作室 獲得《英靈神殿》發行商支援
- 位元組預熱智慧硬體 Ola Friend,預計為智慧耳機;鴻蒙 NEXT 公測正式開啟,微信邀請內測丨 RTE 開發者日報鴻蒙開發者日報
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- Doodles數藏NFT元宇宙開發系統技術丨原始碼丨Doodles元宇宙功能元宇宙原始碼
- 史丹佛 AI 團隊被曝抄襲中國大模型開源成果;Zoom 創始人談視訊會議未來丨 RTE 開發者日報 Vol.218AI大模型OOM開發者日報
- 斯嘉麗·約翰遜指控 OpenAI 非法使用其聲音;微軟推出 AI 工具「回顧」(Recall)丨 RTE 開發者日報 Vol.208OpenAI微軟開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨 RTE 開發者日報AI開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨RTE 開發者日報AI開發者日報