Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@JLT,@ 鮑勃
01 有話題的新聞
1、Meta SAM 2 登場:首個能在圖片和影片中實時分割物件的統一開源 AI 模型
Meta AI 宣佈推出新一代的 Segment Anything Model(SAM)2,能夠在影片和影像中實現實時的可提示物件分割。
SAM 2 可以快速、精確地在任何影片或影像中選擇物件。它不僅能在影像中分割物件,還能在影片中追蹤物件,即使這些物件在訓練時從未見過。該模型支援實時互動,非常適合各種實際應用,比如影片編輯和互動式媒體內容製作。
物件分割:它可以在影像或影片中識別出一個特定物件,並將該物件的畫素與背景區分開來。例如,在一張包含多個物體的圖片中,模型可以準確地找出並標記出某一個物體的輪廓。
實時性:模型能夠在影片播放的過程中快速處理每一幀,立即識別並分割、跟蹤出特定物件。這樣可以實現如影片編輯、特效製作等需要快速反饋的應用。
可提示:是模型可以根據使用者提供的提示(如點選某個物體、框選某個區域等)來進行分割。這種互動方式使得使用者可以更精確地控制哪些物件需要被分割。
(@ 小互 AI)
2、英偉達「AI 盒子」升級釋出軟體和服務,黃仁勳打造物理世界的數字副本
快科技 7 月 30 日訊息,在頂尖計算機圖形大會 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、模擬和生成式 AI 領域的最新進展,其中最引人注目的是 NVIDIA NIM 的全新升級。透過這一平臺,使用者可以在幾分鐘內構建 AI 應用,大大簡化了 AI 模型的開發和部署過程。
黃仁勳將 NIM 形容為「AI-in-a-Box」,即盒子裡的人工智慧,這次升級透過標準化 AI 模型的複雜部署,進一步最佳化了效能,使得英偉達在 AI 領域的領導地位更加穩固。
英偉達還宣佈,Hugging Face 推理即服務平臺現在由 Nvidia NIM 提供支援,在雲端執行,進一步擴充套件了 NIM 的應用範圍。
此外,NVIDIA NIM 微服務透過增強 OpenUSD(通用場景描述)語言的理解,使得各行各業都能夠構建基於物理的虛擬世界和數字孿生。(@ 快科技)
3、波形智慧釋出私人語言模型「Weaver 2.0」,聚焦個性化與自適應技術
人工智慧初創公司波形智慧近日正式釋出了新一代多模態無限式長內容生成的個性化自適應私人語言模型「Weaver 2.0」。
據介紹,「Weaver 2.0」在技術上實現了多項最佳化升級,包括千人千面的個性專屬、資料為核的自適應/自進化,以及端雲結合的高效部署。這些特性使得該模型能夠根據使用者的個性化需求和使用習慣進行動態調整,從而提供更加精準、高質量的內容生成服務。
為了實現模型的持續進化和自我最佳化,波形智慧自研了以資料為核心的可「自主進化」的智慧體框架——AIWaves Self-Evolving Agents。這一框架不僅整合了 1.0 版本的可控效能力,還採用 Symbolic Learning 方式,讓 Agent 可以在不斷更新的資料環境中解析自身的效能表現,並根據使用者習慣和反饋定期或主動進行調整。
此外,在隱私保護方面,「Weaver 2.0」採用端雲結合的高效部署方案,可以根據需求在不同環境下打造「本地私鑰」,以確保使用者資料的安全性和隱私性。(@ 環球網科技)
4、蘋果釋出 iPhone AI 首個預覽版:暫時向開發者開放
據外媒報導,蘋果週一釋出了 Apple Intelligence 的第一個版本,這是一套人工智慧功能,可以改進 Siri、自動生成電子郵件和影像並對通知進行排序。這款名為 Apple Intelligence 的新軟體在 iOS 18.1 的開發者測試版中釋出。iPad 和 Mac 也有類似的版本。目前,它只對註冊的 Apple 開發者開放。
此外,使用者更新後必須在 Apple 的設定應用中註冊候補名單才能訪問該服務,這涉及 ping Apple 伺服器以處理更復雜的請求。今年晚些時候,它將向公眾釋出,但 18.1 版本號表明 Apple Intelligence 不會與新 iPhone 硬體一起釋出,預計新 iPhone 硬體將於秋季推出執行 iOS 18 的版本。
Apple Intelligence 是蘋果的一項重要舉措。投資者希望人工智慧與蘋果作業系統的緊密結合能夠在未來幾年引發一波大規模升級,尤其是考慮到該系統僅適用於 iPhone 15 Pro、iPhone 15 Pro Max 及更新版本。(@ 鞭牛士)
5、OpenAI 旗下 AI 搜尋引擎 SearchGPT 官方演示被曝翻車
近期,OpenAI 宣佈旗下 AI 搜尋引擎 SearchGPT 開放內測,但該公司上演了谷歌 Bard 出糗的一幕,SearchGPT 的官方演示被曝出低階錯誤。據外媒,在回答「8 月在北卡羅來納 Boone 舉辦的音樂節」的相關問題時,SearchGPT 出現了幻覺。
報導稱 OpenAI 發言人已承認了這個錯誤,但表示「這僅是初始的原型,我們將不斷改進。」此外,有參與內測的科技外媒還揭開了 SearchGPT 的搜尋機制,與當前 ChatGPT 提供的通用 Bing 搜尋功能不同,SearchGPT 更擅長提供實時資訊。(@ 每日經濟新聞)
02 有態度的觀點
1、多名院士專家談人工智慧:中國發展 AI 不能靠「堆晶片」
多名院士專家在 2024 中國算力發展專家研討會上討論了中國人工智慧發展問題。他們認為,中國 AI 發展不能簡單模仿美國「堆晶片」模式,而應結合國情,發展具有自主智慧財產權的「主權級大模型」。專家們提出,智慧計算應參考人類智慧,從基礎理論突破,實現低能耗高智慧的計算模式。同時,應重視大模型的算力需求,利用中國在超算領域的技術積累,研發專用超算,克服算力瓶頸。(@ 環球網)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- OpenAI 釋出 AI 生成圖片檢測器;特斯拉計劃在中國測試自動駕駛計程車丨 RTE 開發者日報 Vol.200OpenAI自動駕駛開發者日報
- ElevenLabs Voice Design :可透過文字建立個性化語音;蘋果推出首個開發者測試版丨 RTE 開發者日報蘋果開發者日報
- Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報OpenAI開發者日報
- 蘋果釋出 macOS11.0 Big Sur 首個開發者測試版蘋果Mac
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- Mistral 釋出 Large 2 123B 大模型;微軟釋出 VALL-E 2,零樣本實現聲音克隆丨 RTE 開發者日報大模型微軟開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- OpenAI 收購桌面實時協作公司 Multi;iOS 18 開放 iPhone 映象測試丨 RTE 開發者日報 Vol.231OpenAIiOSiPhone開發者日報
- SpaceX 星艦週四晚八點再試飛;Backseat AI 釋出《英雄聯盟》實時輔導工具丨 RTE 開發者日報 Vol.219AI開發者日報
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- 谷歌釋出世界模型,能生成可互動虛擬世界;華為釋出全球首個 5.5G 智慧核心網丨 RTE 開發者日報 Vol.152谷歌世界模型虛擬世界開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- (內含福利)Meta 釋出新開源模型 Llama 3;華為 Pura 70 系列一分鐘售罄丨 RTE 開發者日報 Vol.188模型開發者日報
- 蘋果歷時 13 年最終勝訴;谷歌釋出 Gemma 大模型;華為首超蘋果成中國平板市場第一丨 RTE 開發者日報 Vol.149蘋果谷歌Gemma大模型開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- 沒有方向盤和踏板,特斯拉釋出無人駕駛計程車;位元組豆包推出 AI 智慧體耳機 Ola Friend 丨 RTE 開發者日報AI智慧體開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- 平價 Vision Pro 需搭配 Mac/iPhone;OpenAI 收購實時分析資料庫公司丨 RTE 開發者日報MaciPhoneOpenAI資料庫開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 創紀錄:英偉達市值一日增 2770 億美元;Xiaomi 14 Ultra 正式釋出丨 RTE 開發者日報 Vol.150開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- WWDC 蘋果釋出 AI 全家桶;三星宣佈「實時翻譯」將相容第三方 App 丨 RTE 開發者日報 Vol.222蘋果AIAPP開發者日報
- GTC 2024 開幕,英偉達釋出新一代 GPU 架構;Apple ID 或將淘汰丨 RTE 開發者日報 Vol.168GPU架構APP開發者日報
- iPhone 7、Apple Watch 2釋出時間首曝光iPhoneAPP
- 英偉達市值超越蘋果;ChatGPT、Perplexity、Claude 同時大崩潰丨 RTE 開發者日報 Vol.220蘋果ChatGPT開發者日報
- 活動報名丨實時互動 AI 開發者年度聚會!RTE Open Day@RTE2024,10.25/26 北京AI
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 前 OpenAI 首席科學家建「安全超級智慧」實驗室;Meta 重組元宇宙團隊丨 RTE 開發者日報 Vol.228OpenAI元宇宙開發者日報
- 微軟釋出測試版安全API 正式版尚需時日微軟API
- 釋出會後蘋果股價創歷史新高;商湯 Embedding 模型拿下 SOTA 丨 RTE 開發者日報 Vol.223蘋果模型開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 特斯拉宣佈 10% 大裁員;劉強東數字人開啟直播首秀丨 RTE 開發者日報 Vol.185開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- RTE 領域近期詞雲統計釋出;谷歌開始新一輪「瘦身」計劃;使用ChatGPT之後智力提高 50%丨RTE開發者日報 Vol.50谷歌ChatGPT開發者日報
- Mini-Omni:具有實時對話能力的多模態模型;狨猴會用名字稱呼彼此 丨 RTE 開發者日報模型開發者日報