Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報

RTE开发者社区發表於2024-07-30

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@JLT,@ 鮑勃

01 有話題的新聞

1、Meta SAM 2 登場:首個能在圖片和影片中實時分割物件的統一開源 AI 模型

Meta AI 宣佈推出新一代的 Segment Anything Model(SAM)2,能夠在影片和影像中實現實時的可提示物件分割。

SAM 2 可以快速、精確地在任何影片或影像中選擇物件。它不僅能在影像中分割物件,還能在影片中追蹤物件,即使這些物件在訓練時從未見過。該模型支援實時互動,非常適合各種實際應用,比如影片編輯和互動式媒體內容製作。

物件分割:它可以在影像或影片中識別出一個特定物件,並將該物件的畫素與背景區分開來。例如,在一張包含多個物體的圖片中,模型可以準確地找出並標記出某一個物體的輪廓。

實時性:模型能夠在影片播放的過程中快速處理每一幀,立即識別並分割、跟蹤出特定物件。這樣可以實現如影片編輯、特效製作等需要快速反饋的應用。

可提示:是模型可以根據使用者提供的提示(如點選某個物體、框選某個區域等)來進行分割。這種互動方式使得使用者可以更精確地控制哪些物件需要被分割。
(@ 小互 AI)

2、英偉達「AI 盒子」升級釋出軟體和服務,黃仁勳打造物理世界的數字副本

快科技 7 月 30 日訊息,在頂尖計算機圖形大會 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、模擬和生成式 AI 領域的最新進展,其中最引人注目的是 NVIDIA NIM 的全新升級。透過這一平臺,使用者可以在幾分鐘內構建 AI 應用,大大簡化了 AI 模型的開發和部署過程。

黃仁勳將 NIM 形容為「AI-in-a-Box」,即盒子裡的人工智慧,這次升級透過標準化 AI 模型的複雜部署,進一步最佳化了效能,使得英偉達在 AI 領域的領導地位更加穩固。

英偉達還宣佈,Hugging Face 推理即服務平臺現在由 Nvidia NIM 提供支援,在雲端執行,進一步擴充套件了 NIM 的應用範圍。

此外,NVIDIA NIM 微服務透過增強 OpenUSD(通用場景描述)語言的理解,使得各行各業都能夠構建基於物理的虛擬世界和數字孿生。(@ 快科技)

3、波形智慧釋出私人語言模型「Weaver 2.0」,聚焦個性化與自適應技術

人工智慧初創公司波形智慧近日正式釋出了新一代多模態無限式長內容生成的個性化自適應私人語言模型「Weaver 2.0」。

據介紹,「Weaver 2.0」在技術上實現了多項最佳化升級,包括千人千面的個性專屬、資料為核的自適應/自進化,以及端雲結合的高效部署。這些特性使得該模型能夠根據使用者的個性化需求和使用習慣進行動態調整,從而提供更加精準、高質量的內容生成服務。

為了實現模型的持續進化和自我最佳化,波形智慧自研了以資料為核心的可「自主進化」的智慧體框架——AIWaves Self-Evolving Agents。這一框架不僅整合了 1.0 版本的可控效能力,還採用 Symbolic Learning 方式,讓 Agent 可以在不斷更新的資料環境中解析自身的效能表現,並根據使用者習慣和反饋定期或主動進行調整。

此外,在隱私保護方面,「Weaver 2.0」採用端雲結合的高效部署方案,可以根據需求在不同環境下打造「本地私鑰」,以確保使用者資料的安全性和隱私性。(@ 環球網科技)

4、蘋果釋出 iPhone AI 首個預覽版:暫時向開發者開放

據外媒報導,蘋果週一釋出了 Apple Intelligence 的第一個版本,這是一套人工智慧功能,可以改進 Siri、自動生成電子郵件和影像並對通知進行排序。這款名為 Apple Intelligence 的新軟體在 iOS 18.1 的開發者測試版中釋出。iPad 和 Mac 也有類似的版本。目前,它只對註冊的 Apple 開發者開放。

此外,使用者更新後必須在 Apple 的設定應用中註冊候補名單才能訪問該服務,這涉及 ping Apple 伺服器以處理更復雜的請求。今年晚些時候,它將向公眾釋出,但 18.1 版本號表明 Apple Intelligence 不會與新 iPhone 硬體一起釋出,預計新 iPhone 硬體將於秋季推出執行 iOS 18 的版本。

Apple Intelligence 是蘋果的一項重要舉措。投資者希望人工智慧與蘋果作業系統的緊密結合能夠在未來幾年引發一波大規模升級,尤其是考慮到該系統僅適用於 iPhone 15 Pro、iPhone 15 Pro Max 及更新版本。(@ 鞭牛士)

5、OpenAI 旗下 AI 搜尋引擎 SearchGPT 官方演示被曝翻車

近期,OpenAI 宣佈旗下 AI 搜尋引擎 SearchGPT 開放內測,但該公司上演了谷歌 Bard 出糗的一幕,SearchGPT 的官方演示被曝出低階錯誤。據外媒,在回答「8 月在北卡羅來納 Boone 舉辦的音樂節」的相關問題時,SearchGPT 出現了幻覺。

報導稱 OpenAI 發言人已承認了這個錯誤,但表示「這僅是初始的原型,我們將不斷改進。」此外,有參與內測的科技外媒還揭開了 SearchGPT 的搜尋機制,與當前 ChatGPT 提供的通用 Bing 搜尋功能不同,SearchGPT 更擅長提供實時資訊。(@ 每日經濟新聞)

02 有態度的觀點

1、多名院士專家談人工智慧:中國發展 AI 不能靠「堆晶片」

多名院士專家在 2024 中國算力發展專家研討會上討論了中國人工智慧發展問題。他們認為,中國 AI 發展不能簡單模仿美國「堆晶片」模式,而應結合國情,發展具有自主智慧財產權的「主權級大模型」。專家們提出,智慧計算應參考人類智慧,從基礎理論突破,實現低能耗高智慧的計算模式。同時,應重視大模型的算力需求,利用中國在超算領域的技術積累,研發專用超算,克服算力瓶頸。(@ 環球網)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章