WWDC 蘋果釋出 AI 全家桶;三星宣佈「實時翻譯」將相容第三方 App 丨 RTE 開發者日報 Vol.222

RTE开发者社区發表於2024-06-11

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@CY@JLT,@ 鮑勃

01 有話題的新聞

1、蘋果 Apple Intelligence 登場:提智 Siri,幫你管理通知等

6 月 11 日訊息,蘋果公司在今天召開的 2024 年度 WWDC 全球開發者大會上,正式宣佈「蘋果智慧」(Apple Intelligence),將會為 iPhone、Mac 等裝置提供一系列 AI 功能。

  • 幫你操作應用

蘋果公司表示,其人工智慧功能將能在應用程式中為你做一些事情。它將能夠管理你的通知,自動為你寫東西,或總結郵件和其他應用程式中的文字。

蘋果還表示,它還能做一些事情,比如引用一個應用程式來執行另一個應用程式中的操作,比如讓 Apple Intelligence 播放你女友發給你的播客。

  • Siri 變得更加智慧

蘋果公司表示,在 iOS 18 中,使用者將能更自然地與 Siri 對話。新 Siri 可以理解上下文,因此你在隨後的請求中不必重複資訊。

App Intents 可以讓 Siri 與第一方、第三方應用程式深度合作,在螢幕上感知你當前正在檢視的內容,並能採取應用內操作。蘋果演示了讓照片應用編輯你正在檢視的圖片,Siri 會代表你執行調整。

  • 隱私

該公司表示,其人工智慧功能將在裝置上處理,以保證資訊的私密性。不過,你需要 A17 Pro 或 M 系列晶片才能利用這些功能。此外,「語義索引」(semantic index)也是其中的一部分,它會在需要時獲取個人資訊,並在各個應用程式中顯示出來。

對於需要呼叫雲端的 AI 功能,蘋果公司表示會使用「私有云」的,資料永遠不會儲存在伺服器上,蘋果公司也表示永遠無法訪問這些資料。該公司表示,將邀請獨立專家來驗證蘋果的說法是否屬實。(@IT 之家)

2、OpenAI 對 AI 語音引擎非常謹慎:可能永遠不會被廣泛使用

6 月 10 日訊息,據外媒報導,幾個月內,OpenAI 第二次解釋其文字轉音訊工具,提醒大家該工具尚未廣泛使用,也可能永遠不會被廣泛使用。該公司週五在其網站上發表的宣告中表示:無論我們最終是否會廣泛部署這項技術,讓世界各地的人們瞭解其發展方向都很重要。這就是為什麼我們要解釋該模型的工作原理、我們如何將其用於研究和教育,以及我們如何圍繞它實施安全措施。

去年年底,OpenAI 與公司外部的一小群使用者分享了其語音引擎,該引擎依靠文字輸入和 15 秒的人類聲音片段來生成聽起來與原始說話者非常相似的自然語音。該工具可以用多種語言建立聽起來令人信服的人類聲音。當時,該公司表示,它選擇預覽該技術但不會廣泛釋出,以增強社會韌性,以抵禦越來越令人信服的生成模型的威脅。(@ 鞭牛士)

3、本地 AI 執行、支援簡中,三星宣佈「實時翻譯」將相容第三方 App

三星公司近日釋出新聞稿,最新 Galaxy AI 套件中實時翻譯(Live Translate)功能將相容第三方應用程式,意味著使用者可以在喜歡的應用中使用基於 AI 的翻譯功能了。

實時翻譯功能向第三方應用開放,無論是對於普通使用者,還是專業使用者來說都是好事,可以讓使用者更好地和外國朋友或商業夥伴保持聯絡,消除語言障礙。

三星尚未透露有關支援應用程式的更多具體細節。實時翻譯功能不需要藉助雲服務,完全在本地裝置上執行,因此使用者始終掌控自己共享的資料。(@IT 之家)

4、EOS R7 + 雙攝相機鏡頭可拍 3D 影片,蘋果佳能合作共建「空間影片」生態

IT 之家 6 月 11 日訊息,在目前正在進行的蘋果 WWDC 2024 中,蘋果公司宣佈與佳能合作,將推出能拍攝 Apple 空間影片格式的「全新空間鏡頭」,該鏡頭為「RF-S 7.8mm F4 STM」,號稱搭配佳能 EOS R7 相機效果更佳。

IT 之家獲悉,佳能此前已經推出 RF5.2mm F2.8 L DUAL FISHEYE 魚眼鏡頭,這款鏡頭國行售價 14399 元,主要用於拍攝 VR 影片,不過目前不得而知該鏡頭是否相容相關空間影片模式。(@IT 之家)

02 有態度的觀點

1、傅盛評阿里雲「最強開源模型」:長遠看來,開源大模型能力會超越閉源

近日,阿里雲釋出開源模型 Qwen2-72B。據介紹,該模型效能超過美國最強的開源模型 Llama3-70B,也超過眾多國內閉源大模型。對此,獵豹移動董事長兼 CEO、獵戶星空董事長傅盛發影片表示,正當國內某大廠 CEO 說閉源模型的能力將持續超越開源模型時,阿里巴巴剛釋出的 Qwen2-72B 開源模型能力已經超越了國內絕大多數閉源模型。

「我們之前一直認為開源大模型和閉源大模型會並駕齊驅,而且長遠看來,我認為開源社群的大模型能力會超越閉源,這背後的原因就是開源並不是簡單的做雷鋒,而是結合自己的商業模式,結合能夠形成社群的反饋能力的一套戰略部署。」(@ 新浪科技)

2、Pika 團隊:打敗 Sora 不難,我們的演算法能夠以小勝大

即使 Sora 已經強勢「炸」過場,Pika 還是再次帶著矽谷一眾明星資方的投票回到了輿論中心。6 月 5 日,Pika 宣佈已完成 8000 萬美元(約合人民幣 5.8 億元)的 B 輪融資,總融資額達到 1.35 億美元,較 2023 年末,公司投後估值實現翻倍至 4.7 億美元。

「我們會更 aggressive 地做影片大模型」,這家剛剛度過一週年生日的影片生成創業公司,計劃在這輪融資之後快速擴張研究和工程師團隊。(@ 機器之心)

3、馬斯克怒噴蘋果與 OpenAI 的合作:考慮禁止蘋果裝置進入我的公司

蘋果宣佈與 OpenAI 合作,將 GPT-4o 功能整合到蘋果裝置中。對此,馬斯克表示強烈不滿,認為這將構成安全風險,考慮禁止蘋果裝置進入他的公司,並要求使用蘋果裝置的人員在入口處接受檢查,存放裝置於法拉第籠中。

他還批評蘋果無法自主開發 AI,卻聲稱能確保 OpenAI 保護使用者安全和隱私,認為這是出賣使用者的行為。(@ 騰訊科技)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章