史丹佛 AI 團隊被曝抄襲中國大模型開源成果;Zoom 創始人談視訊會議未來丨 RTE 開發者日報 Vol.218

RTE开发者社区發表於2024-06-04

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@CY@JLT,@ 鮑勃

01 有話題的新聞

1、史丹佛 AI 團隊被曝抄襲中國大模型開源成果,作者火速刪庫,創始人回應:也算國際認可

據鈦媒體報導,美國史丹佛大學某 AI 團隊在近期釋出了一個名為 Llama3V 的 SOTA 開源多模態模型,號稱效果比肩 GPT-4V、Gemini Ultra、Claude Opus,尺寸比 GPT4-V 小 100 倍,但訓練成本僅需 500 美元。

有網友質疑,該模型抄襲、套殼清華系 AI 公司面壁智慧於 5 月中旬釋出的 8B 多模態小模型 MiniCPM-Llama3-V 2.5。面對質疑,Llama3V 團隊稱,他們只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer(分詞器),並宣稱在 MiniCPM-Llama3-V 2.5 釋出前就開始了這項工作。

而面壁智慧團隊測試發現,Llama3-V 大模型能識別清華簡,其訓練資料的採集和標註均由清華 NLP 實驗室和麵壁智慧團隊完成,相關資料尚未對外公開。而 Llama3-V 在識別清華簡的文字時,結果和 MiniCPM-Llama3-V 2.5 不僅在正確的地方一模一樣,在犯錯的地方也雷同。

隨後,該史丹佛團隊成員刪除他們在 X 上官宣模型的推文,並將該專案在 Github 和 HuggingFace 上的庫一併刪除。

而面壁智慧聯合創始人兼 CEO 李大海朋友圈也對此事做出回應,感慨這是一種「受到國際團隊認可的方式」。同時他也呼籲大家共建開放、合作、有信任的社群環境,一起加油合作。(@ 愛範兒)

2、蘋果發出 WWDC24 影片直播邀請:6 月 11 日凌晨 1 點見

6 月 4 日訊息,蘋果最新透過官方公眾號向大家釋出了 WWDC24 邀請,將於北京時間 6 月 11 日凌晨 1 點正式開始,號稱「猛料載入中」。

據瞭解,本次大會蘋果將釋出新一代 iOS 18、iPadOS 18、macOS 15、tvOS 18 以及 watchOS 11、visionOS 2 作業系統。其中,最受消費者關注的還是 iOS 18。爆料稱,iOS 18 可能會加入生成式 AI 技術,成為蘋果史上升級幅度最大的版本之一。

根據傳聞,iOS 18 中的 Siri 會帶來大幅提升,能夠幫助使用者完成更多操作,並且主動提供幫助,此外還能完成一些創作任務。需要注意的是,國內的 AI 服務可能會接入百度文心一言來實現。

知名科技記者 Mark Gurman 曾表示,蘋果內部將 iOS 18 視為有史以來最重要的升級。根據 MacRumors 曝光的升級機型名單,iOS 18 將支援 24 款機型升級,與 iOS 17 保持一致。

iPhone 15 系列、iPhone 14 系列、iPhone 13 系列、iPhone 12 系列、iPhone 11 系列、iPhone XS、iPhone XS Max、iPhone XR 以及 iPhone SE 2 和 iPhone SE 3 等裝置會支援 iOS 18。(@ 快科技)

3、特斯拉回應單踏板模式被禁傳言:不影響現有的產品和功能

近期,工信部就一項強制性國家標準《乘用車制動系統技術要求及實驗方法》公開徵求意見。意見中對單踏板提出了具體要求,也就是「在前進擋下透過鬆開加速踏板實現的制動作用不能使車輛減速至停車」。對此,市場上有聲音認為,特斯拉單踏板模式或許將被禁止。

此外,海外一家專注特斯拉的媒體「Tesla Newswire」日前發文爆料稱,單踏板「保持」模式將於 2026 年在中國不再可用。對於近期市場上關於特斯拉單踏板模式或被禁止的傳言,特斯拉方面向媒體回應稱:這項標準目前尚未正式釋出和實施,不影響現有的產品和功能。(@CSDN)

4、火狐 Firefox 130 瀏覽器新特性:本地模型自動生成圖片 Alt 文字

6 月 4 日訊息,Mozilla 公司於 5 月 31 日釋出博文,計劃在火狐 Firefox 130 瀏覽器中測試引入新的功能,使用完全私有、本地執行的 AI 模型自動生成圖片的 Alt 文字內容。

Alt 文字,也叫 Alt 標籤或 Alt 屬性,指的是附加在影像上用來描述影像所顯示內容的文字。此文字嵌入在網站的程式碼中,通常可以透過將游標懸停在影像上檢視。
Mozilla 公司正嘗試使用基於 Transformer 的多個機器學習模型來描述圖片,這些模型非常 “小而優”,可以在資源有限的裝置上執行。

這些模型雖然無法叫板 GPT-4 Turbo 或 LLaVA,不過其準確性足以在各種硬體裝置上提供有價值的見解。(@IT 之家)

02 有態度的觀點

1、安全專家稱微軟 Copilot + 新功能「回顧」存嚴重安全隱患,資料可被遠端竊取

IT 之家 6 月 4 日訊息,微軟最近釋出的 Copilot+ 引發熱議,其中一項名為「回顧」(Recall)的 AI 功能更是備受關注。該功能可以自動擷取使用者電腦螢幕並加以記錄,使使用者能夠像查詢記憶一樣回顧過去的操作。

然而,一些使用者擔心這項功能的安全性。使用者擔心駭客一旦入侵,就能夠輕而易舉地獲取這些記錄,暴露使用者過去數月的隱私資訊。對此,微軟堅稱所有資料都經過加密處理,但一位網路安全專家卻發現了未加密的日誌檔案,並表示駭客可以遠端訪問這些資訊。

IT 之家注意到,網路安全專家凱文・博蒙特(Kevin Beaumont)在社交平臺上指出,經過調查,他發現「回顧」功能的日誌系統僅僅是一個 SQLite 資料庫,並稱該功能的存在「讓網路安全倒退十年」。他建議使用者在 Copilot+ 上線後立即禁用「回顧」功能,以防止資料洩露。(@IT 之家)

2、Zoom 創始人談視訊會議未來:數字人「代勞」參會,本人可抽出時間陪伴家人

IT 之家 6 月 3 日訊息,視訊會議平臺 Zoom 創始人袁徵(Eric Yuan)日前接受外媒 The Verge 採訪,談到了視訊會議這一新興會議形式的未來發展。

袁徵先前在思科工作,後續創辦了 Zoom,並意識到有機會使視訊會議更加簡單易用。而在當下,袁徵希望 Zoom「不僅僅」是一個視訊會議平臺,而是在企業軟體領域與微軟、谷歌一較高下,力圖把文件、郵件和其他生產力工具做得像「聊天平臺」一樣。

現如今各行各業都在擁抱 AI,Zoom 也不例外,並在 AI 領域投入了巨資。袁徵表示,AI 在工作中的一大好處,就是所有人都能創造一個「數字孿生」—— 其本質上是本人的一個「深偽」化身。這個「數字孿生」可以代表使用者去參加 Zoom 視訊會議,甚至在使用者自己把時間花在更重要的事情(例如陪伴家人)時,代替自己做出決策。

袁徵進一步補充說,實現這一目標的前提是使用者可以控制所有的數字孿生。某些情況下,使用者的多個數字孿生會根據訓練的內容而展現出不同的特徵。例如,一個數字孿生更像銷售專家、另一個數字孿生更像資深工程師。「這就是人工智慧充滿不確定性的原因,但在現實中,它一定會實現。」

據 IT 之家此前報導,Zoom 去年已經在服務條款中明確,在未經使用者許可的情況下,不會利用使用者的資料,來培訓生成式 AI。(@IT 之家)

寫在最後:

我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章