史丹佛 AI 團隊被曝抄襲中國大模型開源成果;Zoom 創始人談視訊會議未來丨 RTE 開發者日報 Vol.218
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
01 有話題的新聞
1、史丹佛 AI 團隊被曝抄襲中國大模型開源成果,作者火速刪庫,創始人回應:也算國際認可
據鈦媒體報導,美國史丹佛大學某 AI 團隊在近期釋出了一個名為 Llama3V 的 SOTA 開源多模態模型,號稱效果比肩 GPT-4V、Gemini Ultra、Claude Opus,尺寸比 GPT4-V 小 100 倍,但訓練成本僅需 500 美元。
有網友質疑,該模型抄襲、套殼清華系 AI 公司面壁智慧於 5 月中旬釋出的 8B 多模態小模型 MiniCPM-Llama3-V 2.5。面對質疑,Llama3V 團隊稱,他們只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer(分詞器),並宣稱在 MiniCPM-Llama3-V 2.5 釋出前就開始了這項工作。
而面壁智慧團隊測試發現,Llama3-V 大模型能識別清華簡,其訓練資料的採集和標註均由清華 NLP 實驗室和麵壁智慧團隊完成,相關資料尚未對外公開。而 Llama3-V 在識別清華簡的文字時,結果和 MiniCPM-Llama3-V 2.5 不僅在正確的地方一模一樣,在犯錯的地方也雷同。
隨後,該史丹佛團隊成員刪除他們在 X 上官宣模型的推文,並將該專案在 Github 和 HuggingFace 上的庫一併刪除。
而面壁智慧聯合創始人兼 CEO 李大海朋友圈也對此事做出回應,感慨這是一種「受到國際團隊認可的方式」。同時他也呼籲大家共建開放、合作、有信任的社群環境,一起加油合作。(@ 愛範兒)
2、蘋果發出 WWDC24 影片直播邀請:6 月 11 日凌晨 1 點見
6 月 4 日訊息,蘋果最新透過官方公眾號向大家釋出了 WWDC24 邀請,將於北京時間 6 月 11 日凌晨 1 點正式開始,號稱「猛料載入中」。
據瞭解,本次大會蘋果將釋出新一代 iOS 18、iPadOS 18、macOS 15、tvOS 18 以及 watchOS 11、visionOS 2 作業系統。其中,最受消費者關注的還是 iOS 18。爆料稱,iOS 18 可能會加入生成式 AI 技術,成為蘋果史上升級幅度最大的版本之一。
根據傳聞,iOS 18 中的 Siri 會帶來大幅提升,能夠幫助使用者完成更多操作,並且主動提供幫助,此外還能完成一些創作任務。需要注意的是,國內的 AI 服務可能會接入百度文心一言來實現。
知名科技記者 Mark Gurman 曾表示,蘋果內部將 iOS 18 視為有史以來最重要的升級。根據 MacRumors 曝光的升級機型名單,iOS 18 將支援 24 款機型升級,與 iOS 17 保持一致。
iPhone 15 系列、iPhone 14 系列、iPhone 13 系列、iPhone 12 系列、iPhone 11 系列、iPhone XS、iPhone XS Max、iPhone XR 以及 iPhone SE 2 和 iPhone SE 3 等裝置會支援 iOS 18。(@ 快科技)
3、特斯拉回應單踏板模式被禁傳言:不影響現有的產品和功能
近期,工信部就一項強制性國家標準《乘用車制動系統技術要求及實驗方法》公開徵求意見。意見中對單踏板提出了具體要求,也就是「在前進擋下透過鬆開加速踏板實現的制動作用不能使車輛減速至停車」。對此,市場上有聲音認為,特斯拉單踏板模式或許將被禁止。
此外,海外一家專注特斯拉的媒體「Tesla Newswire」日前發文爆料稱,單踏板「保持」模式將於 2026 年在中國不再可用。對於近期市場上關於特斯拉單踏板模式或被禁止的傳言,特斯拉方面向媒體回應稱:這項標準目前尚未正式釋出和實施,不影響現有的產品和功能。(@CSDN)
4、火狐 Firefox 130 瀏覽器新特性:本地模型自動生成圖片 Alt 文字
6 月 4 日訊息,Mozilla 公司於 5 月 31 日釋出博文,計劃在火狐 Firefox 130 瀏覽器中測試引入新的功能,使用完全私有、本地執行的 AI 模型自動生成圖片的 Alt 文字內容。
Alt 文字,也叫 Alt 標籤或 Alt 屬性,指的是附加在影像上用來描述影像所顯示內容的文字。此文字嵌入在網站的程式碼中,通常可以透過將游標懸停在影像上檢視。
Mozilla 公司正嘗試使用基於 Transformer 的多個機器學習模型來描述圖片,這些模型非常 “小而優”,可以在資源有限的裝置上執行。
這些模型雖然無法叫板 GPT-4 Turbo 或 LLaVA,不過其準確性足以在各種硬體裝置上提供有價值的見解。(@IT 之家)
02 有態度的觀點
1、安全專家稱微軟 Copilot + 新功能「回顧」存嚴重安全隱患,資料可被遠端竊取
IT 之家 6 月 4 日訊息,微軟最近釋出的 Copilot+ 引發熱議,其中一項名為「回顧」(Recall)的 AI 功能更是備受關注。該功能可以自動擷取使用者電腦螢幕並加以記錄,使使用者能夠像查詢記憶一樣回顧過去的操作。
然而,一些使用者擔心這項功能的安全性。使用者擔心駭客一旦入侵,就能夠輕而易舉地獲取這些記錄,暴露使用者過去數月的隱私資訊。對此,微軟堅稱所有資料都經過加密處理,但一位網路安全專家卻發現了未加密的日誌檔案,並表示駭客可以遠端訪問這些資訊。
IT 之家注意到,網路安全專家凱文・博蒙特(Kevin Beaumont)在社交平臺上指出,經過調查,他發現「回顧」功能的日誌系統僅僅是一個 SQLite 資料庫,並稱該功能的存在「讓網路安全倒退十年」。他建議使用者在 Copilot+ 上線後立即禁用「回顧」功能,以防止資料洩露。(@IT 之家)
2、Zoom 創始人談視訊會議未來:數字人「代勞」參會,本人可抽出時間陪伴家人
IT 之家 6 月 3 日訊息,視訊會議平臺 Zoom 創始人袁徵(Eric Yuan)日前接受外媒 The Verge 採訪,談到了視訊會議這一新興會議形式的未來發展。
袁徵先前在思科工作,後續創辦了 Zoom,並意識到有機會使視訊會議更加簡單易用。而在當下,袁徵希望 Zoom「不僅僅」是一個視訊會議平臺,而是在企業軟體領域與微軟、谷歌一較高下,力圖把文件、郵件和其他生產力工具做得像「聊天平臺」一樣。
現如今各行各業都在擁抱 AI,Zoom 也不例外,並在 AI 領域投入了巨資。袁徵表示,AI 在工作中的一大好處,就是所有人都能創造一個「數字孿生」—— 其本質上是本人的一個「深偽」化身。這個「數字孿生」可以代表使用者去參加 Zoom 視訊會議,甚至在使用者自己把時間花在更重要的事情(例如陪伴家人)時,代替自己做出決策。
袁徵進一步補充說,實現這一目標的前提是使用者可以控制所有的數字孿生。某些情況下,使用者的多個數字孿生會根據訓練的內容而展現出不同的特徵。例如,一個數字孿生更像銷售專家、另一個數字孿生更像資深工程師。「這就是人工智慧充滿不確定性的原因,但在現實中,它一定會實現。」
據 IT 之家此前報導,Zoom 去年已經在服務條款中明確,在未經使用者許可的情況下,不會利用使用者的資料,來培訓生成式 AI。(@IT 之家)
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- 開發者實踐丨Agora Home AI 音視訊的未來GoAI
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 釋出會後蘋果股價創歷史新高;商湯 Embedding 模型拿下 SOTA 丨 RTE 開發者日報 Vol.223蘋果模型開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 《阿凡達》導演卡梅隆加入 Stability AI 董事會;Molmo 橫空出世,開源多模態模型王座易位丨 RTE 開發者日報AI模型開發者日報
- 馬斯克突擊訪華;谷歌 Python 基礎團隊全數被裁;丨 RTE 開發者日報 Vol.195馬斯克谷歌Python開發者日報
- 史丹佛爆火Llama3-V竟抄襲國內開源專案,作者火速刪庫
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- 2018 中國短視訊開發者創意大賽震撼來襲,萬元現金大獎邀你來戰!
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 2024智源大會議程公開丨生成模型模型
- 百度釋出 AI 眼鏡:全球首搭中文大模型,支援邊走邊問;OpenAI 聯合創始人宣佈迴歸,主抓重大技術創新丨 RTE 開發者日報大模型OpenAI開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- YouTube 上線「用相機拍攝」標籤為真實影片「驗明正身」;美國被曝考慮限制向中東國家出口 AI 晶片丨 RTE 開發者日報AI晶片開發者日報
- 2024智源大會議程公開丨大語言模型模型
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- 活動報名:Voice Agent 開發者分享會丨 RTE Meetup
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- Amphion 推出開源 TTS 模型 MaskGCT,5 秒克隆聲音;神秘文生圖模型「小熊貓」登頂競技場丨 RTE 開發者日報TTS模型GC開發者日報
- 華為否認大模型演示造假;美國億萬富翁宣佈競購 TikTok 丨 RTE 開發者日報 Vol.206大模型開發者日報
- Fish Agent:多語言 Voice-to-Voice 開源語音模型;Runway 推出攝像機運鏡功能丨 RTE 開發者日報模型開發者日報
- 離開育碧,放置手遊《採礦大亨》開發團隊創始人再創業創業
- 11Labs 支援打造對話 AI 智慧體;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 開發者日報AI智慧體阿里大模型開發者日報
- 議題徵集|MTSC2024 中國網際網路測試開發大會開始徵集議題,快來報名!
- Facebook開發者大會4月18日舉行,今天開始報名
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- 活動報名丨實時互動 AI 開發者年度聚會!RTE Open Day@RTE2024,10.25/26 北京AI
- CosyVoice 2.0 支援雙向流式語音合成;無問芯穹開源全模態理解端側模型丨 RTE 開發者日報模型開發者日報
- 4.22北京 | 第二屆開源雲原生開發者日重磅來襲
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- OpenAI 再發 Sora 新短片,傳 Sora 兩週內推出;李飛飛團隊出品空間智慧版 ImageNet 丨 RTE 開發者日報OpenAISora開發者日報
- Vision Pro 5 月將在中國區發售;全球科技大廠 1 月已裁員 32000 人丨RTE 開發者日報 Vol.145開發者日報