OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@JLT,@ 鮑勃
01 有話題的新聞
1、代號「草莓」,OpenAI 被曝研發新專案:將 AI 推理能力提至新高度
路透社釋出報導,稱 OpenAI 公司正在研發代號為「草莓」的全新專案,進一步延伸去年 11 月宣佈的 Q* 專案,不斷提高 AI 推理能力,讓其更接近人類的智力。該媒體報導稱,「草莓」專案會自主、高效地掃描網際網路,並可靠地執行 OpenAI 所描述的「深度研究」,讓其能夠大規模解決更復雜的現實世界問題。
一位內部知情人士透露:「我們希望我們的人工智慧模型能夠像我們一樣看待和理解這個世界。不斷研究新的人工智慧能力也成為業界共識,我們都相信,這些系統的推理能力會隨著時間的推移而不斷提高」。
「草莓」專案的目標是在現有 AI 模型基礎上進行更廣泛的「post-training」分析,實現更接近於人類的反應。「草莓」專案目前仍在開發階段,尚不清楚距離正式釋出還有多長距離。報導稱「草莓」專案的工作原理,即便是在 OpenAI 內部也嚴格保密,沒有太多人瞭解其細節。
一些業內人士認為該專案是一項技術突破,可以開發出「更強大的人工智慧模型」。(@IT 之家)
2、Amazon 推出 Rufus AI 購物助手
在經過了五個月的測試後,Amazon 面向所有美國客戶推出了 AI 購物助手 Rufus。
Amazon 介紹,透過點選 Amazon App 的相關圖示,購物者可以調出一個文字聊天介面,並可以向 Rufus 提出一系列問題,例如識別某些產品的型號,詢問某些商品的詳細細節,比較不同的商品和獲取訂單更新。
除了網購方面的更新,Rufus 還能實現類似 ChatGPT 等聊天機器人的功能,例如生成名人傳記、旅遊建議或者寫一篇短篇小說。(@ 愛範兒)
3、智譜 AI 開源影片理解模型 CogVLM2-Video,可回答時間相關問題
智譜 AI 宣佈,訓練了一種新的影片理解模型 CogVLM2-Video,並將其開源。
據介紹,當前大多數的影片理解模型使用幀平均和影片標記壓縮方法,導致時間資訊的丟失,無法準確回答與時間相關的問題。一些專注於時間問答資料集的模型過於侷限於特定格式和適用領域,使得模型失去了更廣泛的問答能力。
智譜 AI 提出了一種基於視覺模型的自動時間定位資料構建方法,生成了 3 萬條與時間相關的影片問答資料。基於這個新資料集和現有的開放領域問答資料,引入了多幀影片影像和時間戳作為編碼器輸入,訓練出 CogVLM2-Video 模型。
智譜 AI 表示,CogVLM2-Video 不僅在公共影片理解基準上達到了最新的效能,還在影片字幕生成和時間定位方面表現出色。(@IT 之家)
4、OpenAI 被舉報限制員工報告 AI 風險
據報導,有人向美國證券交易委員會舉報,OpenAI 非法禁止員工向監管機構報告其技術可能對人類構成的嚴重風險,舉報人要求對 OpenAI 進行調查。
舉報人表示,OpenAI 向其員工發出了過於嚴格的僱傭、遣散費和保密協議,協議表示「未豁免向美國證券交易委員會披露證券的違規行為」,並要求員工在向有關部門披露機密資訊前獲得公司的同意,這可能會導致向監管機構報告 OpenAI 潛在問題的員工受到處罰。
OpenAI 的發言人表示,他們的舉報人政策保護員工進行受保護披露的權益,OpenAI 也認為針對 AI 技術的嚴格討論是必不可少的,目前 OpenAI 已經對其離職流程進行了更改,取消保密協議中的不詆譭條款。
此前,OpenAI 曾曝出離職保密協議,員工在離職後不能向外界批評 OpenAI,否則將會受到處罰。(@ 愛範兒)
5、230 億美元收購 Wiz!谷歌或迎來有史以來最大規模收購
谷歌正與網路安全初創公司 Wiz 就一筆可能達到 230 億美元的收購案進行深入談判,這將成為谷歌歷史上最大規模的收購。Wiz 專注於提供雲端計算網路安全軟體,由在 2015 年將前初創公司 Adallom 以 3.2 億美元賣給微軟的 Assaf Rappaport 創立。Wiz 的總部位於紐約,與多家頂級雲端計算公司合作,包括亞馬遜、微軟和谷歌。公司成立不久便實現了顯著的年度經常性收入增長,並獲得了矽谷頂尖風險投資公司的支援。
此次收購將加強谷歌在雲端計算領域的業務,尤其是在網路安全方面,這是其 Google Cloud 服務相對落後的領域。谷歌一直在積極擴充套件其雲端計算業務,去年收入增長了 26%,並首次實現營業利潤。Wiz 的加入可能會帶來先進技術和專業團隊,幫助谷歌雲在與 AWS 和 Azure 的競爭中迎頭趕上。(@ 有新 Newin)
02 有態度的觀點
1、復旦教授:AI 在新聞業只能扮演助理角色,難以完成調查性報導
近日,復旦大學新聞學院教授、博士生導師鄧建國接受了中新社採訪,談到了 AI 技術和新聞學的關係。
鄧建國表示,由於目前的虛擬 AI 缺乏實體,無法與客觀世界進行直接互動,且其資料基礎可能存在時效性限制,這在一定程度上制約了其在調查性新聞中的應用。
鄧建國主張,將 AI 視為新聞報導工具箱中的可用但並非核心的工具之一:「它們倆(AI 和人)並不是很對立矛盾的,而是以人類為主,AI 為輔。AI 不是完全替代人類,AI 是一個聰明的助理,助理肯定不是代替記者做新聞的核心。AI 能夠做的是幫我們做前期調查。」(@ 愛範兒)
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 史丹佛 AI 團隊被曝抄襲中國大模型開源成果;Zoom 創始人談視訊會議未來丨 RTE 開發者日報 Vol.218AI大模型OOM開發者日報
- 《阿凡達》導演卡梅隆加入 Stability AI 董事會;Molmo 橫空出世,開源多模態模型王座易位丨 RTE 開發者日報AI模型開發者日報
- 11Labs 支援打造對話 AI 智慧體;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 開發者日報AI智慧體阿里大模型開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- 位元組豆包釋出新模型,AI 一句話 P 圖;Google 正式推出 Vids,簡單提示即可生成影片演示丨 RTE 開發者日報模型AIGo開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- CosyVoice 2.0 支援雙向流式語音合成;無問芯穹開源全模態理解端側模型丨 RTE 開發者日報模型開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 爆火 AI 硬體遭差評,Ai Pin 上市即翻車;Grok 推出首個多模態模型丨 RTE 開發者日報 Vol.184AI模型開發者日報
- OpenAI 成功收購 Chat.com 域名;AI「電子舌頭」問世,可辨別味道、檢測食品安全丨 RTE 開發者日報OpenAI開發者日報
- 智譜清言 App 面向 C 端開放 AI 視訊通話服務;谷歌 GameNGen:神經網路驅動的實時遊戲引擎丨 RTE 開發者日報APPAI谷歌GAM神經網路遊戲引擎開發者日報
- AI開源專案 - SeldonAI
- AI開源專案 - ONNXAI
- AI開源專案 - KubeflowAI
- AI開源專案 - MLflowAI
- AI開源專案 - ZeppelinAI
- AI開源專案 - JupyterAI
- AI開源專案 - AdaNetAI
- AI開源專案 - AutoKerasAIKeras
- AI開源專案 - TPOTAI
- AI開源專案 - RayAI
- AI開源專案 - NNIAI
- AI 開源專案 - DaskAI
- AI開源專案 - HorovodAI
- AI開源專案 - MahoutAI
- AI開源專案 - facenetAI
- AI開源專案 - OpenPoseAI
- AI開源專案 - OpenCVAIOpenCV