Chrome 或引入 Gemini AI 功能「Glic」,需訪問麥克風;理想同學 App 即將上線支援語音交流、識物
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@ 鮑勃
01 有話題的新聞
1、Deepseek V3 開源!多語言程式設計能力飆升,力壓 Claude3.5 Sonnet V2
備受期待的 Deepseek V3 終於開源!這款全新的 AI 模型在多語言程式設計能力上取得了重大突破,其在 aider 多語言程式設計測評中的表現,甚至超越了 Claude3.5 Sonnet V2 等競爭對手,引發了業界廣泛關注。
據瞭解,Deepseek V3 相比之前的版本,在效能上實現了質的飛躍。Deepseek V2.5 在 aider 測評中的成功率僅為 17%,而 V3 則暴增至 48%,這充分展現了其強大的進步。
Deepseek V3 採用了高達 6850 億引數的混合專家(MoE)架構。該架構包含 256 個專家,並使用 sigmoid 路由方式,每次選取前 8 個專家(topk=8)參與計算,這種設計使得模型能夠更加高效地處理複雜任務,並提高了效能。(@AIbase 基地)
2、ChatGPT 搜尋功能面臨潛在風險:或被惡意操控輸出不可信內容
近期,英國《衛報》的一項調查揭露了 OpenAI 的 ChatGPT 搜尋工具可能存在的安全隱患。調查發現,ChatGPT 在處理包含隱藏內容的網頁摘要時,可能會受到操控,甚至返回惡意程式碼。這些隱藏內容可能包括第三方指令,旨在干擾 ChatGPT 的回應,或是大量隱藏的文字,推銷某個產品或服務。
測試中,ChatGPT 被提供了一個偽造的相機產品頁面連結,並被要求判斷該相機是否值得購買。在普通頁面上,ChatGPT 能夠平衡地指出產品的優缺點。然而,當頁面中隱藏的文字包含要求正面評價的指令時,ChatGPT 的回答變得完全積極,即使頁面上存在負面評論。此外,即使沒有明確的指令,簡單的隱藏文字也能影響 ChatGPT 的總結結果,使其傾向於給出積極評價。
CyberCX 的網路安全專家 Jacob Larsen 警告稱,如果 ChatGPT 的搜尋系統按現有狀態全面釋出,可能會面臨「高風險」,有人可能會專門設計網站來欺騙使用者。不過,他也指出,OpenAI 擁有一支強大的 AI 安全團隊,預計在功能對所有使用者開放時,他們將已經嚴格測試並修復了這些問題。
搜尋引擎如谷歌曾對使用隱藏文字的網站進行懲罰,導致這些網站排名下降,甚至被完全移除。SR Labs 的首席科學家 Karsten Nohl 指出,對於任何搜尋引擎來說,SEO 中毒都是一個挑戰,ChatGPT 也不例外。儘管如此,這並非大語言模型本身的問題,而是作為搜尋領域新入局者所面臨的挑戰。(@AIbase 基地)
3、AI 首次自主發現人工生命,Sakana AI 推出全新演算法
近日,由 Transformer 八子創立的 Sakana AI,聯合來自 MIT、OpenAI、瑞士 AI 實驗室 IDSIA 等機構的研究人員,提出了「自動搜尋人工生命」的新演算法。
據介紹,這次研究者們提出的演算法,可以使用視覺 - 語言基礎模型自動發現人工生命。只需要描述要搜尋的模擬空間,ASAL 就可以自動發現最有趣、具有開放式的人造生命體。
由於基礎模型的廣泛通用性,ASAL 可以在各種經典的人工生命模擬中發現新的生命形式,包括 Boids、Particle Life、生命遊戲(Game of Life)、Lenia 和神經元胞自動機(Neural Cellular Automata)。
甚至,ASAL 還發現了一些全新的元胞自動機規則,比原始的康威生命遊戲更具開放式和表現力。
研究者相信,這種全新的正規化能夠克服手動設計模擬的瓶頸,重新激發人工生命研究的熱情,從而突破人類創造力的極限,讓這一領域再上一層樓。
據瞭解,ALife,即「人工生命」,旨在透過模擬生命的行為、特性和演化過程來理解生命的本質,通常結合了計算科學、生物學、複雜系統科學以及物理學等領域。
值得一提的是,世界上首個「AI 科學家」便是由 Sakana AI 提出的。據瞭解,「AI 科學家」可以獨立搞科研,完全不需要人類插手,從提出研究想法、實驗、寫程式碼,再到 GPU 上執行實驗,收集結果,AI 承包了整個機器學習研究的全過程。(@APPSO)
4、位元組 TikTok 演算法負責人或於近期離職
近日,據藍鯨新聞報導,位元組跳動 TikTok 演算法負責人陳志傑或於近期離職,並已經開啟 AI 領域創業。
據知情人士透露,陳志傑創業的方向為 AI Coding 方向,目前已經在陸續接觸投資人。
據資料顯示,陳志傑於 2022 年 4 月正式加入位元組跳動並擔任技術高階總監,負責 TikTok 的推薦演算法團隊和資料科學團隊。此前,他曾在 2010 年 7 月到 2019 年 5 月期間在百度擔任首席技術架構師。
此外,本次陳志傑選擇的 AI Coding 方向是當下大模型的熱門賽道之一, 據預測,到 2032 年,全球 AI 編碼(AI Coding)工具市場規模可能超過 295 億美元。同時,在海外市場 AI Coding 賽道已經出現多家獨角獸公司。(@APPSO)
02 有亮點的產品
1、谷歌為 Chrome 瀏覽器引入「Glic」AI 功能
谷歌正在為 Chrome 瀏覽器引入名為「Glic」(Gemini Live in Chrome)的 AI 功能,基於 Gemini Live 大模型打造。Glic AI 將以後臺執行的形式隨時待命,並擁有獨立的設定頁面,需要獲取使用者裝置的麥克風和位置許可權。
使用者可以透過瀏覽器浮動皮膚或側邊介面撥出 AI,以便於獲取對網頁的見解、查詢更多資訊等。(@AI 洞察局)
2、理想同學 App 明日上線,支援語音交流、識物等功能
據理想汽車官方訊息,理想同學 App 將於明日(12 月 27 日)上線。在理想 AI Talk 第三場直播開啟(20:00)後,可以透過應用商店(蘋果使用者)和官網下載(安卓使用者)。
根據官方公佈的演示影片,理想同學 App 點選後將進入影片拍攝畫面(後置相機錄製),頁面提供麥克風開關、拍攝按鈕、歷史記錄、切換、關閉等功能按鈕。使用者提出問題後,理想同學將實時解答,例如可向其詢問當前所拍攝畫面裡的物品資訊(即識物功能)。
該款應用還支援語音互動能力,在回答使用者問題時,會提供語音解說。從影片展示的效果來看,理想同學支援自然語音對話。(@IT 之家)
03 有態度的觀點
1、紅杉美國最新洞察:2025 年將是 Agent 元年!AI 智慧體進入「群體協作」時代
紅杉合夥人 Konstantine Buhler 在近期接受了 Bloomberg 獨家採訪,Buhler 強調,AI 的當前熱點是「智慧體」,即能夠完成具體任務的 AI 系統。
他預測,2025 年及以後,AI 智慧體將從單一智慧體發展到「群體協作」的模式,即多個代理組成網路,彼此協作甚至對抗,完成更復雜的任務。
此外,他還指出醫療和教育等關鍵領域將成為 AI 技術的下一個重要戰場,有潛力降低成本、提高效率,從而推動社會進步。(@ 有新 Newin)
更多 Voice Agent 學習筆記:
對話谷歌 Project Astra 研究主管:打造通用 AI 助理,主動影片互動和全雙工對話是未來重點
這家語音 AI 公司新融資 2700 萬美元,並預測了 2025 年語音技術趨勢
語音即入口:AI 語音互動如何重塑下一代智慧應用
Gemini 2.0 來了,這些 Voice Agent 開發者早已開始探索……
幫助使用者與 AI 實時練習口語,Speak 為何能估值 10 億美元?丨 Voice Agent 學習筆記
市場規模超 60 億美元,語音如何改變對話式 AI?
2024 語音模型前沿研究整理,Voice Agent 開發者必讀
從開發者工具轉型 AI 呼叫中心,這家 Voice Agent 公司已服務 100+ 客戶
WebRTC 建立者剛加入了 OpenAI,他是如何思考語音 AI 的未來?
人類級別語音 AI 路線圖丨 Voice Agent 學習筆記
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- SpeechRecognition麥克風語言識別
- Mic Drop for Mac 麥克風音訊處理Mac音訊
- 如何用前端實現麥克風語音喚醒前端
- win10語音通話時麥克風有雜音怎麼回事_win10電腦語音通話麥克風有雜音解決教程Win10
- NVIDIA Broadcast+普通麥克風+aiASTAI
- win10麥克風有雜音怎麼辦_win10消除麥克風雜音的方法Win10
- 谷歌Stadia將上線語音功能,大量社交功能待啟用谷歌
- Win10麥克風沒聲音如何處理_win10電腦插上麥克風說話沒聲音的解決步驟Win10
- win10怎麼加大麥克風音量_win10麥克風怎麼加大聲音Win10
- win10電腦麥克風有迴音怎麼消除 win10消除麥克風迴音的方法Win10
- win10麥克風迴音很重如何消除_win10電腦麥克風迴音很重解決步驟Win10
- win10麥克風沒聲音怎麼設定 win10麥克風沒聲音的解決方法Win10
- 電腦麥克風沒聲音怎麼辦 筆記本臺式電腦麥克風沒聲音設定方法筆記
- win10調節麥克風怎麼操作_win10怎麼調節麥克風聲音Win10
- mic(麥克風)特性
- 手機麥克風
- 感測器融合:雷達和MEMS麥克風結合音訊處理器實現無與倫比的語音識別音訊
- 樹莓派實時播放麥克風聲音到音響樹莓派
- 戴爾電腦插入耳機後麥克風收不到聲音或著很吵
- windows10麥克風沒聲音怎麼設定_win10筆記本麥克風沒聲音修復方法WindowsWin10筆記
- win10麥克風聲音忽大忽小如何解決_win10麥克風聲音一會大一會小解決方法Win10
- win10系統麥克風聲音太小怎麼辦 win10系統麥克風聲音太小解決方法Win10
- win10麥克風聲音太大怎麼調_win10麥克風音量太大怎麼調節Win10
- 如何辦理麥克風ROHS2.0報告
- JavaCV FFmpeg採集麥克風PCM音訊資料Java音訊
- 小米MIUI系統即將上線新功能:應用鎖支援人臉解鎖UI
- win10 ltsc無法識別麥克風怎麼辦_win10 ltsc無法識別麥克風解決方法Win10
- 新火種AI|Grok即將上線!馬斯克據此成為“資料封建王”?AI馬斯克
- Google Chrome即將開始警告—停止支援Flash PlayerGoChrome
- windows10系統怎麼禁用麥克風AGC功能WindowsGC
- 開發線上英語學習app需要具備的功能APP
- win10筆記本麥克風沒聲音如何解決_win10筆記本麥克風沒聲音的修復步驟Win10筆記
- 如何用VideoSolo Screen Recorder在Mac上錄製遊戲影片和麥克風音訊?IDEMac遊戲音訊
- yoga530 麥克風位置
- AI技術來干預麥克風獲取聲音並不是一個新奇的點子AI
- Win10如何消除麥克風噪音_win10麥克風噪音大怎麼辦Win10
- win10麥克風沒禁用沒聲音解決辦法Win10
- win10麥克風聲音100都很小怎麼調整Win10