百度釋出 AI 眼鏡:全球首搭中文大模型,支援邊走邊問;OpenAI 聯合創始人宣佈迴歸,主抓重大技術創新丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@ 鮑勃
01 有話題的新聞
1、百度釋出小度 AI 眼鏡:全球首搭中文大模型,支援邊走邊問
在 2024 百度世界大會上,百度正式釋出了小度 AI 眼鏡,稱該產品為「全球首款搭載中文大模型的原生 AI 眼鏡」。據百度官方介紹,小度 AI 眼鏡具備第一視角拍攝、邊走邊問、卡路里識別、識物百科、視聽翻譯、智慧備忘等功能。
具體配置方面,該眼鏡重量 45 克,搭載 16MP 超廣角攝像頭,支援 AI 防抖演算法;標稱待機續航 56 小時,支援超 5 小時連續聆聽,可 30 分鐘充滿電;搭載四麥克風陣列識別聲音,採用開放式防漏音揚聲器設計。
小度 AI 眼鏡將於明年上半年正式上市。(@ 極客公園)
2、Rokid Glasses 推出新預告片,引入光波導,推出實時翻譯 + 隨身抓拍 + 智慧導航等功能
Rokid Glasses 將於 11 月 18 日在 Rokid Jungle 2024 合作伙伴暨新品釋出會上釋出。(@Rokid)
3、AI+AR 迎來「百鏡大戰」,智慧眼鏡距離「下一代計算平臺」還有多遠?丨播客《編碼人聲》
隨著出貨量突破 100 萬臺的 Ray-Ban Meta 智慧眼鏡的成功,加上愈加成熟的語音 AI 和視覺理解能力的加持,國內外各大廠和創業公司紛紛進場智慧眼鏡,「百鏡大戰」一觸即發。
本期節目,嘉賓將從 AR 眼鏡從業者、AI Agent 構建者和空間計算開發者的不同視角,分享實踐中看到的新機會。
有嘉賓認為,軟硬結合的垂類 AR 眼鏡解決的是手機無法滿足的場景,解決問題就能讓使用者用錢投票。隨著上下游生態鏈的成熟,現在正是輕型 AR 眼鏡創業的黃金時代。
智慧眼鏡還推動了開發者對下一代人機互動介面 LUI(語言使用者介面)的探索,端側模型能力和與低延遲的實時 AI 互動也會變得更加重要。
智慧眼鏡距離成為下一代計算平臺還有多遠?雲端結合的計算的未來會是什麼樣子?開發者該如何面對「每天醒來就是一個新彎道」的世界?
本期嘉賓各抒己見,但至少達成了一個共識:一款的好的智慧眼鏡,首先是一副好的眼鏡。
👂收聽入口:
4、阿里通義千問開源 Qwen2.5-Coder 全系列模型,號稱程式碼能力追平 GPT-4o
阿里通義千問於昨日(11 月 12 日)開源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成為目前 SOTA 的開原始碼模型,官方號稱程式碼能力追平 GPT-4o。
Qwen2.5-Coder-32B-Instruct 作為本次開源的旗艦模型,在多個流行的程式碼生成基準(如 EvalPlus、LiveCodeBench、BigCodeBench)上都取得了開源模型中的最佳表現,官方稱達到和 GPT-4o 有競爭力的表現。
阿里通義千問此前開源了 1.5B、7B 兩個尺寸,本次開源帶來 0.5B、3B、14B、32B 四個尺寸,覆蓋了主流的六個模型尺寸。
Qwen2.5-Coder 0.5B / 1.5B / 7B / 14B / 32B 模型均採用 Apache 2.0 許可證,3B 模型使用 Research Only 許可。(@IT 之家)
5、OpenAI 聯合創始人布羅克曼宣佈迴歸,主抓重大技術創新
今天凌晨 5 點,OpenAI 聯合創始人兼總裁 Greg Brockman 宣佈結束數月長假,重回 OpenAI。
而在最近 OpenAI 受到了嚴重的離職風波影響的背景下,Greg 的迴歸多少有些受命於危難之際的意思。
Greg 表示,他一直在與執行長 Sam Altman 合作商議,為自己設立一個新職位,專注於重大技術創新和挑戰。網友對 Greg 的迴歸相當期待,說 OpenAI 的技術競爭力基石又回來了。
Greg Brockman 是 OpenAI 最初的聯合創始人之一,他在 OpenAI 的發展中扮演了至關重要的角色,與 Sam Altman、Ilya Sutskever、Mira Murati 合稱「OpenAI 四大天王」。
Greg 曾在網際網路支付平臺 Stripe 並擔任 CTO,幫助團隊實現了從 4 人到 250 人的增長。2015 年,Greg 離開 Stripe,與 Sam Altman、馬斯克等人共同創立了 OpenAI,旨在推動 AI 技術的發展。
Greg 作為 OpenAI 重要技術人員,他與首席科學家 Ilya Sutskever 主導了 OpenAI 的技術創新,參與開發了 GPT-1、GPT-2、GPT-3、GPT-4、GPT-4o 等眾多知名專案。Greg 曾被《時代》週刊評選為全球 100 AI 領導者之一。(@AIGC 開放社群)
6、百度世界 2024 大會重磅釋出文心 iRAG 和無程式碼工具「秒噠」
百度世界 2024 大會上,百度創始人李彥宏發表了題為《應用來了》的演講,釋出了兩項新技術 —— 檢索增強的文生圖技術(iRAG)和無程式碼工具「秒噠」。李彥宏表示,過去 24 個月,AI 行業發生了顯著變化,尤其是大模型在生成內容時已大幅減少幻覺現象。
文心 iRAG 技術旨在解決大模型在影像生成中存在的幻覺問題,提升 AI 生成內容的實用性。與傳統生成模型不同,文心 iRAG 透過結合百度海量圖片資源,能夠生成更加真實的影像。
這一技術特別適用於品牌宣傳、影視製作和其他創意產業,極大地降低了創作成本。李彥宏在演講中展示了用文心 iRAG 生成的影像,強調了其無幻覺、超真實的效果。
除了文心 iRAG,李彥宏還介紹了無程式碼工具「秒噠」。
這一工具使使用者無需編寫任何程式碼,便能輕鬆實現各種應用設想。它具備無程式碼程式設計、多智慧體協作及多工具呼叫等特點,使用者只需透過自然語言描述需求,就能完成複雜的系統搭建。
李彥宏現場演示瞭如何利用「秒噠」快速構建一個活動報名系統,展示了多智慧體協作的能力。
李彥宏指出,智慧體將是未來 AI 應用的主要形態,能夠大幅提升企業的營銷和服務效率。目前,文心智慧體平臺已經吸引了大量企業和開發者參與,展現出強大的市場潛力。(@AIbase 基地)
7、谷歌 DeepMind 開源 AlphaFold3:諾獎化學模型,助力藥物研發!
谷歌 DeepMind 近日意外發布了 AlphaFold3 的原始碼和模型權重,標誌著一個可能加速科學發現和藥物開發的重大進展。這一訊息傳出僅幾周後,系統的創造者 Demis Hassabis 和 John Jumper 便獲得了 2024 年諾貝爾化學獎,以表彰他們在蛋白質結構預測方面的貢獻。
與前一版本 AlphaFold2 相比,AlphaFold3 的技術能力有了質的飛躍。AlphaFold2 只能預測蛋白質的結構,而 AlphaFold3 則可以建模蛋白質、DNA、RNA 及小分子之間複雜的相互作用,這是生命的基本過程。
這一進展至關重要,因為理解這些分子相互作用是現代藥物發現和疾病治療的核心。傳統的研究方法往往需要數月的實驗室工作和數百萬的研究資金,並且並不保證成功。
AlphaFold3 的釋出讓其從一個專用工具轉變為研究分子生物學的綜合解決方案。這一更廣泛的能力為理解細胞過程開闢了新路徑,包括基因調控和藥物代謝等,達到以前無法實現的規模。
儘管 AlphaFold3 的釋出為科學研究提供了新的動力,但其時機也突顯出現代科學研究中的一個重要矛盾。儘管在今年 5 月 AlphaFold3 首次亮相時,DeepMind 選擇暫時不釋出程式碼,並僅透過網路介面提供有限訪問,這一決定引發了研究者們的廣泛批評。此次開放原始碼的釋出試圖在科學與商業利益之間找到一個平衡點。雖然程式碼在創意共享許可證下可以自由獲取,但使用關鍵模型權重仍需獲得谷歌的明確許可,這一做法引發了一些研究者的質疑。
儘管如此,AlphaFold3 在藥物發現和開發方面的影響仍然是巨大的。儘管商業限制目前限制了其在製藥領域的應用,但這次釋出所帶來的學術研究將提升我們對疾病機制和藥物相互作用的理解。系統在預測抗體 - 抗原相互作用方面的準確性提高,有望加速治療性抗體的開發,這是製藥研究中越來越重要的領域。(@AIbase 基地)
02 有態度的觀點
1、微軟 AI CEO 蘇萊曼清華大學演講:AI 的成功最終取決於實際生活中的應用,始終與真實生活息息相關
近日,微軟 AI CEO 穆斯塔法·蘇萊曼(Mustafa Suleyman)在清華大學的演講中,分享了他對人工智慧未來發展的深刻洞見。
蘇萊曼提出了三個對於 AI 的核心觀點:
1)發展人工智慧的目標應當是服務人類並對社會產生積極影響,而不僅僅關注技術效能的比較;
2)人工智慧應被用於解決全球面臨的最緊迫社會挑戰,如氣候、環境問題等,將 AI 的能力擴充套件到更廣闊的應用領域;
3)負責任地發展人工智慧的重要性。
在蘇萊曼的新書《浪潮將至:技術、權力與未來的衝擊》中,他圍繞技術浪潮所帶來的風險,討論了一系列發人深省的問題。他指出:「人工智慧既極具價值,又充滿危險,因為它正是人性最好與最壞的延伸。」
在人工智慧、生物技術和量子計算等領域的推動下,我們正站在人類歷史的一個關鍵節點上,這個節點將塑造我們未來的走向。人工智慧已經滲透到我們生活的方方面面,預示著一切都將發生變革。(@ 有新 Newin)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
相關文章
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報OpenAI開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報AI3D開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨RTE 開發者日報AI3D開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- OpenAI 聯合創始人回來了,還是總裁,將更專注重大技術挑戰OpenAI
- 特斯拉宣佈 10% 大裁員;劉強東數字人開啟直播首秀丨 RTE 開發者日報 Vol.185開發者日報
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- RTE 大會報名丨 AI 時代新基建:雲邊端架構和 AI Infra ,RTE2024 技術專場第二彈!AI架構
- 蘋果聯合創始人宣佈退出Facebook:小扎鬧心蘋果
- 史丹佛 AI 團隊被曝抄襲中國大模型開源成果;Zoom 創始人談視訊會議未來丨 RTE 開發者日報 Vol.218AI大模型OOM開發者日報
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- 釋出會後蘋果股價創歷史新高;商湯 Embedding 模型拿下 SOTA 丨 RTE 開發者日報 Vol.223蘋果模型開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 華為否認大模型演示造假;美國億萬富翁宣佈競購 TikTok 丨 RTE 開發者日報 Vol.206大模型開發者日報
- 暴雪聯合創始人之一弗蘭克·皮爾斯宣佈離開暴雪
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 全日程釋出|AI 大模型如何賦能智慧網聯車技術創新與產業應用?AI大模型產業
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 百度釋出DuMix AR 3.0 三大創新能力開放賦能開發者
- WWDC 蘋果釋出 AI 全家桶;三星宣佈「實時翻譯」將相容第三方 App 丨 RTE 開發者日報 Vol.222蘋果AIAPP開發者日報
- ChatGPT 向更多使用者推出高階語音模式:支援 50 種語言;位元組釋出兩款新影片生成大模型丨 RTE 開發者日報ChatGPT模式大模型開發者日報
- 谷歌釋出世界模型,能生成可互動虛擬世界;華為釋出全球首個 5.5G 智慧核心網丨 RTE 開發者日報 Vol.152谷歌世界模型虛擬世界開發者日報
- Kaggle聯合創始人、執行長Anthony Goldbloom離職,開啟新創業GoOOM創業
- 11Labs 支援打造對話 AI 智慧體;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 開發者日報AI智慧體阿里大模型開發者日報
- 亞馬遜雲集齊 Claude 3 全家桶;世界數字技術院釋出大模型安全國際標準丨 RTE 開發者日報 Vol.187亞馬遜大模型開發者日報
- 聯合國貿發會議:2021年技術與創新報告
- 創紀錄:英偉達市值一日增 2770 億美元;Xiaomi 14 Ultra 正式釋出丨 RTE 開發者日報 Vol.150開發者日報
- 零一萬物 Yi-Lightning:超越 GPT-4o 衝擊全球榜單;阿里國際 Marco 翻譯大模型釋出丨 RTE 開發者日報GPT阿里大模型開發者日報
- OpenAI 釋出全新生成式模型 GPT-4o;位元組收購音訊裝置公司 Oladance 丨 RTE 開發者日報 Vol.203OpenAI模型GPT音訊開發者日報
- RTE 領域近期詞雲統計釋出;谷歌開始新一輪「瘦身」計劃;使用ChatGPT之後智力提高 50%丨RTE開發者日報 Vol.50谷歌ChatGPT開發者日報
- 首發新文創技術支撐戰略,騰訊雲用科技支援文化創新
- Mistral 釋出 Large 2 123B 大模型;微軟釋出 VALL-E 2,零樣本實現聲音克隆丨 RTE 開發者日報大模型微軟開發者日報