百度釋出 AI 眼鏡:全球首搭中文大模型,支援邊走邊問;OpenAI 聯合創始人宣佈迴歸,主抓重大技術創新丨 RTE 開發者日報

RTE开发者社区發表於2024-11-13

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@SSN,@ 鮑勃

01 有話題的新聞

1、百度釋出小度 AI 眼鏡:全球首搭中文大模型,支援邊走邊問

在 2024 百度世界大會上,百度正式釋出了小度 AI 眼鏡,稱該產品為「全球首款搭載中文大模型的原生 AI 眼鏡」。據百度官方介紹,小度 AI 眼鏡具備第一視角拍攝、邊走邊問、卡路里識別、識物百科、視聽翻譯、智慧備忘等功能。

具體配置方面,該眼鏡重量 45 克,搭載 16MP 超廣角攝像頭,支援 AI 防抖演算法;標稱待機續航 56 小時,支援超 5 小時連續聆聽,可 30 分鐘充滿電;搭載四麥克風陣列識別聲音,採用開放式防漏音揚聲器設計。
小度 AI 眼鏡將於明年上半年正式上市。(@ 極客公園)

2、Rokid Glasses 推出新預告片,引入光波導,推出實時翻譯 + 隨身抓拍 + 智慧導航等功能

Rokid Glasses 將於 11 月 18 日在 Rokid Jungle 2024 合作伙伴暨新品釋出會上釋出。(@Rokid)

3、AI+AR 迎來「百鏡大戰」,智慧眼鏡距離「下一代計算平臺」還有多遠?丨播客《編碼人聲》

隨著出貨量突破 100 萬臺的 Ray-Ban Meta 智慧眼鏡的成功,加上愈加成熟的語音 AI 和視覺理解能力的加持,國內外各大廠和創業公司紛紛進場智慧眼鏡,「百鏡大戰」一觸即發。

本期節目,嘉賓將從 AR 眼鏡從業者、AI Agent 構建者和空間計算開發者的不同視角,分享實踐中看到的新機會。

有嘉賓認為,軟硬結合的垂類 AR 眼鏡解決的是手機無法滿足的場景,解決問題就能讓使用者用錢投票。隨著上下游生態鏈的成熟,現在正是輕型 AR 眼鏡創業的黃金時代。

智慧眼鏡還推動了開發者對下一代人機互動介面 LUI(語言使用者介面)的探索,端側模型能力和與低延遲的實時 AI 互動也會變得更加重要。

智慧眼鏡距離成為下一代計算平臺還有多遠?雲端結合的計算的未來會是什麼樣子?開發者該如何面對「每天醒來就是一個新彎道」的世界?

本期嘉賓各抒己見,但至少達成了一個共識:一款的好的智慧眼鏡,首先是一副好的眼鏡。

👂收聽入口:

4、阿里通義千問開源 Qwen2.5-Coder 全系列模型,號稱程式碼能力追平 GPT-4o

阿里通義千問於昨日(11 月 12 日)開源 Qwen2.5-Coder 全系列模型,其中 Qwen2.5-Coder-32B-Instruct 成為目前 SOTA 的開原始碼模型,官方號稱程式碼能力追平 GPT-4o。

Qwen2.5-Coder-32B-Instruct 作為本次開源的旗艦模型,在多個流行的程式碼生成基準(如 EvalPlus、LiveCodeBench、BigCodeBench)上都取得了開源模型中的最佳表現,官方稱達到和 GPT-4o 有競爭力的表現。

阿里通義千問此前開源了 1.5B、7B 兩個尺寸,本次開源帶來 0.5B、3B、14B、32B 四個尺寸,覆蓋了主流的六個模型尺寸。

Qwen2.5-Coder 0.5B / 1.5B / 7B / 14B / 32B 模型均採用 Apache 2.0 許可證,3B 模型使用 Research Only 許可。(@IT 之家)

5、OpenAI 聯合創始人布羅克曼宣佈迴歸,主抓重大技術創新

今天凌晨 5 點,OpenAI 聯合創始人兼總裁 Greg Brockman 宣佈結束數月長假,重回 OpenAI。

而在最近 OpenAI 受到了嚴重的離職風波影響的背景下,Greg 的迴歸多少有些受命於危難之際的意思。

Greg 表示,他一直在與執行長 Sam Altman 合作商議,為自己設立一個新職位,專注於重大技術創新和挑戰。網友對 Greg 的迴歸相當期待,說 OpenAI 的技術競爭力基石又回來了。

Greg Brockman 是 OpenAI 最初的聯合創始人之一,他在 OpenAI 的發展中扮演了至關重要的角色,與 Sam Altman、Ilya Sutskever、Mira Murati 合稱「OpenAI 四大天王」。

Greg 曾在網際網路支付平臺 Stripe 並擔任 CTO,幫助團隊實現了從 4 人到 250 人的增長。2015 年,Greg 離開 Stripe,與 Sam Altman、馬斯克等人共同創立了 OpenAI,旨在推動 AI 技術的發展。

Greg 作為 OpenAI 重要技術人員,他與首席科學家 Ilya Sutskever 主導了 OpenAI 的技術創新,參與開發了 GPT-1、GPT-2、GPT-3、GPT-4、GPT-4o 等眾多知名專案。Greg 曾被《時代》週刊評選為全球 100 AI 領導者之一。(@AIGC 開放社群)

6、百度世界 2024 大會重磅釋出文心 iRAG 和無程式碼工具「秒噠」

百度世界 2024 大會上,百度創始人李彥宏發表了題為《應用來了》的演講,釋出了兩項新技術 —— 檢索增強的文生圖技術(iRAG)和無程式碼工具「秒噠」。李彥宏表示,過去 24 個月,AI 行業發生了顯著變化,尤其是大模型在生成內容時已大幅減少幻覺現象。

文心 iRAG 技術旨在解決大模型在影像生成中存在的幻覺問題,提升 AI 生成內容的實用性。與傳統生成模型不同,文心 iRAG 透過結合百度海量圖片資源,能夠生成更加真實的影像。

這一技術特別適用於品牌宣傳、影視製作和其他創意產業,極大地降低了創作成本。李彥宏在演講中展示了用文心 iRAG 生成的影像,強調了其無幻覺、超真實的效果。

除了文心 iRAG,李彥宏還介紹了無程式碼工具「秒噠」。

這一工具使使用者無需編寫任何程式碼,便能輕鬆實現各種應用設想。它具備無程式碼程式設計、多智慧體協作及多工具呼叫等特點,使用者只需透過自然語言描述需求,就能完成複雜的系統搭建。

李彥宏現場演示瞭如何利用「秒噠」快速構建一個活動報名系統,展示了多智慧體協作的能力。

李彥宏指出,智慧體將是未來 AI 應用的主要形態,能夠大幅提升企業的營銷和服務效率。目前,文心智慧體平臺已經吸引了大量企業和開發者參與,展現出強大的市場潛力。(@AIbase 基地)

7、谷歌 DeepMind 開源 AlphaFold3:諾獎化學模型,助力藥物研發!

谷歌 DeepMind 近日意外發布了 AlphaFold3 的原始碼和模型權重,標誌著一個可能加速科學發現和藥物開發的重大進展。這一訊息傳出僅幾周後,系統的創造者 Demis Hassabis 和 John Jumper 便獲得了 2024 年諾貝爾化學獎,以表彰他們在蛋白質結構預測方面的貢獻。

與前一版本 AlphaFold2 相比,AlphaFold3 的技術能力有了質的飛躍。AlphaFold2 只能預測蛋白質的結構,而 AlphaFold3 則可以建模蛋白質、DNA、RNA 及小分子之間複雜的相互作用,這是生命的基本過程。

這一進展至關重要,因為理解這些分子相互作用是現代藥物發現和疾病治療的核心。傳統的研究方法往往需要數月的實驗室工作和數百萬的研究資金,並且並不保證成功。

AlphaFold3 的釋出讓其從一個專用工具轉變為研究分子生物學的綜合解決方案。這一更廣泛的能力為理解細胞過程開闢了新路徑,包括基因調控和藥物代謝等,達到以前無法實現的規模。

儘管 AlphaFold3 的釋出為科學研究提供了新的動力,但其時機也突顯出現代科學研究中的一個重要矛盾。儘管在今年 5 月 AlphaFold3 首次亮相時,DeepMind 選擇暫時不釋出程式碼,並僅透過網路介面提供有限訪問,這一決定引發了研究者們的廣泛批評。此次開放原始碼的釋出試圖在科學與商業利益之間找到一個平衡點。雖然程式碼在創意共享許可證下可以自由獲取,但使用關鍵模型權重仍需獲得谷歌的明確許可,這一做法引發了一些研究者的質疑。

儘管如此,AlphaFold3 在藥物發現和開發方面的影響仍然是巨大的。儘管商業限制目前限制了其在製藥領域的應用,但這次釋出所帶來的學術研究將提升我們對疾病機制和藥物相互作用的理解。系統在預測抗體 - 抗原相互作用方面的準確性提高,有望加速治療性抗體的開發,這是製藥研究中越來越重要的領域。(@AIbase 基地)

02 有態度的觀點

1、微軟 AI CEO 蘇萊曼清華大學演講:AI 的成功最終取決於實際生活中的應用,始終與真實生活息息相關

近日,微軟 AI CEO 穆斯塔法·蘇萊曼(Mustafa Suleyman)在清華大學的演講中,分享了他對人工智慧未來發展的深刻洞見。

蘇萊曼提出了三個對於 AI 的核心觀點:

1)發展人工智慧的目標應當是服務人類並對社會產生積極影響,而不僅僅關注技術效能的比較;
2)人工智慧應被用於解決全球面臨的最緊迫社會挑戰,如氣候、環境問題等,將 AI 的能力擴充套件到更廣闊的應用領域;
3)負責任地發展人工智慧的重要性。

在蘇萊曼的新書《浪潮將至:技術、權力與未來的衝擊》中,他圍繞技術浪潮所帶來的風險,討論了一系列發人深省的問題。他指出:「人工智慧既極具價值,又充滿危險,因為它正是人性最好與最壞的延伸。」

在人工智慧、生物技術和量子計算等領域的推動下,我們正站在人類歷史的一個關鍵節點上,這個節點將塑造我們未來的走向。人工智慧已經滲透到我們生活的方方面面,預示著一切都將發生變革。(@ 有新 Newin)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

相關文章