開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@鮑勃
01 有話題的新聞
1、亞馬遜再度向 Anthropic 注資 40 億美元,AI 晶片研發成為合作新焦點
亞馬遜(Amazon)日前宣佈向人工智慧公司 Anthropic 追加投資 40 億美元,這使得亞馬遜對 Anthropic 的總投資額達到 80 億美元。作為此次投資的重要組成部分,Anthropic 將主要依託亞馬遜雲端計算服務(AWS)來訓練其旗艦級生成式 AI 模型。
此次合作的一大亮點是雙方在晶片領域展開深度合作。Anthropic 將與 AWS 旗下晶片製造部門 Annapurna Labs 共同開發新一代 Trainium 加速器。Anthropic 表示,公司工程師將與 Annapurna 的晶片設計團隊密切合作,致力於提升硬體的計算效率,這些技術進展將用於訓練其最先進的基礎模型。(@AIbase 基地)
2、史丹佛大學、華盛頓大學研究:1000 個 AI 智慧體預測人類行為,準確率最高可達 85%
據 The Decoder 今日報導,史丹佛大學、華盛頓大學和 Google DeepMind 的研究人員聯合開發了一種 AI 智慧體(AI Agent,也稱「AI 代理」),能夠在社會實驗中逼真地模擬人類行為。
研究指出,這類模擬系統可以作為一個虛擬實驗室,幫助驗證經濟學、社會學、組織學和政治科學中的理論。研究團隊透過對 1000 多名具有代表性的美國人(覆蓋多種年齡、性別、教育背景和政治立場)進行訪談,建立了這些 AI 智慧體模型。
系統執行方式是將詳細的訪談記錄與 GPT-4o 模型結合。當使用者向智慧體提問時,系統會載入訪談記錄並讓 AI 模仿受訪者的回答。為生成這些記錄,研究團隊對每位受訪者進行了長達兩小時的訪談,並透過 OpenAI 的 Whisper 技術將對話轉錄成文字。
研究團隊設計了多個測試,評估 AI 對人類行為的預測能力,涵蓋《通用社會調查》、大五人格評估以及若干行為經濟學實驗。
結果顯示,基於訪談資料的 AI 在預測社會調查(GSS)問題時,準確率高達 85%,遠超單純依賴人口統計資訊的 AI 智慧體。
研究團隊在五項社會科學實驗中測試了人類與 AI 的表現,其中四項研究顯示,AI 的結果與人類高度一致。相關係數高達 0.98,表明 AI 對人類行為有極強的模擬能力。(@IT 之家)
3、谷歌創新 AI 工具 SpeakFaster 幫助漸凍症患者大幅減少眼動打字操作
隨著漸凍症(ALS)等運動障礙患者日常溝通的困難,傳統的輔助性溝通工具往往無法高效解決眼動打字過程中按鍵操作頻繁帶來的眼疲勞和高時間成本。為了解決這一問題,谷歌研究團隊開發了一款名為 SpeakFaster 的使用者介面(UI),它利用大語言模型(LLM)和對話語境,幫助 ALS 患者顯著提升溝通效率。
SpeakFaster 透過預測使用者輸入的首字母縮寫,並根據對話上下文擴充套件為完整的短語,減少了眼動打字的按鍵次數高達 57%,文字輸入速度較傳統方法提升了 29%至 60%。該系統經過微調的 LLM 結合了三個不同的輸入路徑,使得使用者即使在初始預測失敗的情況下也能輕鬆找到合適的短語,從而加快了輸入速度,減少了不必要的操作。
此外,研究表明,SpeakFaster 不僅在模擬實驗中實現了顯著的按鍵節省,還在 ALS 患者的實驗中提高了打字速度,尤其在指令碼場景下,ALS 患者的輸入速度提高了 61.3%。儘管初期學習曲線稍顯陡峭,但大多數使用者在 15 次練習後已能夠達到舒適的打字速度。(@AIbase 基地)
02 有亮點的產品
1、iOS 19 將大幅強化 Siri
據彭博社記者 Mark Gurman 最新一期的《 Power On 》報導,蘋果將在明年推出的 iOS 19 中大幅強化 Siri。
Gurman 的報導指出,此次的升級將使 Siri 更像 OpenAI 的 ChatGPT,讓其能夠「處理更復雜的請求」。同時,Gurman 還表示,該功能最早要到 2026 年春季才會推出,這意味著該功能將作為 iOS 19.4 更新的一部分發布。
此前,Gurman 曾報導過,蘋果公司依賴於內部大型語言模型,在對 Siri 進行真正的改造方面取得了進展。該公司正在內部積極執行和測試這項新服務,並將其稱為「LLM Siri」。
另外,據 MacRumors 報導,在 iOS 18.4 中,Siri 將獲得螢幕感知、更深入的每個應用程式控制以及一些其他增強功能,但它仍然不會直接提供成熟的類似 ChatGPT 的對話功能。(@APPSO)
2、Runway 新增影片擴充套件畫面功能「Expand Video」 還可調整影片比例
近日,影片生成人工智慧企業 Runway 宣佈推出其最新功能 「Expand Video」,這一創新工具將幫助使用者透過簡單的文字提示,輕鬆在原始影片畫面基礎上生成額外的視覺內容。使用者不僅可以自由調整影片的比例,還能確保擴充套件後的畫面在視覺效果上的統一性,提升影片的靈活性和專業性。
「Expand Video」 功能的推出,讓使用者能夠透過多次擴充套件,創造出如 「快速變焦(crash zoom)」 和 「拉遠鏡頭(pull-back shot)」 等具有動態效果的攝像體驗。這意味著,靜態的影片畫面可以透過這一功能轉變為更加生動且富有電影感的動態序列。
官方表示,Expand Video 已開始逐步推出,很快將向 Gen-3Alpha Turbo 中的每個人提供。(@AIbase 基地)
3、可靈 AI 平臺 1.5 模型升級:上線人臉模型功能 新增「標準模式」
快手旗下可靈 AI 平臺宣佈其 1.5 模型全新升級,引入了一系列創新功能,此次升級包括圖生影片高品質模式的增強,支援運動筆刷和運鏡,以及新增的標準模式,為使用者提供了高價效比的選擇。
在高品質模式中,使用者可以為圖片中的元素指定運動軌跡,新增運動軌跡和靜止區域,實現更精細的控制。同時,平臺提供了六種運鏡方式,包括水平運鏡、垂直運鏡、拉遠/推進和旋轉運鏡,以滿足不同創作需求。
新推出的標準模式允許使用者快速生成 720p 畫質的影片,5 秒影片僅需 20 靈感值,10 秒影片僅需 40 靈感值,大大縮短了創作時間。
此外,可靈 AI 平臺還推出了「人臉模型」功能,該功能面向鑽石和鉑金會員開放,並提供限時 5 折優惠。這一行業首發的影片模型定製功能,透過創新技術解決了人臉 ID 保持的難題,使用者在訓練結束後可以隨時呼叫該人臉模型生成影片。
對於新使用者,可靈 AI 也進行了體驗升級,每月可領取包含靈感值和會員功能體驗次數的驚喜體驗包,有效期為一個月。會員使用者每日登入可領取靈感值,一個月合計可領取 1980 靈感值。
同時,可靈 AI 的 API 能力也得到了免費升級,V1.5 高品質模型和 V1.0 模型影片延長功能「加量」不加價,為個人開發者和企業使用者提供了更多的便利。(@AIbase 基地)
03 有態度的觀點
1、Salesforce 執行長:大語言模型可能已接近技術上限,AI 的未來是智慧體
據《商業內幕(Business Insider)》今日報導,Salesforce 的執行長 Marc Benioff 最近在「Future of Everything」播客中表示,他認為人工智慧的未來在於自主代理(即俗稱的「AI 智慧體」),而不是目前用於訓練 ChatGPT 等聊天機器人的大型語言模型(LLM)。「實際上,我們可能已經接近 LLM 的技術上限了。」
Benioff 提到,近年來社會對 ChatGPT 的熱潮讓許多人「錯誤高估」AI 的能力,他們從而會認為大語言模型是推動 AI 發展的核心動力。但他認為,真正具有潛力的方向是自主代理。這些代理可以獨立完成任務,比如負責銷售溝通或營銷活動。對於想要提高效率、重塑工作模式的企業來說,這種技術的重要性甚至超過了 LLM 。
與此同時,英偉達 CEO 黃仁勳也表示,他相信未來我們會與「AI 智慧體」和「AI 員工」並肩工作。
「現在我們擁有一系列強大的工具,能夠提高生產力、幫助員工完成任務、提升利潤率和收入,讓企業變得更強大,並與客戶建立更緊密的聯絡。」 Benioff 說。「但目前,我們還沒進入那些科幻電影中描述的未來場景 —— 或許有一天會達到,但至少今天還不是。」
Benioff 提到,公眾對 AI 智慧體的認知很多來自影視作品,比如 1984 年上映的《終結者》和 2002 年的《少數派報告》。前者講述了由阿諾德・施瓦辛格飾演的賽博格刺客「終結者」,後者則設想了一個警方透過 AI 技術預判犯罪的未來世界。
不過,Benioff 警告稱,一些行業人士和 AI 推崇者對人工智慧能力的描述過於誇大,甚至虛構了治癒癌症或解決氣候危機等「壯舉」,誤導了那些可以切實受益於 AI 技術的使用者。
「這些所謂的‘AI 佈道者’在傳播不實資訊,這不僅無法幫助企業利用人工智慧提高效益,反而對他們造成了損害。」 Benioff 說道。(@IT 之家)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞