Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@JLT,@ 鮑勃
01 有話題的新聞
1、OpenAI CEO 成立 AI 健康公司,將致力打造 AI 健康教練
OpenAI CEO Sam Altman 與 Thrive Global CEO Arianna Huffington 在《時代》雜誌上發文,宣佈聯合創立一家名為 Thrive AI Health 的新公司。該公司將由 OpenAI Startup Fund 和 Thrive Global 資助,Google 前健康和可穿戴裝置負責人 DeCarlos Love 將擔任這家公司的 CEO。
Thrive AI Health 將致力於打造一個「 AI 健康教練」,該「教練」會以一個手機 App 的形式呈現。Sam Altman 也表示,希望這款 AI 應用可以利用科學和行為改變方法,為使用者提供精準的健康建議,解決日常生活中的健康問題,讓更多人享受健康平權的好處。(@ 愛範兒)
2、Genspark:透過實時生成定製頁面來滿足使用者個性化的搜尋需求
MainFunc 是一家於 2024 年聯合創立的 AI 搜尋公司,開發了基於大型語言模型的新搜尋引擎 Genspark。Genspark 的核心產品是一款 AI Agent 搜尋引擎,採用多代理框架,透過實時生成定製頁面(稱為 Sparkpages)來滿足使用者的特定資訊需求。
其設計以對話為主要互動方式,使用者提出問題後,Genspark 會生成相關的簡短回答,直接提供所需資訊,而不是 Google 傳統的「十個藍色連結」。Genspark 的每個搜尋結果頁面首先會呈現 AI 生成的結果摘要,後面是指向更詳細的 Sparkpage 的連結,基本上可以理解為針對問題生成的一篇完整回答。
此外,Genspark 整合了來自各種信譽良好的來源的資料,專注於提供沒有垃圾郵件和偏見的內容。(@Z 計劃支援大模型創業)
3、徹底改變語言模型:全新架構 TTT 超越 Transformer,ML 模型代替 RNN 隱藏狀態
一種全新的大語言模型(LLM)架構有望代替至今在 AI 領域如日中天的 Transformer,效能也比 Mamba 更好。本週一,有關 Test-Time Training(TTT)的論文成為了人工智慧社群熱議的話題。
TTT 架構用機器學習模型取代 RNN 隱藏狀態,最佳化了語言模型方法。TTT 層替代自注意力層,增強了處理長上下文的能力,並降低了計算複雜度。實驗結果顯示 TTT 在多種模型規模上表現優於或匹敵傳統的 Transformer 和 Mamba。(@ 機器之心)
4、AI 影片創新:MOTIA 讓影片擴充無限可能
MOTIA(Mastering Video Outpainting Through Input-Specific Adaptation)作為一種新型的影片外繪製技術,正在 revolutionizing 影片內容創作領域。這項由擴散模型驅動的技術能夠智慧地在原始影片視角之外生成高質量、連貫的內容,為創作者提供了前所未有的創意空間。
MOTIA 的核心優勢在於其兩階段處理方法:首先透過輸入特定適應學習源影片模式,然後利用模式感知外繪製技術擴充套件影片邊界。這種創新方法不僅提高了生成質量,還增強了靈活性,無需大量特定任務調整就能在多個基準測試中超越現有最先進的方法。MOTIA 為影片創作者、電影製作和虛擬現實等領域開啟了新的可能性,標誌著影片處理技術的重大突破。(@AI 科技評論)
5、對標 Photoshop,悟空影像上線華為鴻蒙 HarmonyOS NEXT
亦心科技已與華為達成合作,旗下「悟空影像」應用接入華為鴻蒙生態。官方表示,悟空影像是亦心科技自主研發的國產專業影像處理軟體,對標國外同類軟體 Photoshop,雙向相容 PS 檔案格式,支援全平臺執行,可實現平替。悟空影像應用已完成鴻蒙 HarmonyOS NEXT 系統適配,並上架華為應用市場。
悟空影像適用於影像編輯與處理、創意設計、AI 實時繪畫與實時渲染等場景,支援 50 億畫素圖片,相容 PSD、PDF 等格式檔案,支援以文生圖、以圖生圖、邊畫邊實時生成等功能。(@IT 之家)
02 有態度的觀點
1、中國工程院院士鄔賀銓:原有網際網路業務值得用 AI 再造
在 2024 中國網際網路大會上,中國工程院院士鄔賀銓強調了 AI 在網際網路業態創新中的重要性。他認為,隨著「5G-A+IPv6」和 AI 大模型的發展,網際網路業務值得用 AI 重新塑造,以促進產業數字化和數字產業化。AI 將為平臺經濟帶來新動能,網際網路平臺成為 AI 賦能消費和行業應用的關鍵。(@ 財聯社)
2、周鴻禕稱 2024 年是大模型場景之年,To C 將出現殺手級應用
「大模型是風口,不是泡沫。」周鴻禕表示「今年英偉達市值一直狂飆,超越了微軟和蘋果,這就是人類進入人工智慧時代的一個標誌。」周鴻禕稱,今年年初的時候,我說 24 年會是大模型的場景之年,當時很多同行不以為然,在刷各種引數,但是到了 6 月份,我覺得整個研究就都轉過來了。「因為模型不是產品,模型只是能力,你有了人工智慧的能力,還要結合具體的需求。」(@AI 科技評論)
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 徹底改變語言模型:全新架構TTT超越Transformer,ML模型代替RNN隱藏狀態模型架構ORMRNN
- 11Labs 支援打造對話 AI 智慧體;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 開發者日報AI智慧體阿里大模型開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 多家中國車企宣佈將搭載英偉達最新車載晶片;Altman 曝全新 GPT-5 細節丨 RTE 開發者日報 Vol.168晶片GPT開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- 英偉達市值超越蘋果;ChatGPT、Perplexity、Claude 同時大崩潰丨 RTE 開發者日報 Vol.220蘋果ChatGPT開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- 零一萬物 Yi-Lightning:超越 GPT-4o 衝擊全球榜單;阿里國際 Marco 翻譯大模型釋出丨 RTE 開發者日報GPT阿里大模型開發者日報
- 大語言模型底層架構丨帶你認識Transformer模型架構ORM
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- GTC 2024 開幕,英偉達釋出新一代 GPU 架構;Apple ID 或將淘汰丨 RTE 開發者日報 Vol.168GPU架構APP開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- TikTok 正式起訴美國政府;全新 iPad Pro 將搭載蘋果 M4 晶片丨 RTE 開發者日報 Vol.199iPad蘋果晶片開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- 華為否認大模型演示造假;美國億萬富翁宣佈競購 TikTok 丨 RTE 開發者日報 Vol.206大模型開發者日報
- 《阿凡達》導演卡梅隆加入 Stability AI 董事會;Molmo 橫空出世,開源多模態模型王座易位丨 RTE 開發者日報AI模型開發者日報
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- RTE 大會報名丨 AI 時代新基建:雲邊端架構和 AI Infra ,RTE2024 技術專場第二彈!AI架構
- 爆火 AI 硬體遭差評,Ai Pin 上市即翻車;Grok 推出首個多模態模型丨 RTE 開發者日報 Vol.184AI模型開發者日報
- 位元組跳動打響大模型價格戰;蘋果將在 iPhone、iPad 上推出眼球追蹤功能丨 RTE 開發者日報 Vol.205大模型蘋果iPhoneiPad開發者日報
- 星紀魅族宣佈 All in AI;歐盟將首次對蘋果處以罰款丨 RTE 開發者日報 Vol.146AI蘋果開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- OpenAI 釋出全新生成式模型 GPT-4o;位元組收購音訊裝置公司 Oladance 丨 RTE 開發者日報 Vol.203OpenAI模型GPT音訊開發者日報
- OpenAI CEO Sam Altman:AI革命即將到來,我們需要新的系統OpenAI
- 非Transformer架構站起來了!首個純無注意力大模型,超越開源巨頭Llama 3.1ORM架構大模型
- 什麼是LLM大模型訓練,詳解Transformer結構模型大模型ORM
- Amphion 推出開源 TTS 模型 MaskGCT,5 秒克隆聲音;神秘文生圖模型「小熊貓」登頂競技場丨 RTE 開發者日報TTS模型GC開發者日報