爆火 AI 硬體遭差評,Ai Pin 上市即翻車;Grok 推出首個多模態模型丨 RTE 開發者日報 Vol.184
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
01 有話題的新聞
1、馬斯克的首款多模態大模型來了,GPT-4V 又被超越了一次
上個週末,X.AI 推出首個多模態模型 Grok-1.5V;能處理文字、文件、圖表、截圖和照片。
Grok-1.5V 在多領域效能媲美頂尖多模態模型,預計將提升影像、音訊和影片處理能力,而在基準測試 RealWorldQA 上顯示 Grok-1.5V 在理解物理世界方面的卓越效能。(@ 三易生活)
2、騰訊雲披露 4 月 8 日服務故障原因:雲 API 異常持續近 87 分鐘
IT 之家 4 月 14 日訊息,騰訊雲官方公眾號今日發文,披露了 4 月 8 日服務大範圍故障的原因及細節。
官方表示,經過故障定位發現,客戶登入不上控制檯正是由雲 API 異常所導致。雲 API 是雲上統一的開放介面集合,客戶可透過 API 以程式設計方式管理和操控雲端資源,雲控制檯透過組合雲 API 提供互動式的網頁功能。(@IT 之家)
3、Adobe 以每分鐘約 3 美元的價格購買影片構建文字影片 AI 模型
Adobe 正以每分鐘約 3 美元的價格購買影片構建文字影片生成模型,試圖趕上 OpenAI 的 Sora。Adobe 要求攝影師和藝術家遞交表現人們日常活動的影片,比如步行,或者表達情緒如快樂和生氣。Adobe 要求提供逾百種人物動作和表現情感的短片,以及腳、手或眼睛的簡單解剖片段。它不希望影片包含版權材料,裸體或其它冒犯性內容。影片的平均費用約為每分鐘 2.62 美元,最高每分鐘 7.25 美元。(@Solidot)
4、清華團隊釋出 AI 光晶片「太極」:靈感來自周易
清華大學科研團隊的新成果釋出在了 4 月 12 日凌晨的最新一期《科學》上,首創分散式廣度智慧光計算架構,研製出全球首款大規模干涉衍射異構整合晶片「太極(Taichi)」,實現了 160 TOPS/W 的通用智慧計算,首次賦能光計算實現自然場景千類物件識別、跨模態內容生成等人工智慧複雜任務。
據介紹,「太極」光晶片架構開發的過程中,靈感來自典籍《周易》,團隊成員以「易有太極,是生兩儀」為啟發,建立了全新的計算模型,實現了光計算強悍效能的釋放。
「太極」光晶片有望為大模型訓練推理、通用人工智慧、自主智慧無人系統提供算力支撐。(@ 快科技)
02 有態度的觀點
1、爆火 AI 硬體遭差評,Ai Pin 上市即翻車
最近,Ai Pin 的第一批使用者拿到了他們的新玩具。
自從在 MWC 2024(世界行動通訊大會)亮相後,標榜要做「AI 時代的 iPhone」的 Ai Pin 終於發貨,第一時間上手的外媒也抱著極大的熱情和好奇,全方位體驗了這款「奇葩」產品。
大家都對 Ai Pin 有著高度一致的評價:
- 裝置做工精良,不愧是蘋果前工程師的作品;
- 看上去比圖片裡的要小,佩戴很方便,有多個模組可選;
- 拍照質量不錯;
- 實時翻譯很好用,譯文挺準確。
但如果你想知道 Ai Pin 是否值得購買,所有人也都會異口同聲地叫醒你:NO
- 過於簡陋,沒多大用處。——Wired
- 我真正可以依靠 Ai Pin 做的唯一一件事就是告訴我時間。——The Verge(@ 愛範兒)
03 有思考的文章
1、《做工具,開發者工具》
「信任開發者的技術能力非常重要,要做到『放權』。
何為信任他們的技術能力?就是針對他們的技術水平,給到他們不同程度的控制。
何為控制?就是支援不同 interface 層面上的操作,讓他們有自主權。以下面的 interface 進行舉例,我的理解,從控制度大小排序:APIs(Application Programming Interfaces)> Command-Line Interfaces(CLIs)> Configuration Files > GUI(Graphical user interface)」(@ 雞湯掛麵)
@ 鮑勃:是從@Tison 的推薦看到這篇文章的。作者作為一個非技術背景的產品設計師,分享了自己如何理解開發者,以及如何給開發者更多控制權,並在不同互動介面提供合適功能的思考。
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 《阿凡達》導演卡梅隆加入 Stability AI 董事會;Molmo 橫空出世,開源多模態模型王座易位丨 RTE 開發者日報AI模型開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- Mini-Omni:具有實時對話能力的多模態模型;狨猴會用名字稱呼彼此 丨 RTE 開發者日報模型開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 11Labs 支援打造對話 AI 智慧體;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 開發者日報AI智慧體阿里大模型開發者日報
- 新火種AI|微軟扶持下一個OpenAI?Mistral AI新模型對標GPT-4,上線即擠爆微軟OpenAI模型GPT
- ElevenLabs Voice Design :可透過文字建立個性化語音;蘋果推出首個開發者測試版丨 RTE 開發者日報蘋果開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- 新火種AI|“賭城”上演“科技春晚”,AI硬體將在2024年大爆發AI
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- 實時多模態 AI 的 N 種新可能丨實時互動和大模型專場 @RTE2024 回顧AI大模型
- 阿里釋出革新的音訊多模態模型 Qwen2-Audio;月之暗面回應大模型顯示「9.11 大於 9.9」丨 RTE 開發者日報阿里音訊大模型開發者日報
- 新火種AI|Grok即將上線!馬斯克據此成為“資料封建王”?AI馬斯克
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- 蘋果頭顯產品年內中國上市;「美版貼吧」Reddit 苦熬 19 年終上市丨 RTE 開發者日報 Vol.170蘋果開發者日報
- 微軟釋出首個大氣AI基礎模型Aurora微軟AI模型
- 馬斯克的 xAI 融資 60 億美元;英偉達收購兩家 AI 創企丨 RTE 開發者日報 Vol.193馬斯克AI開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- 沒有方向盤和踏板,特斯拉釋出無人駕駛計程車;位元組豆包推出 AI 智慧體耳機 Ola Friend 丨 RTE 開發者日報AI智慧體開發者日報
- 位元組豆包釋出新模型,AI 一句話 P 圖;Google 正式推出 Vids,簡單提示即可生成影片演示丨 RTE 開發者日報模型AIGo開發者日報
- 和 TEN、CosyVoice、Rokid 一起「組裝」你的專屬多模態 Agent!丨 RTE2024 AI 工坊報名AI
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- Spring AI多模態開發SpringAI
- 星紀魅族宣佈 All in AI;歐盟將首次對蘋果處以罰款丨 RTE 開發者日報 Vol.146AI蘋果開發者日報
- SpaceX 星艦發射「成功一半」;首位具身 AI 機器人面世丨 RTE 開發者日報 Vol.166AI機器人開發者日報
- 46秒AI生成真人影片爆火,遭線上打假「換口型、聲音」AI
- 活動報名丨實時互動 AI 開發者年度聚會!RTE Open Day@RTE2024,10.25/26 北京AI
- Fish Agent:多語言 Voice-to-Voice 開源語音模型;Runway 推出攝像機運鏡功能丨 RTE 開發者日報模型開發者日報