微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@JLT,@ 鮑勃
01 有話題的新聞
1、一張圖即可 0.5 秒生成三維建模,Stability AI 推出「Stable Fast 3D」模型
Stability AI 近天推出了一款名為 Stable Fast 3D 的 AI 模型,該模型主打「圖生 3D 模型」,號稱只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前該模型已在 Hugging Face 平臺上架。
Stable Fast 3D 只需要單張圖片即可快速生成高質量的 3D 模型,相關模型自帶材質及對應的引數,同時提供了精確的 UV 展開(UV Unwrapping)便於使用者進行後期修改,如果使用者需要,還可以選擇四邊形或三角形網格重建功能,相關工作只需多耗費 100 至 200 毫秒時間即可完成,能夠允許使用者更細緻地控制模型網格拓撲結構。
官方同時提到,Stable Fast 3D 能夠在利用圖片生成模型時儘可能減少原圖中主體受光照影響的痕跡,以便於生成的模型在不同的環境光照下都可以呈現出正確的顏色。(@IT 之家)
2、微軟宣佈將 Azure AI 與 GitHub 進行深度整合,大幅簡化 AI 應用開發流程
微軟宣佈與 GitHub 合作,旨在透過 GitHub.com 無縫整合 Codespaces 和 Visual Studio Code,使超過 1 億開發者能夠直接從 GitHub 構建 AI 應用。這一合作使 AI 開發更加便捷和可擴充套件,為開發者提供透過 GitHub Models 和簡單 API 訪問 Azure AI 領先模型的機會。
新功能允許開發者直接在 GitHub 中訪問和使用 Azure AI 服務。
整合包括程式碼生成、AI 輔助程式設計和自動化測試等功能。
開發者可以在 GitHub Models 中直接使用 Azure AI 最新的 AI 模型庫
開發者可以使用 Azure AI 推理 API 輕鬆實驗和比較不同的 AI 模型,無需更改底層程式碼。
(@ 小互 AI)
3、史丹佛 AI 實驗室推出 AlphaXiv 論文討論平臺,可進行實時討論
AlphaXiv 由史丹佛 AI 實驗室的學生 Rehaan Ahmad 和 Raj Palleti 打造,他們都曾在吳恩達實驗室工作。該平臺允許使用者註冊賬號後對 arXiv 上的論文進行評論和討論,支援不同型別的評論,如一般性問題、研究性見解、資源分享和私人筆記。使用者可以申請成為 reviewer,參與論文評審和討論主持。
AlphaXiv 最初是作為 web 開發課的期末作業啟動,後來在史丹佛內部得到了實驗室的使用和最佳化。該平臺支援與 ORCID 系統的整合,實現了身份識別和學術成果連結。目前,AlphaXiv 已經吸引了多個實驗室的合作,並且獲得了業內專家的關注和支援。(@AI 科技評論)
4、為推進人工智慧語音專案,Meta 向好萊塢明星提供百萬美元報酬
據彭博社報導,Meta 準備向好萊塢明星們提供數百萬美元,以換取他們的錄音和在人工智慧專案中使用他們的聲音的權利。知情人士表示,Meta 正在與公司正在與朱迪·丹奇,奧卡菲娜和基根·邁克爾·基就此事進行交談。
報導指出,Meta 公司正在加緊達成交易,以便有時間開發一套人工智慧工具,並在 9 月份的 Connect 2024 活動上亮相。
知情人士表示,雖然目前還不完全清楚 Meta 將如何使用這些聲音,但已經討論了一款可以充當數字助理或朋友的聊天機器人。例如,使用者可以與擁有奧卡菲娜聲音的聊天機器人交談。(@ 愛範兒)
5、MindSearch:匹敵 Perplexity.ai 模仿人類在網路上尋找和整合資訊的 AI 搜尋
上海 AI Lab 開源了名為 MindSearch 的 AI 搜尋工具,能力與 Perplexity Pro 相當,提供了線上演示和程式碼,支援深入理解問題並構建動態搜尋思維圖譜,基於 MultiAgent 架構提升可信度和可用性。
MindSearch 能夠瀏覽數百個網頁來深入理解和回答問題,動態構建搜尋思維圖譜。該工具基於 MultiAgent 架構,旨在提高可信度和可用性。MindSearch 的核心功能包括動態構建思考圖譜,透過 MultiAgent 反思機制來提高可信度,以及支援解決生活中的任何問題,進行深入問題解決,並最佳化使用者介面。在超過 100 個人工設計的現實問題上,MindSearch 在深度、廣度和真實性上均超越了 ChatGPT-Web 和 Perplexity Pro。(@AI 科技評論)
02 有態度的觀點
1、吳聲:人是 AI 終端的終極形態
據新浪科技報導,在新物種爆炸·吳聲商業方法釋出 2024 活動上,場景實驗室創始人吳聲表示,2024 年,聯想 AI PC 正在開啟個人的 Agent 時代。
他現場喊話聯想,表示「不要辜負我們的期待」。他認為,端智慧正在迎來了一個全新的好時代,端正在成為具體場景的最大公約數。
在吳聲看來,在這樣的背景下,「人才是 AI 終端的終極形態,這個人不是人形機器人,而是我們在座的每一個人,我們都是 AI 終端的終極形態」。(@ 愛範兒)
2、京東雲總裁:大模型要用起來才能活起來
京東集團技術委員會主席、京東雲事業部總裁曹鵬接受澎湃新聞記者採訪時談到了 AI 大模型應用的一些觀點。
曹鵬認為,大模型要用起來,才能「活起來」。「當下沒有一個模型可以解決企業所有場景的應用,通用大模型可以靠卡堆出來,但好的企業大模型,必須要靠業務用出來。」,曹鵬說。
談及 AI 的前景,曹鵬認為,在模型訓練和整體算力上確實存在泡沫,從商業應用角度,他更看好 B 端(企業端)場景的最後打通,認為現在的模型還不足以支撐其在 C 端(消費者端)出現智慧化。(@ 愛範兒)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 0.5秒,無需GPU,Stability AI與華人團隊VAST開源單圖生成3D模型TripoSRGPUAIAST3D模型
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 《阿凡達》導演卡梅隆加入 Stability AI 董事會;Molmo 橫空出世,開源多模態模型王座易位丨 RTE 開發者日報AI模型開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 首個被人類騙錢的 AI 誕生;微信公眾號後臺新增「AI 配圖」功能丨 RTE 開發者日報AI開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- 斯嘉麗·約翰遜指控 OpenAI 非法使用其聲音;微軟推出 AI 工具「回顧」(Recall)丨 RTE 開發者日報 Vol.208OpenAI微軟開發者日報
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- Pi 母公司將開發情感 AI 商業機器人;Meta 科學家:Sora 不是影片生成唯一方向丨 RTE 開發者日報 Vol.214AI機器人Sora開發者日報
- WWDC 蘋果釋出 AI 全家桶;三星宣佈「實時翻譯」將相容第三方 App 丨 RTE 開發者日報 Vol.222蘋果AIAPP開發者日報
- Stability AI開源47秒音訊生成模型,蟲鳴鳥叫、搖滾、鼓點都能生成AI音訊模型
- 星紀魅族宣佈 All in AI;歐盟將首次對蘋果處以罰款丨 RTE 開發者日報 Vol.146AI蘋果開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- 位元組豆包釋出新模型,AI 一句話 P 圖;Google 正式推出 Vids,簡單提示即可生成影片演示丨 RTE 開發者日報模型AIGo開發者日報
- 活動報名丨實時互動 AI 開發者年度聚會!RTE Open Day@RTE2024,10.25/26 北京AI
- AI晶片0.5與2.0AI晶片
- SpaceX 星艦發射「成功一半」;首位具身 AI 機器人面世丨 RTE 開發者日報 Vol.166AI機器人開發者日報
- 爆火 AI 硬體遭差評,Ai Pin 上市即翻車;Grok 推出首個多模態模型丨 RTE 開發者日報 Vol.184AI模型開發者日報
- AI 口語學習應用 Speak 新一輪融資估值 10 億美元;YouTube 推出 AI 多語言配音丨 RTE 開發者日報AI開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨RTE 開發者日報AI開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨 RTE 開發者日報AI開發者日報
- ChatGPT 新增朗讀功能;微軟 Win11 滑鼠懸停自動開啟 Copilot 丨 RTE 開發者日報 Vol.158ChatGPT微軟開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- 美眾議院透過強制要求 TikTok 剝離的法案; 首個 AI 軟體工程師上線丨 RTE 開發者日報 Vol.165AI軟體工程工程師開發者日報