Mistral 釋出 Large 2 123B 大模型;微軟釋出 VALL-E 2,零樣本實現聲音克隆丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@JLT,@ 鮑勃
01 有話題的新聞
1、阿里巴巴通義大模型成為奧運首個 AI 大模型應用技術提供方
7 月 24 日,阿里巴巴通義大模型在與眾多國際科技公司的競爭中獲勝後,成為奧運首個 AI 大模型應用的技術提供方。
在即將開幕的巴黎奧運會上,將有一系列 AI 應用亮相。其中就包括阿里 AI 技術支援的 360 度直播特效、黑白影像 AI 彩色修復、碳減排輔助等應用。
另外,巴黎奧運會還將上線首個大模型應用,由阿里通義千問提供技術支援,開放給國際奧組委官方解說員使用,輔助各項賽事解說。(@ 愛範兒)
2、Mistral 釋出 Large 2 123B 大模型
法國初創公司 Mistral AI 今天宣佈推出 Large 2,這是其新的旗艦機型,在程式碼生成、數學和推理方面的能力大大增強。Mistral 還在 Large 2 中增加了更好的多語言支援和高階函式呼叫功能。
Mistral Large 2 型號有 1230 億個引數,可在單個 H100 節點上以高吞吐量執行。它支援法語、德語、西班牙語、義大利語、葡萄牙語、阿拉伯語、印地語、俄語、漢語、日語和韓語。在編碼方面,它支援 80 多種編碼語言,包括 Python、Java、C、C++、JavaScript 和 Bash。Mistral Large 2 現已開放權重,但只能免費用於研究和非商業用途。商業用途需獲得模型許可。(@CSDN)
3、蘋果宣佈推出 Apple Maps 網頁版地圖,全球使用者可直接透過瀏覽器訪問
蘋果今日宣佈旗下 Apple Maps 網頁版正式上線並開啟全球公測,所有使用者均可直接透過瀏覽器使用地圖服務(中國內地 IP 開啟該網站預設跳轉高德地圖)。蘋果指出,使用者可透過 Apple Maps 網頁版獲取駕車和步行路線、尋找好的去處、獲取目的地資訊(包括照片、營業時間、評分和評論),還可以直接從地圖卡片上訂餐。
藉助 Apple Maps 網頁版,使用者可以瀏覽精選指南以探索全球各大城市的美食、購物和景點。此外,蘋果還宣佈將在未來幾個月內推出包括「附近」在內的更多有趣功能。
對於開發者來說(包括使用 MapKit JS 的開發者),也可以連結到 Apple Maps 網頁版,讓使用者獲取駕車路線、檢視詳細地點資訊等。(@IT 之家)
4、阿里雲宣佈推出 Llama3.1 系列開源訓練推理服務
昨日,阿里雲宣佈,阿里雲百鍊平臺推出 Llama3.1 系列開源訓練推理服務。平臺將限時 1 個月為所有使用者提供免費算力額度,助力使用者玩轉 Llama3.1 訓練推理。
Meta 於昨天凌晨釋出了 Llama 3.1 模型,它包含 8B、70B 和 405B 三個尺寸,最大上下文提升到了 128K,支援多語言,程式碼生成效能優秀,具有複雜的推理能力。(@ 愛範兒)
5、語音克隆達到人類水平,微軟全新 VALL-E 2 模型讓 DeepFake 堪比配音員
繼去年初的第一代 VALL-E 模型之後,微軟最近又上新了 VALL-E 2 模型,標誌著第一個在合成語音穩健性、相似度、自然程度等方面達到人類水平的文字到語音模型。
最近,微軟釋出了零樣本的文字到語音(TTS)模型 VALLE-2,首次實現了與人類同等的水平,可以說是 TTS 領域裡程碑式的進展。「零樣本」意味著推理過程中,模型只能參照一段簡短的陌生語音樣本,用相同的聲音說出文字內容,就像一個能即時模仿的口技大師。
雖然 VALL-E 2 有很強的零樣本學習能力可以像配音員一樣模仿聲音,但相似度和自然度取決於語音 prompt 的長度和質量、背景噪音等因素。(@IT 之家)
02 有態度的觀點
1、英偉達黃仁勳:全球企業採用生成式 AI 的關鍵時刻已經到來
英偉達推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與 Llama 3.1 系列開源模型一起,為全球企業提供生成式 AI 相關服務。
黃仁勳認為,Llama 3.1 開源模型將掀起各個企業與行業建立先進生成式 AI 應用的浪潮。(@ 每日經濟新聞)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 阿里釋出革新的音訊多模態模型 Qwen2-Audio;月之暗面回應大模型顯示「9.11 大於 9.9」丨 RTE 開發者日報阿里音訊大模型開發者日報
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- Amphion 推出開源 TTS 模型 MaskGCT,5 秒克隆聲音;神秘文生圖模型「小熊貓」登頂競技場丨 RTE 開發者日報TTS模型GC開發者日報
- 微軟 Azure 推出文字到語音虛擬人;英偉達釋出 8B 小語言模型,可在 RTX 工作站部署丨 RTE 開發者日報微軟模型開發者日報
- OpenAI 釋出全新生成式模型 GPT-4o;位元組收購音訊裝置公司 Oladance 丨 RTE 開發者日報 Vol.203OpenAI模型GPT音訊開發者日報
- 釋出會後蘋果股價創歷史新高;商湯 Embedding 模型拿下 SOTA 丨 RTE 開發者日報 Vol.223蘋果模型開發者日報
- ChatGPT 向更多使用者推出高階語音模式:支援 50 種語言;位元組釋出兩款新影片生成大模型丨 RTE 開發者日報ChatGPT模式大模型開發者日報
- 最強國產 Sora 大模型 Vidu 釋出,長度可達 16 秒;微信檔案 3 小時內可撤回丨 RTE 開發者日報 Vol.194Sora大模型開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- 零一萬物 Yi-Lightning:超越 GPT-4o 衝擊全球榜單;阿里國際 Marco 翻譯大模型釋出丨 RTE 開發者日報GPT阿里大模型開發者日報
- 實時語音互動中文基準首期測評出爐;美取消 SB-1047 法案,大模型廠商大難不死丨 RTE 開發者日報大模型開發者日報
- 谷歌釋出世界模型,能生成可互動虛擬世界;華為釋出全球首個 5.5G 智慧核心網丨 RTE 開發者日報 Vol.152谷歌世界模型虛擬世界開發者日報
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 亞馬遜雲集齊 Claude 3 全家桶;世界數字技術院釋出大模型安全國際標準丨 RTE 開發者日報 Vol.187亞馬遜大模型開發者日報
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- 斯嘉麗·約翰遜指控 OpenAI 非法使用其聲音;微軟推出 AI 工具「回顧」(Recall)丨 RTE 開發者日報 Vol.208OpenAI微軟開發者日報
- Kotlin 2版本即將釋出Kotlin
- 創紀錄:英偉達市值一日增 2770 億美元;Xiaomi 14 Ultra 正式釋出丨 RTE 開發者日報 Vol.150開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 微軟釋出遊戲 UX/UI 開發指南微軟遊戲UXUI
- RTE 領域近期詞雲統計釋出;谷歌開始新一輪「瘦身」計劃;使用ChatGPT之後智力提高 50%丨RTE開發者日報 Vol.50谷歌ChatGPT開發者日報
- WebRTC 作者加入 OpenAI 主導實時 AI 專案;TTS 小模型 OuteTTS v0.2 釋出:聲音克隆 + 多語言WebOpenAITTS模型
- WebRTC 作者加入 OpenAI 主導實時 AI 專案;TTS 小模型 OuteTTS v0.2 釋出:聲音克隆+多語言WebOpenAITTS模型
- 蘋果 macOS 12.2 開發者預覽版 Beta2 釋出蘋果Mac
- .NET 8 RC 2 釋出,將在11月14日釋出正式版
- 微軟開始推送Win10 19H2釋出預覽18363.327微軟Win10
- 微軟釋出Win10 1909(19H2)正開發首個預覽版微軟Win10
- 微軟正式釋出:.NET Aspire 雲原生開發框架微軟框架
- SpaceX 星艦週四晚八點再試飛;Backseat AI 釋出《英雄聯盟》實時輔導工具丨 RTE 開發者日報 Vol.219AI開發者日報
- 蘋果歷時 13 年最終勝訴;谷歌釋出 Gemma 大模型;華為首超蘋果成中國平板市場第一丨 RTE 開發者日報 Vol.149蘋果谷歌Gemma大模型開發者日報