首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的新聞」、「有態度的觀點」、「有意思的資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
01 有話題的新聞
1、OpenAI 宣佈訓練名為 CriticGPT 的模型,用於捕捉 ChatGPT 程式碼輸出中的錯誤
OpenAI 於 6 月 27 日宣佈,該公司已經成功訓練了一個基於 GPT-4 的模型,命名為 CriticGPT。這個模型主要用來檢測和糾正 ChatGPT 程式碼輸出中存在的錯誤。
CriticGPT 作為一個批判性評估器,在生成文字時能夠提供更準確、可靠的反饋資訊。透過引入這個新模型,OpenAI 希望進一步改善 ChatGPT 在程式碼編寫方面的表現,並降低潛在問題發生率。(@CSDN)
2、史上首個實時 AI 影片生成技術,DiT 通用,速度提升 10.6 倍
新加坡國立大學提出 Pyramid Attention Broadcast(PAB)技術,透過減少冗餘注意力計算,實現高達 21.6 FPS 幀率和 10.6 倍加速;PAB 方法在影片生成的中間步驟廣播注意力輸出,大幅降低計算成本和通訊開銷,同時保持生成影片質量;PAB 方法在單 GPU 上加速 1.26 至 1.32 倍,在多 GPU 上實現 10.6 倍加速,顯著提高了基於 DiT 模型的實時影片生成效率。(@ 機器之心)
3、奧迪宣佈為自 2021 年起的 200 萬輛該品牌汽車整合 ChatGPT
奧迪宣佈,從今年 7 月起,將為數百萬輛奧迪車型提供由微軟 Azure OpenAI 服務支援的 ChatGPT 整合。透過這一整合,數百萬奧迪車主將能夠享受到改進的語音控制功能。
自 2021 年以來生產的約 200 萬輛配備 MIB 3(第三代模組化資訊娛樂系統)的奧迪車型將獲得 ChatGPT 整合更新。新款奧迪車型(如 Q6 e-tron)和未來採用 E3 1.2 電子架構的車型將透過 Cerence Chat Pro 獲得 ChatGPT 整合,作為奧迪助手的擴充套件。
除了透過語音控制資訊娛樂、導航和空調系統外,奧迪車主現在還可以詢問一些常識性問題。他們可以說「嘿,奧迪」或使用方向盤上的「一鍵通」按鈕來呼叫由 ChatGPT 支援的助手。
由 ChatGPT 支援的全新奧迪助手可以自動識別是應該執行車輛功能(如開啟空調),還是應該將查詢轉發給 ChatGPT 以回答常識性問題。(@cnBeta)
4、科大訊飛釋出星火大模型 4.0
科大訊飛釋出星火大模型 4.0,該模型在醫療、教育、商業等多個領域有應用。新增個人空間概念,升級曉醫 APP,提供個人數字健康空間。星火語音大模型支援 72 種語種/方言對話,並推出複雜場景語音轉寫技術。
同時,推出首款智慧批閱機,基於星火大模型,能智慧批改多學科作業並生成學情報告。(@ 騰訊新聞一線)
5、谷歌翻譯新增包括粵語在內 110 種語言支援,覆蓋 6.14 億使用者
谷歌宣佈,其翻譯服務將新增 110 種語言,包括粵語、NKo 和 Tamazight。這些新增的語言覆蓋了全球約 8% 的人口,其中包括一些擁有超過 1 億使用者的主要世界語言,以及一些由小型原住民社群使用的語言,還有一些語言幾乎沒有母語使用者,但正在進行復興工作。
谷歌表示,這些新增的語言是透過與專業語言學家和母語人士合作,並利用其 PaLM 2 大語言模型實現的。在此之前,谷歌曾於 2022 年宣佈了支援全球最常用的 1000 種語言的人工智慧模型計劃。谷歌翻譯將繼續與專業人員合作,在技術進步和時間推移的過程中,將提供更多語言的支援。(@CSDN)
02 有態度的觀點
1、Sam Altman 最新 NBC 對談:AGI 或在十年內實現全球 GDP 翻倍
近日,OpenAI CEO Sam Altman 和 Airbnb CEO Brian Chesky 與 NBC 主持人 Lester Holt 展開了一場關於 AI 發展現狀、未來前景以及其對社會潛在影響的討論。
Sam Altman 與 Brian Chesky 都強調, AI 的發展並非一蹴而就,而是一個漸進的過程。儘管 ChatGPT 的推出引起了廣泛關注,但大多數應用程式還未發生根本性變化。未來幾年,隨著更多應用程式在 AI 模型基礎上構建,變化將更加顯著。
Altman 預測, AGI 可能會使全球 GDP 翻倍,這將成為巨大的生產力驅動因素。他相信,隨著人們逐漸採用這些工具, AI 將帶來前所未有的經濟和社會效益。(@ 有新 Newin)
2、微軟 AI 負責人稱未來知識生產成本將降到邊際成本為零
據財聯社昨日報導,微軟 AI 執行長穆斯塔法。蘇萊曼示,對於許多開放網路上的內容,預設的社會契約是允許這種使用的。自 90 年代以來,網路內容的社會契約是基於「公平使用」原則,這意味著任何人都可以複製、重建或再生公開可用的內容。
他聲稱,現有智慧財產權法在某種程度上有寬鬆性,在 AI 時代這種寬鬆性面臨挑戰。AI 技術能夠在短時間內處理和生成大量資料和內容,這種能力可能會顛覆現有的知識生產和分配方式。蘇萊曼認為,資訊經濟學即將發生根本性的變化,「因為我們將把知識的生產成本降低到邊際成本為零」。(@ 愛範兒)
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- SpaceX 星艦週四晚八點再試飛;Backseat AI 釋出《英雄聯盟》實時輔導工具丨 RTE 開發者日報 Vol.219AI開發者日報
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 谷歌釋出世界模型,能生成可互動虛擬世界;華為釋出全球首個 5.5G 智慧核心網丨 RTE 開發者日報 Vol.152谷歌世界模型虛擬世界開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- Mistral 釋出 Large 2 123B 大模型;微軟釋出 VALL-E 2,零樣本實現聲音克隆丨 RTE 開發者日報大模型微軟開發者日報
- ChatGPT 向更多使用者推出高階語音模式:支援 50 種語言;位元組釋出兩款新影片生成大模型丨 RTE 開發者日報ChatGPT模式大模型開發者日報
- 位元組豆包釋出新模型,AI 一句話 P 圖;Google 正式推出 Vids,簡單提示即可生成影片演示丨 RTE 開發者日報模型AIGo開發者日報
- OpenAI 釋出全新生成式模型 GPT-4o;位元組收購音訊裝置公司 Oladance 丨 RTE 開發者日報 Vol.203OpenAI模型GPT音訊開發者日報
- WWDC 蘋果釋出 AI 全家桶;三星宣佈「實時翻譯」將相容第三方 App 丨 RTE 開發者日報 Vol.222蘋果AIAPP開發者日報
- Hume AI 語音控制功能:建立個性化語音;李飛飛空間智慧首個模型:單圖生成 3D 互動場景丨 RTE 開發者日報AI模型3D開發者日報
- 百度釋出 AI 眼鏡:全球首搭中文大模型,支援邊走邊問;OpenAI 聯合創始人宣佈迴歸,主抓重大技術創新丨 RTE 開發者日報大模型OpenAI開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 亞馬遜雲集齊 Claude 3 全家桶;世界數字技術院釋出大模型安全國際標準丨 RTE 開發者日報 Vol.187亞馬遜大模型開發者日報
- 釋出會後蘋果股價創歷史新高;商湯 Embedding 模型拿下 SOTA 丨 RTE 開發者日報 Vol.223蘋果模型開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 用AI重新定義記錄——科大訊飛釋出智慧辦公本AirAI
- 阿里釋出革新的音訊多模態模型 Qwen2-Audio;月之暗面回應大模型顯示「9.11 大於 9.9」丨 RTE 開發者日報阿里音訊大模型開發者日報
- OpenAI 釋出 AI 生成圖片檢測器;特斯拉計劃在中國測試自動駕駛計程車丨 RTE 開發者日報 Vol.200OpenAI自動駕駛開發者日報
- 議程丨全球首款企業級OpenSCA技術開源釋出會
- 蘋果歷時 13 年最終勝訴;谷歌釋出 Gemma 大模型;華為首超蘋果成中國平板市場第一丨 RTE 開發者日報 Vol.149蘋果谷歌Gemma大模型開發者日報
- RTE 大會報名丨智慧編解碼和 AI 生成影片 ,RTE2024 技術專場第五彈!AI
- 零一萬物 Yi-Lightning:超越 GPT-4o 衝擊全球榜單;阿里國際 Marco 翻譯大模型釋出丨 RTE 開發者日報GPT阿里大模型開發者日報
- 權威釋出丨2021 中國最受開發者歡迎的技術活動
- 權威釋出丨2022 中國最受開發者歡迎的技術活動
- Microsoft Build 釋出丨開發者關注的7大方向技術更新ROSUI
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報AI3D開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨RTE 開發者日報AI3D開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- 最強國產 Sora 大模型 Vidu 釋出,長度可達 16 秒;微信檔案 3 小時內可撤回丨 RTE 開發者日報 Vol.194Sora大模型開發者日報
- 科大訊飛釋出智慧辦公本Air 2,打造更懂你的辦公AI助手AI
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- QEMU 4.0 釋出
- selenium 4.0 釋出