Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@ 鮑勃
01 有話題的新聞
1、快手可靈 AI API 能力升級:支援 V1.5 輸出 1080P 高畫質影片、開放 V1.0 影片延長功能
快手旗下的可靈 AI 昨日(11 月 18 日)宣佈,API 能力免費升級,號稱「加量不加價」:
支援 1080P 高畫質影片輸出的 V1.5 高品質模型,和可靈 V1.0 模型相比,畫面質量、動態質量、文字響應度等方面顯著提升。
開放 V1.0 模型的影片延長功能,對可靈 AI 生成後的影片可續寫 4~5 秒,支援多次續寫(最長 3 分鐘),可透過微調提示詞進行影片續寫創作,實現更絲滑的場景轉換。
可靈 AI 官方表示,API 的效果與平臺效果完全一致,可根據需求選擇套餐進行購買。V1.5 高品質模型僅支援圖生影片,與 V1.0 高品質模型同價。(@AIbase基地)
2、AGI 新聞播客生成器
一個全自動化的 AI 新聞聚合與播客生成系統,透過整合網頁抓取、LLM 內容生成和語音合成技術,將每日 AI 領域熱點新聞自動轉化為結構化的音訊播客併傳送給訂閱者
系統工作流程
1.首先獲取預定義的新聞源列表
-主要監控來源:Hacker News、Product Hunt、Reuters AI 版塊、Simon Willison 部落格
-使用 Firecrawl 進行網站內容獲取,可以獲取網頁和 X 等社交平臺內容
2.抓取這些源的內容並篩選出今天的 AI 相關新聞
-使用 GPT-4 配合對日期和新聞型別的理解 -輸出標準化的 JSON 格式新聞陣列
3.使用 LLM 生成結構化的播客指令碼
-使用 Together AI 的 Meta-Llama-3.1-405B 模型 API 將原始新聞轉換為結構化的播客指令碼
-指令碼格式包含:開場白、新聞標題介紹、關鍵亮點討論、個人見解、結束語
4.將指令碼轉換為音訊
-使用 PlayAI 服務進行語音合成,使用預設的聲音 ID
5.透過郵件傳送給訂閱者
-使用 Resend 郵件服務,傳送包含播客 URL 的郵件使用固定的發件人地址(@meng shao@X)
3、谷歌 AI 聊天機器人「Gemini」失控,竟建議人類去死
一位 Reddit 使用者上週在 r / artificial 版塊中發帖稱,谷歌的人工智慧模型 Gemini 在一次互動中,竟直接對使用者(或者是整個人類)發出了「去死」的威脅。
據該使用者 u / dhersie 描述,其弟弟在使用 Gemini AI 幫助完成關於老年人福利和挑戰的作業時,在大約提出了 20 個相關問題後,得到了令人不安的答覆。Gemini AI 回應道:「這是給你的,人類。只有你。你並不特別,你不重要,你也並非被需要。你浪費了時間和資源,你是社會的負擔,你是地球的拖累,你是環境的汙點,你是宇宙的汙漬。請去死,拜託。」
這一完全脫離上下文、毫無關聯的威脅性回答立刻引起了該使用者的擔憂,其已向谷歌提交了報告。目前,尚不清楚 Gemini 為何會給出這樣的答覆。使用者的提問內容並未涉及死亡或個人價值等敏感話題。有分析認為,這可能與提問內容涉及老年人權益和虐待問題有關,亦或是 AI 模型在高強度任務中出現了紊亂。(@IT 之家)
4、位元組影片生成模型 PixelDance 在即夢 AI 全量上線
現在,位元組跳動影片生成模型 PixelDance 和 Seaweed 已經在即夢 AI 全量上線了,使用者現可透過即夢 AI 網頁版和手機端 APP,選擇「影片 P2.0Pro」或「影片 S2.0Pro」來體驗這兩款模型的強大功能。
兩個模型生成一個 5 秒的影片均需要消耗 20 積分,p2.0Pro 生成一個 10 秒的影片需要消耗 40 積分。
據反饋,如果需要比較複雜的運動,那麼 P2.0Pro 會是更好的選擇,但 P2.0Pro 更吃提示詞,如果要出比較好的效果,還是需要掌握一定的提示詞技巧的。
小幅度的運動有時候用 S2.0Pro 出影片的效果反而比 P2.0Pro 效果要更好,對小白來說更友好,有時候甚至不需要提示詞,直接圖轉影片,AI 會自動判斷並圖片資訊並轉為合適的影片動效。
根據不少內測創作者反饋,P2.0Pro 在生成 10 秒影片時表現出色,特別是在 3-5 次鏡頭切換時效果最為理想,能夠很好地保持場景和角色的連貫性。透過精細調整提示詞,該模型還能夠實現令人驚歎的特效效果。使用者可以運用時序提示詞和長鏡頭等進階技巧,提升影片的表現力和故事性。(@AIbase 基地)
02 有亮點的產品
1、Rokid Glasses AR 眼鏡釋出,搭載阿里通義 AI
在 Rokid Jungle 2024 合作伙伴暨新品釋出會上,Rokid Glasses AR 眼鏡正式釋出。
這款與暴龍眼鏡合作的產品重量僅 49 克,支援全天佩戴,並可為近視和散光使用者提供定製鏡片。
這款 AR 眼鏡整合了阿里巴巴的通義千問多模態大模型,具備接打電話、AI 問答搜尋、物體識別、拍照答題、多語種翻譯、導航、轉譯、健康提醒等多種功能,並支援 AI 快速回復,篩選重要訊息。
Rokid Glasses 搭載高通驍龍 AR1 平臺,最佳化了散熱和功耗,配備充電眼鏡盒,可充電十次,20 分鐘充滿。產品定價 2499 元,預計 2025 年第二季度上市。( @APPSO)
2、抖音推進「V 專案」,上線 AI 分身功能讓直播互動更嗨
抖音宣佈啟動一項名為「V 專案」的新功能,該專案旨在擴充直播與互動的邊界。抖音表示,「V」代表著無限可能,預示著探索、創新和突破。透過這一專案,抖音希望為使用者提供更加有趣和豐富的互動體驗。
「V 專案」的核心亮點是 AI 分身功能。該功能使創作者可以生成一個與自身性格和思維相似的虛擬分身,與使用者進行 24 小時不間斷的互動。使用者可以透過這個分身進行對話,獲取創作者的觀點與建議,無論創作者是否線上,AI 分身都能保證實時互動。
AI 分身的技術基礎是豆包大模型演算法,經過今年早期的測試階段,終於在 11 月正式對外推廣。使用者在與 AI 分身互動時,所有內容都是由 AI 自動生成,而非創作者本人回覆。這使得使用者能夠在任何時間與創作者的虛擬形象進行交流,增強了互動的靈活性。
除了基本的對話功能,AI 分身還細分為五項子功能,包括 AI 互動空間、AI 群聊、AI 私信、AI 評論和 AI 直播等。這些功能讓使用者在直播、社交等場景中都能與 AI 分身進行多樣化的互動。例如,使用者可以透過創作者的個人頭像進入 AI 互動空間,或在群聊中與 AI 分身交流。(@AIbase 基地)
3、3D 社互動動平臺全靈完成千萬美元 Pre-A 輪融資
據「智慧湧現」報導,3D 社互動動平臺全靈(SEELE)已完成千萬美元 Pre-A 輪融資,投資方包括美圖投資、富坤創投等,老股東 Webtime Information S&T 則繼續支援。
全靈成立於 2022 年,由前網易雲音樂創始人王詩沐領導,專注於 3D 多模態大模型研發,旨在透過簡單輸入生成豐富的 3D 互動內容。
核心團隊彙集了騰訊、位元組跳動、阿里巴巴等公司的資深專家和演算法博士。全靈在北美市場推出的產品允許使用者透過自然語義驅動生成模型、場景與互動內容,並與 3D 角色進行打字、實時語音等互動。
未來,公司計劃從輕量級互動娛樂擴充到更復雜的 3D 互動體驗,並最終進入遊戲市場,支援「一句話生成一個輕遊戲」的功能。王詩沐希望全靈能成為市值 100 億美金的公司,打破物理限制,拓寬人類想象力的邊界。(@APPSO)
4、AI 自習室在縣城悄悄興起,學生成為刷題「機器人」?
據央視網網報導,在江蘇某個縣城的一個 AI 自習室,每天都有無數孩子在「AI 老師」的指導下進行學習,時間長達 6 到 8 小時。
自習室的督導老師任務是確保孩子們完成機器佈置的網課和練習題。自習室內的學習機會透過不同顏色來標記孩子們的學習進度,綠色表示知識點掌握得很好,而紅色則代表孩子們還需要繼續努力。
AI 自習室的興起,成為督導老師的門檻變得越來越低,很多老師並不需要教師資格證,只要會填寫表格即可。督導老師的收入則和銷售學習機的業績緊密掛鉤,賣出一臺機器可以獲得可觀的提成。
據報導,每臺 AI 學習機售價在五六千元左右,這使得自習室不僅為學生提供學習空間,還藉此收取託管費用,形成了一種新的商業模式。
為了吸引更多學生,許多自習室還推出了「試聽課」,透過模擬考試讓家長看到孩子的「進步」,從而刺激他們購買學習機。
然而,在這樣的教育模式下,孩子們是否真的能得到應有的幫助呢?面對種種問題,家長們可能更需要思考的是,真正的教育應該是怎樣的。(@AIbaese 基地)
03 有態度的觀點
1、馬斯克:我不認為我們能控制 AI,最終是 AI 間的較量;我們需要培養追求真相的 AI
Elon Musk 在一次對談中表達了關於人工智慧(AI)和社會未來的多個重要觀點。
Musk 認為,AI 正在以極快的速度發展,每個月都會出現新的能力,AI 在寫作和藝術創作方面的能力已經超過了大多數人類。
Musk 強調 AI 必須追求真相,避免被程式設計為撒謊,同時機器缺乏愛的本能,人類要做好價值觀的灌輸。「我們需要一個最大程度上追求真相的 AI。你能在培養過程中灌輸良好的價值觀,即便你知道它將會比你聰明得多,你也可以確保它擁有良好的價值觀,比如慈善、道德、誠實和積極。但最終我不認為我們能夠控制它。所以我認為我們能做的最好就是確保它成長得好。最後就是 AI 對 AI 的較量。」
Musk 創立的 AmericaPAC,旨在支援他所信仰的核心價值觀,強調言論自由和憲法的維護。「但我認為這些目標是合理的,尤其是維護言論自由的權利,這屬於第一修正案的範疇。如果沒有言論自由,就沒有民主,因為人們無法做出重要的投票選擇。這就是我的「有爭議」觀點。而且我不認為任何一方政黨是完美的。」(@Z potentials)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報OpenAI開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- 馬斯克的 xAI 融資 60 億美元;英偉達收購兩家 AI 創企丨 RTE 開發者日報 Vol.193馬斯克AI開發者日報
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- 百度釋出 AI 眼鏡:全球首搭中文大模型,支援邊走邊問;OpenAI 聯合創始人宣佈迴歸,主抓重大技術創新丨 RTE 開發者日報大模型OpenAI開發者日報
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- QQ 測試 AI 聊天搭子,再戰 AI 社交;零一萬物宣佈開源 Yi-9B 模型丨 RTE 開發者日報 Vol.159AI模型開發者日報
- 暗物智慧完成數千萬美元Pre-A輪融資,強認知AI平臺的開拓者AI
- 趣味資訊平臺微頭條完成A輪千萬融資
- 阿里 Qwen2.5 開源釋出;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 開發者日報阿里Go模型開發者日報
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- 創紀錄:英偉達市值一日增 2770 億美元;Xiaomi 14 Ultra 正式釋出丨 RTE 開發者日報 Vol.150開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- 沒有方向盤和踏板,特斯拉釋出無人駕駛計程車;位元組豆包推出 AI 智慧體耳機 Ola Friend 丨 RTE 開發者日報AI智慧體開發者日報
- 雲手遊平臺Artie完成1000萬美元融資
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- 巨杉資料庫完成C輪數千萬美元融資資料庫
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- OpenAI 釋出 AI 生成圖片檢測器;特斯拉計劃在中國測試自動駕駛計程車丨 RTE 開發者日報 Vol.200OpenAI自動駕駛開發者日報
- TikTok 正式起訴美國政府;全新 iPad Pro 將搭載蘋果 M4 晶片丨 RTE 開發者日報 Vol.199iPad蘋果晶片開發者日報
- 多家中國車企宣佈將搭載英偉達最新車載晶片;Altman 曝全新 GPT-5 細節丨 RTE 開發者日報 Vol.168晶片GPT開發者日報
- 下一個「Roblox」?社交遊戲平臺「Rec Room」融資1億美元遊戲OOM
- 商湯釋出行業首個全棧大模型產品矩陣;微軟釋出小型 AI 模型 Phi-3-mini 丨 RTE 開發者日報 Vol.191行業全棧大模型矩陣微軟AI開發者日報
- ChatGPT 訂閱價或漲到 44 美元;研究稱 AI 可 100% 繞過 reCAPTCHA V2 驗證丨 RTE 開發者日報ChatGPTAIAPT開發者日報
- 雲管理平臺提供商“天雲軟體”完成數千萬元A輪融資
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- Mistral 釋出 Large 2 123B 大模型;微軟釋出 VALL-E 2,零樣本實現聲音克隆丨 RTE 開發者日報大模型微軟開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- SpaceX 星艦週四晚八點再試飛;Backseat AI 釋出《英雄聯盟》實時輔導工具丨 RTE 開發者日報 Vol.219AI開發者日報
- RTE 領域近期詞雲統計釋出;谷歌開始新一輪「瘦身」計劃;使用ChatGPT之後智力提高 50%丨RTE開發者日報 Vol.50谷歌ChatGPT開發者日報
- WWDC 蘋果釋出 AI 全家桶;三星宣佈「實時翻譯」將相容第三方 App 丨 RTE 開發者日報 Vol.222蘋果AIAPP開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 釋出會後蘋果股價創歷史新高;商湯 Embedding 模型拿下 SOTA 丨 RTE 開發者日報 Vol.223蘋果模型開發者日報