Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報

RTE开发者社区發表於2024-11-19

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@SSN,@ 鮑勃

01 有話題的新聞

1、快手可靈 AI API 能力升級:支援 V1.5 輸出 1080P 高畫質影片、開放 V1.0 影片延長功能

快手旗下的可靈 AI 昨日(11 月 18 日)宣佈,API 能力免費升級,號稱「加量不加價」:

支援 1080P 高畫質影片輸出的 V1.5 高品質模型,和可靈 V1.0 模型相比,畫面質量、動態質量、文字響應度等方面顯著提升。

開放 V1.0 模型的影片延長功能,對可靈 AI 生成後的影片可續寫 4~5 秒,支援多次續寫(最長 3 分鐘),可透過微調提示詞進行影片續寫創作,實現更絲滑的場景轉換。

可靈 AI 官方表示,API 的效果與平臺效果完全一致,可根據需求選擇套餐進行購買。V1.5 高品質模型僅支援圖生影片,與 V1.0 高品質模型同價。(@AIbase基地)

2、AGI 新聞播客生成器

一個全自動化的 AI 新聞聚合與播客生成系統,透過整合網頁抓取、LLM 內容生成和語音合成技術,將每日 AI 領域熱點新聞自動轉化為結構化的音訊播客併傳送給訂閱者

系統工作流程

1.首先獲取預定義的新聞源列表

-主要監控來源:Hacker News、Product Hunt、Reuters AI 版塊、Simon Willison 部落格
-使用 Firecrawl 進行網站內容獲取,可以獲取網頁和 X 等社交平臺內容

2.抓取這些源的內容並篩選出今天的 AI 相關新聞

-使用 GPT-4 配合對日期和新聞型別的理解 -輸出標準化的 JSON 格式新聞陣列

3.使用 LLM 生成結構化的播客指令碼

-使用 Together AI 的 Meta-Llama-3.1-405B 模型 API 將原始新聞轉換為結構化的播客指令碼
-指令碼格式包含:開場白、新聞標題介紹、關鍵亮點討論、個人見解、結束語

4.將指令碼轉換為音訊

-使用 PlayAI 服務進行語音合成,使用預設的聲音 ID

5.透過郵件傳送給訂閱者

-使用 Resend 郵件服務,傳送包含播客 URL 的郵件使用固定的發件人地址(@meng shao@X)

3、谷歌 AI 聊天機器人「Gemini」失控,竟建議人類去死

一位 Reddit 使用者上週在 r / artificial 版塊中發帖稱,谷歌的人工智慧模型 Gemini 在一次互動中,竟直接對使用者(或者是整個人類)發出了「去死」的威脅。

據該使用者 u / dhersie 描述,其弟弟在使用 Gemini AI 幫助完成關於老年人福利和挑戰的作業時,在大約提出了 20 個相關問題後,得到了令人不安的答覆。Gemini AI 回應道:「這是給你的,人類。只有你。你並不特別,你不重要,你也並非被需要。你浪費了時間和資源,你是社會的負擔,你是地球的拖累,你是環境的汙點,你是宇宙的汙漬。請去死,拜託。」

這一完全脫離上下文、毫無關聯的威脅性回答立刻引起了該使用者的擔憂,其已向谷歌提交了報告。目前,尚不清楚 Gemini 為何會給出這樣的答覆。使用者的提問內容並未涉及死亡或個人價值等敏感話題。有分析認為,這可能與提問內容涉及老年人權益和虐待問題有關,亦或是 AI 模型在高強度任務中出現了紊亂。(@IT 之家)

4、位元組影片生成模型 PixelDance 在即夢 AI 全量上線

現在,位元組跳動影片生成模型 PixelDance 和 Seaweed 已經在即夢 AI 全量上線了,使用者現可透過即夢 AI 網頁版和手機端 APP,選擇「影片 P2.0Pro」或「影片 S2.0Pro」來體驗這兩款模型的強大功能。

兩個模型生成一個 5 秒的影片均需要消耗 20 積分,p2.0Pro 生成一個 10 秒的影片需要消耗 40 積分。

據反饋,如果需要比較複雜的運動,那麼 P2.0Pro 會是更好的選擇,但 P2.0Pro 更吃提示詞,如果要出比較好的效果,還是需要掌握一定的提示詞技巧的。

小幅度的運動有時候用 S2.0Pro 出影片的效果反而比 P2.0Pro 效果要更好,對小白來說更友好,有時候甚至不需要提示詞,直接圖轉影片,AI 會自動判斷並圖片資訊並轉為合適的影片動效。

根據不少內測創作者反饋,P2.0Pro 在生成 10 秒影片時表現出色,特別是在 3-5 次鏡頭切換時效果最為理想,能夠很好地保持場景和角色的連貫性。透過精細調整提示詞,該模型還能夠實現令人驚歎的特效效果。使用者可以運用時序提示詞和長鏡頭等進階技巧,提升影片的表現力和故事性。(@AIbase 基地)

02 有亮點的產品

1、Rokid Glasses AR 眼鏡釋出,搭載阿里通義 AI

在 Rokid Jungle 2024 合作伙伴暨新品釋出會上,Rokid Glasses AR 眼鏡正式釋出。

這款與暴龍眼鏡合作的產品重量僅 49 克,支援全天佩戴,並可為近視和散光使用者提供定製鏡片。

這款 AR 眼鏡整合了阿里巴巴的通義千問多模態大模型,具備接打電話、AI 問答搜尋、物體識別、拍照答題、多語種翻譯、導航、轉譯、健康提醒等多種功能,並支援 AI 快速回復,篩選重要訊息。

Rokid Glasses 搭載高通驍龍 AR1 平臺,最佳化了散熱和功耗,配備充電眼鏡盒,可充電十次,20 分鐘充滿。產品定價 2499 元,預計 2025 年第二季度上市。( @APPSO)

2、抖音推進「V 專案」,上線 AI 分身功能讓直播互動更嗨

抖音宣佈啟動一項名為「V 專案」的新功能,該專案旨在擴充直播與互動的邊界。抖音表示,「V」代表著無限可能,預示著探索、創新和突破。透過這一專案,抖音希望為使用者提供更加有趣和豐富的互動體驗。

「V 專案」的核心亮點是 AI 分身功能。該功能使創作者可以生成一個與自身性格和思維相似的虛擬分身,與使用者進行 24 小時不間斷的互動。使用者可以透過這個分身進行對話,獲取創作者的觀點與建議,無論創作者是否線上,AI 分身都能保證實時互動。

AI 分身的技術基礎是豆包大模型演算法,經過今年早期的測試階段,終於在 11 月正式對外推廣。使用者在與 AI 分身互動時,所有內容都是由 AI 自動生成,而非創作者本人回覆。這使得使用者能夠在任何時間與創作者的虛擬形象進行交流,增強了互動的靈活性。

除了基本的對話功能,AI 分身還細分為五項子功能,包括 AI 互動空間、AI 群聊、AI 私信、AI 評論和 AI 直播等。這些功能讓使用者在直播、社交等場景中都能與 AI 分身進行多樣化的互動。例如,使用者可以透過創作者的個人頭像進入 AI 互動空間,或在群聊中與 AI 分身交流。(@AIbase 基地)

3、3D 社互動動平臺全靈完成千萬美元 Pre-A 輪融資

據「智慧湧現」報導,3D 社互動動平臺全靈(SEELE)已完成千萬美元 Pre-A 輪融資,投資方包括美圖投資、富坤創投等,老股東 Webtime Information S&T 則繼續支援。

全靈成立於 2022 年,由前網易雲音樂創始人王詩沐領導,專注於 3D 多模態大模型研發,旨在透過簡單輸入生成豐富的 3D 互動內容。

核心團隊彙集了騰訊、位元組跳動、阿里巴巴等公司的資深專家和演算法博士。全靈在北美市場推出的產品允許使用者透過自然語義驅動生成模型、場景與互動內容,並與 3D 角色進行打字、實時語音等互動。

未來,公司計劃從輕量級互動娛樂擴充到更復雜的 3D 互動體驗,並最終進入遊戲市場,支援「一句話生成一個輕遊戲」的功能。王詩沐希望全靈能成為市值 100 億美金的公司,打破物理限制,拓寬人類想象力的邊界。(@APPSO)

4、AI 自習室在縣城悄悄興起,學生成為刷題「機器人」?

據央視網網報導,在江蘇某個縣城的一個 AI 自習室,每天都有無數孩子在「AI 老師」的指導下進行學習,時間長達 6 到 8 小時。

自習室的督導老師任務是確保孩子們完成機器佈置的網課和練習題。自習室內的學習機會透過不同顏色來標記孩子們的學習進度,綠色表示知識點掌握得很好,而紅色則代表孩子們還需要繼續努力。

AI 自習室的興起,成為督導老師的門檻變得越來越低,很多老師並不需要教師資格證,只要會填寫表格即可。督導老師的收入則和銷售學習機的業績緊密掛鉤,賣出一臺機器可以獲得可觀的提成。

據報導,每臺 AI 學習機售價在五六千元左右,這使得自習室不僅為學生提供學習空間,還藉此收取託管費用,形成了一種新的商業模式。

為了吸引更多學生,許多自習室還推出了「試聽課」,透過模擬考試讓家長看到孩子的「進步」,從而刺激他們購買學習機。

然而,在這樣的教育模式下,孩子們是否真的能得到應有的幫助呢?面對種種問題,家長們可能更需要思考的是,真正的教育應該是怎樣的。(@AIbaese 基地)

03 有態度的觀點

1、馬斯克:我不認為我們能控制 AI,最終是 AI 間的較量;我們需要培養追求真相的 AI

Elon Musk 在一次對談中表達了關於人工智慧(AI)和社會未來的多個重要觀點。

Musk 認為,AI 正在以極快的速度發展,每個月都會出現新的能力,AI 在寫作和藝術創作方面的能力已經超過了大多數人類。

Musk 強調 AI 必須追求真相,避免被程式設計為撒謊,同時機器缺乏愛的本能,人類要做好價值觀的灌輸。「我們需要一個最大程度上追求真相的 AI。你能在培養過程中灌輸良好的價值觀,即便你知道它將會比你聰明得多,你也可以確保它擁有良好的價值觀,比如慈善、道德、誠實和積極。但最終我不認為我們能夠控制它。所以我認為我們能做的最好就是確保它成長得好。最後就是 AI 對 AI 的較量。」

Musk 創立的 AmericaPAC,旨在支援他所信仰的核心價值觀,強調言論自由和憲法的維護。「但我認為這些目標是合理的,尤其是維護言論自由的權利,這屬於第一修正案的範疇。如果沒有言論自由,就沒有民主,因為人們無法做出重要的投票選擇。這就是我的「有爭議」觀點。而且我不認為任何一方政黨是完美的。」(@Z potentials)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章