YouTube 上線「用相機拍攝」標籤為真實影片「驗明正身」;美國被曝考慮限制向中東國家出口 AI 晶片丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@SSN,@ 鮑勃
01 有話題的新聞
1、美國被曝考慮限制英偉達、AMD 等向中東國家出口 AI 晶片
外媒援引知情人士訊息稱,美國已討論限制英偉達、AMD 等美國公司對某些國家人工智慧晶片的出口許可證設定上限。這些限制將重點放在波斯灣國家,這些國家對人工智慧資料中心的需求越來越大,限制的舉措將影響一些國家的人工智慧能力。(@ 騰訊科技)
2、祖克伯:聯想基於 Meta Llama 大模型構建個人 AI 智慧體 AI Now
聯想集團於當地時間 10 月 15 日在美國西雅圖召開年度 Tech World 大會。聯想 CEO 楊元慶在主題演講中,與 Meta 創始人兼 CEO 馬克・祖克伯一道宣佈,聯想與 Meta 合作基於 Llama 大模型推出面向 PC 的個人 AI 智慧體 ——AI Now。
祖克伯透過影片在主題演講上表示,聯想與 Meta 已經合作多年,推出了許多卓越的創新成果,將突破性的 AI 和混合現實技術帶給更多人,共同構建一個更加智慧的未來。
聯想最新的個人 AI 智慧體 ——AI Now,它正是基於 Meta 的 Llama 模型進行構建,將 PC 轉變為更具實用性和個性化的智慧裝置。而這也是 Meta 開源 Llama 的一個重要原因,像聯想這樣的公司可以對大型語言模型進行微調,最佳化其在特定使用場景中的表現。
近期,Meta 剛剛釋出了 Llama 3.2,這是 Meta 的首個開源多模態模型。Meta 釋出了 110 億和 900 億引數的模型,以及更小的、專為在裝置上執行而最佳化的 10 億和 30 億引數的模型。
祖克伯稱,我們相信,開源是目前最具成本效益、最可定製化、最值得信賴且效能最優的選擇。如今,Llama 已處於前沿地位,正逐漸成為 AI 領域的行業標準,就像「Linux」在作業系統領域的地位一樣。透過與 Llama 合作,聯想在我們達到這一轉折點的過程中扮演了重要角色,併為消費者帶來了令人印象深刻的體驗。(@IT 之家)
3、YouTube 上線「用相機拍攝」標籤,為真實影片「驗明正身」
YouTube 正在推出新的「用相機拍攝」標籤,以表明上傳的影片是否來自真實相機拍攝,且具有未經修改的畫面和聲音。
數字內容認證服務 Trupic 上傳了一段影片到其頻道,展示了新的「用相機拍攝」標籤的實際效果,該標籤會在影片描述皮膚中顯示。Trupic 表示,這是「YouTube 上第一個帶有 C2PA 內容憑證的真實影片」。
YouTube 依靠內容來源與真實性聯盟(C2PA)標準來檢測上傳影片的真實性,這意味著該功能僅適用於支援後設資料的錄製裝置和工具。該網站在關於這一新功能的幫助頁面中表示,該標籤「意味著創作者使用了特定技術來驗證其影片的來源,並確認其音訊和影片沒有被修改過」。此外,創作者必須專門使用 C2PA 2.1 或更高版本的工具,標籤才會出現,所以使用者可能在很長一段時間內都不會經常看到這個標籤。像徠卡這樣的公司去年開始在硬體中實施內容憑證,但目前還不清楚這些憑證是否會觸發 YouTube 的標籤。
谷歌還在其部落格中解釋了其在 YouTube 上增加人工智慧生成內容透明度的目標,影片不一定需要未經編輯才能獲得標籤,只是整個過程的每一步都必須支援 C2PA,並且要避免以下情況:
一是破壞來源鏈的編輯,或者使影片無法追溯到其原始來源。例如,如果用帶有 C2PA 後設資料的相機拍攝影像,然後將其儲存到不支援 C2PA 2.1 或更高版本的手機相簿中,這可能會破壞來源鏈。
二是對影片的核心性質或內容進行重大修改,包括聲音和視覺效果。
三是進行使影片與 C2PA 標準(2.1 及以上版本)不相容的編輯。(@IT 之家)
4、Adobe 推出多款 AI 工具:可構建 3D 場景、消除路人、清潔鏡頭
據 The Verge 今天凌晨報導,Adobe 近期展示了多款實驗性的 AI 工具,可用於動畫製作、影像生成、照片及影片的最佳化等領域,未來有望被整合到 Creative Cloud 中。
Project Scenic:該工具可讓使用者在使用 Firefly 模型生成影像時擁有更大的控制權。其能夠生成一個完整的 3D 場景,使用者可以自由新增、移動、調整場景中的物體大小,最終結果會根據 3D 場景生成相應的 2D 影像。
Project Motion:一款兩步動畫製作工具,使用者無需動畫經驗即可給文字和基礎影像新增動態效果。此外,使用者也可以透過文字描述和參考影像,進一步為動畫影片新增色彩、紋理和背景,從而實現更復雜的效果。
Project Clean Machine:一款專門用於清理影像和影片的工具,能夠自動移除諸如相機閃光、路人等干擾元素。例如在移除下圖背景煙花導致的過曝現象時,Clean Machine 會自動校正色彩和光線,保證畫面一致性。
據報導,上述工具將作為「Sneaks」的一部分在 Adobe MAX 大會上首次亮相。Sneaks 是 Adobe 的一個展示新技術並收集使用者反饋的專案,不少在 Photoshop、After Effects 等平臺上提供的功能(如內容感知填充)都來源於此。(@IT 之家)
5、AsrTools,一款智慧語音轉文字工具
AsrTools 是一款智慧語音轉文字工具,旨在透過高效的批處理和使用者友好的介面,將音訊檔案快速轉換為精確的文字。該工具無需 GPU 支援,支援生成 SRT 和 TXT 格式的字幕檔案,適合多種應用場景。其介面基於 PyQt5 和 qfluentwidgets,操作簡單,適合各類使用者使用。(@ 機器之心 SOTA 模型)
02 有態度的觀點
1、普林斯頓教授 Arvind:構建大引數模型不再有效,資料正成為瓶頸;社會對 AI 過度恐懼
Arvind Narayanan 是普林斯頓大學的電腦科學教授,同時也是資訊科技政策中心的主任。他是《AI Snake Oil》一書的合著者,並大力支援關於僅僅增加計算能力重要性的 AI 擴充套件迷思。
在一次採訪中,Arvind 提到,資料量正成為大模型發展的瓶頸。從歷史發展來看,計算資源提升模型效能的方式是透過構建更大的模型,從 GPT-3.5 到 GPT-4 之間最大的變化就是模型的規模。Arvind 認為這種趨勢正在走向終結。現有的模型已經在幾乎所有可獲取的資料上進行了訓練,資料量的增加可能不會像以前那樣帶來根本性的改變或新的能力。
對於合成資料,Arvind 認為其具有很大的侷限性。合成資料在提升資料量方面可能並不總是有效的,因為它可能只是在犧牲資料質量,而沒有提供新的學習內容。
Arvind 認為,小型化可能會成為 AI 模型的未來發展趨勢,因為小型模型成本和隱私方面具有優勢,並且隨著技術進步,小型模型也能保持與大型模型相似的能力水平。
Arvind 提出,社會普遍對 AI 持有過度恐懼的態度,尤其是擔心 AI 的自我意識和潛在威脅,但這種恐懼是沒有根據的。AI 目前更多的是工具而非自主意識的實體。(@ Z potentials)
寫在最後:
我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 結合多模態 AI 谷歌展示 AR 眼鏡原型機;Meta 被曝開發帶攝像頭的 AI 耳機丨 RTE 開發者日報 Vol.204AI谷歌原型開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- GitHub 開始限制被美國貿易制裁的國家的開發者Github
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- 史丹佛 AI 團隊被曝抄襲中國大模型開源成果;Zoom 創始人談視訊會議未來丨 RTE 開發者日報 Vol.218AI大模型OOM開發者日報
- Pi 母公司將開發情感 AI 商業機器人;Meta 科學家:Sora 不是影片生成唯一方向丨 RTE 開發者日報 Vol.214AI機器人Sora開發者日報
- TikTok 正式起訴美國政府;全新 iPad Pro 將搭載蘋果 M4 晶片丨 RTE 開發者日報 Vol.199iPad蘋果晶片開發者日報
- 華為否認大模型演示造假;美國億萬富翁宣佈競購 TikTok 丨 RTE 開發者日報 Vol.206大模型開發者日報
- 美國AI軟體出口限制令下,這156家中美公司或將「中槍」AI
- 美國限制AI軟體出口!BAT提前佈局,“無人車”駛向何方?AIBAT
- 外媒:美國考慮上調中國進口關稅至25% 包括遊戲主機及相關配件遊戲
- Runway 新增影片擴充套件畫面功能;Anthropic 再獲亞馬遜投資 40 億美元,聚焦 AI 晶片研發丨 RTE 開發者日報套件亞馬遜AI晶片開發者日報
- 多家中國車企宣佈將搭載英偉達最新車載晶片;Altman 曝全新 GPT-5 細節丨 RTE 開發者日報 Vol.168晶片GPT開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- 美國對蘋果提起反壟斷訴訟;周鴻禕:不轉向 AI 手機的廠商會成下一個「諾基亞」丨 RTE 開發者日報 Vol.170蘋果AI開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- 中國教育 AI 產品正在成為百萬美國學生的輔導老師;李飛飛:大模型不存在主觀感覺能力丨 RTE 開發者日報 Vol.213AI大模型開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 美眾議院透過強制要求 TikTok 剝離的法案; 首個 AI 軟體工程師上線丨 RTE 開發者日報 Vol.165AI軟體工程工程師開發者日報
- 擔心美國政府限制,Github考慮在華設立子公司Github
- Fish Agent:多語言 Voice-to-Voice 開源語音模型;Runway 推出攝像機運鏡功能丨 RTE 開發者日報模型開發者日報
- 影片美顏SDK拍攝類APP近況報告APP
- 中國的AI演算法, 現在限制出口了AI演算法
- Meta SAM 2:實時分割圖片和影片中物件;Apple Intelligence 首個開發者測試版釋出丨 RTE 開發者日報物件APPIntel開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- SpaceX 星艦發射「成功一半」;首位具身 AI 機器人面世丨 RTE 開發者日報 Vol.166AI機器人開發者日報
- 美國宣佈限制AI軟體出口中國:無人機、自動駕駛首當其衝AI無人機自動駕駛
- ChatGPT 開啟「眼睛」,實時攝像頭對話來了;崑崙萬維推出實時語音助手 Skyo 丨 RTE 開發者日報ChatGPT開發者日報
- ChatGPT 開啟「眼睛」,實時攝像頭對話來了;崑崙萬維推出實時語音助手 Skyo丨 RTE 開發者日報ChatGPT開發者日報
- 手機AR特效短影片拍攝工具ToFe在App Store全新上線特效APP
- 活動報名丨實時互動 AI 開發者年度聚會!RTE Open Day@RTE2024,10.25/26 北京AI
- 前 OpenAI 首席科學家建「安全超級智慧」實驗室;Meta 重組元宇宙團隊丨 RTE 開發者日報 Vol.228OpenAI元宇宙開發者日報
- 蘋果 Vision Pro 產地首次公佈:原汁原味的中國製造丨 RTE 開發者日報 Vol.143蘋果開發者日報
- 寧德時代與特斯拉合作;鍾睒睒連續四次中國首富丨 RTE 開發者日報 Vol.171開發者日報
- 高速攝影機輔助的相機方位線上標定
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 公益手遊《家國夢》上線,邀你共建美麗中國