YouTube 上線「用相機拍攝」標籤為真實影片「驗明正身」;美國被曝考慮限制向中東國家出口 AI 晶片丨 RTE 開發者日報

RTE开发者社区發表於2024-10-16

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@SSN,@ 鮑勃

01 有話題的新聞

1、美國被曝考慮限制英偉達、AMD 等向中東國家出口 AI 晶片

外媒援引知情人士訊息稱,美國已討論限制英偉達、AMD 等美國公司對某些國家人工智慧晶片的出口許可證設定上限。這些限制將重點放在波斯灣國家,這些國家對人工智慧資料中心的需求越來越大,限制的舉措將影響一些國家的人工智慧能力。(@ 騰訊科技)

2、祖克伯:聯想基於 Meta Llama 大模型構建個人 AI 智慧體 AI Now

聯想集團於當地時間 10 月 15 日在美國西雅圖召開年度 Tech World 大會。聯想 CEO 楊元慶在主題演講中,與 Meta 創始人兼 CEO 馬克・祖克伯一道宣佈,聯想與 Meta 合作基於 Llama 大模型推出面向 PC 的個人 AI 智慧體 ——AI Now。
祖克伯透過影片在主題演講上表示,聯想與 Meta 已經合作多年,推出了許多卓越的創新成果,將突破性的 AI 和混合現實技術帶給更多人,共同構建一個更加智慧的未來。

聯想最新的個人 AI 智慧體 ——AI Now,它正是基於 Meta 的 Llama 模型進行構建,將 PC 轉變為更具實用性和個性化的智慧裝置。而這也是 Meta 開源 Llama 的一個重要原因,像聯想這樣的公司可以對大型語言模型進行微調,最佳化其在特定使用場景中的表現。

近期,Meta 剛剛釋出了 Llama 3.2,這是 Meta 的首個開源多模態模型。Meta 釋出了 110 億和 900 億引數的模型,以及更小的、專為在裝置上執行而最佳化的 10 億和 30 億引數的模型。

祖克伯稱,我們相信,開源是目前最具成本效益、最可定製化、最值得信賴且效能最優的選擇。如今,Llama 已處於前沿地位,正逐漸成為 AI 領域的行業標準,就像「Linux」在作業系統領域的地位一樣。透過與 Llama 合作,聯想在我們達到這一轉折點的過程中扮演了重要角色,併為消費者帶來了令人印象深刻的體驗。(@IT 之家)

3、YouTube 上線「用相機拍攝」標籤,為真實影片「驗明正身」

YouTube 正在推出新的「用相機拍攝」標籤,以表明上傳的影片是否來自真實相機拍攝,且具有未經修改的畫面和聲音。

數字內容認證服務 Trupic 上傳了一段影片到其頻道,展示了新的「用相機拍攝」標籤的實際效果,該標籤會在影片描述皮膚中顯示。Trupic 表示,這是「YouTube 上第一個帶有 C2PA 內容憑證的真實影片」。

YouTube 依靠內容來源與真實性聯盟(C2PA)標準來檢測上傳影片的真實性,這意味著該功能僅適用於支援後設資料的錄製裝置和工具。該網站在關於這一新功能的幫助頁面中表示,該標籤「意味著創作者使用了特定技術來驗證其影片的來源,並確認其音訊和影片沒有被修改過」。此外,創作者必須專門使用 C2PA 2.1 或更高版本的工具,標籤才會出現,所以使用者可能在很長一段時間內都不會經常看到這個標籤。像徠卡這樣的公司去年開始在硬體中實施內容憑證,但目前還不清楚這些憑證是否會觸發 YouTube 的標籤。

谷歌還在其部落格中解釋了其在 YouTube 上增加人工智慧生成內容透明度的目標,影片不一定需要未經編輯才能獲得標籤,只是整個過程的每一步都必須支援 C2PA,並且要避免以下情況:

一是破壞來源鏈的編輯,或者使影片無法追溯到其原始來源。例如,如果用帶有 C2PA 後設資料的相機拍攝影像,然後將其儲存到不支援 C2PA 2.1 或更高版本的手機相簿中,這可能會破壞來源鏈。

二是對影片的核心性質或內容進行重大修改,包括聲音和視覺效果。

三是進行使影片與 C2PA 標準(2.1 及以上版本)不相容的編輯。(@IT 之家)

4、Adobe 推出多款 AI 工具:可構建 3D 場景、消除路人、清潔鏡頭

據 The Verge 今天凌晨報導,Adobe 近期展示了多款實驗性的 AI 工具,可用於動畫製作、影像生成、照片及影片的最佳化等領域,未來有望被整合到 Creative Cloud 中。

Project Scenic:該工具可讓使用者在使用 Firefly 模型生成影像時擁有更大的控制權。其能夠生成一個完整的 3D 場景,使用者可以自由新增、移動、調整場景中的物體大小,最終結果會根據 3D 場景生成相應的 2D 影像。

Project Motion:一款兩步動畫製作工具,使用者無需動畫經驗即可給文字和基礎影像新增動態效果。此外,使用者也可以透過文字描述和參考影像,進一步為動畫影片新增色彩、紋理和背景,從而實現更復雜的效果。

Project Clean Machine:一款專門用於清理影像和影片的工具,能夠自動移除諸如相機閃光、路人等干擾元素。例如在移除下圖背景煙花導致的過曝現象時,Clean Machine 會自動校正色彩和光線,保證畫面一致性。

據報導,上述工具將作為「Sneaks」的一部分在 Adobe MAX 大會上首次亮相。Sneaks 是 Adobe 的一個展示新技術並收集使用者反饋的專案,不少在 Photoshop、After Effects 等平臺上提供的功能(如內容感知填充)都來源於此。(@IT 之家)

5、AsrTools,一款智慧語音轉文字工具

AsrTools 是一款智慧語音轉文字工具,旨在透過高效的批處理和使用者友好的介面,將音訊檔案快速轉換為精確的文字。該工具無需 GPU 支援,支援生成 SRT 和 TXT 格式的字幕檔案,適合多種應用場景。其介面基於 PyQt5 和 qfluentwidgets,操作簡單,適合各類使用者使用。(@ 機器之心 SOTA 模型)

02 有態度的觀點

1、普林斯頓教授 Arvind:構建大引數模型不再有效,資料正成為瓶頸;社會對 AI 過度恐懼

Arvind Narayanan 是普林斯頓大學的電腦科學教授,同時也是資訊科技政策中心的主任。他是《AI Snake Oil》一書的合著者,並大力支援關於僅僅增加計算能力重要性的 AI 擴充套件迷思。

在一次採訪中,Arvind 提到,資料量正成為大模型發展的瓶頸。從歷史發展來看,計算資源提升模型效能的方式是透過構建更大的模型,從 GPT-3.5 到 GPT-4 之間最大的變化就是模型的規模。Arvind 認為這種趨勢正在走向終結。現有的模型已經在幾乎所有可獲取的資料上進行了訓練,資料量的增加可能不會像以前那樣帶來根本性的改變或新的能力。

對於合成資料,Arvind 認為其具有很大的侷限性。合成資料在提升資料量方面可能並不總是有效的,因為它可能只是在犧牲資料質量,而沒有提供新的學習內容。
Arvind 認為,小型化可能會成為 AI 模型的未來發展趨勢,因為小型模型成本和隱私方面具有優勢,並且隨著技術進步,小型模型也能保持與大型模型相似的能力水平。

Arvind 提出,社會普遍對 AI 持有過度恐懼的態度,尤其是擔心 AI 的自我意識和潛在威脅,但這種恐懼是沒有根據的。AI 目前更多的是工具而非自主意識的實體。(@ Z potentials)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章