過去的幾年裡,傳媒業見證了太多的技術迭變。我們在享受技術發展帶來的各種便捷的同時,也在無聲地承受著技術濫用的惡果。

智慧裝置、語音助手正變得越來越無微不至,合成媒體可以針對我們的口味和喜歡提供個性化服務,我們暴露於多元化、多介面的智慧生態中。然而過去一年中大規模的資料洩露、假新聞氾濫,當機器開始複製我們的聲音、預測我們的行為時,人類該何去何從?凜冬已至,針對科技公司的監管縮緊,契機與風險並存的資訊時代或許已悄然面臨拐點。

Future Today Institute(簡稱FTI)近期釋出了《2020年娛樂、媒體和技術趨勢報告》,介紹了包括人工智慧、合成媒體、區塊鏈等共計16種前沿趨勢,以及其中的157項具體革新,騰訊媒體研究院對報告進行了精選摘編,以饗讀者。正如Neo在《黑客帝國》的結尾所說:“我並不知道未來是什麼樣的。我來這兒不是告訴你一切是如何結束的,而是告訴你一切是怎樣開啟的。”

以下為報告全文,讓我們共同觸碰技術與傳媒業態的未來。

趨勢一:人工智慧

AI已經不再是一種趨勢,而是計算機時代的第三紀元。本篇報告從AI的不同方面彙總了娛樂、媒體和技術的趨勢。在新聞業中,AI成為了各大新聞機構的寵兒。路透社的Lynx Insight程式可以幫助記者挖掘大資料。《華盛頓郵報》的 Heliograf被用來報導選舉和體育賽事。杜克大學記者實驗室的ClaimBuster則可以幫助記者進行事實核查。

弗蘭肯演算法的擴散(Proliferation of Franken-algorithms)

演算法只是定義和自動處理資料的規則。它們使用的是計算機可以理解的“如果……那麼”邏輯。舉個例子:如果網站瀏覽者的IP地址位於芝加哥,那麼演算法就允許他們直接進入;如果IP地址位於倫敦,則演算法就會按照GDPR的要求先顯示隱私和cookie政策。儘管人們可以直接按照自己想法設計某個演算法,但是所有演算法系統一起工作就有可能會帶來問題。開發人員並不總是事先知道演算法之間將如何一起工作。有時,幾個開發人員團隊都在獨立地處理不同的演算法和資料集,但是隻有演算法被設計出來以後才能看到如何執行。這也就是最近股市和電商網站出現崩潰的原因。對於像Facebook這樣的大型公司而言這是一個艱鉅的挑戰,因為在任何特定時間,會有數十億的演算法同時工作,根本無法預測其執行結果。

專用、開放和自主開發的AI技術(Proprietary, Open and Homegrown AI Languages)

Python是一種具有許多預構建庫和框架的先進的程式語言。麻省理工學院開發了一種名為Julia的開源語言,專注於數值計算,此外還有AI的提出者John McCarthy於1958年建立的Lisp語言。各大公司正在開始構建和釋出自己的軟體包以及用於AI應用程式的獨特程式語言。Uber用Python編寫了自己的概率程式語言Pyro。不同於OSX與Android或者早期Mac與PC陣營的對立,這一舉動意味著AI生態系統未來將走向分裂。市場會發現在不同的AI框架和語言之間轉化代價高昂。

問題資料集 (Problematic Data Sets) 

公司自主訓練研製的AI並不具備代表性,因此不能被廣泛採用。MIT的研究學者釋出了一款名為“Norman”的AI用來捕獲識別照片。他們做了一組對比實驗,一組系統採用的是經過訓練的標準資料,另一組則沒有經過訓練,結果令人大跌眼鏡:採用標準資料的系統顯示出來是“一個棒球手套的黑白照”,而另一個系統則顯示出的是“一個白天在國外被槍殺的男人”。一些為了生成自然語言的新系統於2019年釋出。雖然這些系統都事先經過訓練,但它們曾經用來學習自然語言的Reddit和亞馬遜上的評論卻被刪除了。原因在於:Reddit和Amazon評論員都偏向白人和男性,因此這些人的話並不能代表所有人。這說明開發人員仍然面臨挑戰。如今已經變得很難從真人那裡獲得真實的資料來訓練系統了,而且由於新的隱私政策出現,開發人員只能更多地依賴公共資料集和有問題的資料集。

Norman AI與標準化AI的照片捕捉對比

資料的深層連結(Deep Linking)

自智慧手機問世以來,深層移動連線就已經使使用者在手機所有軟體中查詢和共享資料。但是現在深層連線卻讓使用者越來越難找到自己想要的資訊。2019年,Yelp餐廳在其軟體中標明瞭準確的聯絡資訊,但是當客戶點選時,他們就被跳轉到Grubhub軟體裡訂餐去了。即使客戶關掉了軟體並想直接打電話訂餐,該軟體仍將其轉換成Grubhub上的號碼,因為這樣Grubhub可以將其歸類為“營銷”活動並向餐館收取高額的佣金。如今深層連結有三種:傳統深層連結,延遲深層連結和語境化深層連結。傳統深層連結會從一個軟體或網站重新定向您:如果單擊某人在Twitter上釋出的Baltimore Sun連結,那麼理論上只要使用者安裝了Baltimore Sun軟體,它就自動開啟Baltimore Sun。延遲深層連結也直接連結到該軟體(如果已安裝),或直接連結到軟體商店讓使用者先下載該軟體。語境化深層連結的服務更強大,可以使使用者直接從站點轉到軟體、從軟體到站點或從軟體到軟體,還可以提供個性化資訊,儘管故意向消費者隱瞞了整個過程。

AI雲(AI in the Cloud) 

過去一年,人工智慧生態的領導企業一直在爭奪“人工智慧雲共享”,以期成為值得信賴的AI遠端服務提供者。在西方,該領域由亞馬遜、微軟和谷歌領導,其次是蘋果、IBM、Salesforce、SAP和甲骨文。在亞洲,AI雲由阿里巴巴等巨頭主導。這是一個價值2500億美元的行業,並且仍在迅速發展。紐約大學斯特恩商學院教授Arun Sundararajan說:“(這場競爭的)收益是成為下一個技術時代的作業系統。”娛樂和媒體公司將在未來幾年找到更多使用AI雲的方式。

 AI晶片組(AI Chipsets) 

對我們來說,平常筆記本和手機上搭載的CPU效能已經在不斷提升,卻滿足不了機器學習的要求。它們的問題在於,缺少足夠的處理單元,去完成下一個計算機時代所需的連線和計算。這時就需要一組新型處理器,華為、Apple、IBM等企業都在試水新系統的構建和SoCs。簡而言之,這意味著晶片已經可以在AI專案中發揮作用,並且有更快的速度和更精確的資料——也不難預料到,幾家企業在未來即將開展競爭。特斯拉的新型定製AI晶片雖然不如最初描述得那麼引人注目,但已於2019年4月釋出。Google的Tensor處理單元(或TPU)是專門為AI的深度學習而構建的,旨在與該公司的TensorFlow系統配合使用。

圖表 2 Google Tensor處理單元

無處不在的數字助理(智慧語音助理)(Ubiquitous Digital Assistants) 

Siri、Alexa和天貓等數字助理使用語義和自然語言處理我們的資料,有時甚至在我們不知道要問什麼之前提前預測我們下一步想要或需要做什麼。FTI模型在2017年預測,到2020年,將有近一半的美國人擁有並使用數字助理,而FTI模型將繼續追蹤這個方向的趨勢。亞馬遜和谷歌主導了智慧語音市場,但數字助理是無處不在的。現在,有成千上萬的可跟蹤響應的數字助理軟體和小程式。新聞機構、娛樂公司、營銷商、信用卡公司、銀行、地方政府機構(警察、公路管理)、政治運動以及許多其他活動也在通過數字助理傳達重要資訊。

利用短視訊生成虛擬環境(Generating Virtual Environments From Short Video)

晶片設計師Nvidia正在教AI用短視訊片段構建逼真的3D環境,利用了此前生成對抗網路(GANs)的研究成果。Nvidia系統從開源資料集中生成的圖形將用於自動駕駛領域。設計師使用了劃分成不同類別(建築物、天空、車輛、標誌、樹木、人)的短片段對GAN進行了訓練,從而生成這些物件的新版本。自動生成虛擬環境的應用前景無窮:物流(倉庫、工廠、運輸中心)、城市規劃模擬,甚至包括測試遊樂園和購物中心內的客流量場景。

實際視訊內容與AI生成內容

機器識別(Machines Performing Cognitive Work) 

公司不再僅僅依靠AI系統執行繁瑣的重複性任務。更先進的系統正在企業幫助優化工作流程並主動生成策略。這意味著人們並沒有被機器人完全取代;相反,機器人是按照人類的工作能力而創造出來的。從倉庫到審計公司,人工智慧系統開始執行認知任務——在此過程中,人類只需要執行基礎的操作。

亞馬遜的自動化系統幫助提高倉庫的效率、指導員工完成工作。沃爾瑪使用計算機視覺來查詢熟爛的農產品,其AI系統可以對僅從堆中取出壞蘋果的人進行檢查。在新聞編輯室中,類似的系統可以幫助記者篩選非常龐大的資料集以查詢異常或識別人員。

機器程式自動化 (Robotic Process Automation) 

機器流程自動化(RPA)使企業能夠在辦公室內實現任務和流程的自動化,從而使員工可以把更多時間花在更有價值的工作上。

Google的Duplex是RPA的一種,用於向他人進行常規電話通話。亞馬遜使用RPA篩選簡歷,然後再對最優秀的候選人進行排序。在銀行業務中,Blue Prism和Automation Anyware可以幫助員工處理重複性工作,提高員工們的生產力水平。這項技術將使媒體和娛樂公司能夠在客戶服務等許多不同領域中節省成本以做出更好的實時預測。

機器人 (Bots) 

基本意義上的機器人是指,為自動完成某一特定任務而設計的軟體應用。在媒體領域,機器人可被分為兩大類:新聞型機器人(news bots)和生產力型機器人(productivity bots)。前者可以協助集合新聞資訊,並自動為讀者推送特定新聞事件;而生產力型機器人,則可以幫助新聞組織自動化他們的日常流程。

機器人的下一個重大進步不在技術方面,而是監管。在2018年的競選中,我們看到了“殭屍網路”的復甦,“殭屍網路”是指傳送誤導性內容的計算機網路。由於人們對越來越多的機器人詐騙感到擔憂,加利福尼亞州制定了一項新法律,該法律於2019年7月1日生效,要求機器人在在與人類的交往中必須清晰、醒目、合理地表明自己不是人類。

騰訊媒體+峰會現場Dreamwriter在寫作

實時機器學習(Real-Time Machine Learning) 

機器學習指的是一種應用演算法來分析資料,從而可以更好地完成各種任務的系統,並且隨著時間推移,它會越來越擅長這些任務。但這種系統也面臨著效率問題:系統需要停下來解析資料。而最新研究表明,實時機器學習可以隨資料獲取而實時調整模型。這標誌著資料移動方式以及我們檢索資訊方式的巨大變化。

比如說,即便是在多種語言混雜的情況下這種技術也能自動同聲傳譯;它也可以對內容分發進行隨時調整,從而為讀者提供更具個性化的內容。比起刻板地使用歷史資料(讀者XX只喜歡體育類報導),實時偏好則能夠將內容納入推薦機制(讀者XX在接下來的幾天裡對大選新聞的需求可能會更強烈)。

自然語言理解(NLU)(Natural Language Understanding (NLU)) 

對於Siri和Alexa等對話式AI系統而言,讓機器準確瞭解某人的意思難度較大。這些系統都經過訓練後最多可以理解語句中的代詞。如果消費者問“獅子王在Cinemark劇院幾點鐘上映?然後在那附近停車”,系統會自動推斷“那”的意思是“Cinemark劇院”。從技術上講,此過程稱為“插槽結轉”。它可以使用句法語境來理解代詞的意思,除非我們說了帶有許多不同代詞的複雜句子。事實是,在日常交流中我們的說話都很混亂隨意、濫用單詞,甚至只用語氣詞來傳達意思。

2019年,亞馬遜研究科學家在NLU方面取得了令人矚目的進步,他們推出了新的架構,能夠幫助Alexa在人類不說完整的句子的情況下也能很好地理解人類。

Amazon Alexa首頁

機器閱讀理解(MRC)

(Machine Reading Comprehension (MRC))

MRC使得系統閱讀大資料、推斷含義並且立即得出答案的流程成為可能。舉個例子,當你搜尋時,你是希望系統直接給出一個確切答案,還是提供給你一堆“欲知後事如何請看更多超鏈”的URL合集?讓機器自己找出問題所在,這就是MRC。

在未來,MRC是實現強人工智慧的關鍵性步驟之一,而近期,它則可以協助我們把技術手冊、歷史地圖和醫療記錄等各種資料轉化為易於搜尋的資訊集合。

自然語言生成(NLG)(Natural Language Generation (NLG)) 

自然語言生成技術現今已被不少媒體與營銷機構所應用,基於大規模的資料集來進行自動內容生產。NLG可實現的功能包括,整合關鍵詞、提升SEO(Search Engine Optimization,搜尋引擎優化,即利用搜尋引擎的規則來提升網站的搜尋排名)以及為使用者批量提供個性化的內容。

Arria NLG、IBM Watson語音轉文字技術、Amazon Polly、谷歌雲語音轉文字技術,敘事科學公司Narrative Science和自動觀察公司Automated Insights利用大型資料集構建敘事以幫助非資料科學界人士更好地瞭解其組織中正在發生的事情。NLG在各個專業領域都有無數的用例,可為律師、政客、醫生、顧問、金融分析師、市場營銷人員及其他人士提供幫助。

機器學習中的實時語境(Real-Time Context in Machine Learning)

IBM公司研發的Project Debater可以通過消化大量文字,從語境中找出邏輯漏洞、假訊息。雖然目前處於測試階段,但已經能夠通過實時學習利用實際環境分辨真偽資訊了。

Project Debater的工作原理

多工強化學習演算法(General Reinforcement Learning Algorithms) 

AlphaZero的團隊開發的新演算法可以學習多個任務。比如AlphaZero不僅在圍棋上無人可敵,在象棋和日本象棋中也出類拔萃。

更快的深度學習(Much Faster Deep Learning)  

深度學習(Deep Learning, DL)是機器學習中相對較新的分支,也會很快無形地融入到各個組織機構當中。設計者會結合包括文字、影象、視訊、演講等類似內容在內的各種資料庫使用較為特殊的深度學習演算法。

從概念層面上來講,它不算新,最近更新的是計算處理能力和可用資料的數量。落實到實踐上,這就意味著更多的人類事務可以被計算機自動完成,比如設計軟體寫程式碼。

DL受計算機網路執行速度的制約:幾年前,用ImageNet網站中的資料集來訓練影象識別功能,可能要花費一個月或者更長時間;而現在,Facebook可以在一小時內實現相同的效果。隨著計算機提速和硬體技術的提升,系統也會以更加“超人”的速度完成任務。

ImageNet官網

強化學習與分層強化學習(Reinforcement Learning and Hierarchical RL)

強化學習(Reinforcement Learning, RL)是處理決策型問題的強力工具,應用於AI系統訓練,使之擁有超出常人的能力。在計算機模擬過程中,一個系統嘗試、失敗、學習、實驗,然後再次嘗試——這一系列步驟都能飛速完成,且每次試錯都會對它的未來嘗試有所修正。

我們所熟悉的AlphaGo就是基於RL機制學習如何決定戰勝人類棋手。但這項技術也存在問題:當智慧體(agents)缺乏足夠的監督(supervisor,簡單來說監督就是設定輸出值/目標,在資料中發現潛藏模式能更容易,而無監督式學習不設定輸出值,下文在機器學習相關技術中出現的“監督”也是同一個概念),或是需要執行一項長時間的複雜任務時,可能會遇到困難。

這時,研究者將嘗試應用分層強化學習(Hierarchical Reinforcement Learning)——能夠發現高水準的行動,有條理地克服學習困難,最終以出乎人類意料的速度掌握新的任務。RL可以提升AI系統的“智慧”,來使汽車能在非常規條件下自動駕駛,或者協助軍用無人機實現之前尚未實現過的複雜動作。

持續學習(Continuous Learning) 

現在,深度學習技術已經可以幫助系統學習,去以更接近人的所作所為的方式來完成複雜任務,但是這些任務仍然很具象,比如在某一項比賽中打敗人類。並且它們需要遵循一個嚴格的程式:收集資料、設定目標、應用某一項演算法。這一過程需要人工參與,也會花費不少時間,特別是需要監督式訓練(supervised training)的早期階段。持續性學習(CL)將偏重於構建提升自主學習與增量學習的技能,研究者未來還將持續擴充套件其能力邊界。

多工學習(Multitask Learning)

電影《龍威小子(The Karate Kid)》裡,園丁宮地先生承諾教男孩Daniel空手道,但Daniel很快厭倦了日復一日的訓練。對於Daniel來說,漆柵欄、汽車、無休止的“打蠟、封蠟”……這些事情看起來都毫無用處,肯定不能幫他學會空手道。當然,最後所有的雜務都被證明與空手道有關,這樣的訓練也幫他成為一名空手道冠軍。提起這部電影,是因為研究者最近就在訓練智慧系統像Daniel這樣學習。

當開發者使用機器學習時,他們要嘗試用這種方式解決單個特定的問題。他們會監督智慧系統微調,且不斷修正,直到系統的表現符合預期。但是僅僅聚焦於單個任務,經常會指向無效結果——也許有比研究者發現的機制更好的解決方案呢?於是,新的研究領域,也就是多工學習就產生了,讓系統像Daniel這樣,在各種各樣的相關任務中尋求聯絡,探尋如何更好地解決問題。

生成式對抗網路(Generative Adversarial Networks (GANs))

換臉技術在2019一直熱度不斷。基於生成式對抗網路(或GANs)的換臉技術很容易實現。我們可以把GAN理解為無需任何人員參與的圖靈測試。GAN是無監督的深度學習系統,由兩個在相同資料(例如人的影象)上訓練的相互對抗的神經網路組成。比如說,第一個AI建立看上去很真實的女人的照片,第二個AI將生成的照片與真實女人的照片進行比較。第一個AI根據第二個AI的判斷重新對其生成過程進行一次又一次的調整,直到自動生成看起來完全真實的女人影象為止。

thispersondoesnotexist.com網站正是利用該技術不斷生成逼真的照片,而實際上這些照片並不存在。GANs也被用來實現舊照片或畫作的動態化。今年,斯科爾科沃科技學院和三星AI中心的研究人員利用該技術讓蒙娜麗莎搖了搖頭、讓拉斯普丁演唱了碧昂絲的《Halo》。

ThisPersonDoesNotExist.com生成的人像

自動化機器學習(Automated Machine Learning (AutoML))

自動化機器學習(AutoML)是一種新的機器學習方法,它可以將原始資料和模型匹配在一起以顯示最相關資訊,從而幫助一些機構擺脫目前耗時且困難的傳統的機器學習方法。現在,谷歌、亞馬遜和微軟都提供了許多AutoML產品和服務。

定製化機器學習(Customized Machine Learning) 

Google的Cloud AutoML可以幫助使用者可以上傳自己的資料建構模型,就算非專業人士也可以訓練機器學習。

AI的持續偏見(Ongoing Bias In AI)

AI有嚴重的偏見已不是祕密。這個問題是多方面的。舉個例子,用於訓練AI的資料集通常來自Reddit或亞馬遜的評論以及Wikipedia等本身就充滿偏見的地方。建立模型的人往往不知道自己存在偏見。隨著我們的計算機系統越來越多地用於決策,我們可能會發現自己被演算法分到一個組別中,雖然對我們而言可能沒什麼影響,但實際上可能產生巨大隱患。

AI偏見導致內亂(AI Bias Causes Civil Unrest)

實際上每天你都在主動地或被動地建立不計其數的資料(比如在Facebook上上傳和標記照片、開車去上班等)。這些資料通常是在你沒有發現的情況下被演算法挖掘和使用的,並用於製作廣告、幫助潛在廣告主預測我們的行為、確定我們的抵押貸款利率,甚至幫助執法部門預測我們是否可能犯罪。

包括馬里蘭大學、哥倫比亞大學、卡內基·梅隆大學、麻省理工學院、普林斯頓大學、加州大學伯克利分校、國際電腦科學研究所等在內的許多大學的研究人員正在研究自動決策的副作用。你或者你認識的某個人可能會陷入演算法錯誤的一面,比如說你會由於一些不透明或不易理解的原因不符合貸款資格,不能拿到特定藥物或不能瞭解房租價格。並且越來越多的資料在不知情的情況下被收集並出售給第三方。

趨勢二:計算新聞業(智慧新聞業)

新聞報導可以使用計算來挖掘原本不會被發現的故事。CS技術可以通過兩種主要方式幫助新聞業:使用計算方式的新聞業和進行有關計算的新聞業。2019年7月,《華盛頓郵報》成立了一個專攻大選的團隊,該團隊建立了一個計算政治新聞研究與開發實驗室,並開展了實驗以支援2020年大選之前郵報的資料工作。史丹佛大學的計算新聞實驗室一直在為公共新聞開發新的計算方法。

The California Civic Data Coalition是一個由幾家媒體聯合成立的用於跟蹤政治資金的資料開源檔案庫

計算影象的生成

(Computational Image Completion and Generation)

現在,每個擁有智慧手機的人都可以使用計算攝影工具。他們可以在合影中把閉上的眼鏡睜開、在運動畫面中尋找最佳幀並清除我們自拍照中的瑕疵。所有這些都是實時的,而無需啟動其他照片編輯軟體。現在,我們可以在場景中無縫新增或刪除物件、更改陰影等等。

顯然,這裡對記者有倫理要求——在什麼情況下對照片允許什麼程度的編輯?同樣,記者在將其用於報導或故事之前,應該開發一項技術可以自動顯示該照片已被編輯。

自動生成文章(Automated Versioning) 

總部位於瑞士的Tamedia的記者在本國2018年大選期間嘗試採用了生成技術。Tamedia用一個名為“ Tobi”的決策樹演算法自動生成了文章,詳細描述了由私人媒體組織的30家報紙所涵蓋的每個城市的投票結果,並同時生成了多種語言、總計39,996個不同版本的選舉報導,每篇平均250字,並將其釋出到Tamedia的線上平臺上。每篇報導都標記出了該報導是由演算法編寫的。隨著更多的嘗試,新聞和娛樂媒體公司能夠開發相同內容的多個版本,從而覆蓋更廣泛的受眾或大規模生產內容。

Tobi的Twitter賬戶

生成自然語言以調節閱讀水平(Natural Language Generation to Modulate Reading Level)

自然語言生成(NLG)是一項能夠生成人類指定使用語言的處理任務。NLG可用於重寫各種不同閱讀層次的內容,為書籍出版商和新聞媒體機構都提供了巨大的可能。隨著圖書出版商和新聞機構在尋找新的收入來源,NLG不僅將用於撰寫報導,而且還將為具有不同閱讀水平的讀者建立不同的版本。這是因為基本語料庫(構成故事的資料)不會改變,但是可以調整詞彙量和細節。

例如,關於伯克希爾·哈撒韋公司(Berkshire Hathaway)季度收入的報導可以用許多不同的方式來表達,分別面向金融專業人士、高中經濟學課程、以英語作為第二語言的學習者以及非英語國家。同樣,NLG可用於自動建立書摘和摘要等工作量大的任務。使用NLG自定義編寫不同版本的報導可以幫助媒體機構擴充全球業務規模而無需僱用其他人員。但是,NLG同樣可被用於造假,這意味著未來將要進行監管。

資料探勘群體行為(Datamining Crowds) 

計算新聞技術使記者能夠查詢我們的被動資料(比如我們的線上活動、健康記錄、位置等),從而學習或瞭解新事物。我們的資料不僅會跟蹤我們的行為,而且任何人都可以用它進行搜尋、收集和分析。我們預計,更多的新聞機構以及營銷商、政治活動家和其他團體將開始創造性地利用資料。因為我們的思維影響行動(例如搜尋“歐盟是什麼?”),我們的行動產生資料,而這些資料可用於瞭解有關我們的資訊。

演算法事實核查(Algorithmic Fact Checking)

誤導性的虛假資訊汙染了網際網路和我們的社交媒體環境,每天的消費者都不得不與虛假資訊做抗爭。儘管我們在全球範圍內進行了大量的事實核查工作,但事實證明,用於傳播假新聞的演算法比人類事實核查者的速度更快。

德克薩斯大學阿靈頓分校和谷歌的研究人員一直在研究使用框架語義的自動化技術。框架是描述了特定型別事件、情況、物件或關係及其參與者的示意圖。研究人員擴充套件了一個名為FrameNet的系統用來專門為包括自動事實核查在內的功能構建新框架。

在屏事實核查(On-Screen Fact Checking)

杜克大學和得克薩斯大學阿靈頓分校的研究人員發明了ClaimBuster,它可以對任何句子中的事實評分。該系統使用來自直播活動的音訊或視訊並將其轉換為文字,用過濾器識別其中有關事實的語句,然後將這些語句與資料庫進行匹配。

ClaimBuster官網

合成資料(Synthetic Data)

研究人員並非總能獲得完整的健康、醫療、運輸和人口資料。因此,一些人正在開發和試驗合成資料集,用來在AI中執行有意義的分析和訓練模型。但是合成資料集通常會漏掉重要資訊或出現偏差。

MIT資訊與決策系統實驗室的Data to AI Lab的研究人員正在開發一種機器學習系統,用以自動建立合成資料,然後將其用於開發和測試資料科學演算法和模型。他們提出了合成資料庫Synthetic Data Vault (SDV),該資料庫能夠學習和開發用於多種目的的多元模型。記者需要了解何時使用合成資料,新聞機構應制定有關何時使用合成資料以及如何告知消費者報導使用了合成資料的道德準則。

合成並生成內容核查(Synthetic and Generated Content Authentication)

AI可以用來發現哪些文字是演算法寫的而不是人類寫的。哈佛大學和MIT-IBM Watson AI Lab的研究人員開發了一種用於識別演算法何時生成文字的工具。

Giant Language model Test Room(簡稱GLTR)使用AI來確定文字中的常用詞,並可以判斷句子是否看起來太有預測性以至於不像真人所寫。該工具預期可以被用來識別虛假或誤導性新聞、機器人生成的內容及偽造品。

Giant Language model Test Room文字識別(動圖)

趨勢三:認知系統

聲音識別技術(Voiceprints)

聲紋是一個人聲音的獨特特徵。現在新的機器學習技術與語音錄製的龐大資料集相連線可以幫助研究人員能夠通過人們說話時產生的聲紋進行識別。

卡內基·梅隆大學(Carnegie Mellon University)的研究人員開發出了一種可以使用聲紋就可以構建3D面部的生成技術。執法機構正在應用該系統識別惡作劇呼叫者以及欺騙當地派遣特警就為了報復他人的人。

個性識別(Personality Recognition)

新興的預測分析工具會記錄使用者的資料、行為和偏好,這些資料可以反映出使用者的個性並預測使用者在任何情況下的反應。2018年,Cambridge Analytica就使用演算法分析幫助Donald Trump贏得了大選。政治候選人、律師事務所、營銷商、客戶服務代表和其他人員都在使用新型系統,這種系統可以檢視使用者手機網上活動、電子郵件和對話,實時評估使用者的性格。最終目的就是判斷使用者的特定需求。

ElectronicArts正在開發一種可以評估多人視訊遊戲玩家性格的系統,從而根據他們的遊戲風格、對話風格和花錢意願更好地匹配玩家。

在現實世界中,保險承銷商正試圖通過使用者訂閱的雜誌和網站、釋出到社交媒體上的照片等等來評估使用者的個性,以便確定其投保風險。一些貸款方已經開始使用個性演算法來預測使用者未來的商業交易了。(資料顯示,如果兩個具有相同專業和個人情況的人同時借款,那麼擁有較高大學文憑的人更可能還清債務。)

情緒識別(Emotional Recognition)

2018年,亞馬遜申請了一項新系統的專利,該系統可以根據使用者過去及現在的互動來檢測使用者的身心健康狀況。如果亞馬遜檢測到該使用者生病了,就會建議使用者一小時內服用止咳藥。

汽車製造商Kia於2019年在CES上首次亮相了它的實時情感識別系統(R.E.A.D.)。該系統可以通過感測器監控乘客面部表情、心率和皮膚電活動來調節車內環境以乘客的情緒狀態。

Kia的R.E.A.D.系統

情感計算(Affective Computing)

情感計算屬於跨學科領域,涵蓋電腦科學、心理學和認知科學。麻省理工學院的研究人員正在研究一種機器學習演算法,可以通過從我們的可穿戴裝置(智慧手錶、健身追蹤器)收集的皮膚電活動了解我們的情緒並作出響應。但是其他來源的資料也可能派上用場,比如我們的皮膚、臉部和與他人的對話。分析師推測,到2023年情感計算將成為一個價值250億美元的產業。

趨勢四:合成媒體

 合成媒體已經比比皆是了,比如虛擬的日本流行歌星初音未來(於2007年首次亮相)、由藝術家Jamie Hewlett和音樂家Damon Albarn合作創造的英國虛擬樂隊Gorrilaz(於1998年發行了第一首單曲)。它們都是通過演算法建立或改動的媒體。

初音未來全息演唱會

語音合成(Speech Synthesis)

語音合成也被稱為“合成語音”或“文字轉成語音技術”,它模仿了真實的人類語音並將其應用到各種介面中。通過藉助足夠的資料和培訓,語音合成系統可以瞭解任何人的頻譜頻率併產生某個人的數字聲紋。

Synthesia是一家使用此技術通過自動重製面部動畫來配音的公司,適用於國際廣泛發行的電影。演員的面部表情和嘴巴可以重製以匹配配音。

調節定製語音 (Modulating Custom Voice)

生成演算法可以建立聽起來像原始聲音的合成聲音,並且可以將這些聲音按所需的音高和音調調製。

總部位於蒙特利爾的AI公司Lyrebird構建了一種語音模仿演算法,能夠生成難以察覺出來的合成語音。它使用的語音樣本資料庫既可以在公共儲存庫(YouTube、Vimeo、Soundcloud)中找到,也可以由使用者上傳。

隨著時間的推移,人工智慧不僅學會了識別語調,而且可以識別情緒節奏。只要有足夠公開可用的音訊檔案來構建資料集,就可以偽造自己和最喜歡的明星之間的對話。它很快就可以匹配並快速生成針對每個消費者的個性化合成語音。

Lyrebird視訊編輯

語音欺詐(Voice Fraud)

合成媒體一直以來都存在一個問題:不懷好意的人可以用它來誤導人們,欺騙語音認證系統以及偽造音訊記錄。呼叫中心軟體製造商Pindrop的一項研究顯示,僅去年一年,語音欺詐就給擁有呼叫中心的美國企業造成了140億美元的損失。作為ASVspoof 2019 Challenge的一部分,Google一直致力於合成語音資料集,這是一項開放原始碼,旨在幫助制定對抗欺騙性語音的對策。

機器生成影象(Machine Image Completion)

如果計算機系統可以訪問足夠多的影象,那麼它就可以填補照片中的漏洞。對於專業攝影師以及每個想要拍出更好自拍照的人來說這是十分實用的應用。如果拍出來山的前景不清晰或者皮膚有瑕疵,都可以換用另一個版本以生成完美的影象。

但是我們如何在現實與改善後的場景之間劃清界限?在沒有標籤或披露資訊的情況下,應該修改照片到什麼程度?網上交友者、記者、營銷者和制定政策的人都應該思考這些問題。影象生成對於執法人員和軍事情報人員來說也是有用的工具——計算機現在可以幫助他們識別視訊幀裡的人或物。

考慮到機器學習演算法和資料集上的偏見,影象生成可能會成為有關隱私和裝置的討論的一部分。斯科爾科沃科學技術研究院和三星AI中心的AI研究人員使用機器影象生成技術使舊照片和著名畫作(如《蒙娜麗莎》)動了起來。

動起來的蒙娜麗莎

深層行為學習與預測(Deep Behaviors and Predictive Machine Vision)

麻省理工學院CSAIL的研究人員不僅在訓練計算機識別視訊中的內容,還讓計算機可以預測人類接下來會做什麼。如今計算機可以通過觀看YouTube上的視訊和電視節目預測兩個人是否可能擁抱、親吻、握手或擊掌。

這項研究將使機器人能夠更輕鬆地進行導航,並通過學習我們的肢體語言來與人類互動。它也可以用於銷售、操作機器或許學習。

語音、聲音和視訊的演算法生成(Generative Algorithms For Voice, Sound and Video)

晶片製造商Nvidia的研究人員於2018年開發了一種新的生成演算法,該演算法使用生成式對抗網路建立了逼真的人臉。該演算法還可以在其系統中調整各種元素,例如年齡和雀斑密度。

加州大學伯克利分校的一個團隊開發了一種軟體,該軟體可以將一個視訊中的人的動作自動傳輸給另一個視訊中的某個人。我們一直在訓練計算機觀看視訊並判斷真實世界中相應的聲音,比如一個木槌敲打沙發時會發出什麼聲音。

這項研究的重點是幫助系統瞭解物件在真實世界中如何相互作用。但該技術也具有欺騙性:2017年,華盛頓大學的研究人員開發了一種模型,模型中奧巴馬在發表一段現實生活中從未發表過的演講,但足以以假亂真。合成視訊與旨在提供真實內容的AI混在一起的現象將使問題變得更加棘手。

趨勢五:入口變革

語音搜尋優化(Optimizing For Voice Search) 

對話網路無處不在。通過語音控制我們可以立即從智慧揚聲器、汽車儀表板、電視遙控器和智慧手機的數字助理那兒獲取資訊和其他內容。隨著語音搜尋的普及,發行商等組織有了新的戰略思考:是否可以針對語音搜尋對內容進行優化?Audioburstis公司的技術可以從廣播等來源中提取並分析音訊,將其語境化並可以進行搜尋,幫助AI動力汽車提供聆聽服務。

下一代原生視訊和音訊故事形式(Next-Gen Native Video and Audio Story Formats)

通過具有響應性視覺、觸覺和音訊介面的消費類技術的發展,人們正在開發非新的敘事方式來吸引觀眾。新聞媒體和娛樂組織已開始探索這些新穎的、個性化、互動性和具有沉浸感的敘事模式。雖然這無疑將為消費者帶來更好的體驗,但新聞和娛樂媒體公司必須提前做好規劃,以便在未來可以通過口述進行彙總和傳遞內容摘要。

《黑鏡:潘達斯奈基》劇情就採用了“互動視訊”概念

人與機器的介面(Human-Machine Interfaces)

諸如Siri、Alexa和Google Assistant之類的語音介面正在變得越來越複雜,但是研究人員們已經開始展望未來了:將人類和哺乳動物直接與計算機相連。人們可以通過人機互動介面用思想進行交流,為中風和癱瘓患者提供了新的選擇。

趨勢六:擴充套件現實(混合現實)

混合現實,也稱為擴充套件現實,可以數字生成、增強或者操控環境,包括虛擬現實和擴增實境。MR通常通過頭戴式顯示器(HMD)或移動裝置進行體驗。在過去的十年中,MR已經吸引了越來越多的注意。到2020年,我們將看到MR繼續在各個行業和新的市場上逐漸普及。許多人希望在未來十年中,隨著作為MR催化劑的5G的普及,該技術將成為我們日常生活的一部分。

全息影象(Holograms)

全息影象是指看起來像是在三維空間的投影影象。到2024年,全息影象市場預計將超過50億美元,其中廣告佔比較重。在消費品方面,專業相機品牌Red宣佈推出其全息影象生成的Hydrogen 2手機,華為和三星也在開發具有全息影象功能的移動裝置,包括全息通訊。

在娛樂領域,像洛杉磯的BASE Hologram這樣的公司繼續推出以去世的藝術家的全息投影為特色的“現場”音樂會,惠特尼·休斯頓將於2020年巡迴演出,但他們尚未掌握在全息影像中多角度渲染3D全息圖所必需的體積投影,因此門票銷售有限。為了避免引起人們對動物權利問題的爭議,德國馬戲團Roncalli推出了一種可以展示動物表演的全息眼鏡,既經濟高效,又不殘忍。

BASE Hologram還原了過世歌手Buddy Holly的演唱現場

360度全向視訊(360-degree Video)

360度視訊使用專門的攝像機拍攝,旨在捕獲全向素材。渲染視訊後,觀看者可以使用滑鼠、觸控式螢幕或運動控制手勢來旋轉視角、瀏覽錄製的場景。

YouTube,Facebook和Vimeo都提供360度視訊,ABC、Fox和CNN等主要網路媒體也都擁有專用的數字頻道,用於播放涵蓋新聞、體育和娛樂在內的沉浸式內容,並且有越來越多的媒體緊隨其後。GoPro、Insta360、Ricoh和小米的行動式360度攝像頭很快就會增加使用者拍攝和社交共享的360度視訊的數量。

YouTube上的恐龍360度全景視訊

擴增實境(AR)(Augmented Reality)

AR並不像VR那樣要模擬整個新環境,而只是在你的自然視野裡放置幾個數字元素。AR可使用頭戴式顯示器或智慧眼鏡體驗,谷歌和微軟等領先品牌以及Magic Leapand、Vuzix和Meta的產品都在開發中或已經投放市場。

在各大公司爭相研發AR頭戴式耳機時,移動裝置為普通消費者提供了最方便的AR體驗。一些電影院和NBA場所引入了可在移動裝置上播放的AR遊戲,Quartz的移動應用將AR功能整合到了某些新聞報導中,而谷歌用AR完成了外國語的實時翻譯。

強化圖文功能的AR(AR as a Tool to Enhance Print)

AR將有效助力印刷業發展,媒體公司正在用AR印刷品來進一步吸引消費者。AR可以整合內容和廣告兩個不同的渠道。諸如blippar等服務可以新增只能使用智慧手機解鎖的動畫、模型或影象。

像Max Factor和Net-A-Porter之類的公司已經允許使用者用AR掃描自己喜歡的商品並直接通過手機購買。AR驅動的廣告活動的成功意味著媒體公司和廣告商的雙贏,由於價格較低,品牌將繼續使用AR印刷廣告。

虛擬現實(VR)(Virtual Reality)

虛擬現實是一種計算機模擬環境。佩戴VR眼鏡或者將手機嵌入特定裝置,即可獲得身臨其境的體驗。近年來VR在娛樂內容領域有了重要發展,新的艾美獎項如互動式媒體等層出不窮,好萊塢導演達倫·阿羅諾夫斯基和羅伯特·羅德里格斯等也在使用VR裝置拍攝。谷歌、索尼、三星和HTC都在出售VR頭戴裝置。

2019年,Facebook旗下的Oculus推出了Quest頭戴裝置,是Oculus Rift裝置的獨立替代品,只能在與PC捆綁時使用。任天堂最近也進入了沉浸式市場,為其流行的Switch遊戲裝置推出了VR套件。也可以通過將手機滑入專用面罩中來構造耳機。“站立式” VR是從相對固定的角度觀看的,與“房間規模” VR不同,後者允許觀看者在物理空間中更自由地行走,其數字環境反映了他們的真實生活。

Oculus Quest裝置

趨勢七:視訊趨勢

流媒體(Streamers)

2017年的第四季度見證了50萬名消費者拋棄了他們的有線和衛星電視服務。而使用者持續為電視付費的兩大原因在於,電視能夠觀看直播,和價格優惠的網際網路與有線服務套餐。——顯然這兩個理由都不大像傳統有線電視能持續的優勢。網飛和亞馬遜是世界上兩大流媒體。到2020年,所有人的目光都將集中在擁有Marvel和Star Wars的新Disney+服務上,更何況它還包括了Hulu和ESPN +在內。

未來預期我們會看到Amazon Fire Stick、Google Chromecast和Roku等更多流媒體裝置的份額增長,和有線衛星電視訂閱的穩定消退。而流媒體服務則會侵蝕本地廣播新聞市場,也會使較長時長的電視新聞節目陷入劣勢。

OTT流媒體服務飽和

(Saturation of OTT Streaming Services)

可能是因為HBO Now的成功,2019年各大網路媒體都在推出其頂級流媒體服務。Disney+正在啟動自己的OTT服務,預計AT&T/DirecTV、Viacom和Discovery也將提供新的服務或更新已有服務。OTT流媒體服務市場已足夠擁擠,在不久的將來它將更加飽和。

聯網電視(Connected TVs)

從2019年5月開始,所有與三星聯網電視都置備了針對Apple裝置的整合螢幕映象和內容投射功能,並可以訪問本機Apple TV和iTunes應用。它實際上繞過了單獨的Apple TV裝置,但其他大多數電視都必須通過這個裝置購買Apple內容。這就使三星吸引了大部分Apple使用者。

聯網電視預計在普通家庭的普及率會更高,這可能與流行的流媒體服務或聚合裝置,例如Amazon Prime Video、Roku、Hulu、YouTube、Showtime Anytime、iPlayer(僅限英國)、All 4(僅限英國)、 Playstation Now、HBO Now、DirecTV Now、iTunes和Netflix。

媒體機構可以利用聯網電視和獨家整合作為競爭策略來提供更豐富的內容來留住並擴張受眾。

三星聯網電視

趨勢八:電子競技

電競(e-Sports)

電子競技是一個快速發展的對抗性數字遊戲產業,能夠專業地製作遊戲並通過流媒體直播或面對面等方式面向受眾。儘管這種組織化對抗性的遊戲已經發展了數十年,但近年來,遊戲技術和流媒體功能的發展導致其受歡迎程度和合法性出現了巨幅增長。例如Fortnite(堡壘之夜)是去年最火的遊戲之一,僅2018年就收入24億,收穫使用者超過2.5億。

混合現實體驗館(Mixed Reality Arcades)

就像上個世紀80年代的電子遊戲一樣,遊戲形式日漸流行,但大多數人並不能負擔裝置費用,所以如同當年的遊戲廳,混合現實體驗館應運而生。

Nomadic是MR街機的初創者,在佛羅里達州奧蘭多市和加利福尼亞州聖拉斐爾市都開設了線下MR遊戲體驗店,玩家可以在店內帶著VR頭盔和揹包在房間裡探索。

混合現實體驗館無處不在,使每個人都可以參與到很多遊戲中來,但這次卻不需要等待很久了。Virtual World Arcad公司提供了無限虛擬現實時間的會員套餐。在東京,混合現實體驗館提供的不僅僅是基礎遊戲,還包括搖擺式安全帶、飛行平臺和模擬笨豬跳跳、飛行,甚至可以從摩天大樓上摔下來。

Virtual World Arcad混合現實體驗館

趨勢九:媒體分銷

被迫做出選擇的平臺(Platforms forced to pick sides)

由於假新聞、仇恨言論等滋生,線上平臺和社交媒體將越來越多地投資於平臺管理:可以使用人工審閱,也可以使用能檢測到仇恨或問題語音的演算法。

Amnesty International在Twitter釋出了名為“Troll Patrol”的專案,該專案發現將近1000名女性政客和記者收到的推文中,每30秒就會有一條是“侮辱性”言論。此外,政策明確至關重要。但是,真正的問題在於將是選擇哪些利益相關者參與定義這些規則,因為任何決策都可能被政治化。

限制批量訊息(Restrictions on Bulk Messaging)

新聞機構目前依靠第三方平臺來吸引消費者。而限制批量訊息將導致新聞媒體與受眾的互動變得更加困難。自2019年12月起,WhatsApp將不再允許自動或批量推送訊息。

在當今媒體平臺比電子郵件更受歡迎的時代,Facebook擁有的WhatsApp一直是新聞機構每日傳送新聞訊息的重要工具。該公司宣佈,它將在12月7日新限制生效後對在平臺上批量傳送訊息的任何個人或公司採取法律行動。

這些限制在很大程度上與未來平臺限制法規有關。WhatsApp在印度擁有超過4億的使用者,虛假資訊和謠言傳播引發了一系列暴民動亂。

美國本地新聞機構的新增長點(New Interest in America’s Local News Outlets)

Pew研究中心的資料顯示,2008年至2017年間美國報紙新聞編輯室的僱員下降了45%,創下了美國本地報紙合併和關閉數量的紀錄。目前新聞機構正在為重建本地新聞業做著大量努力。

2019年,谷歌的“新聞計劃”與美聯社合作,為新聞編輯室構建了一個可以直接共享內容及其報導計劃的工具。該公司還與McClatchy合作,建立了覆蓋當地的數字新聞站點——第一個站點將設在俄亥俄州的揚斯敦,那裡的日報《Vindicator》最近剛剛關門。2018年,Facebook和Lenfest新聞學院資助啟動了本地新聞訂閱加速器。據Facebook說,加速器專案在14個參與該計劃的都市報上吸引了成千上萬的數字訂閱和電子郵件訂閱讀者。

Lenfest Institute for Journalism官網

訂閱經濟成熟(The Subscription Economy Matures)

無論你是訂閱、衝會員還是捐贈,我們都生活在受眾經濟時代。對於媒體公司(尤其是新聞媒體)而言,這意味著商業動機需要與消費者的需求保持一致。但是,風險在於訂閱內容的傳播會淹沒觀眾的支付意願(或能力)。如果發生這種情況,釋出商將需要繼續尋找新的收入來源。

訂閱產品已經變得隨處可見:Conde Nast在1月份宣佈將在年底以前將其所有雜誌網站(以前以廣告收入為主)變成付費訂閱。全國各地的報紙都在推出新的訂閱產品或完善現有的服務。迪士尼正在迅速發展訂閱視訊服務,該服務將於11月在美國推出,涵蓋了迪士尼、ESPN和Hulu的視訊。

但即使目前普遍認為數字出版將是未來的發展出路,紙質訂閱仍然對小型本地出版商有重要意義。阿肯色州《生活》雜誌在1月份成功啟動了紙質訂閱活動後,又延續了一年的出版時間。該雜誌計劃削減出版,將更多業務轉移到網上,但仍需要紙質訂戶獲得收入。

線下連線(Offline Connections)

隨著使用者轉向移動裝置,開發者們也應當確保自家APP能夠離線使用。Netflix、Youtube和Amazon Prime現在都在打造離線瀏覽功能,允許使用者快取視訊,稍後觀看。

新聞內容聚合應用,如Google、Smartnews和Apple,同樣想要儘可能地利用使用者時間,哪怕在wifi訊號很弱的時候。《華盛頓郵報》的漸進式網路應用(Progressive Web App,可以理解為類似微信小程式,但它是基於Web瀏覽器執行)就將移動網頁的載入時間從4秒縮短到了80毫秒,使使用者在離線狀態下也能閱讀新聞。

Progressive Web App比正常瀏覽器開啟網頁要快得多

作為服務的新聞業

(Journalism as a Service)

在傳統新聞產品之外,新聞組織現在也在提供新聞服務。這種轉向使得媒體能充分實現其內容價值。新聞服務主要面向從事知識領域工作的群體,包括大學、法律初創公司、資料科學公司、商業、醫院甚至科技巨頭等。媒體積累的內容實際上是能夠被結構化、清洗,從而被多種組織運用的資料資源。

作為服務的新聞包含多個部分:新聞報導、API、編輯部和付費第三方均可使用的資料庫;與新聞事件結合的日曆外掛;使用媒體組織積累的內容和資料庫來自動生成報告的系統等。服務可以脫離社交媒體平臺而提供,減少新聞組織對外的利潤分成,使其提供的服務可以充分變現。

彈出式新聞編輯室與限量新聞產品(Pop-Up Newsrooms and Limited-Edition News Products)

新聞機構正在使用彈出式新聞編輯室和限量產品來吸引受眾。整合協作的新聞編輯室可以專注於單個主題或專案,從而擴大影響範圍並發現更深的故事。限量播客、新聞和活動可識別出對此感興趣的讀者並測試其新想法。

2019年3月,BuzzFeed在紐約發行了單日出版印刷品,在網上吸引了廣泛的注意,這種限量產品可能是發展新受眾的機會。

媒體整合(Media Consolidation)

在美國,數字使用者日漸增加,傳統媒體公司利潤持續下降,基於廣告的收入模式很難維持,尤其是對於本地媒體來說,形勢更加艱難。美國聯邦通訊委員會(FCC)的去管制化政策也為大型媒體集團的收購合併與垂直整合鋪平了道路。

2019年出現了一批鉅額併購:迪士尼和福克斯在三月份完成了合併,其中包括轉移了對Hulu的控制權;法院於2月份對AT&T收購Warner Media一案作出了最終批准,駁回了法官關於該交易是反競爭行為的觀點。

基於聊天模式盈利的新聞業(Monetizing Chat-Based Journalism)

資訊交流平臺已經成為社交行為的新中心,這其中就包括資訊分發和經濟交易行為,且二者可以合二為一。這種渠道的中心化創造了到達讀者的新機會,且讀者擁有小額數字支付的功能。

騰訊微信是率先將小額支付系統納入其資訊交流平臺的軟體之一。以前的記者、電影評論家和行業專家等關鍵意見領袖現在可以通過微信公眾號打賞獲得收入。一些專欄作家每篇文章的收入最高為4,500美元。其他主要平臺包括Facebook等也在增加相似功能。

微信公眾號的讚賞功能

注意力指標的終結(The End of Attention Metrics)

衡量注意力經濟的指標不再易於測量,流量造假屢禁不止。2018年11月,美國司法部起訴8人大規模廣告欺詐,造假廣告收入共計3600萬美元。他們巧妙地使用漫遊器來偽造點選行為甚至滑鼠移動來模仿人類消費者。對於依賴廣告收入的發行商和需要滿足客戶指標的廣告商而言,這都是一個嚴重的問題。

web3.0

去中心化與合作加速了第三代網際網路的發展。Web 1.0是網際網路時代的開始,它引入了靜態網頁、電子商務和電子郵件。Web 2.0通過引入社交網路、共享經濟、雲端計算和動態的自我維持內容儲存庫(如Wikipedia和Github)實現了分散式協作。分散式分類推動了大規模協作,並帶來了Web 3.0。

在Web 3.0時代,合作和分散創作都能夠加速發展的原因有二:基於資料探勘、自然語言生成(NLP)和文字解析等技術,收集、挖掘與理解非結構化資料都變得更容易;通過AI和機器學習,機器能夠直接彼此合作。最終,機器將能夠互相訓練。已經有類似的專案在進行中。

在媒體領域,Otoy通過創立一個合作者組成的去中心化分散式網路,共享空閒的處理資源,降低視覺設計效果的生產成本。另外,在Web3.0時代,媒體也能夠建立微型支付系統,或者使使用者能對自己的隱私和資料擁有更多的控制力。

趨勢十:空間計算

媒介整合(Media Consolidation)

空間計算將來自真實世界的資料與個人資料、數字內容混合在一起。擴增實境將數字內容投影疊加到真實環境中,利用空間計算匯入環境並進行快速計算。數字形態的牆壁、地板和沙發就這樣產生了,而且它們仍然遵循物理定律。Magic Leap是一家著名的空間計算公司,它的護目鏡可以將真實環境變成可計算環境。在未來的10到15年中,Magic Leap希望發展城市規模大小的空間計算環境,讓人們每天可以同時與真實世界和數字世界進行互動。

Magic Leap官網

數字複製品(Digital Twins)

數字複製品指的是在虛擬世界複製出一個真實世界存在的物品,並使其可以按照指令行動。視覺體積 (Volumetric Fields of Vision) 空間計算不像傳統只捕捉2D維度,同時還捕捉深度、體積等多維資料。

動態光場(Dynamic Light fields)

光場可以測量在各個方向上流動的光。對於傳統的計算機圖形,一般可以通過拍攝高清照片或根據資料構建模型來生成光場。在空間計算中,光場必須是動態的。研究人員正在研究動態光場,該光場可以收集光資料,然後以模仿人類視線角度將數字物件投射出來。

雲空間計算(Spatial Computing Clouds)

目前,空間計算系統仍然需要使用硬體。但是研究人員希望在雲中構建更多功能。在雲中的多個使用者和裝置之間儲存環境資料、過往實驗和其他程式將有助於發展空間計算系統。

趨勢十一:智慧電子產品

智慧電子產品包括智慧手錶、智慧鏡子、智慧門鈴等,可以在人們獲取新聞和進行娛樂等方面發揮重要作用。截至目前,幾乎所有可穿戴裝置都需要智慧手機或計算機來檢視和報告資料、調整設定並存檔資訊。但這將隨著智慧手機逐漸淡出視野而改變。

智慧攝像頭新聞網路(Smart Camera News Networks)

亞馬遜的Ring智慧門鈴系統包含一個名為Neighbors的軟體,該軟體使使用者可以釋出他們錄製的視訊,並鼓勵他們釋出社群內可疑活動、犯罪和其他問題的視訊和照片。

截至2019年8月,美國各地共有225個警察部門可以向Ring Doorbell的使用者索取視訊錄影。即便不是Ring的使用者也可以免費下載該應用並檢視釋出的視訊。該應用程式允許上傳者剪輯並給視訊註釋,新聞媒體就可以用這些有關盜竊、火災和其他事件的視訊來補充新聞。但是該應用也會導致一些問題。例如種族歧視,故意給他人的照片貼錯標籤,報告“可疑”活動而沒有任何真實證據。

Neighbors App

智慧ER眼鏡

(Smart ER Glasses)

2019年7月,Magic Leap從其獨立創作者計劃中挑選併發行了第一款包含世界上最知名的風景的3D拼圖遊戲。空間計算系統和ER眼鏡可以將光線直接投射到使用者的眼睛中,使數字物件看起來像存在於現實世界中。雖然Magic Leap的眼鏡尚未面向大眾出售,但其開發者平臺和企業合作伙伴生態系統都在快速發展。

微軟最近展示了一款令人印象深刻的實時應用程式。本來以英語演講的女人被重新制作成逼真的全息影象,用日語表述了同樣的演講。

入耳式電子裝置(Hearables / Earables)

入耳式電子裝置充當了我們的私人助理,並在播放音樂的同事為我們實時翻譯對話。Apple的第二代AirPods可以與Siri相容,而三星的Galaxy Buds可以通過其Bixby助手提供語音幫助。

Jabra的Elite Sport耳塞可提供實時健身指導、心率感應和VO2 Max測試,並且兼具防汗和防水功能。Soul Electronics的Run Free Bio Pro耳塞可捕獲大量跑步節奏、步態對稱性和心率等資料。

智慧手錶、戒指和手鐲(Smart Watches, Rings and Bracelets)

Motiv戒指是一種健身跟蹤器,可以監視步數、心率和其他活動,也可以響應手勢。使用者可以對其進行程式設計,使其自動登入Amazon、Google和Facebook帳戶,無需講話即可控制Alexa。Oura戒指可以收集生物資料為使用者提供優化睡眠和注意力的建議。PayPal的戒指只需在NFC終端上揮手即可付款。

2018年12月,FCC批准了對雷達跟蹤微動晶片的測試。Soli晶片等可以嵌入到眼鏡、戒指、手鐲中隨時監控使用者資料。

Motiv Ring 官網

神經技術(Neurotechnologies)

諸如Siri、Alexa和Google Assistant之類的語音介面正在變得越來越複雜,但是研究人員已經開始設想將人類和哺乳動物直接與計算機相連。人們可以通過這些人機介面用思想進行交流,為中風和癱瘓患者提供了新的選擇。

明尼蘇達大學和卡內基梅隆大學的生物醫學科學家研究出了一種感測器介面,該介面允許患者使用頭上的腦波感測器在螢幕上移動游標並控制機械臂。

數字成癮(Digital Addiction)

對於數字產品而言,培養人們使用數字產品的習慣至關重要。越來越多的研究發現這些習慣可能會對心理健康產生負面影響。

人們通過33種關於人們閱讀方式的研究發現,與螢幕閱讀相比,從紙上閱讀時閱讀者表現更加高效。一些新產品旨在找到一種解決數字成癮的技術解決方案,但目前如何長期緩解這種症狀尚未明晰。

趨勢十二:區塊鏈

區塊鏈(Blockchain Technologies)

一種在分散式分類賬上儲存和共享資訊的新技術,上面所有的交易以及身份資訊都受到保護。

加密貨幣(Cryptocurrencies)

區塊鏈技術在2017年來到拐點。它除了從邊緣化的數字貨幣發展到了比特幣之外,還逐漸成為公眾焦點,是一種共享和儲存資訊的新方式。儘管該技術仍在發展,但其廣泛的應用可能會影響一系列行業。

Facebook在2019年夏季釋出了Libra——一個由28個成員組織組成的財團支援使用的區塊鏈數字貨幣,涵蓋支付,電信,金融科技和風險投資行業等。目前為止區塊鏈技術尚未進入主流,隨著2020年技術成熟,區塊鏈技術將受到持續關注。

Facebook釋出了加密貨幣Libra

自我主權身份(Self-Sovereign Identity)

身份管理系統已經從政府頒發身份證逐漸發展到電子郵件賬戶和社交媒體帳戶。每個人平均擁有27至130個線上帳戶。像Google、Yahoo和Facebook這樣的公司已經建立了代表使用者管理大量資料的業務模型。但在2019年就發生了15起特大資料洩露事件,影響了政府、醫療保健、金融和技術領域的20億個賬戶,涉及Facebook、CapitalOne、新加坡衛生部和保加利亞稅務局等組織。

區塊鏈和分散式分類賬技術引入了新的身份管理方法:自我主權身份。自主權身份具有跨應用、裝置和平臺的互相操作性和可移植性。自主權身份具有兩個主要優點:安全性和控制力。

對於媒體公司而言,自我主權身份將涉及付費、身份驗證、版稅以及數字廣告等領域。

智慧版權和自由職業者的收入(Tokens For Smart Royalties and Freelancers)

以太坊等區塊鏈網路通過使用智慧合約提供了跟蹤內容所有權和許可的新方法。智慧合約是一種自我執行的協議,協議的條款直接寫入程式碼中。例如每次播放歌曲時,款項會自動從聽眾處扣除並流向藝術家們。使用區塊鏈技術可以更好維護版權。

去中心化內容平臺(centralized Content Platforms)

未來將會出現為創作者提供最大所有權和獎勵的平臺。在這個平臺中,創作者將獲得大部分收入,而不是將大部分收入提供給分發平臺。同時,創作者還將保留更多的所有權並與觀眾進行直接互動。

區塊鏈和分散式分類帳正在改變內容管理和消費方式的激勵結構,用投票的方式支援內容以換取報酬。這將影響許多行業,從線上遊戲到時尚到零售,從旅遊業到汽車製造商,甚至包括2020年從事政治運動的行業。

區塊鏈去中心化與版權保護

可溯源與永久存檔(Content Provenance and Permanent Archiving)

區塊鏈技術可以建立共享的永久性分類帳,其中任何內容都無法刪除。因此,將原始內容或索引新增到區塊鏈是記者永久儲存其內容並且可進行追溯的一種方式。

趨勢十三:安全與隱私

娛樂、媒體和技術公司將在整個2020年繼續面臨新的安全和隱私挑戰。現在比以往任何時候都更重要的是,每個組織都必須採取積極措施來保護使用者和公司資料,定期執行滲透測試以識別漏洞,定期更新密碼。每個組織都應該為最壞的情況做好危機計劃。

竊聽(Right To Eavesdrop/ Be Eavesdropped On)

隨著越來越多的手機、移動裝置、智慧軟體連線到物聯網,這些裝置之間以及與製造它們的公司之間的互動將不斷擴充套件。我們的裝置不再只是互相溝通,而是試圖瞭解我們並談論我們。

新聞和娛樂公司需要確定在交換消費者資料時,這些裝置是否違反了道德準則。智慧裝置之間交流資料的時候我們無法確保它們是否在一定程度上超越道德底線、私自獲取我們的資訊。

智慧語音助手被曝出“竊聽”使用者

加密訊息網路(Encrypted Messaging Networks)

在過去的一年中,記者使用的是諸如Keybase和Signal之類的封閉式加密訊息網路。但是,許多新聞機構仍然沒有關於如何使用這些網路的準則。為了對有關全球範圍內社交媒體黑客入侵和政府資助的監視程式做出迴應,專用網路將在2020年繼續流行。

網路霸凌者(Media Trolls)

指網路空間特有的垃圾郵件、仇恨言論、蕩婦羞辱等行為。Twitter、Facebook和Instagram都更新了社群標準以限制仇恨言論。Reddit禁止r / Incels之類的團體違反該網站的社群標準(儘管在該網站的其餘部分上仍有大量可怕的內容)。

真實性(Authenticity)

網路空間何為真實已經很難鑑定。Facebook已與Poynter Institute國際事實檢查網合作,以打擊其平臺上的虛假新聞。但是,這種合作關係本身很難監控,也進一步說明了Facebook對數字媒體的主導影響力。媒體的真實性已從假新聞從擴充套件到假視訊。Deepfake是一種計算機生成的面部互換視訊,最早起源於Redditin,在關閉之前積累了超過80,000的訂戶。

Deepfake製作的假視訊

資訊主權(Data Ownership)

資訊主權不只包括IP和版權,在智慧裝置風行的今天,還包括了個人行為、健康資料和網路活動等。比如上傳到Facebook的照片和在YouTube上投稿的視訊。

寫在最後

我們或許會感覺到技術更新迭代的速度放慢,但無可否認的是,我們正逐漸跨入一個以人工智慧為主流的技術新時代。在這個新時代裡,我們仍然面臨著嚴峻的考驗:驗證新聞真偽仍然棘手,而各類造假應用卻變得更加隱蔽了;在合成媒體的新世界中機器寫作雖然解放了人力,卻帶來了更嚴重的演算法規範問題;數字訂閱失靈,受眾流失困擾著所有傳統媒體和新媒體。如何在這擁擠的市場裡奪取受眾有限的注意力將在未來幾年裡依然縈繞在每一個媒體人的心上。

然而,面對這不確定的未來,所有人都沒有放棄。歐盟通過的《通用資料保護條例》得到了全世界的認可,各個國家也都在推進與網路和資料安全相關的立法規定;演算法寫作曾被認為會取代記者,如今則幫助媒體挖掘出更多更深的故事;區塊鏈技術曾遭遇發展低谷,卻依舊是保護媒體版權和可溯源永久儲存資料的首要選擇。

技術向前發展是無法逆轉的趨勢。然而無論這個世界如何變化莫測,利用技術改善人類生活的初心從未曾改變。

來自:2020年媒體技術趨勢報告:13大領域、89項變革全輸出