玩轉日常消費領域的AI,為何在反恐道路上步履蹣跚?

微胖發表於2017-08-20

這周,是不平靜的一週。當 DotA 玩家還驚訝於 OpenAI Bot 在單挑專案中完敗人類頂級玩家時,歐洲再度傳來讓人震驚的訊息。據報導,西班牙巴塞羅那週四(17 日)發生小貨車衝撞人群事件,造成 13 人死亡,100 多人受傷。襲擊發生幾個小時後,極端組織「伊斯蘭國」(ISIS)宣稱對事件負責。

 

2017 以來,歐洲先後發生了好幾起恐怖主義襲擊。英國倫敦、曼徹斯特、瑞典斯德哥爾摩以及巴黎先後遇襲,西班牙遇襲是歐洲遭遇的一系列恐怖襲擊中的最新一起。西班牙曾自詡「歐洲國家反恐的行動先鋒和榜樣」。這次襲擊也是西班牙自 2004 年「3·11」事件以來遭遇的最嚴重的恐怖襲擊。

 

如果大資料可以幫助我們找到合適的合作伙伴、最佳化酒店房間的選擇和解決許多其它日常生活中的問題,那麼它也應該能夠透過預測致命衝突的未來爆發來拯救生命。對於衝突研究人員來說,這一願景是政策影響和社會控制研究的終極前沿。

一、AI 距離衝突預測的聖盃,還很遠

在阿西莫夫的《基地》系列科幻小說中,天才哈里·謝頓幾乎完美地預測了銀河帝國的衰落和之後相當長一段時間的發展。神經網路的興起,可以幫助人類在更加廣泛的領域,比如政治預測、社會事件預測乃至人類文明發展的預測上,實現同樣的成就嗎?

 

「恐怖襲擊絕不是一時頭腦發熱的結果,而是由像你我一樣有目標、並且努力想要付諸實施的人精心安排的結果。」畢業於西點軍校、曾任美國軍方情報分析人員的 Paulo Shakarian 認為。現在,他是美國亞利桑那州立大學電腦科學教授,也是將人工智慧用於反恐研究的先行者。

 

2015 年,Paulo Shakarian 在 Mining for Causal Relationships: A Data-Driven Study of the Islamic State一文中嘗試對曾被認為不可預測的反叛組織行為進行建模、預測。研究結果超越了相關性,檢驗了基於因果的時態關係。

 

研究人員分析了戰爭研究所提供的 2200 個 ISIS 相關事件的資料,構建了一個模擬 ISIS 行為的演算法。這 2200 個事件發生於 2014 年下半年,既包括了圍繞 ISIS 的軍事行動,也包括反對 ISIS 的勢力(包括伊拉克、敘利亞和美國領導的聯盟)。在其中,他們將邏輯程式和因果推理相結合,試圖挖掘出事件之間的因果關係。由此得出了 ISIS 的一些規律。

 

比如,如果在某個星期,ISIS 在伊拉克採取了步兵行動並伴有間接射擊,那麼,下一個星期在敘利亞就會出現車載簡易爆炸裝置(VBIED)的行動;敘利亞政府空襲之後的一個星期內,ISIS 往往會扣留大量人質。並且,在他們的資料庫中,類似的大規模扣留總是發生在敘利亞空襲之後。

 

根據這些行為規律,他們得出了一些結論。比如,ISIS 可能會在除巴格達以外的其他區域採取大規模步兵行動之前,在巴格拉採取自殺式車載炸彈,來防止伊拉克軍隊/警察的增強部署;聯軍空襲與 ISIS 對簡易爆炸裝置的使用之間存在著關係,但卻沒有激發其他更大規模的武器(例如車載炸彈),這可能意味著 ISIS 在這種行動後,會依賴更加分散和反叛風格的策略,等等。

 

現在,時空範圍更有限的預測——例如預測的一個給定的處於內戰的城市的短期暴力軌跡——是完全可能的,Lars-Erik Cederman、Nils B. Weidmann 總結道。

神經網路的興起推進了衝突預測研究。利用新的可用資料和改進過的模型,研究人員可以看清政治暴力的時空動態(temporal and spatial dynamics)情況。比如,使用新型別的預測器(predictor,主要是戰爭新聞報導)後,研究人員能夠以遠遠更高的時間頻率上撲捉到政治緊張,這些報導被證明是比傳統結構變數(structural variables,如民主的水平)更強大的戰爭發生預測器。

 

但是,技術發展到今天,距離實現可以拯救生命的衝突預防(conflict prevention)還有很大距離。而且,這一領域還遠遠沒有達到民意調查機構和經濟預測機構所能接受的政策影響。

資料是一個很重要的抑制因素。與預測檯球軌跡不同,測量衝突發生的時間、地點和時間要難很多,而且這些預測與相當大的不確定性相關。另外,由於現在使用的新型資料往往是從新聞文章這樣的次要來源編碼而來,因此,觀察得到的高水平暴力結果,可能是實際暴力水平的反應,但也可能僅反應出新聞報導機率很高(或者兩者都是)。這使得預測很困難。擴大資料集可能加劇這一問題,因為它同樣依賴次級來源。

 

另一個很重要的(可能也是最重要的因素)是系統複雜性。與交通、檯球、行星執行系統或大選系統不同,武裝衝突系統包含著一組難以處理的施動因素(actors),而且這些因素以超出常規的方式互動著。因此,在缺乏瞭解這些互動機制,也沒有足夠用於測量相關變數的資料的情況下,我們能做到的僅僅是模式識別,而不是具體事件的經驗預測。

 

最近,哥倫比亞大學統計學教授兼首席研究員 Shaw-Hwa Lo 提出了一種新的分析大資料的方法:「影響分」(I-Score)。由於很多變數可能不具有預測性,同時很多預測指標可能不具有統計學意義。為此,他們提供了一個理論框架,並據此設計了合適的預測方法。研究人員指出,這一方法的應用場景很多。例如,使用高維資料(如基因資料集)進行疾病預測、用於社會科學文字預測或金融市場預測以及恐怖主義、內戰、選舉預測等。

 

在政治暴力這個問題上,希望大資料透過某種無理論的「蠻力」產生某種有效的預測是錯誤的想法,Lars-Erik Cederman、Nils B. Weidmann 指出。自動資料提取演算法,比如基於社交媒體的網頁抓取和訊號探測,可能會加劇政治緊張局勢,但這並不意味著這些演算法能以較高的時空精度預測低機率衝突事件。只有研究人員考慮到資料質量和代表性的侷限性,大型自動編碼的資料集才能發揮用處。

二、切斷網路效應:AI 的三種運用策略

 

直接預測衝突的 AI 距離我們遙遠,但是,我們可以將催生恐怖主義的因素扼殺在搖籃中。這是一種社會預防的犯罪學思維。社交媒體,成為恐怖主義與網際網路公司的必爭之地。

1、AI 監管極端社交媒體資訊,但仍以人力為主。目前,有一種看法在歐洲和美國都越來越流行,那就是網際網路公司在為伊斯蘭聖戰主義者幫忙。

 

以今年 6 月發生的倫敦恐怖襲擊為例。三名恐怖分子都與極端主義傳教士有聯絡,這些傳教士在 YouTube 上擁有很高人氣。其中一人還對澳洲一起青年恐怖襲擊事件負有部分責任。三位恐怖分子中的一人還深受美國傳教士、IS 招募者 Ahmad Musa Jibril 的影片影響。另外,倫敦恐怖襲擊者可能還從極端主義網站上學會了作案手法,制定作案計劃。根據以往經驗,他們還會透過端到端的即使通訊應用程式溝通。

 

正如當初讓網際網路公司為網路氾濫的侵權盜版承擔一定義務,情報政客們都要求科技巨頭對網路極端主義問題承擔更多責任。在一定範圍內,他們的要求是合理的。

 

與傳統恐怖組織相比,IS 的哈里發更「與時俱進」,重視數字市場「廣告營銷」。IS 會使用主流數字平臺搭建自己的社交網路,並「眾籌」恐怖活動。宣傳影片製作完畢,會有翻譯、推廣與社交媒體領袖以及建立連結的人一起將內容推廣到網上。有一個叫 Upload Knights 的團隊,在影片釋出兩天後,就散播了 136 個從谷歌接入的影片連結(69 個 YouTube,54 個 Google Drive,13 個谷歌圖片)。

 

目前,科技巨頭主要依靠傳統的報告系統反恐。使用者標記極端主義內容,公司檢查後再確定是否刪除。這種與早期打擊侵權盜版方式一樣的機制,不僅反應速度慢,而且花費不菲。祖克伯近期表示,Facebook 將利用最新影像識別技術進行判斷,被認定為與資料庫中儲存的恐怖活動相關影像和影片一致的內容將無法釋出和分享。

然而,研發出這樣的工具還需要好些年。一方面,資料不足意味著需要成熟的演算法,需要專家去彌合資料與洞見之間的鴻溝。「人工智慧並不能判斷所有內容」。負責反恐問題的 Facebook 高管莫妮卡·比卡特指出。對於僅靠人工智慧無法應對的內容,將由監管人員進行判斷。

最近 1 年裡,Facebook 增加了 150 多名反恐專家,並在全球追加 3000 名內容監管人員,合計達到 7500 人。谷歌也將大大增加 YouTube 的 Trusted Flagger 計劃中獨立專家的數量。在已有的 63 個組織基礎上新增 50 個專家型非政府組織 (NGO),併為它們提供運營資助。擴大與反極端主義團體的合作,將有助於谷歌識別可能被用於煽動和招募極端分子的內容。但這也同時意味著增加了人類偏見帶來的隱患。

另一方面,區分極端主義內容比識別兒童淫穢圖片要難得多。難點主要在於要區分影片的語境。比如,「我們打算毀壞(destroy)你的辦公室」,這種內容是合法的,但是「我們打算炸掉(bomb)你的辦公室」就屬於禁止內容,因為它更具體地建議了使用武器。機器很難區分這兩種表達的不同。谷歌也投入了大量的機器學習工程資源,應用「內容分類器」,幫助更快識別和消除與與極端主義和與恐怖主義相關的內容。

2、AI 預測極端內容,僅僅是開始。既然恐怖分子善於利用病毒傳播,在社交媒體上釋出符合他們意識形態的資訊。那麼,我們是否能夠預測哪些資訊具有病毒資訊的潛質,搶在他們之前傳送難以反駁的反對資訊呢?

Facebook 已經開始試用能理解語言的人工智慧,辨別支援或助長恐怖行為的留言。不過,幾年前,Shakarian 教授已經開始研究這些問題。他和同事們用 WISE(Web 資訊系統工程國際會議)2012 年挑戰賽所提供的新浪微博資料庫,找到了一套可以預測資訊「病毒性」的引數。研究的基礎是「結構多樣性」(structural diversity),指的是某一個人所涉入的社交語境的數量,通常可以表示為周邊區域內獨立社群的數量。經測試,這套方法的準確性達到 0.69。

不過,研究人員並不滿足於此。正如企業往往希望找到那些阻止廣告資訊蔓延的人,分析他們的特點並對其採取不同的市場策略。研究人員希望找到遏制恐怖意識形態蔓延的「防火牆」。他們在英國、伊拉克、敘利亞等國家的社交媒體進行資料探勘,試圖理解哪些因素能「抑制」社交媒體上的病毒模因(viral meme)。

研究如何預防人們加入極端組織——這非常重要,也是一個長期目標,Shakarian 教授說。

目前,谷歌和 Jigsaw 公司合作,在歐洲實施「重定向」方法,對那些在谷歌和 YouTube 上搜尋極端主義資料的使用者,定向投放反恐怖主義影片以阻止其加入。微軟正在利用 Bing 嘗試類似的研發工作。去年,谷歌、Facebook、推特和微軟同意協作建立一個使用獨特識別符號標記的恐怖主義內容的資料集。其他公司可以識別標記內容並從他們的平臺中移除。但是,這個資料集目前僅處於早期,資料材料也非常糟糕。

最近,Facebook 也引進了使被禁用 Facebook 的恐怖分子在利用假名開設新賬號時,能夠根據其交友關係和釋出內容及時發現的新技術。

3、「形塑(shaping)」行動。理解恐怖分子的網路及其結構,有助於制定更好的目標打擊計劃。詳言之,為了瓦解恐怖組織和反叛網路,國家安全機構通常傾向於定點打擊「高價值目標」(HVT),也就是他們的首領。然而,有無數的例子證明,首領被擊斃後,反叛網路很快就會再生成一位新的首領。如果可以預測到未來新生首領提前予以清除,會大大提高反恐活動的效果。

人工智慧最重要的優勢在於,能對恐怖分子、犯罪分子和極端分子建立更好的模型。人類要花幾個星期時間才能完成一張包含幾十個犯罪分子的社交網路,從中理解他們的組織結構。處理幾百萬人的社交網路,軟體只需幾分鐘。Paulo Shakarian 設計了一套演算法,可以識別出社交網節點(也就是小頭目)。清楚這些種子選手後再擊斃首領,恐怖組織很難再東山再起。


三、其他渠道的零星應用

AI 在反恐場景下的應用,多散見於其他領域,主要以預防手段為主。

比如,切斷恐怖主義活動的資金來源。長期以來,銀行一直在使用傳統反洗錢系統來標記可疑活動,但是,這套系統並不適合追蹤恐怖活動的資金轉移。雖然銀行開始依賴於硬編碼的「if-then」規則預測可疑行為,比如如果該軟體發現了從邁阿密到波哥大的七位數資金轉移,它就會識別出來並標記這筆轉賬。但是,一個藏匿著的恐怖分子進行的小額交易可能不會被常規反洗錢系統檢測到。除非這些系統使用人工智慧技術。

一家位於賓夕法尼亞州的公司 QuantaVerse 正在嘗試利用新技術解決這一矛盾。它們採用機器學習的技術,透過大量的銀行資料訓練,可以及時發現異常的賬戶和潛在的可疑交易。傳統的反洗錢系統可以監測 90 天的資料,而 QuantaVerse 的監測時長可以延至兩到三年。這是一種海底撈針一樣的外科手術式方法。據報導,該技術已經幫助找到了一個被美國緝毒局稱為「世界最大的毒品洗錢人之一」的巴拿馬人。

不過,這個行業的機器學習應用還處於早期階段,即使是 QuantaVerse 也不確定他們掌握的線索中有多少已經變成了實實在在的威脅。

在生物識別方面,也有一些出乎意料的應用。「根據社會和生命科學,個性被基因影響;我們的面部是 DNA 的對映。」一家以色列初創公司Faception  宣稱,掃一眼人臉就鑑別出人眼所發現不了的性格特徵。這家公司建立了 15 個不同的分類器,據說,對特定人格特徵具有高達 80% 的評估準確率。這些分類器可對影片流、相機和線上及線下資料庫中的臉部圖進行編碼,「將個體與各種人格特徵和型別進行匹配,準確率非常高。」公司介紹說。

據英國《每日郵報》報導,該公司表示已經成功識別了巴黎恐怖襲擊的 9 名恐怖分子。Faception 還表示,其技術能在盲測中準確對撲克和非撲克玩家進行分類,在 27 張人臉影像中分辨出 25 個撲克玩家。公司已與某國土安全機構簽下合約,幫助識別恐怖分子。

「我總不能看一眼你的臉,然後預測說你是個殺人犯,就逮捕你吧?你可以從中看出這是多麼地有爭議性。」華盛頓大學電腦科學教授 Pedro Domingos 不禁質疑道。不過,這並沒有阻止面部識別技術被官方應用在反恐活動中。2015年9月,澳大利亞政府將面部識別列入反恐策略,旨在「將恐怖分子、殺人犯和武裝劫匪及其他罪犯的姓名與面部對應起來。」《先驅太陽報》也曾報導澳洲的維州將運用尖端面部識別技術打擊恐怖主義行為。

在爭議協商方面,Integral Mind 的 CEO Daniel Osher 推出了 cogSolv , 一款基於 Mind map 的人工智慧系統。這套系統能夠理解來自其他團隊成員的世界觀,模擬他們的反應,並將這些與真實世界的知識結合起來,說服對方或者獲得雙贏局面。實際上,也提供了一個避免極端紛爭,實現和平決策的工具。

早在 2012 年,Shakarian 教授就曾開發過 SCARE(Spatio-Cultural 誘導推理引擎),幫助定位反叛軍武器庫的軟體,讓士兵洞察出叛軍的武器可能藏在什麼地方,阻止他們的路邊炸彈攻擊計劃。其修改版 C-SCARE/A 軟體專門用在了阿富汗戰場上。但是,未來恐怖主義會改變戰場,Shakarian說,最重要的活動領域將是網路空間。一些恐怖團伙已經開始使用駭客技術了,現在僅僅只是一個開始。

不過,將 AI 有效用於反恐,現在也才開始。玩轉日常消費領域的AI,為何在反恐道路上步履蹣跚?

相關文章