2018年,文娛視聽行業首先感受到一股監管寒潮,一大批知名泛娛樂產品遭到監管約談。內容安全成為行業不得不重視的Top問題,視聽系統的構建繞不開內容安全,視聽行業的從業者也需要越來越關注內容安全。LiveVideoStack郵件採訪了國內內容安全領先廠商網易雲易盾CTO朱浩齊,分享內容安全的技術現狀與未來挑戰。
策劃 / LiveVideoStack
LiveVideoStack:請簡單介紹自己和負責的工作?和業界其他廠商相比,有什麼特別的故事?
朱浩齊:網易雲安全(易盾)是網易雲旗下的一站式安全服務,脫胎於網易安全部門。我們在過去20年主要是為網易所有產品提供安全風控支援,覆蓋內容安全、移動安全、網路安全和業務安全。
網易雲安全和其他安全廠商不同的是,我們一直是業務場景驅動的安全保障,例如內容安全團隊就是因為當時網易部落格等UGC產品遇到有組織大規模的有害垃圾內容攻擊,在網易集團高層的決策下,快速成立的,我們應該是國內第一個大公司中成立這類的團隊。我在易盾主要負責雲安全服務的技術研發,特別是涉及到智慧識別的內容安全和基於大資料的業務安全服務。
LiveVideoStack:據說從網易新聞到網易雲音樂的跟帖文化,你都在背後做支撐,能否分享一些你印象深刻的事?或者有趣的事?
朱浩齊:資訊科技革命使得社會分工協同越來越緊密,何況在一個公司內部,所以我們作為網易產品的基礎安全支援部門,也只是做了我們應該做的事情。但是在幫助產品搭建內容安全體系的時候,確實有很多細節需要相互討論和理解。比如新聞跟貼,網易有蓋樓的特色,但是存在一種可能就是一些樓層有問題,其他沒問題,那我們就需要跟產品討論,讓產品增加拆樓的功能,可以把我們認為有問題的樓層都拆掉(刪除)。這其實對整個跟貼系統來說是比較大的改動,公司確實投入了較大資源進行架構升級。
此外,雲音樂在設計之初就借鑑了跟貼的問題,設計上就不允許多層樓。(最多兩層)。但是跟雲音樂的合作中我們更進了一步,除了有害內容清理之外,我們還嘗試做一些“運營需求”的功能:比如對於無意義灌水,破壞社群氛圍的謾罵等內容進行識別和清理。結果也還不錯,其實網民在網路上也會跟隨社群的風氣而調整自己的行為。
LiveVideoStack:LiveVideoStack社群的目標在於聚集國內首個專注多媒體視聽行業的技術社群,成立來,我們的確驗證了業界以及工程師在這個行業的巨大需求,網易雲易盾在視聽領域有什麼特別的洞見?
朱浩齊:我們非常看好視聽行業的發展,也看好LiveVideoStack所代表的多媒體視聽技術社群的未來。網易在娛樂多媒體方面一直有探索性產品,但易盾是從一個特別的側面感受到視聽行業的爆發。本質上我們的內容安全服務是內容識別,我們目前一天大概識別十億條資訊,成立以來,發現圖片、視訊、音訊所佔比例爆發性提升。
我們和服務客戶的交流也驗證了,內容行業一直朝向更富媒體和社互動動的方向發展,不斷為使用者擴充新的體驗。近兩年,產業中凸顯出三個趨勢:第一是垂直滲透,視聽互動正在作為標配功能嵌入到旅遊、金融、電商等行業應用。另外,不同媒體形式的交叉融合正在加快,媒體不斷增加新的視聽內容,音樂應用上線短視訊等,泛媒體泛娛樂成為共識。最後,更多媒體形式、更多互動和海量內容也給視聽平臺帶來更大更復雜的內容安全監管壓力,內容安全必須走向智慧化。
LiveVideoStack:我們的會員很多是視聽平臺,他們的確也非常關注如何構建高效的內容安全系統?請問有什麼建議嗎?
朱浩齊:在技術上,儘快採用基於自然語言處理、深度學習技術的智慧識別技術改造傳統以關鍵字和特徵庫為代表的內容識別技術,保證對文字、圖片、語音,特別是直播視訊的覆蓋。在產品上,應該注意內容釋出特別是UGC互動介面的覆蓋度,除了評論、部落格、相簿、彈幕等,不能疏漏暱稱、頭像等簽名等角落。在策略上,應該建立對有害資訊精細明確的稽核體系和應對流程,做好應急響應。
LiveVideoStack:從文字、影象、視訊與音訊,對於資訊的理解難度也在不斷加大,能分享一些您和您的團隊正在做的技術探索嗎?比如NLP,聲紋識別的。
朱浩齊:資訊理解的難度確實越來越大,但近年來有效的技術手段也在不斷更新。一方面我們嘗試使用多種技術融合的方式去理解日趨複雜的多媒體內容,例如在圖片分析過程中我們會使用多個深度網路結合的方式去提取圖片語義資訊,同時通過NLP技術對OCR抓取的文字資訊進行情感、意義的理解,最後綜合影象、文字的理解對資訊進行有效判定;另一方面,由於網際網路視訊內容不斷增多,在靜態影象處理的基礎上,我們使用了視訊分析技術更好地對流媒體內容進行解讀。此外,聲紋識別技術也是安全領域的重要研究課題,我們也在嘗試使用端到端的聲紋技術去輔助身份認證。
LiveVideoStack:在這麼多年的安全從業經歷過程中,有哪些樂趣所在?
朱浩齊:安全是一個嚴肅又嚴謹的行業,一個小的問題可能都會導致企業嚴重危機,其實不應該談什麼樂趣吧(對比遊戲,社交,電商等領域)。因為很有可能你的樂趣是建立在別人的痛苦之上的(比如研究安全問題會很有意思,瞭解發生的細節,思考補救的措施,探索新的風險點等等,但那往往是有產品被通報有安全問題了之後發生的)。當然幫助客戶解決安全問題帶來的成就感是很強的,跟黑產的鬥智鬥勇也算苦中作樂吧。我們是在解決一些“反人性”的問題,做起來很難,做成了會很開心。
LiveVideoStack:能否簡要回顧和展望下安全系統的歷史與未來?
朱浩齊:計算機發明之前的資訊保安歷史主要是密碼學範疇,比如加密電報之類的。隨著計算機技術的發展,資訊保安領域不斷擴大,現在已經包含有網路安全,系統安全,移動安全,業務安全,內容安全等等業務了。與此同時,資訊保安的威脅也在不斷升級,安全事件頻發,對安全工作帶來的挑戰也越來越大。我認為未來也會有一樣的發展趨勢:安全範圍和安全威脅同時增加。
LiveVideoStack:安全部門在企業中的地位往往不高,對於許多管理層而言,安全是成本中心而非利潤中心。但安全又無小事,一個小紕漏可能給公司和客戶帶來巨大的損失。您是如何看待安全這一特殊的行業?有哪些難忘的故事可以分享。
朱浩齊:安全行業門檻比較高,並且確實有吃力不討好的嫌疑,所以圈子不如其他資訊科技行業廣大。但是隨著安全事件的發生,越來越多的企業領導和政府官員都開始意識到資訊保安的重要性了,相關法律法規也不斷完善。我認為安全行業的地位隨著時間的推移必然會慢慢升高。並且規模化之後安全行業也可以有商業化的探索,既能幫助公司解決安全問題,又可以成為利潤來源。
LiveVideoStack:在網易內部,安全算盈利中心嗎?是把內部技術開放給了外部對嗎?為什麼會有這樣的舉措?
朱浩齊:確切的說,網易內部的安全工作分成了兩個部分,一個是為集團服務的基礎技術研究工作,一個是商業化安全產品的易盾團隊,商業化的部門是盈利中心,它做的就是把網易20年積累的部分內部技術提供給有需要的企業,形成商業化的服務。產生這樣的舉措我覺得是順理成章的事情。一方面技術需要落地到更多的場景來證明和保持其先進性,另外一方面把高門檻的安全服務商業化之後能更快的滿足安全市場的需求,幫助有需要的企業迅速實現安全體系建設,減少安全風險,提高企業的效率並且減少其成本。
LiveVideoStack:現在各個行業都在談AI,在安全領域AI應用的現狀是什麼?業界看好的探索方向是什麼?
朱浩齊:其實AI技術很早就有了,只是近年來在新的演算法和新的高效能硬體助力下產生的效果有明顯進步,在特定範圍內甚至可以做到比人更精準高效的結果。目前我們把AI技術應用在內容安全和業務安全領域,使用更好的模型來識別內容和識別風險行為。至於AI探索的方向那太多了,語音識別、翻譯、機器人、人臉識別、自動駕駛等等,可以說現在資本投入多的大熱方向都是被看好的。
LiveVideoStack:為了更好的分辨正常使用者和有威脅的使用者,需要對使用者做畫像分析,與此同時如何保護使用者的隱私,您和您的團隊做了哪些工作?
朱浩齊:其實做使用者畫像只需要使用者各個維度的資料,但不需要明文資料。對於模型來說只要資料能保持一致性即可。所以我們一方面在部門內部建立了資料保密制度,根據資料重要性等級劃分了許可權,另外一個方面儘量的把真實的資料做了脫敏處理,比如手機號碼,直接雜湊成另外一個值即可,無法逆向,人也不能理解,這樣資料就算洩露也不會造成隱私洩露的問題。
LiveVideoStack:不久前在西班牙世界通訊大會MWC上,5G成為熱點。可以預見4K乃至8K視訊將在不久的將來普及,這是否會對安全服務帶來新的挑戰?
朱浩齊:5G的理論速度提升,對於更大更清楚的內容傳播肯定會帶來好處,不過這對內容安全來說還好,不會有太大的壓力。但是5G普及對於接入裝置數量的大幅提升,可能會進一步降低黑客的攻擊門檻,導致安全成本大幅提升。