色情/性感如何區分，怎樣的風控能力能防止“平臺兩行淚”？

騰訊安全發表於2019-12-05

原文網址 : https://zhuanlan.kanxue.com/article-9910.htm

“道路千萬條，安全第一條，行車不規範，親人兩行淚”——這句話，出自科幻電影《流浪地球》，卻也恰巧概括出內容平臺的“辛酸經歷”。

從文字到圖片，從直播到短視訊，多年來行駛在內容創作這條康莊大道上的“車輛”可謂形形色色。這其中，有一類“老司機”最讓人頭疼：

這些人，以打色情擦邊球為己任；在露與不露之間摩拳擦掌；為黃而不宣的內容“奮鬥”終生。

他們，可能是你平臺上的一個寫手，一個主播甚至一個配音師。這些老司機們在海量內容池中茁壯成長，你找不到、管不了也清不走。對平臺來講，這種感覺像極了一句話：

直到在風和日麗的某一天，平臺被有關部門點名關懷乃至關停整改，才發現兩行淚也難掩此時的悲壯之感。

2018年，全國各地網信辦平均每月收到網民舉報的淫穢色情、詐騙資訊、垃圾（有害）資訊等高達304.6萬次，且不斷攀升，這都是內容風控所面臨的也是迫切需要解決的問題。

內容風控要做到準確、實時、批量的確不是件易事，隨著內容上雲，AI技術的廣泛應用，內容風控的新技術如何打破上述瓶頸？對於中小型企業和大型企業來說，怎樣的雲上內容管控方案才算適用？

帶著問題，雷鋒網邀請了騰訊安全內容風控專家 Lucas 進行一場關於內容安全的誠意問答。

1、對平臺來說，內容風控為何如此重要？

Lucas：原因有三：

1.如果平臺沒有做好有害的內容識別，是需要負法律責任的：近期《關於辦理非法利用資訊網路、幫助資訊網路犯罪等刑事案件適用法律若干問題的解釋》出臺，進一步明確規定了平臺和產品在內容方面的義務與法律責任。

2.平臺中氾濫的有害內容會嚴重影響使用者的身心健康。

3.平臺如果放任有害內容的產生和傳播，必將導致劣質內容驅逐優質內容，降低平臺整體品質，從而導致使用者流失。

2、色情文字內容和網際網路一樣古老，風控平臺是如何準確識別出哪些文字內容在“開車”的？針對一些諧音、拼音之類的擦邊球文字如何準確識別？對於“嗯，嗯，嗯”“啊，啊，啊”這樣的擬聲字如何識別？

Lucas：文字是網路中最大的資訊載體，所有網際網路平臺都面臨文字安全風控的問題。色情文字中存在一些明顯特點，比如變異字干擾、形近字拆字干擾、同音字干擾。

▲垃圾文字通過變異干擾躲避傳統的有害文字風控模型

針對這類文字的特點，單靠抗干擾能力弱、策略更新滯後的文字策略無法滿足對抗的需求，需要通過文字策略+演算法模型相結合的方式來提升整體識別的召回率和準確率。

文字分類演算法選擇與模型訓練

對比典型的TextCNN、RNN、FastText等文字分類演算法，其中TextCNN的模型複雜度低、推理速度快、抗干擾性強且對詞順序不敏感等特點，適合於短文字高對抗的場景；在模型訓練中通過以下手段來進一步提升模型的識別效果：

1. 基於字元、拼音的Word2Vec來豐富詞的語義資訊，可以有效解決同音字問題；

2. 資料增強，對訓練樣本中的高頻詞做拆字，比如針對“加微”這個詞分別補充“+V”“+威”等用於訓練來提升模型的抗干擾能力。3. 基於靜態詞向量與動態詞向量相結合的方法，比如在不同場景的大規模語料上分別預訓練靜態詞向量，捕捉詞的多場景語義資訊，從而降低因訓練資料過少導致的過擬合風險。

▲短文字型別模型與訓練流程

▲騰訊安全天御內容風控文字安全的打擊效果

3、色情圖片可能是流傳最廣泛，傳播最速度的色情資訊內容了，我們知道對於機器來說，識別色情圖片門檻很高，企業應該如何處理？

Lucas：圖片是網路上僅次於文字的第二大資訊形式，幾乎任何網際網路平臺都要面臨圖片中存在的色情、低俗等問題。

我們把色情低俗等圖片大致分為兩類過濾情況：

存在具象的有害元素：例如露點、性行為等，經典的影象分類/目標檢測演算法就適用於這類情況，此時演算法的挑戰在於元素型別眾多、而且有害元素在畫面中的比例未必是顯著的。針對這種情況通過Attention技術，可以讓模型更關注到特定元素而“忽視”無關痛癢的其他畫面元素，例圖中的輸出圖片是熱力圖，從中可以看出模型對漏溝資訊的反應最為明顯，說明模型判斷這是一張低俗圖的主要原因在於它發現了‘漏溝’這一概念。