“安”的故事

網易易盾發表於2019-03-07

一則新聞


近日,全國“掃黃打非”辦公室為貫徹落實2019年“掃黃打非”專項行動和第三十二次全國“掃黃打非”工作電視電話會議精神,從3月起開始大力組織開展“淨網2019”、“護苗2019”、“秋風2019”等專項行動,持續淨化社會文化環境。


“淨網2019”專項行動,將聚焦整治網路色情和低俗問題,透過強化司法打擊、行政管理、行業規範、道德約束等多種手段綜合施策,綜合治理。


“護苗2019”專項行動,著重強化網上網下兩項整治,堅決查辦涉未成年的“黃”“非”案件。其中,將強化對未成年人接觸較多的網際網路應用的整治,特別對網路短影片、遊戲、漫畫、學習類APP等領域加強清理,堅決遏制色情、低俗、暴力、恐怖、殘酷等有害資訊傳播。


楔子


看到這則通知後,A內容平臺的技術總監“安”陷入了深深的焦慮中:


上次,因為低俗問題被監管部門勒令整改後,“安”被老闆批評:“這種問題一而再再而三地發生,如果你再解決不了,後面你就不用來了。”CTO“全”站在旁邊,堆滿笑容而又尷尬地圓場:“失敗乃成功之母,再說長城不是一天建成的。經過這幾次,我們準確率、召回率又得到了提升,相信再過三個月,就能達標,不出內容安全事故。”“全”側臉對“安”說:“你們這三個月就997了,儘快達標。”老闆並沒給好臉色,而是沒耐心地說:“你們申請什麼,我就給什麼。人力、物力投入那麼多,而且也都一年了,效果仍就那樣。再有事故發生,不止是“安”,連你CTO也要擔責。”


……新一輪的專項行動開始了,這次誰也說不準會不會出現問題。如果出現了,自己又該怎麼辦?“安”有點難安,他熄滅手機螢幕,抬起頭,眼睛飄過工位,望向細雨濛濛的窗外,回憶起這一年抗戰:面對內容安全問題,一開始我們並沒有當回事,以為只是“演算法問題”。招幾個演算法,以及調幾個技術實現過來就能搞定。然而想象很美好,現實卻很殘酷。人員一招擴招,物力一投再投,效果達到一個數值後,就一直得不到明顯的提升。就拿鑑黃來說,經過這一年的努力,特徵明顯的色情問題能勉勉強強處理,但是另外一個檻卻怎麼也繞不過去,那就是低俗問題。比如說,經常有一些吸睛的圖片,像這樣:

“安”的故事

這樣: 

“安”的故事

……

這類圖片要說違規吧,其實不算。但要說是不違規吧,影響卻不好。

這種低俗圖片,會引起不好的聯想,影響青少年身心健康。更重要的,這也不符合社會主義核心價值觀,影響內容平臺打造積極向上、充滿正能量的氛圍。有些內容稍有漏網之魚,就會觸犯國家的法律法規。

而且,這些圖片非常容易打擦邊球,打上一些廣告或色情暗示的水引,讓人防不勝防。

“安”的故事

有些使用者嫌我們這裡的使用者體驗不好,已經跑到B平臺上了。我們的運營總監“找事”每次吃飯或開會時碰面,都和我吐槽:“使用者體驗不好,拉新和留存難做呀。”那個“呀”的音拉的有點長。“找事”每次都看似無意地說這話,然而笑吟吟的臉上,一旁的肌肉卻是僵硬的。


“安老大?安老大?安老大!”耳邊突然響起一陣輕柔、稍顯疑惑的聲音,“安”回過頭來,發現原來是部門助理“心”。


也不曉得她站在邊上有多久了,忙不迭地說:“怎麼了?”


“心”說:“你上次讓調研第三方專業的內容安全服務,我看了幾家,其中有一家有二十多年的技術沉澱和大品牌背書,我簡單地溝通了下。他們後來說,要是方便地話,可以上門聊聊。”


“安”轉頭沉吟了一下,窗外依舊斜風細雨。年後歸來,連續下了十幾天的雨,終日不見太陽,這樣的天氣讓人難受,心情愈發低沉。


也不曉得是什麼觸動了他,安精神略微一震,似乎在下定決心,或許也是覺得久而不答不好,乾脆地說:“那聊一聊吧。”


恍然大悟


一週後,內部管理層會議上,“安”站在會議桌前,後面的大螢幕投著一個PPT,下面的是公司各個口的高管,包括老闆、“全”和“找事”。


“安”嚥了下口水,似乎在下定決心,也可能真的只是在咽口水。兩秒後,他開口說到:“對於內容安全問題,建議採用第三方專業的內容安全服務,我下面內容安全組的人,建議一部分保留,對接第三方專業的內容安全服務和維持內容安全服務;另一部分則建議迴歸業務線,專注於業務創新。”


他隨後給出了幾個理由,身後螢幕上的PPT也跟著翻動起來。其中一頁印著“網易易盾”藍藍的Logo——“E”,以及它的Sologan“智慧高效的安全防護體系”,稍作停頓後,這頁PPT又一閃而過。


他說,內容安全系統並不好開展,主要是其海量的資料往往只有BAT以及網易這類的大公司才有——尤其是和內容型相關的資料,這就導致像我們這種中小公司開發出來的內容安全系統效果不好,對內容安全問題“後知後覺”。


其次,內容安全團隊一旦組建運作,對於中小企業來說是一個無底洞。隨著業務和形態的發展,以及黑灰產攻防的升級,需要不斷投入大量人力、物力。而即使其兩者都能滿足,是否有足夠量級的模型庫用於訓練,訓練後效果能否達到預期?而在資料之外,又涉及到另外一個難題——中文博大精深,雙關、同音字、多音字等都比較複雜,中文的文字結構與語義複雜性使得垃圾資訊與衍生格式變化多端。


最後,國內對於色情內容的界限相對模糊,鑑黃的難度也隨之增加。就比如說露乳溝、露大腿,到底到什麼程度才算是低俗?主播舔東西到什麼界限,才觸達“違規”標準……這些的這些,都需要去界定和特徵提煉。


“這對於我們這樣體量的公司而言,不值得在這些上面做投入。”


“安”接著說:“我們始終無法解決的低俗問題,專業的第三方內容平臺早就有解決方案。就拿我上幾天溝通的網易易盾來說,他們就低俗早就做了概括,比如說腿部裸露、臀部展示、挑逗類、分泌物、情趣用品……整個內容安全,他們做了數十大類近千小類的分類。”


“而在解決方案背後,是網易易盾得天獨厚的自身內容型資料和服務數千家客戶的積累,從輿情、策略分析、運營規則、標註以及人工智慧等領域不斷深入、打磨,把標準層面的東西一點點確定出來。”他緊接著強調,“這不只是演算法的問題。”


“安”眼睛環顧了一週後,眼神停留在“找事”身上說:“在這個過程中,易盾還把主播嚼冰塊、露大腿等不違規,但和色情擦邊的行為提取特徵,訓練模型實現‘命中’,並在內容系統後臺中提交給客戶,由客戶在系統中決定到底要不要刪除。”


天氣放晴了


天氣有點反常,下雨、陰天長達一個月後,天空才開始久違地放晴。


部門助理“心”來到“安”的工位牌提醒說:“和網易易盾的合同簽訂時間是在下午14點,‘光明頂’會議室。”


“那個……”說完後,“心”欲言又止一會,隨後又試探性地說:“確定籤嗎?你的個人發展會不會……”


“確定籤!這條路行不太通,與其拖著,還不如及早轉型。”


“安”又壓低了聲音對“心”說:“內容安全這塊工作,很難做。一個是業務的發展和內容安全中間的度很難把握。其次是,做的好,大家覺得是應該的,然而一出事故,就要背鍋,還不如讓手下的這幫人聚焦於業務創新。”


“我們測試了一段時間,有第三方專業的內容安全服務進來就好多了,使用者體驗和使用者過來的反饋也得到了提升。”


“好多了,好多了,好多了!”“安”喃喃自語了三小聲。窗外初春和煦的陽光照進來,“安”頭上的白頭髮似乎也少好多了。

相關文章