網易易盾音訊過濾服務再次迭代 新增音訊實時檢測

網易易盾發表於2019-05-08

隨著使用者獲取資訊的方式差異化,音訊產品因為使用場景多元、伴隨性和碎片化,在當下快節奏的社會中,受到越來越多的使用者歡迎。iiMedia Research資料顯示,2018年線上音訊使用者規模增速達22.1%,2018年使用者數量達到4.25億。


使用者的快速發展,也伴隨著低俗、色情內容在這些音訊平臺上蔓延。最典型的就是去年6月份,全國“掃黃打非”辦公室約談多家網站負責人,要求各平臺大力清理涉色情低俗問題的ASMR內容,加強對相關內容的監管和稽核。


然而對音訊的內容稽核存在多個難點,比如說語音識別和聲紋識別難、資料標註成本大等,給很多音影片平臺的發展帶來困擾。為此,網易易盾在2018年推出了音訊檢測服務,透過業內領先的語音識別技術,精確、高效地幫助音訊平臺分析和識別出各類違規音訊。


最近,網易易盾又對音訊檢測服務進行迭代升級,在點播音訊過檢的基礎上,開始支援直播音訊,實現實時音訊檢測。

網易易盾音訊過濾服務再次迭代 新增音訊實時檢測

 

                                                                     網易易盾能實時過濾直播間音訊,確保直播間內容安全


易盾的實時音訊檢測,依託網易雲端計算資源,動態擴容,彈性伸縮,輕鬆滿足客戶單日億級請求,特有的降噪處理和多維度檢測,能夠從源頭保障音訊平臺的內容安全。

網易易盾音訊過濾服務再次迭代 新增音訊實時檢測

網易易盾音影片檢測架構


除了支援實時檢測外,本次直播音訊檢測還新增了結合場景的關聯分析:能夠根據彈幕、主播等資訊維度,透過文字NLP模型、規則引擎、智慧特徵庫等技術實現提前風險預判,更準確地返回稽核結果。


高準確性的背後是網易易盾在聲紋檢測的背景環境和資料多樣性上下足了功夫。據網易易盾演算法專家姚澤平介紹,音訊實時檢測上最大的難題是背景噪聲的動態變化,導致違規音訊和背景噪聲的重疊更加複雜,讓模型分類難度變大。


“我們做了兩方面工作,一方面是人工地構造一些特定場景的背景噪聲,和違禁資料相混合,用這些資料訓練模型,提高模型對動態背景環境的魯棒性。另一方面是,透過對資料進行歸一化的方法,減少客觀因素對模型分類造成的影響。”姚澤平說到。


領先技術的應用,使得網易易盾音訊檢測能夠高效識別色情語音、渉政、嬌喘語音、ASMR、謾罵等違規語音;在應用場景上,也能完美覆蓋IM通訊、點播音訊和直播音訊。


目前,網易易盾已和多家音影片內容平臺展開了合作,包括觸電新聞和網易雲音樂。



相關文章