讓音訊實時檢測不再那麼難 網易易盾音訊檢測助力音訊業健康有序發展

網易易盾發表於2019-07-02

近日,國家網信辦會同有關部門,對26款傳播歷史虛無主義、淫穢色情內容的違法違規音訊平臺,分別採取了約談、下架、關停服務等階梯處罰,並針對網路音訊亂象啟動專項整治行動。


之所以進行專項整治,網信辦在官網裡的文章指出:


一段時間以來,網路音訊行業野蠻生長,行業亂象頻出。部分網路音訊平臺的管理制度形同虛設,任由未成年人註冊、訪問各類良莠不齊的內容;一些網路音訊平臺為追求流量、吸引眼球,利用演算法技術向使用者推送違背社會公序良俗的音訊內容;有的音訊直播平臺藏汙納垢,任由主播傳播性暗示、“嬌喘”等色情淫穢資訊,甚至引誘使用者跨平臺從事違法違規交易;有的音訊即時通訊應用以私密社交、一對一社交為賣點,公然傳播招嫖賣淫等違法犯罪資訊;有的網路音樂平臺傳播所謂“色系神曲”,宣揚“二次元文化”、“亞文化”;一些有聲讀物平臺宣揚歷史虛無主義,傳播驚悚恐怖、神仙鬼怪、殭屍、冥婚等怪力亂神的網路小說,散佈封建迷信思想。

公眾號:網信中國

國家網信辦集中開展網路音訊專項整治


網信辦表示,希望專項整治活動能夠遏制行業亂象,督促企業落實主體責任,促進行業健康有序發展。


實際上,除了極個別平臺“本末倒置”外,大部分平臺都不斷在營造風清氣正的網際網路環境,積極承擔起社會責任。


可能非行業人士會疑惑:為什麼還是有不少平臺還是存在一些色情等良莠不齊的內容?這主要是音訊的內容稽核實在太難了,就算有的廠商自研出來了,效果也差強人意。


一方面是音訊的檢測需要一定的技術實力,要具備語音和聲紋的識別能力,以及演算法上要能夠多維度抗干擾的能力,另一方面也要能夠持續投入,因為攻防是持續不斷的過程,需要不斷投入大量人力、物力。就算做到了上述兩點,其是否有足夠量級的模型庫用於訓練,訓練後效果能否達到預期…又是兩碼事。


那是不是隻能任其不良內容損害廣大青少年健康成長?其實網易易盾早就有行動,在今年5月份,網易易盾就對音訊檢測服務進行迭代升級,在點播音訊過檢的基礎上,開始支援直播音訊,實現實時音訊檢測。

讓音訊實時檢測不再那麼難 網易易盾音訊檢測助力音訊業健康有序發展

據悉,易盾的實時音訊檢測,依託網易雲端計算資源,動態擴容,彈性伸縮,輕鬆滿足客戶單日億級請求,特有的降噪處理和多維度檢測,能夠從源頭保障音訊平臺的內容安全。

除了支援實時檢測外,直播音訊檢測還能結合場景的關聯分析:根據彈幕、主播等資訊維度,通過文字NLP模型、規則引擎、智慧特徵庫等技術實現提前風險預判,更準確地返回稽核結果。

讓音訊實時檢測不再那麼難 網易易盾音訊檢測助力音訊業健康有序發展網易易盾聲紋檢測技術:嬌喘的聲紋和正常的聲紋區別圖


高準確性的背後是網易易盾在聲紋檢測的背景環境和資料多樣性上下足了功夫。據網易易盾演算法專家姚澤平介紹,音訊實時檢測上最大的難題是背景噪聲的動態變化,導致違規音訊和背景噪聲的重疊更加複雜,讓模型分類難度變大。“我們做了兩方面工作,一方面是人工地構造一些特定場景的背景噪聲,和違禁資料相混合,用這些資料訓練模型,提高模型對動態背景環境的魯棒性。另一方面是,通過對資料進行歸一化的方法,減少客觀因素對模型分類造成的影響。”姚澤平說到。


領先技術的應用,使得網易易盾音訊檢測能夠高效識別色情語音、渉政、嬌喘語音、ASMR、謾罵等違規語音;在應用場景上,也能完美覆蓋IM通訊、點播音訊和直播音訊。


作為新媒體時代下的重要產物,網路音訊行業在當下正火。iiMedia Research資料顯示,2018年線上音訊使用者規模增速達22.1%,2018年使用者數量達到4.25億。使用者的快速發展,也伴隨著低俗、色情內容在這些音訊平臺上蔓延。音訊平臺不良資訊治理的道路任重而道遠,網易易盾願全力支援音訊平臺的內容治理工作,為音訊業健康有序發展出一份微薄之力。



相關文章