阿里AI語音鑑黃反垃圾服務上線公測可識別多種外語和方言

阿里安全官網發表於2020-01-14

原文網址 : https://zhuanlan.kanxue.com/article-10230.htm

以往靠鑑黃圖拿工資的人工鑑黃師，他們的工作可能要“涼涼”了。近日，阿里AI鑑黃語音反垃圾服務上線公測，能識別語音中存在的涉黃、廣告等違規資訊。這意味著，除識別色情圖片、色情視訊和色情文字外，涉黃語音也能通過AI鑑別了。

以往，傳統的人工鑑黃師通過一雙肉眼鑑別色情圖片和視訊。聽起來像是“福利”，但實際上並不輕鬆。如今，伴隨著網際網路上社交媒體、直播、短視訊的發展，每天光上傳的圖片超過10億張，發文數量超過5億條，不少色情、暴力等內容充斥其中。人工鑑黃師一天一人稽核1萬張圖片的工作量，遠遠滿足不了這一需求。

2015年10月，阿里巴巴“綠網”上線，用人工智慧識別網路上包括色情、暴力在內的違規資訊，阿里AI鑑黃師應運而生。通過人工智慧、深度學習和大資料樣本等技術，阿里巴巴的AI鑑黃師訓練識別千萬張正常圖片與色情圖片，最終生成一個智慧鑑黃模型。

阿里AI語音鑑黃反垃圾服務上線公測可識別多種外語和方言

圖說：阿里AI鑑黃師，用技術解決社會問題

“我們要做的就是拿圖片去‘餵養’它，讓它不斷學習，變得越來越聰明。” 阿里巴巴安全部高階演算法工程師威視介紹：“最初在獲取樣本時，我們篩選了近2000網站、6000多萬色情圖片，經過去重，標註1300多萬張高質量的色情圖片，可以說這是AI鑑黃最重要的一塊基石。”

阿里安全，一向致力於解決社會問題，可以說，高效率、低成本的阿里AI鑑黃技術，正將人工鑑黃師逐漸解放出來。威視表示：AI鑑黃師每天可稽核數億張圖片，識別準確率高於99.5%。舉個例子，一天要稽核4億張圖片的話，單純由人工來審，一人一天審1萬張，需要4萬人，而AI鑑黃只需將其中20萬張可疑的圖片篩出來，由人工再審一道，這需要20人即可。

更厲害的是，阿里AI鑑黃師不僅能鑑別黃片黃圖，連帶有情色資訊的語音內容都能識別。近期上線公測的AI語音鑑黃反垃圾服務，可支援中文、日文、英文等多國語言，還支援東北、四川、廣東等地方言。無語義的呻吟聲也能識別出來。8月21日在北京召開的2018年網路安全生態峰會上，這些成果將集中展示。

當然，AI鑑黃並不能完全取代人工鑑黃，相比人工稽核，機器還很難理解內容背後的深意。“最佳的稽核方式是智慧為主，人工為輔。人工鑑黃師群體數量少了，目前主要做打標和審查可疑圖片的工作。”阿里安全部產品專家念夏說。

文章來源：阿里安全官網

機器學習服務助應用內文字語種線上和離線檢測
2022-06-13
機器學習
語音識別模型
2024-10-29
模型
思必馳xiaochi獲2020 AESR“口音種類識別“冠軍和“口音英語語音識別”亞軍
2020-11-03
JavaScript的語音識別
2018-08-25
JavaScript
語音識別技術
2018-03-04
語音情感識別--RNN
2021-09-09
RNN
亞馬遜雲科技語音識別服務Amazon Transcribe在中國區域上線實時流式轉錄
2021-08-03
亞馬遜
重磅公開！阿里語音識別模型端核心技術，讓你「聽」見未來
2019-01-16
阿里模型
重磅公開！阿里語音識別模型端核心技術，讓你“聽”見未來
2019-01-15
阿里模型
【通用文字識別OCR】多場景、多語種、高精度
2023-03-02
換了30多種方言，我們竟然沒能考倒中國電信的語音大模型
2024-05-27
大模型
樹莓派語音互動--語音輸入識別
2020-11-24
樹莓派
Mac多語種線上翻譯工具——Translatium for Mac
2020-06-04
Mac
AI 聲音：數字音訊、語音識別、TTS 簡介與使用示例
2024-11-28
AI音訊TTS
新一代 Kaldi: 支援 JavaScript 進行本地語音識別和語音合成啦！
2024-03-17
JavaScript
Swift-語音識別、翻譯
2019-03-20
Swift
Python語音識別終極指南
2018-04-11
Python
人工智慧 (08) 語音識別
2019-12-22
人工智慧
ASR-使用whisper語音識別
2024-10-23
訊飛離線語音識別+替換自己的id
2024-04-28
Tongue Twister-快速整合華為實時語音識別服務玩轉繞口令
2020-11-28
阿里安全AI識別語義分析技術再獲突破可快速攔截色情黑話
2020-09-24
阿里AI
阿里AI獲影象識別冠軍百萬影象識別演算法可跑在手機上
2019-07-31
阿里AI演算法
使用AI識別語音和B站影片並透過GPT生成思維導圖
2024-08-25
AIGPT
人工智慧之語音識別(ASR)
2019-08-07
人工智慧
[譯] 使用 WFST 進行語音識別
2019-05-12
百度API---語音識別
2020-12-19
API
語音識別2 -- Listen,Attend,and Spell (LAS)
2020-11-25
人類級別語音 AI 路線圖丨 Voice AI 學習筆記
2024-11-21
AI筆記
語音識別 (ASR) 模型測試之評估指標探索
2020-12-22
模型指標
谷歌再獲語音識別新進展：利用序列轉導來實現多人語音識別和說話人分類
2019-08-28
谷歌
華為機器學習服務語音識別功能，讓應用繪“聲”繪色
2022-06-24
機器學習
秒懂雲通訊：如何用阿里雲語音通知服務（小白指南）
2020-07-31
阿里
怎麼關閉win10語音識別 win10如何關閉電腦的語音識別
2020-10-13
Win10
語音識別技術與政務資訊系統結合
2024-04-02
python語音識別入門及實踐
2018-07-16
Python
雷朋 Meta 眼鏡視覺識別功能開放測試；Ultravox 新版語音模型：語音理解超 GPT-4o 和 Gemini
2025-02-12
視覺模型GPT
開源服務lalserver支援多種鑑權防盜鏈方式
2022-03-23
Server

阿里AI語音鑑黃反垃圾服務上線公測 可識別多種外語和方言

相關文章

阿里AI語音鑑黃反垃圾服務上線公測可識別多種外語和方言