隨著網民人數的不斷增加,網民態度立場不同、文化水平及道德素質參差不齊的狀況便擺在我們面前。網路暴力和網路人身攻擊現象由此而生。政府、社交網站、搜尋引擎、興趣社群都在大力研究如何檢測出社交媒體攻擊性行為,幫助人們構建一個更加和諧友愛的網路環境。百度的研究者也希望透過這一技術,能夠讓世界充滿 AI,少一些偏見。 讓 AI 更有情感:混合語種的情感分析 該任務的主辦方包括谷歌研究院、美國休斯敦大學以及印度的多所高校等。在比賽中,主辦方蒐集了源於社交網路的語料片段,測試參賽者對於相關語料片段的情感分析能力。這些語料中都包含一種特殊的語言現象:語碼混用——即一段語料中同時混有多種語言。主辦方致力於探索時下的 AI 技術對於這一類新問題的解決能力。 不同於傳統的情感分析,隨著網際網路上的內容越來越豐富,夾雜著不同語種的內容不斷產生。這些內容中可能混合著中文、英文等多種語言。針對此類文字內容,傳統的基於單語語料的情感分類模型已經無法發揮作用。針對此問題,百度的研究者首先利用 ERNIE 進行 Zero-Shot 情感分類。為了充分利用多語種語料的資訊,還引入了基於對抗學習的多語種模型,進一步地提升了多語種情感分析的效果。最終在印度語/英語混合任務上以 F1 值超過第二名 1.9% 的絕對優勢獲得第一。
隨著 AI 技術日新月異的發展,已經逐漸的走進千家萬戶。在解決日常生活需求之餘,讓 AI 可以更通情達理、更知性,並感知使用者的喜怒哀樂、提供貼心的服務,也是一個有溫度的 AI 應該達成的目標。百度始終希望透過 AI 讓複雜的世界有更多的貼心。 百度 ERNIE 團隊在 SemEval 2020 取得五項世界冠軍並非偶然,這得益於團隊在語義理解領域的深厚積累。目前,ERNIE 語義理解技術已廣泛地應用於百度內外多個產品和技術場景,在百度搜尋、小度音響、資訊流推薦等一系列產品應用中發揮了重要作用,大幅提升了產品的技術效果和使用者體驗,逐步賦能各行各業。 賦予機器「認知」能力,是人工智慧中最具挑戰的問題。自然語言處理是認知智慧中的重要領域。深入理解語言,讓機器具備人類的思考和理解能力意義重大。百度在自然語言處理領域已有二十年的積累與沉澱,具備了最前沿、最全面、最領先的技術佈局,不僅專注於前瞻技術探索,更致力透過技術應用解決實際問題。