微軟亞洲研究院機器閱讀系統在SQuAD挑戰賽中率先超越人類水平
在由史丹佛大學發起的SQuAD(Stanford Question Answering Dataset)文字理解挑戰賽的最新榜單上,微軟亞洲研究院自然語言計算組於2018年1月3日提交的R-NET模型在EM值(Exact Match, 表示預測答案和真實答案完全匹配)上以82.650的最高分領先,並率先超越人類分數82.304。
微軟亞洲研究院院長洪小文第一時間向自然語言計算組表示了祝賀:“這對於微軟以及自然語言處理研究領域來說,都是一個重要的里程碑。一方面,微軟團隊在如此激烈的競爭中,以穩定的成績長期位居榜首,可喜可賀。團隊的最新研究成果已經應用在微軟相關的AI產品中。另一方面,計算機文字理解能力首次超越人類,也預示著該領域的研究將會有更大突破,相關的AI應用普及可以期待。”
值得一提的是,最新發布的這期榜單中,阿里巴巴、騰訊、科大訊飛等中國研究團隊的相關測試成績也有大幅提升,名列榜單前列。微軟亞洲研究院副院長、自然語言計算組負責人周明博士表示:“祝賀中國的自然語言理解研究已經走在世界前列!整個領域的進步需要大家共同的努力和投入來推動。自然語言處理長路漫漫,讓我們共勉。”
微軟亞洲研究院機器閱讀團隊
SQuAD挑戰賽被稱為機器閱讀理解界的ImageNet,由史丹佛大學自然語言計算組發起,它通過眾包的方式構建了一個大規模的機器閱讀理解資料集(包含10萬個問題),即將一篇幾百(平均100,最多800)詞左右的短文給標註者閱讀,隨後讓標註人員提出最多5個基於文章內容的問題並提供正確答案。SQuAD向參賽者提供訓練集用於模型訓練,以及一個規模較小的資料集作為開發集,用於模型的測試和調優。與此同時,他們提供了一個開放平臺供參賽者提交自己的演算法,並利用測試集對其進行評分,評分結果將實時地在SQuAD官網(點選閱讀原文檢視)上進行更新。
得益於SQuAD所提供的龐大資料規模,參與該項挑戰賽的選手不斷地對成績進行重新整理,SQuAD挑戰賽也逐步成為行業內公認的機器閱讀理解標準水平測試,不斷推動著機器閱讀理解領域的發展。此前,我們曾經詳細介紹過SQuAD挑戰賽的具體規則,以及微軟亞洲研究院自然語言計算組基於深度神經網路構建的端到端系統R-NET,感興趣的讀者可以點選這裡回顧。
你也許還想看:
感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:msraai@microsoft.com。
相關文章
- 微軟機器閱讀理解超越人類水平,CoQA資料集得分重新整理記錄微軟
- 微軟亞洲研究院NLP鐵軍“超越人類”技術揭祕微軟
- 微軟機器翻譯系統:中-英翻譯水平可“與人類媲美”微軟
- 哈工大訊飛聯合實驗室重新整理SQuAD 2.0機器閱讀理解挑戰賽紀錄
- SQuAD文字理解挑戰賽十大模型解讀大模型
- 猿輔導登頂MSMARCO:機器閱讀理解超過人類水平、力壓百度微軟微軟
- 微軟創CoQA挑戰新紀錄,最接近人類水平的NLP系統誕生微軟
- 谷歌AlphaGO挑戰賽:人工智慧的邊界在人類谷歌Go人工智慧
- 微軟亞洲研究院劉鐵巖博士:迎接深度學習的“大”挑戰微軟深度學習
- 記微軟OpenHack機器學習挑戰賽微軟機器學習
- Datawhale AI夏令營-機器翻譯挑戰賽AI
- 超越波士頓動力?這款四足機器人已可以挑戰惡劣環境機器人
- 機器人市場機遇和挑戰並存機器人
- 機器閱讀理解打破人類記錄,解讀阿里iDST SLQA 技術阿里
- 200萬獎金全球招募參賽團隊,第二屆京東X機器人挑戰賽再燃戰火機器人
- 程式設計自動化,未來機器人將超越人類?程式設計機器人
- 又一專案擊敗人類,阿里巴巴的AI模型閱讀理解精準率超越人類阿里AI模型
- 挑戰新物體描述問題,視覺詞表解決方案超越人類表現視覺
- 用Keras搞一個閱讀理解機器人Keras機器人
- 關於聊天機器人的閱讀筆記機器人筆記
- 沈向洋:微軟將在今年成立亞洲研究院上海分部微軟
- EMNLP 2020 | 微軟亞洲研究院精選論文解讀微軟
- 你的英語不行!微軟亞研自動語法糾錯系統達到人類水平微軟
- 挑戰系統 / 進入區域挑戰怪物
- 日立機器人新鮮出爐,欲挑戰軟銀Pepper機器人
- 全國高校計算機能力挑戰賽 Java計算機Java
- EMNLP 2019 丨微軟亞洲研究院精選論文解讀微軟
- 達觀資料率先推出首家相容華為鴻蒙HarmonyOS的RPA機器人系統鴻蒙機器人
- 在匹配模式中玩人機對戰?模式
- 挑戰程式設計競賽選讀-選擇排序程式設計排序
- 震驚!機器人竟然面臨這十大挑戰機器人
- 一文讀懂自動駕駛中的機器人作業系統ROS自動駕駛機器人作業系統ROS
- 在微軟亞洲研究院的日子[1] (原名:我的實習日記) (轉)微軟
- 在微軟亞洲研究院的日子[4] (原名:我的實習日記) (轉)微軟
- xss挑戰賽writeup
- NeurlPS 2019丨微軟亞洲研究院精選論文解讀微軟
- 機器人戰勝人類時間表:2061年機器人能完成所有人類任務!機器人
- 超越挑戰 | 綠盟科技再次圓滿支撐寧波市網路安全大賽