文章來源:阿里安全官網
日前,阿里知產保護科技大腦中的一項OCR技術重新整理世界紀錄。OCR是學界業界必爭之戰,阿里、谷歌、微軟、亞馬遜等網際網路公司也都研究多年。有OCR奧斯卡之稱的ICDAR賽事,吸引全球近百國家數千隊伍參加。近期,來自中國的阿里巴巴,一舉重新整理ICDAR-RCTW17文字檢測及端到端文字識別兩項世界最好成績,位列世界第一。
OCR與奧斯卡均誕生於1929年,二者分別代表全球科技和藝術的里程碑事件。1986年中國提出“863”高新科技研究計劃,才讓OCR的漢字識別研究進入實質性階段。在該領域研究起步晚半個世紀的中國,後程發力進入世界第一梯隊。
OCR是一種能夠自動從影像中檢測並識別文字的技術,應用場景極為廣闊,除了文字翻譯、掃描文件閱讀等辦公場景,自動駕駛等工業場景,還能識別海量影像和視訊中的低俗不雅資訊,識別海量商品中的疑似侵權標識,是數字經濟時代社會治理的新型基礎設施。
阿里安全資深演算法專家薛暉指出,這項廣泛應用於阿里經濟體的技術,也在為解決複雜社會問題持續迭代升級。三年前,阿里OCR識別技術每秒能掃描圖片文字2000餘萬個,相當於501本《康熙字典》,識別準確率達97.6%。
圖說:阿里人工智慧打假技術“知產保護科技大腦”
其實,OCR只是阿里知產保護科技大腦中的一項技術。“大腦”包含上億個商品特徵、百餘個演算法模型,效率相當於5萬人同時工作。過去兩年阿里利用該技術協助執法機關破獲製假售假案件涉案金額122億元。
今年疫情期間,為讓公共服務、執法監管等力量少跑腿,減少線下排查被感染的風險,阿里迅速升級知產保護科技大腦技術,提升AI打假能力,輸出疫情防控的相關演算法模型。截至2月3日,阿里安全已協助全國14個省份30個地市公安機關偵辦製售假冒偽劣口罩等違法案件128起。人民日報高度評價稱科技戰“疫”、智勝一籌,創新技術讓我們戰勝疫情更有信心。
去年,美國眾議院司法委員會副主席道格·柯林斯就公開表示,“阿里巴巴的打假政策和專案比任何美國同行都有效得多,我發現美國平臺在這方面遠遠落後,令人震驚。”阿里知產保護科技大腦中的技術相繼打破“世界計算機視覺挑戰賽”紀錄,在和亞馬遜、IBM、英特爾的同臺競技中獲得國際計算機學會“最佳應用論文獎”,在美國國家標準技術研究所的視訊類人工智慧評測中奪冠。2019年12月,以阿里知產保護科技大腦為代表的阿里打假防假技術,被國家智慧財產權局定義為“中國樣本”、“中國經驗”,向全社會推廣。
文章來源:阿里安全官網