中國西北大學和北京大學的研究結果是否將終結CAPTCHA驗證碼時代?

AMiner學術頭條發表於2018-12-13

CAPTCHA專案是Completely Automated Public Turing Test to Tell Computers and Humans Apart (全自動區分計算機和人類的圖靈測試)的簡稱,卡內基梅隆大學試圖將其註冊為商標,但2008年請求被駁回。CAPTCHA的目的是區分計算機和人類的一種程式演算法,是一種區分使用者是計算機和人的計算程式,這種程式必須能生成並評價人類能很容易通過但計算機卻通不過的測試。用於阻止自動垃圾郵件傳送者到停止機器人在社交媒體網站上建立欺詐性配置檔案的所有內容。在過去的20多年裡,它已經發揮作用 - 可能到現在為止。

在中國西北大學、北京大學和英國蘭開斯特大學研究人員的共同努力下,電腦科學家開發出了一種能夠在短短0.5秒內破解文字CAPTCHA系統的人工智慧。它已在不同的33個CAPTCHA計劃中成功測試,其中11個來自世界上最受歡迎的網站,包括eBay、微軟、谷歌和維基百科。該論文發表於今年的ACM會議上,並是最佳論文獎的入圍者。

蘭卡斯特大學計算與通訊學院副教授Zheng Wang表示:「我們認為我們的研究可能會對CAPTCHA文字進行死刑判決。

儘管已經提出了幾種攻擊,基於文字的CAPTCHAs1仍被廣泛用作安全機制。其中一個普遍使用文字驗證碼的原因是很多以前的攻擊是針對特定方案的,需要勞動密集型的建設耗時的過程。

但是此次研究人員開發的攻擊基於深度神經網路影像分類器。深度神經網路在影像識別方面表現出令人印象深刻。但是,成功的模型通常需要數百萬個手動標記的影像才能學習。這項最新工作的新穎之處在於它使用生成對抗網路(GAN)來建立此訓練資料。該系統不需要收集和標記數以百萬計的CAPTCHA示例,而只需要500個就可以學習。然後,它可以使用它來生成數百萬甚至數十億的合成訓練資料,以建立其成功的影像分類器。結果是比迄今為止所見的任何CAPTCHA識別器系統具有更高的精度。

中國西北大學和北京大學的研究結果是否將終結CAPTCHA驗證碼時代?

這種方法對於需要大量訓練資料的任何影像識別任務都是有用的。然而,CAPTCHAs在某種程度上是獨一無二的,因為它們不斷髮展。基於文字的早期CAPTCHA是該技術的第一次迭代。但是,到目前為止,您可能更習慣於廣泛使用的基於交通標誌的CAPTCHA。這種不斷變化使收集訓練資料變得很痛苦。

「這種方法意味著,當攻擊者收集到足夠的訓練資料時,CAPTCHA 計劃將會發生變化,這將使這些努力無效。」Zheng Wang 說,「我們的工作提供了一種以更低的成本生成 CAPTCHA 識別器的新方法。因此,它對 CAPTCHA 計劃構成了真正的威脅,因為它可以更快地學習 CAPTCHA 解算器。」

資訊來源:https://www.digitaltrends.com/cool-tech/ai-cracks-captcha-05-seconds/

相關文章