AI 破解谷歌人機鑑別系統,文字驗證碼或將離場

微胖發表於2017-10-28

來源 | IEEE Spectrum

作者 | Charles Q. Choi

編譯 | Rik R

最近,一項新的研究發現,透過模擬人類視覺的工作原理,人工智慧軟體可以擊敗谷歌的 reCAPTCHA 人機鑑別驗證碼系統,這也是世界上使用最廣泛的用於區分人類與電腦的全自動圖靈測試。

科學家們補充道,這項發現不僅表明人們需要更強大的自動化人機鑑別技術,也有助於提升計算機在執行機器人任務中的感知能力。

AI 破解谷歌人機鑑別系統,文字驗證碼或將離場

電腦科學之父艾倫·圖靈構思了圖靈測試,其中最為知名的一個設想為,是否可以設計出一種能夠在文字對話中模仿人類的機器,讓旁人無法分辨出二者的差異。在進行試驗的過程中,圖靈促成了人工智慧領域的發展。

最常用的圖靈測試是 CAPTCHA,即「用來分辨計算機和人類的全自動公共圖靈測試(Completely Automated Public Turing test to tell Computers and Humans Apart)」的縮寫。CAPTCHA 被用於分辨使用者是否為人類,也經常被用於阻止機器人訪問計算服務。CAPTCHA 通常會讓網站訪問者識別一串扭曲的字母和數字,或者是回答一個對計算機來說很難、對人類卻很容易的問題。

一般情況下,如果一個演算法的識別成功率達到 1%,就可以認為它成功破解了 CAPTCHA。目前,位於舊金山灣區的初創公司 Vicarious 透露,其人工智慧軟體的 CAPTCHA 識別準確率已經可以達到 66.6%,BotDetect 是 64.4%,雅虎是 57.1%,PayPal 是 57.4%。

Vicarious 開發的系統被稱為遞迴神經網路(Recursive Cortical Network,RCN)。這是一個用來模仿大腦工作方式的人工神經網路。在這種系統中,被稱為人工神經元的各個部件會接受外部輸入的資料,並相互合作解決諸如識別文字或語音等問題。然後,神經網路可以改變這些神經元之間的連線模式,從而改變它們相互作用的方式,接下來網路又會再次試圖解決這個問題。隨著時間的推移,神經網路會知道哪種模式最適合用於計算解決方案。(詳情可見:學界 | Vicarious 發表 Science 論文:機率生成模型超越神經網路

AI 破解谷歌人機鑑別系統,文字驗證碼或將離場


此前的神經網路也可以攻破 reCAPTCHA,但需要對數百萬張標記過的 CAPTCHA 影像樣本進行訓練,或者人工標定破解各種影像的方式,而 Vicarious 的系統只需要較少的訓練資料。與用最先進的深度學習神經網路來閱讀文字相比,Vicarious 遞迴神經網路能夠在使用大約三百分之一的訓練資料的情況下,具備與之相當或更高的精度。

「我們的系統已經有能力使用相對較少的樣本進行學習,就像人的大腦。」研究負責人 Dileep George 說道,他是 Vicarious 的聯合創始人。

Vicarious 稱其成功的關鍵是:在模仿人類大腦的視覺系統之後建模遞迴神經網路。該公司解釋說,遞迴神經網路的人工神經元是結構化的,因此得以支援模型的生成。這些模型能夠快速地識別表面和輪廓,進而能夠透過有限的影像和物件樣本來輔助識別。

「這些研究結果表明基於文字的 CAPTCHA 已經過時了。」George 說道。他指出,谷歌和其它公司已經從基於文字的 CAPTCHA 轉向了新的驗證機制,比如依賴於基於影像的 CAPTCHA。

研究人員指出,他們的軟體還可以應對與計算機感知相關的其它挑戰。「我們正將其應用在許多機器人任務中。」George 說道,「可以想象一下,機器人不僅要識別物件,還要與其進行互動。這就需要建立一個行為反應模型來應對各種情況。」

AI 破解谷歌人機鑑別系統,文字驗證碼或將離場

相關文章