Google首款小程式「猜畫小歌」用了哪些AI相關技術?

景略集智發表於2018-07-23

本文首發自集智專欄

Google首款小程式「猜畫小歌」用了哪些AI相關技術?


這兩天,谷歌推出的首款AI小程式“猜畫小歌”徹底火了,朋友圈一時成為靈魂畫師們的舞臺。大體來說,就是你和AI玩一個“你畫我猜”的遊戲,你在螢幕上畫個塗鴉,AI會猜測你在畫什麼。至於遊戲規則和玩法,其他答主已經介紹的非常詳細了,這裡不再贅述。

Google首款小程式「猜畫小歌」用了哪些AI相關技術?
(圖片來自TechCrunch)

其實這款產品並非谷歌首次推出,它的原型是谷歌在2016年11月釋出一款叫做Quick,Draw!的網頁版小遊戲,當時集智專欄也分享過:來自Google的小遊戲,讓任何人都能參與到機器學習中來

Quick,Draw以及這款“猜畫小歌”比較類似於前幾年很火的手機遊戲你畫我猜,但不同的是,Google在這兩款遊戲中為使用者安排的對手不是人類,而是人工智慧。

在Quick,Draw!畫板上畫出一個塗鴉後,AI會隨時給出它的猜測結果,當完成六次遊戲後,系統會給出一個總覽圖,你可以點選每一幅圖片來觀察AI的識別結果並瀏覽其他人的繪製結果。

Google首款小程式「猜畫小歌」用了哪些AI相關技術?
Google首款小程式「猜畫小歌」用了哪些AI相關技術?

網站傳送門

這兩款遊戲的本質其實就是一個影象識別分類過程,系統通過清洗、分析圖形的特徵,來判斷圖形的真正含義。谷歌在釋出Quick,Draw!之初時,分享過一個視訊,介紹了這款遊戲的成型過程,可以幫助大家更形象的理解它背後的技術原理:

視訊戳這裡

影象識別技術一直是人工智慧的一個重要組成內容,也是Google一直努力的研究方向之一,效能良好影象識別模型具有重要的實用功能,可以廣泛地應用於圖片檢索、媒體內容歸類、視訊監控等多個領域。

當然訓練好這樣的人工智慧並不容易,谷歌在介紹“猜畫小歌”時提到,Google AI 的神經網路驅動。該網路由全世界最大的、囊括超過 5000 萬個手繪素描的資料集訓練而成。去年8月份時,谷歌專門做過關於這個資料集的介紹,當時集智也做了分享

這個龐大的資料集是由1500餘萬使用者在玩耍Quick,Draw!時和機器互動的過程中得來,目前收錄了5千萬幅塗鴉作品。谷歌已經將該資料集開源,將這些塗鴉畫作整理為開放資料集(後面會擴充為8億幅作品),旨在幫助全世界的開發者能用它訓練神經網路,用來做資料分析、產品設計,幫助研究者們研究全球各地人們的繪畫習慣,甚至幫助藝術家創作新奇的作品···

Google首款小程式「猜畫小歌」用了哪些AI相關技術?

有這方面需求的朋友,不妨去看看,資料集地址

資料集所在的GitHub倉庫中也包含了有些開發者自己實現的Quick,Draw!模型,對於想復現這種技術的朋友來說很有借鑑意義,不要錯過。

話說回來,和玩Quick,Draw!一樣,我們在玩“猜畫小歌”的同時,也在幫助AI成長。在Quick,Draw!釋出之初時,它只使用了數百個訓練資料,系統識別率並不理想,但經過後續多達千萬個使用者的參與和玩耍,多達幾億幅塗鴉作品幫助AI學習後,系統的識別率已經相當好,而且能識別出不同形態的同一物體(比如說對於寬簷帽和鴨舌帽的圖形,系統均能準確地識別出是“帽子”)。

其實,這種人工智慧的意義也絕非識別人類塗鴉和我們玩玩遊戲這麼簡單。例如通過全球使用者在Quick,Draw!上和AI的互動,我們就能發現不同國家的使用者在認知角度與偏好上的差異,進而能瞭解全球各地使用者在描繪事物時的審美觀差異。通過這樣AI就能為我們的產品和應用在不同國家和地區的本地化做出有意義的指導,比如網站和App的UI該如何設計。

AI在學習人們的塗鴉姿勢和習慣後,甚至還能幫我們畫畫,比如谷歌在釋出Quick,Draw!後不久,就在它基礎上推出了一款叫做AutoDraw的繪畫機器人,能將你的塗鴉自動昇華為美麗的藝術影象。設計師朋友們想想看,以前需要自己用軟體費時費力設計的圖形,現在按大概模樣隨便塗塗畫畫後,AI就能自動幫你轉化為需要的結果,如此省時省力,豈不美哉?

Google首款小程式「猜畫小歌」用了哪些AI相關技術?
(AutoDraw效果示意圖)

另外,通過識別和學習人類的繪畫書寫習慣,訓練後的AI還能幫助警方破案!比如今年的ICFHR18大會上收錄了一篇叫做《A New COLD Feature based Handwriting Analysis for Ethnicity/Nationality Identification》的研究論文,研究人員在收集五個國家公民的手寫字型後對其進行了分析,然後用這些資料集訓練了一個機器學習模型,能夠通過識別字跡確定書寫人的國籍。

研究人員隨即選擇了 100 名來自馬來西亞、伊朗、中國、印度和孟加拉國的被試者,讓他們手寫同樣的英文,然後使用一種線性分佈(COLD)識別工具分析他們所寫字型的形狀分佈特徵,如直線度、彎曲度等。

Google首款小程式「猜畫小歌」用了哪些AI相關技術?
(AI在分析不同國籍人員的書寫習慣)

結果顯示,即使不是書寫該國文字,被試者的筆跡也呈現出明顯的“國籍”特徵。因為這是文字造就的書寫習慣不同,即時換為書寫另一種語言同樣潛意識的保留了它們。例如,習慣漢字筆直筆畫的中國人,即使是手寫羅馬字母,也不會改變直線書寫習慣;而文字比較“圓潤”的印度和孟加拉國,他們寫出的字型則更“圓”。所以,假如案件中出現跨國嫌犯,物證中存在嫌犯留下的筆跡,AI就能分析出嫌犯的國籍。

隨著訓練資料越來越多、越來越廣,人工智慧會帶來更多像這樣的創新成果。

當然,Quick,Draw!以及“猜畫小歌”最直接的意義是以遊戲的方式讓大眾參與到機器學習過程中,從而讓人工智慧技術變得觸手可及,人人都能上手體驗AI的樂趣。

其實谷歌一直以來都有一個很好的傳統,就是將其掌握和正在研究的各類專案轉化為有意思的小實驗來讓普通使用者體驗和測試,比如包含Quick,Draw!小遊戲的專案AI Experiments。

Google首款小程式「猜畫小歌」用了哪些AI相關技術?
(AI Experiments繪畫部分的小實驗)

網站上面彙集了很多有意思的小實驗,題材涵蓋繪畫、音樂和語言多個方面,讓普通人也能輕鬆探索機器學習的世界。傳送門

通過這些小遊戲和小實驗,讓普通大眾也能領略最新的人工智慧技術,不失為一種富有創造力的方式。

最後附一個我們此前分享過的AI Experiment小實驗,讓你在瀏覽器上就能玩耍機器學習,理解神經網路的學習過程,很好玩,不要錯過。

參考資料


0806期《人工智慧-從零開始到精通》限時折扣中!

戳這裡看詳情

談笑風生 線上程式設計 瞭解一下?

(前25位同學還可領取¥200優惠券哦)

Google首款小程式「猜畫小歌」用了哪些AI相關技術?

相關文章