這多年來我一直在鑽研的技術

技術小能手發表於2018-08-01

我大學時代最愛玩的一個遊戲,法老王-埃及豔后,這是一個以古代文明為背景的城市建設遊戲。最近又撿起來玩了玩,還是那個味兒,倍爽。

上次有人說,聽說tinyfool看到AlphaGo火了,馬上去趕時髦學機器學習,結果真的獲益匪淺。

我給大家介紹下,我從業10多年是怎麼趕時髦的吧。

怎麼趕上搜尋技術的時髦

98年,第一次上網,也是第一次看到Google,那時候簡直覺得Google就是天下第一的好東西。網際網路是個無窮無盡的寶庫。但是沒有Google這把鑰匙,你什麼也不知道。

那時候,我就對搜尋技術很感興趣。一直在看各種技術文章,但是因為基礎的問題,對各種文章的描述也不是很懂。01年,我根據一些自己的理解,寫過一個原理性 的單字倒排搜尋引擎,那時候,我連怎麼做好中文分詞都不瞭解。05年,看文章知道了Lucene,但是一直沒有機會用,也沒上過手。

08年做技術諮詢的時候,客戶想上一套搜尋,方案公司的報價是20萬。客戶詢問我們有沒有解決方案,我當時覺得是個千載難逢的好機會,我就跟霍炬商量好,我們 試試看客戶滿意的話,未來還可以賣給別人。但是我們兩個當時的技術路線思路不同,我看好Lucene,基於Java開發簡便社群成熟,文件全面,剛剛還出 了本Lucene in action,他看好Tokyo Cabinet作者用C++寫的一個搜尋核心。春節放假回家,我們各自寫一套,因為大家技術路線不同,所以越好不吵不鬧,看產品見真章。春節7天假後,我 的更成熟一點,所以他的就放棄了。

馬上交付客戶,客戶很滿意,搜尋流量暴增且每天都在持續增長,一個月不到,客戶的競爭對手打電話要求買一套。

這套系統曾用於飯統、點評、六間房、FtChinese,等公司。單一伺服器最大日搜尋量2000萬次。

怎麼趕上移動網際網路的時髦

01-02年,J2ME剛剛推出來的時候,我就很有熱忱想在手機上寫程式,但是受限於當時J2ME的設計思想,以及當時手機的機能,玩了玩,我覺得這不是我要的可以程式設計的手機。

其後到iOS之前,所有流行過的手機作業系統和開發環境我都碰過。我研究過J2ME在Nokia s40上的開發,研究過Symbian,研究過Android 1.0 SDK,那時候還沒Android手機呢。

到了07年賈伯斯宣佈iPhone的時候,我覺得這就是我夢想的手機。但是那時候沒有原生SDK,只有一個Web SDK,我第一時間就開始玩,後來失望的放棄了。過了1年以後,賈伯斯釋出了當時還叫iPhoneOS SDK的iOS SDK第一版。當天,我就發郵件給在美國讀博士的朋友徐宥,請他用他的信用卡幫我買了一個開發者賬號。

有了開發者賬號後,我自己開發的第一個App是執行在我在朋友公司年會抽獎,運氣好,得到的iPod touch上的一個記賬軟體。這個軟體大概開發了2個星期以後,網易有道的人輾轉找到我,請我幫我開發有道詞典iOS版。

後來,有道詞典iOS版是我上線App Store的第一個App。

最近為什麼在趕機器學習的時髦

08-09 年,我們做搜尋創業的時候,我就開始自學機器學習。那時候,機器學習的理念還不是很流行,更多的說法還是人工智慧。還是徐宥博士,他讀完回國探親的時候, 因為他是相關專業的博士,所以他給我做了最早的啟蒙。當時人工智慧行業的現狀,為什麼從規則開始往概率轉變。為什麼現在流行的概念是機器學習,什麼是監督 學習和非監督學習,等等。

那時候開始對機器學習感興趣的主因是,我們做搜尋的時候,大量的看跟Google有關係的東西,當Google有了大量資料積累後,大量的使用機器學習去改善自己的搜尋結果,尋找更好的組織資訊的方式,等等。

我是國內當時最早翻譯Google GFS、Mapreduce、Bigtable論文的人之一。Google公佈這三篇論文後不久,Lucene的創造者Doug Cutting就領導建立了Hadoop社群,後來還建立了Mahout,這個當然後來不夠火。但是我們的研究和對市場的分析都認可,我們的搜尋服務未來 和機器學習服務是非常相配的,所以,我當時花了很大精力在學習機器學習和研究怎麼把他們搞成服務。我們可能也是做搜尋服務的公司,最早給使用者提供搜尋資料 分析服務,關鍵詞提醒服務等等,這些都是從搜尋服務延展到資料服務的例子。

後來,美國次貸危機造成我們A輪融資失敗以後,我們被經濟形勢嚇到了,公司關門了。後來,我們幾個先後去了盛大。而當時盛大對iOS方面的人也很缺乏,所以,我暫時就放下了機器學習。

那個時候,深度學習還沒有興起。大概是12年的一次imagenet的比賽上,深度學習的結果奪冠,然後各種比賽和論文都表現出深度學習的效果和便利性以後,才大行其道起來。

自學機器學習暫時放下以後,在我自己的網站,還讓我當時的下屬,在我的指導下,搭了一個貝葉斯的文章分類器做自動抓取,自動分類,放了很多年。最近,關了上 一家公司,才又有時間和心思專心學了一段時間機器學習和深度學習。當然,有動力去好好學,也是跟深度學習最近有了非常多可惜的進展有關。

不得不告訴大家的是,AlphaGo真的不算裡面多重要的一個。當然AlphaGo有其非常大的價值,因為它是外界最容易理解的,也是最容易被誤解的。就跟 當年的深藍一樣,其實深藍本身對這個世界的價值不大,但是深藍引發了大家對機器智慧的興趣,激起很多相關的討論和研究,這是它的價值。

原文釋出時間為:2018-07-31
本文來自雲棲社群合作伙伴“磐創AI”,瞭解相關資訊可以關注“磐創AI”。


相關文章