這多年來我一直在鑽研的技術
我大學時代最愛玩的一個遊戲,法老王-埃及豔后,這是一個以古代文明為背景的城市建設遊戲。最近又撿起來玩了玩,還是那個味兒,倍爽。
上次有人說,聽說tinyfool看到AlphaGo火了,馬上去趕時髦學機器學習,結果真的獲益匪淺。
我給大家介紹下,我從業10多年是怎麼趕時髦的吧。
怎麼趕上搜尋技術的時髦
98年,第一次上網,也是第一次看到Google,那時候簡直覺得Google就是天下第一的好東西。網際網路是個無窮無盡的寶庫。但是沒有Google這把鑰匙,你什麼也不知道。
那時候,我就對搜尋技術很感興趣。一直在看各種技術文章,但是因為基礎的問題,對各種文章的描述也不是很懂。01年,我根據一些自己的理解,寫過一個原理性 的單字倒排搜尋引擎,那時候,我連怎麼做好中文分詞都不瞭解。05年,看文章知道了Lucene,但是一直沒有機會用,也沒上過手。
08年做技術諮詢的時候,客戶想上一套搜尋,方案公司的報價是20萬。客戶詢問我們有沒有解決方案,我當時覺得是個千載難逢的好機會,我就跟霍炬商量好,我們 試試看客戶滿意的話,未來還可以賣給別人。但是我們兩個當時的技術路線思路不同,我看好Lucene,基於Java開發簡便社群成熟,文件全面,剛剛還出 了本Lucene in action,他看好Tokyo Cabinet作者用C++寫的一個搜尋核心。春節放假回家,我們各自寫一套,因為大家技術路線不同,所以越好不吵不鬧,看產品見真章。春節7天假後,我 的更成熟一點,所以他的就放棄了。
馬上交付客戶,客戶很滿意,搜尋流量暴增且每天都在持續增長,一個月不到,客戶的競爭對手打電話要求買一套。
這套系統曾用於飯統、點評、六間房、FtChinese,等公司。單一伺服器最大日搜尋量2000萬次。
怎麼趕上移動網際網路的時髦
01-02年,J2ME剛剛推出來的時候,我就很有熱忱想在手機上寫程式,但是受限於當時J2ME的設計思想,以及當時手機的機能,玩了玩,我覺得這不是我要的可以程式設計的手機。
其後到iOS之前,所有流行過的手機作業系統和開發環境我都碰過。我研究過J2ME在Nokia s40上的開發,研究過Symbian,研究過Android 1.0 SDK,那時候還沒Android手機呢。
到了07年賈伯斯宣佈iPhone的時候,我覺得這就是我夢想的手機。但是那時候沒有原生SDK,只有一個Web SDK,我第一時間就開始玩,後來失望的放棄了。過了1年以後,賈伯斯釋出了當時還叫iPhoneOS SDK的iOS SDK第一版。當天,我就發郵件給在美國讀博士的朋友徐宥,請他用他的信用卡幫我買了一個開發者賬號。
有了開發者賬號後,我自己開發的第一個App是執行在我在朋友公司年會抽獎,運氣好,得到的iPod touch上的一個記賬軟體。這個軟體大概開發了2個星期以後,網易有道的人輾轉找到我,請我幫我開發有道詞典iOS版。
後來,有道詞典iOS版是我上線App Store的第一個App。
最近為什麼在趕機器學習的時髦
08-09 年,我們做搜尋創業的時候,我就開始自學機器學習。那時候,機器學習的理念還不是很流行,更多的說法還是人工智慧。還是徐宥博士,他讀完回國探親的時候, 因為他是相關專業的博士,所以他給我做了最早的啟蒙。當時人工智慧行業的現狀,為什麼從規則開始往概率轉變。為什麼現在流行的概念是機器學習,什麼是監督 學習和非監督學習,等等。
那時候開始對機器學習感興趣的主因是,我們做搜尋的時候,大量的看跟Google有關係的東西,當Google有了大量資料積累後,大量的使用機器學習去改善自己的搜尋結果,尋找更好的組織資訊的方式,等等。
我是國內當時最早翻譯Google GFS、Mapreduce、Bigtable論文的人之一。Google公佈這三篇論文後不久,Lucene的創造者Doug Cutting就領導建立了Hadoop社群,後來還建立了Mahout,這個當然後來不夠火。但是我們的研究和對市場的分析都認可,我們的搜尋服務未來 和機器學習服務是非常相配的,所以,我當時花了很大精力在學習機器學習和研究怎麼把他們搞成服務。我們可能也是做搜尋服務的公司,最早給使用者提供搜尋資料 分析服務,關鍵詞提醒服務等等,這些都是從搜尋服務延展到資料服務的例子。
後來,美國次貸危機造成我們A輪融資失敗以後,我們被經濟形勢嚇到了,公司關門了。後來,我們幾個先後去了盛大。而當時盛大對iOS方面的人也很缺乏,所以,我暫時就放下了機器學習。
那個時候,深度學習還沒有興起。大概是12年的一次imagenet的比賽上,深度學習的結果奪冠,然後各種比賽和論文都表現出深度學習的效果和便利性以後,才大行其道起來。
自學機器學習暫時放下以後,在我自己的網站,還讓我當時的下屬,在我的指導下,搭了一個貝葉斯的文章分類器做自動抓取,自動分類,放了很多年。最近,關了上 一家公司,才又有時間和心思專心學了一段時間機器學習和深度學習。當然,有動力去好好學,也是跟深度學習最近有了非常多可惜的進展有關。
不得不告訴大家的是,AlphaGo真的不算裡面多重要的一個。當然AlphaGo有其非常大的價值,因為它是外界最容易理解的,也是最容易被誤解的。就跟 當年的深藍一樣,其實深藍本身對這個世界的價值不大,但是深藍引發了大家對機器智慧的興趣,激起很多相關的討論和研究,這是它的價值。
原文釋出時間為:2018-07-31
本文來自雲棲社群合作伙伴“磐創AI”,瞭解相關資訊可以關注“磐創AI”。
相關文章
- 程式設計師如果只鑽研技術其實是很蠢的程式設計師
- 我相信catalyst可以代替我原來用了多年的interchange
- 時隔多年的部落格,我又回來了
- 關於技術書籍,我是這麼來選書和看書的
- 如何寫好技術文件——來自Google十多年的文件經驗Go
- 我和技術部落格的這一年
- JS阻塞渲染,這麼多年我理解錯啦?JS
- 谷歌這款新概念鍵盤,治好了我多年的老病谷歌
- Android開發多年每天Crud不清楚自己的技術?來刷刷大廠的高階技術面試題就知道了Android面試題
- 這麼多年來,你值得驕傲堅持的是什麼?
- 我們始終不能只靠技術來生活
- 這些年,我是如何當好一個技術支援的
- 叢集ARM伺服器技術規格-記錄我們的研發生活伺服器
- 你想成為.Net 7的技術高手嗎?來這裡看看
- 從技術轉管理,我做了什麼來拯救自己?
- 新來個技術總監,禁止我們使用Lombok!Lombok
- 我的“技術架構”之旅架構
- 我的技術成長之路
- 11、DNS隧道技術調研DNS
- Flutter技術調研報告Flutter
- 工作這麼多年,我總結的資料傳輸物件 (DTO) 的最佳實踐物件
- 印度宣佈已獨立研發出5G技術,我不信!
- 來了!「年度最強技術答辯」看這裡
- 從 HTTP 切換到 HTTPS,這下我的技術部落格安全了吧?HTTP
- 技術人生的職場眾生相 - 十多年的經驗與心得
- DMS鑽石挖礦(智慧合約)系統開發技術
- 是我們控制著技術,還是技術控制著我們?
- 面試題系列:用了這麼多年的 Java 泛型,我竟然只知道它的皮毛面試題Java泛型
- 我的技術之路 | 掘金年度徵文
- 我的前端之路 | 掘金技術徵文前端
- 我的2020回顧——技術篇
- 我的技術書單 [Hex Note]
- 海南企業成功研發我國第三代防偽技術
- 既然來騙我了,那就站在技術角度給你分析一波這個詐騙資訊。
- 我的阿里研發面經合集(阿里中介軟體,螞蟻金服)| 掘金技術徵文阿里
- 我的百度研發面經整合版(智慧雲,核心搜尋) | 掘金技術徵文
- 這門技術平均月薪18190元,我又拖後腿了?
- 容器技術的未來——京東雲技術專訪