撰文 | 王藝
編輯 | 藤子
成立於 2014 年的海知智慧專注於 NLP(自然語言處理)與知識圖譜。9 月 20 日,釋出第三方機器人技能外掛開放平臺,將智慧的語言理解能力免費開放給開發者。同時釋出的,還有智慧分析員「水晶球」和知識圖譜生產線「聚寶盆」,這兩款產品均用於知識圖譜的生產及應用。
然而,在成立之後的兩年半時間內,2016 年下半年語音市場爆發的前夜,謝殿俠和他的團隊沒有如預期發展起來,不斷被質疑所堅持的方向是否正確。
自然語言理解+知識圖譜,聚焦於讓機器聽得懂
還要從矽谷說起,2014 年,謝殿俠在那裡遇到了自己在北大唸書時的學弟丁力。丁力比謝殿俠小一屆,二人相識在北大古典音樂愛好者社團。
從北大畢業後,丁力赴馬里蘭大學攻讀博士學位,此後一直在學術界從事知識圖譜(之前稱 semantic web 或 Linked Open Data)相關研究。基於社群的中文知識圖譜資料標準 cnSchema 便由他起草發起。
謝殿俠從北大畢業後,並未選擇繼續深造,而是選擇了工作,二人相遇時,謝已經運營海知智慧的前身,一家名為海知資訊的知識管理公司兩年有餘。海知資訊幫助中小企業將員工的隱性知識變為顯性知識,將孤立的個人的知識變為團隊的共享知識,最終希望將不同組織、個人的知識共享,形成一個龐大的知識庫。
與丁力相遇後,謝殿俠意識到,自己的知識管理生意能夠被擴充套件到更貼合人工智慧時代的脈搏,並屬於在人工智慧技術中非常重要且位於底層的知識圖譜領域。
丁謝二人看到其老本行——知識領域的資料開放程度在日益增大,可共享、可公開的資訊日漸增多。例如曾經需要依靠關係才能拿到的昂貴的航班資訊,在 2014 年已經能夠以低成本甚至免費的形式獲得,這催生了航班管家等差旅類 App 的發展。
生活類服務例如叫車、外賣等領域的市場也愈發成熟,越來越多的開放介面、公開資料可供使用;4G 時代的到來使得網路訊號不再昂貴;語音識別技術取得了極大幅度的突破。
但是,儘管在 2014 年,智慧硬體熱潮興起,產量迅速增加。但當時業界對智慧硬體的定義還停留在「能與手機相連的硬體」階段,並非今天定義的搭載人工智慧技術的硬體。
謝殿俠觀察,語音互動作為消費者與智慧硬體之間的主要互動手段,具有很大的增長空間。而知識圖譜作為人機互動的「墊腳石」,正是商機所在。於是,他決定將知識圖譜與 NLP 結合,聚焦讓機器「聽得懂」這一層面,「聽得清」、「說得出」等其他環節一律不碰。
對別人構成價值,自身才有價值
如今,語音技術的鏈條上擁有許多環節,包括聲音的採集、識別、語言的準確理解、搜尋知識庫及應答、語音合成、使用者互動等。正是由於語音技術環節眾多,謝殿俠認為,「贏者通吃」效應在語音領域不太可能發生,在未來的很長一段時間內,「競爭合作」將成為行業的主旋律。
謝殿俠決心只在 NLP 與知識圖譜深耕細作,用謝殿俠的話說,就像打井,希望在某一點上「挖井挖出水來」。
但是,公司成立後的兩年半,幾乎沒有可觀的收入。「前面都聊得很好,聊到最後容易討論到人工智慧是造福人類還是毀滅人類,實質專案落地往往有限。」謝殿俠回憶他和硬體廠商的談話。
市場的慢熱使得發展不如預期,外部和內部壓力與日俱增。但謝殿俠相信,只要堅持打磨技術,就一定有轉機。
市場最終給了他們機會。
2016 年下半年,智慧音響市場爆發。由於語義理解處於語音技術鏈條的中部,是業內公認的技術瓶頸所在,而其他語音公司多數從處於鏈條前端且更容易達成的語音識別技術開始打磨,追求更高的識別準確率。因此,他們需要強有力的合作伙伴幫助他們跨過語義理解這道關卡。
小米、百度等 IT 公司,思必馳等語音公司紛至沓來,以合作的形式接入海知智慧的 NLP 技術。目前,海知智慧的客戶包括小米、海爾、平安、新華社、張小盒等大小機構,並作為首批合作伙伴對接了小米「水滴」平臺、度秘 DuerOS、思必馳 DUI 平臺等對話式人工智慧系統。
「堅持,深挖井,不挖出水不罷休;把要做的環節做到對別人產生價值」謝殿俠堅定不移地說。
但是,目前語音市場的現狀與謝殿俠的預測並不完全吻合,語音廠商如科大訊飛、出門問問、雲知聲等,以及巨頭的語音部門如阿里 iDST、微軟亞洲研究院等均在語音全鏈條進行佈局。
以科大訊飛為例,2015 年,訊飛研究院與約克大學成立約克大學 • 訊飛神經計算與深度學習聯合實驗室,並在 2016 國際知識圖譜構建大賽(NIST TAC Knowledge Base Population)上取得核心任務全球第一的成績。另一家公司雲知聲 CTO 梁家恩也曾在採訪中表示正在啃「語義理解和知識圖譜這塊硬骨頭」。
和他們相比,海知智慧只打一口井的運營策略註定其天生需要依靠其他語音公司生存。謝殿俠表示,他並不畏懼對其他公司甚至競爭對手的依賴,他認為「對別人構成價值,自身才有價值」。
他以思必馳為例解釋,思必馳主打全鏈條的語音技術,除語義理解外還有語音識別與合成等模組,但語義理解模組選擇與海知智慧合作。與其說是競爭對手,謝殿俠更願意將思必馳看作合作伙伴。
與思必馳合作後,海知智慧的技術能夠透過思必馳的車載產品觸達使用者,在車載領域的能力也能有所提升;同樣的,海知智慧的技術能夠增強思必馳的能力,幫助思必馳更好地服務使用者。
「表面上看來,與競爭對手的合作的確會對自己不利,但是站在更大的視野中思考,實際上我們得到了更多。」謝殿俠堅信開放的生態一定有出路。市場上也有其他公司專注於語義理解,但均有專案制的方式運營,據謝殿俠的介紹,該領域中以開放平臺模式運營的公司只有海知智慧。
「專業化分工是人工智慧時代的趨勢,要麼做出對上下游都有價值的東西,要麼死。」謝殿俠說,態度堅決。
讓知識的複用產生價值,人人都能做自己的 Bot
2017 年 9 月釋出的第三方機器人技能外掛開放平臺正是這一理念的產品。該平臺承載的第三方機器人技能外掛工具名為「魔戒」,能夠讓使用者三步構造自己的機器人。
首先,使用者需要確定其機器人的使用者、場景、以及服務,進行創意設計。接著,工具透過知識庫、問答組合、以及訓練集對技能進行訓練。最後,技能外掛被連線到智慧硬體、機器人、微信公眾號等互動入口級平臺上,接入成「人」。
謝殿俠介紹道,以大四畢業的文科生為例,經過 1-2 周的培訓就能輕鬆使用該工具,頭腦快的可能 3 天就能掌握。如果使用者掌握程式設計知識,那麼將能夠從更大的功能維度上使用該工具。
海知智慧希望為以語音合成與識別為主的公司增強語義理解能力,同時幫助不具備語音能力的內容提供公司,如餓了麼、小紅唇等整合到如小米電視等語音平臺上。
以小紅唇為例,海知智慧僅用一週時間便將小紅唇變為小米電視上的一個互動技能,當使用者用語音查詢「去見前男友應該化什麼妝」類似的問題時,小米電視能夠自動返回相應的影片。這背後的定製化自然語言理解技術若靠小紅唇自研,可能需要上百人的團隊。
上圖是一個完整的語音團隊中需要包含的人才角色,海知智慧希望「小紅唇們」在開發語音機器人時不再需要上圖中的藍色部分,僅需綠色部分。
「你有一個蘋果,我有一個蘋果,我們加在一起還是各自有兩個蘋果。但是你有一種知識,我有一種知識,我們合作能夠產生更多的知識。」謝殿俠的理念在於知識複用,在他的眼中,這就是知識複用的價值,他希望自然語言理解技術能夠像水力和電力一樣隨取隨用,使用者不需要自己提水和發電。
同時釋出的智慧分析員「水晶球」和知識圖譜生產線「聚寶盆」,用於知識圖譜的生產及應用。
水晶球是一個以知識圖譜為基礎的智慧分析員,與企業的業務系統相結合,幫助企業進行一定程度的分析、預測、判斷、預警。水晶球透過分析大量資料,尤其是半結構化以及非結構化資料,例如自動閱讀行業報告、文字等,透過自然語言理解技術構建知識圖譜,加之量化的分析模型生成分析結果。比如,水晶球對醫藥行業 100 多種物料的市場價格進行預測,誤差小於 7% 的物料佔比已經達到 80%。
聚寶盆是一條知識圖譜生產線,它是水晶球具有可操作性的根本。透過機器與人工的結合生成領域覆蓋相對較全,質量相對較高,更新較為及時的知識圖譜。
如果說魔戒是 最終服務於 C 端產品,那麼水晶球和聚寶盆則面向 B 端。謝殿俠介紹道,之所以選擇 B 端的知識圖譜業務,是因為單獨使用知識圖譜進行預測的業務對於 B 端客戶來說更易接受,且容易變現。但除 B 端產品外,海知智慧也在研發面向智慧家居等 C 端應用場景產品的知識圖譜應用模組,會被應用在使用者畫像解讀,透過場景推薦歌曲等應用程式中。
魔戒、水晶球、與聚寶盆三款產品交叉組合,產生了三種業務,即面向智慧家居的語音技能平臺;幫助企業連線售前售後環節的智慧客服(中的智慧部分);以及替代企業分析員的自動分析業務。
謝殿俠希望將這三款產品做到極致;能將自身的 NLP 與知識圖譜技術打造成上下游合作伙伴的堅實依靠;他希望到 2020 年,人人都有自己的對話機器人。「按照既定的路線走下去。」談及未來時,這是謝殿俠說的最多的一句話。