讓蘋果副總裁都讚歎不已的中國AI創業公司,是如何在半年內實現規模化盈利的?| 人物對話

藤子發表於2018-02-23

讓蘋果副總裁都讚歎不已的中國AI創業公司,是如何在半年內實現規模化盈利的?| 人物對話


很多人的手機上可能都有「英語流利說」這個 App,當年一上線,就被蘋果 App Store 多個區域推薦,且被評為年度精選,蘋果副總裁還帶隊參觀該公司。
「用一句話概括,英語流利說就是手機裡的人工智慧英語老師,不需要知道它是如何工作的,但它能比真人老師更高效地幫你學好英語。」英語流利說創始人、CEO 王翌說。
英語流利說上線於 2012 年,如今已有 7000 萬的使用者數量,覆蓋 175 個國家。
2012 年之前,那時中國還沒有人工智慧概念,也沒有網際網路教育概念。谷歌產品經理王翌單純覺得國內市場有很大機會,按照他的話說,有很多行業的「水位」,也就是效率比較低,可以去改進。
然而那時的王翌並沒想好自己要做什麼,回國之後的他加入一家做網際網路廣告創業公司,藉此觀察國內使用者的需求。
有意思的是,他發現在不同的場合,包括在公司和同事聊天,他們都會問王翌「如何學英語」,「為何交了很多錢卻沒堅持下來」,「是不是應該多看點美劇。」
嗅覺敏銳的王翌發現這其中有很大需求,在調研中發現,像一些線下英語培訓機構,正如同事的苦惱,很多人付了學費,但無法爭取全程學完,效果也不明顯。
正是那時,唱吧火了。「當時我覺得怎麼會有人願意對手機唱歌,後來發現內建的麥克風是一個 game changer,它可以改變一些使用者的行為。我就想,這樣子是不是大家也可以對著手機練英文,這麼一個樸素的想法。」王翌說。
「我要找一個巨大的市場,使用者有很好的付費習慣,效率還很低,可以改進。教育絕對算一個,剩下的還有金融和健康。」當時的王翌,決定選擇教育,因為相對來說,金融和健康政策風險更高,但教育有很大一部分是課外培訓。
「這方面完全可以靠產品競爭,使用者可以拿手指頭投票。」教育,再加上學英語的使用者需求,王翌拉上同在谷歌工作,從事語音識別和機器學習的本科同學林暉,決定從英語學習做起,英語流利說由此誕生。
作為將人工智慧應用於教育的典型公司,英語流利說也在我們的年終對話之列。

以下是王翌的專訪實錄(機器之能做了不改變內容的編輯):

英語流利說作為一款使用人工智慧教學的產品,有哪些地方應用了人工智慧?

在多年不斷迭代的過程中,我們收集了世界上最大的中國人說英語的語音資料,透過這些資料,打造了精確度全行業第一的中國人說英語的識別引擎,在這個基礎上,研發了評測引擎,給使用者打分和反饋。最初,我們用語音識別技術給使用者輸入的口語打分,現在我們的引擎能夠進行全方位的口語評測,甚至我們還研發了作文批改引擎。
我們有款跟雅思有關的功能,雅思考察「發音、語法、詞彙、流利度」這四個維度,針對這四個維度,我們不僅可以精準打分,而且還透過了圖靈測試,能以假亂真,AI 和真人考官之間的打分誤差,小於兩個真人考官之間打分的差距。在打分之後,從四個維度進行分析,給使用者提供具體的改進措施。
2016 年 7 月,我們推出了世界上第一個 AI 英語老師,這是付費的系統解決方案,可以極大地幫助使用者提高英文水平。
首先,使用者先進行一個可變長度的自適應的定級測試,目前,已經有一千多萬使用者完成這個測試。所謂可變長度,也就是說,如果一個水平較低的同學,可能只花費五六分鐘,系統就能確定他處於一級水平,如果水平高可能需要花費 20 分鐘。
測試完成後,系統會確定使用者的級別,也就是起點。比如是三級,那就從三級開始學。之後,是全沉浸式的學習體驗,沒有字幕沒有翻譯,用插畫和動畫的方式,把場景展現在面前,使用者透過自己的嘗試,來理解這些內容。之後,系統再讓使用者做練習,再進行強化,再將進度向前推,以此環環相扣。這套方法可以高效地幫助使用者提升英文水平。透過 ETS 託福的測試,證明我們的 AI 老師可以三倍提升學習效率,比如要達到歐標的級別,原本需要 100 小時,但我們現在大概只要 36 小時。
不管是產品還是服務,能公佈這種學習效率資料的英語學習機構,我們是世界上唯一一家。這是讓我比較興奮的。
最初從哪裡獲取的語音識別的資料?
冷啟動的時候,也就是在產品釋出之前,我們找了一些美國的 native speaker,給我們錄了一些英文,來冷啟動我們的引擎。此外,我們也用一些眾包的方式在中國收集了一些中國使用者的語音。當然,這個數量還是有限的。當我們的產品釋出之後,獲得的資料量級就不一樣了,每天會有很多使用者給我們貢獻資料。這些資料非常多樣化,人的水平不同,口音不同,用的裝置不同,都是非常真實的環境下的資料。因為這些資料是使用者跟讀時輸入的,還相當於打了標籤的資料。由於大量使用者的練習,我們相當於免費拿到了這些資料。
評測引擎所使用的標準語音資料從哪裡獲得?
我們邀請了很多專家對我們的資料進行標註,然後拿這些標準去訓練我們的引擎。比如,我們雅思功能的引擎,就專門找的雅思考官。
英語流利說中那些個性化的內容從何而來?比如那些動畫片、短片、場景。
我們的內容主要分兩類,一類是免費的內容,一部分是找專業的 writers,撰寫的原汁原味的英文的對話,還有我們社群裡的使用者貢獻的 UGC、PGC 內容。我們有中國現在最活躍的語言學習社群,這些影片短片,很多是這個社群的貢獻。
還有一類是我們的付費內容,是我們教研團隊精心製作的,我們邀請了世界上先驅式的利用技術來做語言教學的專家做我們的顧問,比如 Phillip Lance Knowles 先生提出了層級遞迴認知理論(RHR 理論 Recursive Hierarchical Recognition Theory)和以腦認知神經科學(Cognitive Neuroscience)為基礎的突破性的語言學習理論。我們的課程就是圍繞 Lance 先生的學習理論來打造的內容,就像打造一個系統工程一樣,有一套方法和思路。但我們打造的內容,跟寫書不一樣,寫書是所有學生的學習順序都一樣,但我們是由一個引擎驅動,每個使用者的內容順序都不相同。
有沒有想過用 AI 來創造內容?
這是一個大方向,其實我們也在做一些早期的嘗試。
在做英語流利說的過程當中,你覺得是哪一點是最重要的?是用人工智慧這些技術,還是這麼多豐富的內容,或者是抓住使用者的興趣?

我覺得你說的都挺重要。我們和絕大多數你們採訪的 AI 公司都不一樣。首先 90% 以上的 AI 公司是 to B 的公司,to B 的公司是典型的,先有個榔頭就是 AI 技術,然後找一個應用場景釘子錘進去,to B 的商業模式也比較清晰。但作為 to C 的公司,我們是從使用者需求出發,沒有先去找榔頭,而是先找釘子,然後思考這個釘子是應該拔出來,還是把榔頭敲進去。
第二,很多 to B 的公司,是單點突破,就是把人臉識別做到最強,可能就有人買單,但我們是 to C 公司,要做端到端,要自己先把流量做起來。我們最初用工具化的方式做流量,然後發現純網際網路模式比較輕,無法真正幫使用者提升,所以又打造教研團隊。做了之後,我發現人工智慧上去了,教研上去了,但我們還要商業化,那我們又做了商業化的運營團隊。
從 2016 年 7 月,我們開始商業化,到 2017 年 2 月實現了規模化盈利,這個速度是很快的。很多 AI 公司都在燒錢,對不對?現在 AI 相關的公司有很多人是有團隊,簡歷很漂亮,但沒技術,或者是有技術沒產品,有產品沒利潤,我們是真的有團隊、技術、產品,而且有盈利。就這幾方面,如果都放在市場上去,我相信這樣的公司是不多的。而且英語流利說是在全世界範圍第一個實現規模化盈利的產品型公司,靠產品而不是公司。

現在有很多公司在做翻譯耳機,之前谷歌的硬體釋出會就釋出了一款翻譯耳機,對這樣的產品,你怎麼看?隨著 AI 在翻譯方面的進展,以後是否可以不用學英語?

像這樣的翻譯耳機,假設它效能不錯的話,一定會滿足一部分人的需求。比如中老年人出國玩,它是一個更加方便的翻譯機,但是我認為它一定不可能取代語言學習這個市場。第一,教育部不可能因為有翻譯機,就把英語課取消。第二,語言學習,其實不僅僅是翻譯,翻譯只是其中一個場景。語言學習是為了真的無障礙的交流,甚至語言學習裡還有很多跟文化有關的需要理解的內容。只有這種天然的交流方式,才是使用者想要的。而在學習語言的過程中,也有使用者建立信心不斷挑戰自我,達成目標的這種成就感。另外,語言學習其實也有社交功能,很多人去培訓機構,是去交友的,對吧?我們社群就有成為男女朋友,甚至結婚的例子。所以語言學習是一個綜合的事情,並不是單方的對方沒聽懂,翻譯給他就可以了。
今天我們想到的不是挑戰學習,而是如何達到學習的終極狀態,也就是個性化+高效率,要達到這兩個目標,我們認為靠資料驅動的人工智慧相關產品就是終極的解決方案。

你覺得目前英語流利說有哪些需要改進的地方?

我們認為在人工智慧老師的嘗試上面,我們只邁出了第一步,老師現在還不夠智慧,學習體驗還有很多需要最佳化的地方。這是我們正在著力解決的問題。
其實人對自己的意識,自己的大腦如何工作了解得非常有限,這就是為什麼我們現在跟很多神經認知學專家、教育學專家,比如史丹佛大學的教育學院院長,耶魯大學神經學教授等專家合作的原因。我們跟這些專家合作,就是希望跨界推進一些最新的研究成果。我們的平臺也有利於他們的研究,因為我們有大量的使用者資料,能夠迭代出新的學習模式。我們在美國灣區組建了一個教育+AI 的實驗室,在全球範圍之內吸引最優秀的人工智慧專家、教育專家,腦認知神經學方面的專家加入,一起想象未來,創造未來。我們的目標是打造最智慧最高效的人工智慧英語老師。
從 2012 年到現在,英語流利說有哪些轉折的地方?
2012 年,移動網際網路大爆發,成為新的生活方式,幾乎可以結合生活的任何方面,所以我覺得這裡面機會巨大。但當時意識到,如果做得很輕,比如天氣、日曆、拍照,變現會有很大挑戰。因此,我們就想著將移動網際網路與傳統行業進行結合。市場要大,付費習慣要剛性,效率要低,可以用技術+移動產品的方式去顯著提升效率,調研了金融、健康和教育,切入教育。然後,我們決定單點突破,做一個極致好用的產品。英語流利說上線第一週就被蘋果在中國大陸、香港、臺灣和日本幾個地區進行推薦,而且還成為蘋果的年度精選,蘋果的全球資深市場副總裁來我們公司來參觀。這說明我們在產品上的投入,最後是得到回報的。
第二個轉折是我們將英語流利說工具型產品變成社群型產品,推出了一個社群,用來提高使用者粘性和活躍度,打造學習氛圍。
第三件事是在 2014 年上半年,我們做了一個戰略性質的決定,從零開始在完全不瞭解的情況下打造一支教研團隊,從內容的角度,把涉及專業性的教育做好。因為之前就是純網際網路的,現在回頭看這是非常正確的決定,只有在這方面做重,觸及到教育的本質,也就是內容的個性化。如果你永遠繞著它走,你永遠就是個邊緣型的公司。但今天我們是真的做到了,做到了給使用者解決方案和結果的公司。
這個過程中,是否走過哪些彎路?
走過幾個彎路。2014 年,我們覺得可能遊戲化會進一步激發使用者學英語的熱情,於是和國外的內容方合作,嘗試做兩個小的學習遊戲,用單詞遊戲的方式練口語。但這兩個遊戲並不成功,因為論遊戲性,它沒有普通遊戲好玩,論學習,它的學習屬性又沒有那麼強。2014 年下半年,我們想做系統教材的產品,當時第一反應是找頂尖出版社,培生、劍橋、牛津等,讓他們將最好的教材授權給我們。但瞭解之後才發現,這些教材並不適合我們。因為這些教材的作者在寫作的時候,腦子裡想的都是線下教室的場景,並非一個使用者坐在沙發上或躺在床上,拿著有麥克風的觸屏手機這樣一種學習場景。此後我們開始打造自己的教研團隊,研發 AI 老師,投入了兩年時間,對我們來說,這是戰略上的變化,但目前看來是正確的。
你覺得英語學習的趨勢是什麼?
我們為什麼在這個時間點做這個事情?其實我們看到了三個巨大的歷史性機遇。
第一,整個學習正在從模擬走向數字,以前我們學習做作業寫到紙上,老師在教室裡揮揮手,這全是模擬的,沒有被數字化。今天我們使用者的學習過程,全軌跡百分之一百的行動,各種互動,全部數字化,這是一個巨大的跨越,只有這樣,AI 化才有可能,你沒有數字化,沒有資料化,沒有結構資料化,AI 是無從談起,對吧?
第二,在教育行業,太長時間以來,學習體驗是圍繞老師進行,老師是學習的中心。這是在工業時代,學生多老師少,但我認為我們正在經歷一個歷史性的跨越,從以老師為中心到學生為中心。在英語培訓界,很多人在做外教一對一,我們認為這是一箇中間過渡狀態。因為所謂的一對一併不是真正以學生為中心,整個課堂的程式還是老師在主導。而這些一對一的老師,並不能真正快速瞭解學生的需求,做出適合他的教學方案和教學行為。
但是,英語流利說的 AI 老師,不是人,所以它的判斷完全依賴於學生的輸入以及學生跟它的互動,透過深度學習等相關技術,它能夠從巨大的內容庫中找出相關內容,根據學生的水平,個性化地推送,而不是一次性把內容全都下載下來。我認為這是終極意義上的以學生為中心,根據學生的學習需求,強項弱點,安排學習的內容、複習的節奏和練習的頻率等等。
第三,從商業模式上說,我們認為要從以過程為導向的商業模式發展到以結果為導向的商業模式,過程為導向,買的是老師的時間。比如培訓機構,你學一百小時,如果沒有進步,但培訓機構不會負責,因為他的服務已經完成,已經把老師的時間賣給了你。所以,培訓機構成為了老師時間的批發商,我們認為這種情況終將會過去,以後會變成按照結果付費。
我們的付費產品,就不是按照課時,而是為使用者提供自助餐,一個月 99 元,使用者可以成天泡在這上面。這是我們朝著最終按照結果付費的一個重要步驟。這種模式,如果是一個勤奮的學生,可以學很多,進步很快。我們的付費使用者,平均一週學習時間在五小時以上。成年人現在有誰每週花五小時去學一樣東西?這說明這對他們真的是有用的,而且他們也適應了在手機上跟著虛擬的 AI 老師學習。
你對英語流利說的短期規劃和長期規劃是什麼?
我希望 2-3 年的時間,流利說能夠建立起一支世界領先的將人工智慧應用於教育的科研+教育產品團隊,希望我們有世界領先的全棧的技術實力和產品實力。如果說長期規劃的話,我希望在下一個十年,我們能成為世界領先的教育科技集團。


讓蘋果副總裁都讚歎不已的中國AI創業公司,是如何在半年內實現規模化盈利的?| 人物對話

相關文章