教育市場+瞄準剛需,這是景鯤和百度DuerOS在2017年交出的成績單| 人物對話

彭君韜發表於2018-02-26

教育市場+瞄準剛需,這是景鯤和百度DuerOS在2017年交出的成績單| 人物對話

智慧語音互動是科技歷史上為數不多的一次重大的人機互動介面迭代,之前還有兩次:滑鼠鍵盤,以及觸屏互動。它提供了一種使用者即使在雙手被束縛的情況下依然可以進行的交流手段;同時也為人工智慧技術的落地提供了真實的應用場景。
這種新穎的互動方式在過去幾年裡在中國掀起了一場科技變革,尤其到了 2017 年,以 BAT 領銜的中國市值最高的幾大科技公司都爭先入局,或宣佈由人工智慧加持的語音互動系統,或推出能實現人機對話的智慧音響。總之,目前的中國已經鮮有科技公司不涉獵智慧語音互動了。
去年這一輪比拼中,由百度度秘事業部總經理景鯤所主持的 DuerOS 開放平臺最為耀眼。DuerOS,中文即是對話式 AI 作業系統。度秘原本在百度扮演的是一個人工智慧秘書服務的角色,但在語音互動的這一波浪潮裡,被百度迅速地推往第一線,成為和百度另一大自動駕駛開放平臺 Apollo(阿波羅)等並行重要的業務線。

DuerOS 在去年 CES 上正式亮相。在接下來的短短十二個月裡,DuerOS 經歷了從作業系統升級為開放平臺的變化;兩代版本的重大更新;賦能 130 多家合作伙伴,提供 20 多種硬體解決方案。截止到 2018 年 1 月,DuerOS 啟用裝置量已經超過 5000 萬,月活躍裝置量超過了 1000 萬。百度也給 DuerOS 平臺貼上了很多標籤,包括「人工智慧時代的安卓」、「生態化」、「軟硬結合」。
然而,我們還無法從這些標籤上看清楚 DuerOS 堅持乃至於執著做開放平臺的用意,到底是出於怎樣的考量?對未來格局的判斷又是什麼樣的?同時必須要承認的是,中國智慧語音互動市場雖潛力巨大但目前體量還很小,推動中國語音互動市場的發展依然任重道遠。
百度是如何看待這些問題的?景鯤給出了他的答案。
以下是景鯤的專訪實錄(機器之能做了不改變內容的編輯):

開放平臺是一個生態,最大的挑戰是你要理解這個生態裡每個角色的訴求。

去年 2 月度秘升級為度秘事業部之前,當時度秘有多少人?當時有沒有一些心理上的變化?

當時一百多人,現在好幾百人了。在度秘升級成事業部之後,我當然覺得身上擔子更重。原來我們屬於大公司大業務下面的一個創新業務。如今,公司把我們提高到這麼重要的位置,公司支援比較大,同時團隊士氣特別高漲,因此大家工作也都比較辛苦,都非常拼。
公司內部是從什麼時候決定要把 DuerOS 從一個系統打造成開放平臺?
這個倒不是某個時候的決定,更多是公司與團隊對度秘業務整體發展規劃、行業發展趨勢和使用者訴求幾個方面綜合考慮想法的逐步推進。
從開放的角度來講,前年的時候我們就把一些對話式 AI 的能力放到硬體上去。大規模付諸行動是在 16 年的 11 月份,那個時候第一個合作伙伴是國安廣視,它是一家在電視機頂盒領域很有名的公司,也是好幾個大的衛視的股東。那時起,我們開始系統化地把我們的努力付諸到硬體上去。
第二個重要的合作是去年 CES 和小魚在家的新產品釋出,也是我們第一次對外公佈 DuerOS 這樣的一個平臺。從這兩個合作之後,我們再回到國內後發現這是一個巨大的市場,使用者有很多的痛點,合作伙伴也有很多痛點,同時百度有很多優勢,DuerOS 是一個很好的、能夠滿足多方需求的一個平臺。
從一個系統變成一個開放平臺,你覺得最大的挑戰在哪裡?
我個人覺得,開放平臺是一個生態,生態裡往往有許多種角色,比如說:有硬體合作伙伴、晶片方面的角色、系統整合方的方案商、開發者、內容方面,還有我們自己的角色。
因此在這裡面,我認為最大的挑戰是你要理解這個生態裡每個角色的訴求,包括他們擅長的點,他們希望從合作裡面得到什麼,這個是做平臺的最大的一個挑戰。
原來做一款產品很容易:瞭解你自己的能力+瞭解使用者,將這兩個結合在一起做一個 App 就能做出比較好的效果。但是,真正做一個生態,尤其是在 AI 時代裡,許多(案例)是軟硬結合的。AI 時代的企業所需要的能力,全面性要求特別高,需要懂硬體、軟體、使用者、產品、商業,甚至還要和之後的內容服務商合作。所以整個產業的複雜度是巨大的。
你在定義 DuerOS 的時候,經常將它定義為 AI 時代的安卓,那麼如何理解這兩者之間的聯絡,在 AI 時代的開放平臺是否也具備了一些(移動時代所沒有的)特質?
我認為雖然每個時代的開放平臺都有一些不一樣的地方,但是同時也有一些核心本質是不變的。
本質不變的是如果一個開放平臺要真正成功,它必須有自己的生態,而不是依附於其他人的生態。沒有生態,再怎麼貼標籤也不是真正的開放平臺系統。
你可以看到在移動時代,兩個很成功的作業系統:安卓和 iOS。當然,Windows Phone 我們也把它定義成作業系統,但是他沒有自己的生態。生態沒成功,系統就沒有成功。從這個角度來講,為什麼我們希望定義成 AI 時代的安卓?因為在移動時代,安卓是比較成功的,它基本上支撐了中國大量企業的創新。沒有安卓的底層支撐,許多企業會耗費巨大的人力財力,可能也不一定能進步到今天這樣的位置。因此我覺得安卓在中國真的是發揮了非常非常關鍵的一個平臺作用。
我們也希望在這個時代,在智慧語音互動的時代,DuerOS 也能成為對整個社會、整個產業的這樣一個支撐作用,這是我們心裡更大的期望。我們把一些基礎做好,然後讓很多的合作公司和合作夥伴,不用重複建設基礎工作,更多時間花在產品、使用者和應用場景上,進而有機會引領世界的創新,這個是我們想做成 AI 時代 Android 的原因,也是我們為什麼做這個比喻。

在 AI 的這場大戰裡,AI 能力體現在全棧上。但是我後來發現說一個公司真的很難把全棧都理解並做好。

你如何評價現階段的語音互動系統?DuerOS 是如何將互動能力體現在實際的應用上?

說實話,我覺得使用者體驗都不到位,包括現在(Amazon)Echo 在做的,主要就是一問一答,這只是在進入新型人機互動的初期,為了控制使用者預期才做了這樣的互動,並不是使用者想要的一個自然的互動。
我認為,還有很多產品創新值得去推動,去探索邊界。不只是百度,產學研都是要做。所以我們在百度世界大會上宣佈了人工智慧互動設計院,它的使命就是要不斷地探索這個邊界,是在技術可以允許的情況下,怎麼能讓一個裝置互動的更好。
我們最近做了很多嘗試,也有很多收穫。比如,過去的一問一答模式裡,每天早晨你問一個天氣它就返回答案。我們最近做了一些新的嘗試,智慧音響回覆了天氣資訊之後,系統會接著問使用者是不是想聽機器之心最新的更新,要不要聽一下?聽,確定,新的內容就出來了。這樣就自然引導使用者獲得更多優質的內容。這就是更自然地互動,一次喚醒,同時又把新的對使用者有幫助的內容要推進,這樣整個人機互動的方式就有創新。
我們希望和一些合作伙伴聯手能夠把產品互動的邊界不斷地往前探索,讓每一個使用者覺得這些擁有智慧語音能力的裝置是好用的,是自然的。
百度 DuerOS 平臺一直在強調降低門檻,你認為降低門檻的意義是什麼?
在 AI 的這場大戰裡,AI 能力體現在全棧上。但是我後來發現說一個公司真的很難把全棧都理解並做好。這裡不僅需要很多行業的知識,不僅是硬體的水很深,需要很長時間的積累,而且從雲端能力儲備上,也需要很長時間的儲備。我們發現,大家都想軟硬結合,這種門檻挺高的,對百度都已經算高了,我覺得對很多公司也會很高。所以降低門檻很重要。
回溯最初的安卓時代,那時候也有一些其他的手機作業系統。當時如果開發一個手機,每個廠商的投入是非常高的。但是安卓的系統出來之後就不一樣。每個公司研發手機的代價可能以指數往下降,整個迭代速度變得特別快。
有的手機公司一年開幾十場釋出會,發幾十個手機,這樣的創新速度太快了,而創新速度快的原因,根本還是因為門檻降得很低,品牌就會把很多精力放在使用者體驗和品牌效應上。所以我們也認為,一定要把語音互動的技術門檻需要降下來,這樣才能讓更多的合作伙伴受益,進而關注點更加放在使用者和使用場景上。
能不能舉一些百度切實地降低門檻的例子?
比如,去年 7 月 5 號是百度第一次人工智慧開發者大會,我們公佈了智慧裝置開放平臺,併發布了幾個開發套件:個人開發套件、輕量版、標準版本開發套件。包括你看我們那個灰色的音響,從來沒有開售,那個是我們的參考設計。參考設計裡面所有的東西,包括剛才說的這些模組和套件,都是告訴我們的合作伙伴怎麼去把這些能力放到他們的產品裡面,怎麼能迅速創造一個智慧語音裝置。我們現在有一些個人開發者,利用我們現在的套件直接可以開發出一套自己的智慧語音裝置,這樣的門檻已經很低了。

打造一款硬體,尤其是很創新的硬體,不是複製別人的硬體,基本上至少 12 到 18 個月,這是至少的。渡鴉從加入百度,從構想這個硬體到做這個硬體,這前後只花了基本上幾個月的時間。

去年百度收購了渡鴉和 Kitt.ai,當一個新的創業公司加入到百度之後,有沒有磨合上的問題,如何去解決這些問題?他們的技術優勢和百度自身的系統在做結合的時候,有沒有一些難點是需要去克服的?

肯定有磨合的問題。即使是同一個公司兩個團隊之間合作也存在磨合的問題,那被收購公司和收購公司之間肯定也存在這樣的問題。
但是,百度和渡鴉的合作真的是磨合的非常好。為什麼?從結果來看,打造一款硬體,尤其是很創新的硬體,不是複製別人的硬體,基本上至少 12 到 18 個月,這是至少的。渡鴉從加入百度,從構想這個硬體到做這個硬體,這前後只花了基本上幾個月的時間,這個產品就已經做到量產。而且他不只做了全新的硬體,並且還搭載了 DuerOS 最新的 2.0 的系統,相當於軟體為他配合定製了整個設計。
其實軟硬之間需要很強的磨合,渡鴉的團隊也是相對比較獨立的運營。創始人呂騁 Jesse 也有很多創新的產品的思路,我們更多從平臺角度來對他進行很多的支援。渡鴉的創始人有自己的特色,DuerOS 其他的合作伙伴的創始人也都有自己的特色和個性,這就需要我們成為一種比較包容的平臺,我們希望支援他們的產品有個性,並且能夠打中相應的使用者人群。
這種收購還會繼續嗎?在度秘事業部裡,投資併購和業務發展的關係是什麼樣的?
我覺得投資併購是業務發展的一種手段,需要結合一些場景下看是不是要利用這類手段,合適的就會繼續做。我們也沒有一個 target,例如今年要特意要做到什麼樣,它就是一種手段。無論是 Kitt.ai 還是渡鴉的時候,都是幫百度 DuerOS 平臺迅速的成熟,迅速的能夠支援我們的更多的合作伙伴的一種手段。Kitt 相當於是從技術角度來講讓平臺更豐富和成熟。包括渡鴉,從軟硬結合標杆的角度來講讓平臺更成熟,且引領行業的發展,推動平臺再往前走。

在人工智慧時代,中國是在某一些領域甚至有機會再趕超美國。所以我覺得這無論是對百度還是中國的產業都是一個很好機會。我們其實很有幸站在這樣一個世界的舞臺上。

去年 DuesOS 收穫了許多合作伙伴,其中你覺得令你印象最深刻的、最典型的合作案例是哪些?
第一個比較有代表性的就是國安廣視。
國安廣視是一個非常好的合作伙伴,我們的合作一直特別融洽,它的母公司是中信國安,是江蘇衛視的第二大股東,河北衛視的第二大股東,也參與了很多地方衛視,是一個又有廣電背景、又有 OTT 的這種網際網路基因的一家企業。
我們今天看電視,可能年輕人看的不是很多,但使用者數量還是巨大的,每年中國電視銷售量大概 4000-5000 多萬,智慧電視盒子也是幾千萬的銷售量。現在人在看電視的過程中,和電視互動特別難,這限制了使用者在電視上內容的獲取。國安廣視合作有很多行業的知識,他們也知道使用者的痛點。例如在家裡看電視的使用者很多是老人和小孩。他們在使用電視的時候,為什麼不用電視去獲取更多資訊服務?是因為互動太難。所以國安廣視迫切的希望能找到一種更簡單的互動方式,透過整個智慧語音互動可以讓使用者體驗更上一層樓,我們的合作也就一拍即合。
傳統產業在整個升級的過程中,需要很多的 AI 技術支撐,這些 AI 技術是他們原來不擅長的。同時這些技術很多時候又不是單一的技術,不是一個僅僅語音識別的技術,它是一個全面語音識別、語義理解、資訊服務加在一塊的綜合性解決方案。傳統產業有落地場景,也有強需求。AI 時代的落地就是找場景,這場景有痛點,有需求,再疊加 AI 能力,可能就會讓整個 AI 爆發。在當時,這次合作對我們而言是很重要的一個訊號:和傳統產業結合,和軟硬體系統結合,賦能更多的硬體會是很大的一個機會。
第二個印象深刻的就是和小魚在家的合作。小魚在家是一家創新型的科技創業公司,他們的產品口碑很好,特別能滿足一些使用者的剛需。比如當你結婚之後家裡有老人和小朋友,與他們的家庭影片通訊就是一個很剛性的需求。無論是 PC 時代還是移動時代,通訊一直是人類很重要的一個需求。但是,我覺得家和車這兩個場景的通訊還沒有完全解決好。小魚在家從家庭的通訊角度出發,再疊加上 AI 的能力,是能夠找到突破口的。
同時,它又是引領世界的,你可以看到說它的產品大概在兩年前就已經發布了,甚至三年前。現在我們來看,它這種型別的產品,國外也有一些,比如說 Echo Show,Echo Spot。今天我看新聞說 Google 又釋出了三款帶屏的音響合作伙伴,但是如果我們退一步講,退到三年前,沒人想到說為什麼裝置上需要做這麼多感測器,做這麼多攝像頭攝像頭、麥克風、螢幕。從今天來看,這款產品就是比較合適的。說不定我再過兩天看,這個就是未來的產品形態。所以它也給我們很多的啟發。
透過 AI 能力的賦能我們可以做很多引領世界的創新,DuerOS 平臺不止可以在 AI 時代做中國領先的一個品牌,也可以做世界的領先的開放平臺。這就是為什麼在 CES,我們第一次搭建一個這樣大的展臺,同時也把很多合作伙伴的產品拿來,是讓世界看到說,基於我們的能力我們能打造出世界級別的產品,讓世界瞭解中國在 AI 時代的創新速度,是和美國並駕齊驅的。
在人工智慧時代,中國是在某些領域甚至有機會再趕超美國。所以我覺得這無論是對百度還是對中國的產業都是一個很好機會,我們其實很有幸站在這樣一個世界的舞臺上。
在挑選合作伙伴的問題上,有沒有自己的一些標準?
第一個從安卓的角度來講,安卓不挑合作伙伴且開放給每個人使用,我們也是。無論合作伙伴是大是小,甚至是個人開發者,我們都對他們開放。像我們最近跟個人開發者都接觸很多,很多新的創意都是從個人開發者手上誕生,他們會有很多特別超前的想法。進而這些從底至上的創新會慢慢被企業接受,創新都是有一種自下而上的驅動力。所以從我們的角度來講,服務各種各樣的合作伙伴,都會給我們平臺帶來不同的訊號,帶來不同的收穫。針對個人開發者,我們去年去了幾次深圳、北京、成都辦了幾次開發者大會,有很多個人開發者在裡面給我們很多新的一些輸入。

從我們平臺來講,我們會扶持很多個人開發者,中小企業到大型企業,支援他們去開發新的產品。有些品類產品是屬於定義性產品,需要定義顛覆式優秀產品互動,然後才能夠推動這個行業的往前走。另外還有些品類的產品,不只要求定義,還要求必須要有量。只有又叫好又叫座的時候才能推動整個產業往前走。所以在這個時候,我們也會相對投入更大的力量去推動這種型別產品,像 Echo 為什麼給美國市場帶來這麼大的影響,也是因為他又叫好又叫座。
DuerOS 從去年的下半年,尤其在年末,高頻地釋出了有關戰略合作的訊息,包括和高通驍龍以及華為的合作。DuerOS 在選擇這樣的戰略合作的時候,會優先選擇考慮什麼樣的合作伙伴?
如果想改變使用者對語音的互動的認知,一種是不停的營銷教育市場,告訴使用者這種產品的好處;一種是潛移默化地讓使用者知道產品裡都有已經具備更強的 AI 能力。所以與高通這樣的合作,是我們看到了產業鏈的上游的機會。產業鏈上游就是晶片,晶片可以發揮極大的的作用,而同時晶片也都在找新的增長點「AI 晶片」。AI 晶片目前應用有兩個主要方向,一個方向是視覺,一個方向是語音。如果未來所有晶片出場是都預設具備了語音對話能力,那麼使用者總有一個機會能和智慧裝置對話。智慧裝置越多,將來培養使用者使用習慣的速度就越快。這是為什麼我們希望和高通綁在一起來做這樣的事情。

我覺得目前研究機構投入的熱情不夠的一個重要原因是因為資料不夠。

10 月份的時候機器之能在矽谷參加了 DuerOS 普羅米修斯計劃的釋出會,能講講這個計劃當時產生的原因,以及對整個平臺開放的意義是什麼?
我認為智慧語音互動這個市場需要大家的教育。尤其看在中國科技市場發展的歷史,很多產品都是一窩蜂地火起來。如果沒有快的,滴滴的成功不會像今天這麼快,可能還得需要兩三年時間。因為當時補貼大戰很大程度刺激了使用者接受這種新服務其實我覺得智慧語音互動也需要更多的市場教育。所以我們也一直在想還有什麼方法能夠幫助教育這個市場,同時也讓 DuerOS 持續引領這個創新。
從產業角度推動使用者認知的提升,我們已經在做並保持領先。同時我們覺得從學術和研究角度也是同樣重要的教育市場的切入口。我們在智慧語音對話方面需要更多專業人才,需要更多的研究機構,我們要讓研究機構有更多的人更有熱情地投入到這個產業。
我覺得目前研究機構投入的熱情不夠的一個重要原因是因為資料不夠。為什麼做影像識別大家更容易參與?資料集在那兒,大家都願意參與。但是智慧語音互動的感覺就是一些巨頭在玩兒,很多資料都是封閉的。之前中國的語音廠商也是,什麼也不給。但是我覺得這個時候就不對,應該更開放。普羅米修斯就是希望能透過我們的努力,我們去錄製更多的語料,能開放給學術界去推動學術界參與到進來。同時學術界也能培養更多的學生,將來為整個產業貢獻更多的人才。

不只是普羅米修斯,在同期我們還宣佈了百度人工智慧互動設計院,那是從互動的前沿去探索。我不希望說只是做硬體的創新,我覺得從軟體角度上互動層面上也有很多需要有很多創新。我不希望大家在互動上停留在亞馬遜定義的互動就是最好的互動。我覺得遠遠不是,在語音互動上來講,現在所有人大家都處在起跑線上,真正好的自然互動應該像我們人類平時溝通一樣自然。我覺得從這個角度來講,人工智慧互動的創新也需要有特別的研究機構來做,誰來做?百度推動來做,做人工智慧互動設計院。
之前我們人工智慧互動設計院釋出了一個報告,關於智慧音響什麼樣的反饋速度是最好的?使用者跟音響互動多快是好的?原來我們做搜尋引擎的時候,會覺得越快越好,最好是響應速度快的不眨眼。搜尋是一個基於資料統計來迭代的一個產品,唯一一個能提升全面指標的就是速度。只要速度快了,使用者也多,點選也漲,PV 也漲,什麼都漲。許多人會想當然,覺得語音互動這樣產品也應該越快越好。後來經過我們的調研,不是這樣的,這樣的語音互動裝置的時候,如果回覆太快反而使用者會覺得搶話。我們人類說話是需要一個思考的時間,比如說像我們的互動,可能都有幾百毫秒的延時,這是我們舒服的。如果返回太快了反而不舒服,所以我們希望研究在這個時候多快是好。
還有一點,比如智慧音響返回速度如果控制在一秒鐘,我需要投入 10 個人力。而做到 800 毫秒,我可能投入 50 個人力,因為永遠最後的一公里是最難走的。但是最後的一公里的提升究竟使用者有多大的感知,這不知道,這就需要衡量。有可能投入 50 個人,使用者感知很弱。所以我覺得這些都需要有些人去探索這個產業的前沿,我們也願意花時間,我不覺得其他公司有足夠的想象力和領先程度去做這樣事情。
你認為在語音互動在什麼階段會出現一個壟斷性的行業領導者或者系統?
我還覺得還早著呢,因為現在還屬於一個市場的早期和教育期。
DuerOS 升級非常快。
DuerOS 3.0 我們已經構想的差不多了。
3.0 什麼時候會亮相?
今年百度的開發者大會吧。我們已經規劃好了。
版本快速迭代背後的驅動力是什麼?
我覺得兩方面,一種方面就是自己給自己壓力。(笑)大家工作都挺努力的,就是真的希望說這個平臺迅速的往前走,能夠從體驗持續地提升。
第二個角度,我們合作伙伴的需求特別多。當你是一個平臺之後,你的前進也是合作伙伴是推著你往前走,每天合作伙伴都會提出要求:我要上這個功能,我這產品要這個時候發,我的硬體有周期的,要趕雙 11,你要搭配著往前走,他們都推著我們走。
DuerOS 3.0,有什麼是讓我們的讀者期待的?
會更加強大,更加豐富,更多的就不能說了。

從百度優勢來講,理解力是我們的特色,在理解和處理資訊的能力更強。同時連結更廣泛且優質的資訊內容也是百度一直以來的優勢。

同樣是開放平臺給第三方,百度和谷歌、亞馬遜的做法你覺得有什麼樣的區別?
我覺得有時候谷歌和亞馬遜在跟合作伙伴競爭,不完全是一個平臺的做法。如果看安卓平臺初期,一開始不是谷歌自己做手機,是跟 HTC 先合作做這一款,又跟三星做了很多合作手機。那如果現在看谷歌和亞馬遜,他們每次音響的降價(尤其在黑色星期五),都對其他的音響合作伙伴是致命的打擊,別人都沒有辦法再進入這個市場。所以你這種又做平臺,又做跟合作伙伴去競爭,這會讓很多合作伙伴心裡很忐忑。
如果我是合作伙伴,心裡會打一個問號。至少是現在已經看到音響每次黑色星期五音響的降價,對其他的音響都是以致命的打擊。現在的美國市場就只有他們了,別人都不玩兒了。我覺得從這個角度來講百度的策略是不一樣的。
去年國內也有很多不同背景的公司在推進自己的開放平臺,你認為短期內這樣的態勢會帶來什麼樣的價值?
在行業初期肯定會有很多人跟進,這是挺好的一件事情,他們不跟進,反而我會比較擔心,人家會說這麼大的市場怎麼就你一個人看到了,別人沒看到。
長期來講,最終平臺肯定都會收斂,比如手機最多也就是兩個平臺現在。
智慧語音互動無論是語音助手還是音響也好,會擁有很多功能,解決很多問題,百度在解決這些問題上會不會有側重?比如小米音響和阿里的天貓精靈的定位可能偏向物聯網和智慧家居控制,百度會在哪些方面比較側重?
我們也接入了很多智慧家居平臺和產品,擁有像飛利浦,Broadlink,Life Smart,塗鴉智慧等知名的智慧家居合作伙伴。
從我們的音響來講,綜合能力是很強。從百度優勢來講,理解力是我們的特色。基於百度大腦強大的能力和知識圖譜資料,DuerOS 在理解和處理資訊方面的能力更強。同時我們的資訊與服務方面有很深厚的儲備,搜尋一直就在連結非常廣的內容,這些都是我們的優勢。

我當時對階段性的成功做了兩個比喻,一個成功的標誌是我希望青島的二叔開始用語音跟他家裡的裝置對話;第二個成功的標誌,我希望北京在街邊上開始出現關於 DuerOS平臺開發技能(Skill)的培訓班。

在智慧語音互動當中,你覺得最重要的三個應用場景是什麼?
說大一點就是,家、車和在路上的場景,都是雙手被束縛或者佔用的場景。
縮小一點呢?
例如電視,本來的互動很費勁,有語音之後就變得很近。比如像智慧玩具,用語言互動對小朋友是最自然的互動了。智慧音響就不用說了,已經逐漸變得普及。車被網際網路化是一個很重要的趨勢,語音互動也是車裡面很重要的一個剛需。我其實能看到它的應用場景還挺廣的,甚至包括手機。你可以看到今天的手機如果不打人工智慧標籤都是有點過時了。人工智慧標籤的手機中影像和聲音相關的計算能力更強了,而我們也觀察到手機上的語音互動也在變得越來越頻繁,使用者接受度在逐漸提升中。
如何評價中國現在的智慧語音互動市場?
我覺得還屬於初期。有的時候問一問一個不做 IT 這一行業的,他都不知道什麼是智慧音響,不知道解決什麼樣的痛點。
想象一下什麼時候 DuerOS 是成功的,我對階段性的成功做了兩個比喻,一個成功的標誌是我希望青島的二叔開始用語音跟他家裡的裝置對話,這是我覺得一個初期成功的標誌。細緻的解釋就是,我青島的二叔是不懂 IT 的,他作為一個在二線城市不懂 IT 的使用者開始用語音開始跟他家裡的裝置進行互動,說明這類產品的影響力已經覆蓋到足夠大了。這是某種成功的標誌。
第二個成功的標誌,我希望北京在街邊上開始出現關於 DuerOS 平臺開發技能(Skill)的培訓班。這說明系統化的有人開始學習這種對話式互動型別的技能開發,側面代表了智慧語音互動生態的初期成功。這兩個對我來講是一個小夢想,希望在某個階段就能實現。
Apollo 已經開始和 Udacity 聯合推出課程了,DuerOS 有這方面的想法嗎?
肯定也有。其實我們已經在開類似的這樣的(培訓),我們的喚醒之旅已經走過深圳、北京和成都。每次我們組織這樣的課程都是爆滿的,雖然與會者我們都會事先邀請,但是經常 200 人的場地來了 400 人,場場爆滿。
但是我當然希望未來這些培訓班是自發的,不是我們組織的。我也希望其他人看到這樣的機會能自發組織這樣的活動。

去年焦慮的是怕一年之後只有自己在玩,這個新機會需要非常大的資源投入來教育市場。不止需要百度,最好也有其他公司一起參與一起教育市場。現在的焦慮在於說怎麼能夠把這個市場教育時間縮短,讓使用者更快接受這種新興互動體驗。

DuerOS 過去一年的發展是非常迅猛的,你有總結過這種階段性成績的原因嗎?

我覺得就是把自己的定位想清楚,這個很重要。你究竟是做一款產品,還是你去做一個平臺,你做封閉還是做開放,這個對很多工作會有巨大的影響,同時對路徑上也會有很大的影響。DuerOS 第一天就希望做一個開放的平臺,所以你可以看到我們整個走的路都是一個很開放的路,我們推出 First party 硬體,也是在我們基本上開放的基礎之上,我們沒有選擇和合作夥伴競爭。由於這樣的平臺設定也就決定了我很多的步伐都是按照這個設定來做的,很多今天的成績也是由於當時做了這樣的決定。
去年一年最讓你焦慮的是什麼?
焦慮的是怕一年之後只有自己在玩,這是我特別特別焦慮的。最害怕的是你被冷落,你做一個事情只有你自己做,因為需要巨大的資源來教育市場。那種孤獨是,你自己心裡都會打鼓,自己是不是做早,是不是時間點不對。最好有更多的公司一起參與進來。
現在反過來看呢?
現在感覺踩著點對啊!現在的焦慮在於說怎麼能夠把這個市場教育時間縮短,讓使用者更快接受這種新型互動體驗,這樣的新型智慧裝置。
你希望這個教育市場完成的時間點在哪兒?
我希望 18 年要把這個工作做好。我希望在 2018 年送給我青島二叔一個音響,他能天天用,而且覺得這個東西好,並且他願意再買一個送給其他人(笑)。
個人是更偏向技術型的還是產品型的?
我加入微軟的時候是程式設計師。我在微軟做了八年,都是研發這條線。到百度的第一天開始,我就開始做產品方面的工作。我覺得要把一個技術利用好的話,首先應該要把產品想對了。
陸奇說你是最好的產品經理之一,你認為一個優秀的產品經理是什麼樣的?
首先不敢當。不過我確實非常享受做產品的過程。
從我自己做產品的角度來講,我會一直保持如履薄冰的感覺,我自己在公司內部 IM 軟體的個人簽名叫創造性張力。這個概念是來自一本書裡,它形容了美好夢想和殘酷現實之間的張力。這個張力會每天繃著你往前走,讓你不舒服,但同時這種張力也會迫使你產生很多意想不到的創新能量。所以有時候都會有一種極度的焦慮和自我壓力,迫使自己不斷地審視我們自己的產品,是不是還有哪些做的不到位的,哪裡可以做的更好。這種張力下會有很多好的產品想法產生。
這種焦慮是你個人的因素還是這個產品本身的特徵帶來的?
我個人覺得所有創新業務都會是這樣的。不是我個人的。所有的創新業務,就是隻有一小部分人信,其他人不信,如果所有人都信他就不是創新,大家就覺得你就做的就是一個普通的工作。而對創新業務,我的感覺可能都是在這種狀態。

這樣的互動的改變,說實話在科技歷史上都沒有幾次,前面也就兩次,滑鼠鍵盤和觸屏互動,當語音對話成為一個主流的或者成為一個非常重要的互動方式之後,你有很多的商業化的機會。

過去這一年,對智慧語音互動市場有沒有新的認識?

第一個,中國市場還是能被開啟的。隨著使用者教育,很多使用者對這個產品是接受,雖然中國市場的總量不是那麼多,但是粘性非常好,使用者願意用。所以這個是一年之後比較欣慰的。
第二個,能找到剛需場景,有的時候技術還沒有準備好的時候,但是場景控制好。還是能找到剛需。電視上是很清楚的剛需場景。
當然也有在平臺上一些新的認知。18 年我們應該做什麼?哪些方面做的可以做的更好?細節我不方便分享,但這些都是一些新的收穫。
新的想法是自己的認識還是有一些人或者事情對你產生的影響?
我覺得可能都有,不只是對我的影響,我覺得我們整個團隊在過去一年都有很多的提升。而且是認知上的提升。就是在面對一個新的市場的時候,誰有最好的判斷再加上最好的執行力,誰就能贏。我認為我們這個團隊在這個領域有著最好的認知和執行力。因為作為最領先和活躍的開放平臺,我們接受到的訊號最多,當你有最多訊號的時候,做決定的時候也會更堅決。
DuerOS 在短期內很難盈利,這個事情會對你產生困擾嗎?
完全不會。這樣的互動的改變,說實話在科技歷史上都沒有幾次,前面也就兩次,滑鼠鍵盤和觸屏互動,當語音對話成為一個主流的或者成為一個非常重要的互動方式之後,你有很多的商業化的機會,因為這是資訊和服務很重要的一個入口。這種時候你還擔心什麼商業化嗎?我根本不擔心。
你認為 2018 年相比於 2017 年,中國的智慧語音互動市場會發生什麼樣的變化?
我覺得會更活躍,會看到更多的有意思的產品會出現,並且出現的節奏會更快。包括我們與合作伙伴仍在研發的產品,目前在執行中的已經非常多了,而且都會有很多創新。所以我覺得 2018 年會是非常精彩的一年。

教育市場+瞄準剛需,這是景鯤和百度DuerOS在2017年交出的成績單| 人物對話

相關文章