柯潔與AlphaGo的比賽受到了所有AI創業公司和投資者的關注。那到底什麼樣的AI創業公司才能受到投資者的青睞?
MMCVentures是英國著名的專注於技術領域投資的機構,其投資和研究院總監David Kelnar介紹了他們對初創企業進行判斷的17個要素,涉及價值創造的潛力、實現價值的能力、對競爭的防禦力三個決定性問題。(此評判標準主要是針對專注於“應用”的機器學習公司,不適合通用的解決方案公司。)
今天星河研究院將為我們帶來「創業課堂」第一講。以下,將以這三個決定性問題為主線,進行逐一介紹。
這一問題MMC Ventures考慮六方面的因素。
1、價值釋放
我們通過以下為客戶創造收入的能力來判斷企業的價值釋放:
- 提高驅動收入的因素的增量,如轉化率、收益率、吞吐量、價格等;
- 降低流失率——提供更多的個性化、更好的客戶服務、更少的客戶摩擦或提高品牌忠誠度;
- 創造新收入來源——識別新客戶、增加向上行銷或交叉行銷的機會、創造新的市場機會。
我們還通過以下為客戶降低成本的能力來判斷企業的價值釋放:
- 減少多餘的花費、超額的資源或核心資源的需求——提高預測效率、流程效率或過程自動化;
- 減少經濟損漏——如增強合規性。
2、具有顛覆性
機器學習主導的企業如何簡化現有使用者流程(優化範圍),吸引新類別使用者使用服務(顛覆性)?例如AI助理。根據PayScale的資料,人類助理的薪水已達到2.5萬英鎊/年,雖然AI助手只能替代一定人員的一小部分工作,但對於許多中小企業來說可以減少很多費用。助理只是一個小領域的顛覆,但可能通過規模化產生很大效果。
3、替代品稀少
現在,機器學習成為了很多人力資源的替代品,被替代的這些人力資源,他們越是稀缺、昂貴,機器學習就越有價值。
我們看到,在英國,機器學習初創企業最集中的領域恰恰是人力薪資最高的三個行業——金融、IT和公用事業。
4、機器學習的適用性
機器學習非常適用於艱鉅、複雜和深不可測的任務:
- 艱鉅的問題:在人類的能力範圍內、可以通過程式設計來解決,但需要花費難以想象的時間和精力;
- 複雜的問題:在人類的能力範圍內,但無法通過很有效的程式設計來解決的。例如人類可以通過人類的規則判斷出一輛汽車的照片,但很難通過程式設計來有效的制定識別的規則;
- 深不可測的問題:超出人類能力範圍的問題。在這些領域,人類無法組織資料來進行判斷或預測,但利用神經網路的深度學習方法,就可以解決此類問題。
機器學習不太適合無限問題和因果推理問題,因為:
- 機器學習離開了資料幾乎無法使用;
- 機器學習主要是描述資料的相關性,而不是因果關係。
5、達到一定效能的路徑
從實踐的角度來看,機器學習並不需要做到100%,只需要提供接近人類或比人類稍好的效能水平即可。更重要的是,我們要依據現有的條件來判斷是否有一條達到這樣效能的路徑。
例如美國94%的交通事故是人為失誤,自動駕駛汽車不需要100%的安全,只需提供相當或稍優於這一安全率即可。
6、合適的資料
機器學習需要合適的資料進行訓練和部署,我們將資料操作分為兩個階段,並以此衡量資料的實用性:
- 選擇:資料的可獲得性、資料的現有差距和可複製性、資料標籤質量和資料偏差性;
- 處理:資料碎片、資料清洗要求,資料取樣,資料轉換的需求、分解和聚合。
我們還需要衡量資料的保留價值。如果歷史資料來對改進迭代演算法有用,則擁有保留價值。例如反欺詐公司,它們的客戶歷史資料可以有效的來測試演算法的準確性是否得到改善。
如果一個企業有潛力創造價值,那麼如何實現這個價值?根據我們的經驗,價值實現需要判斷五個因素。
1、創業團隊的商業心態
機器學習為主的初創企業中,許多創始人都擁有精湛的技術,但商業智慧將會在其業務的長期發展中發揮巨大的作用。大多數B2B軟體公司遲早要建立銷售團隊,如果不這樣業務是不會自動擴大的。因此,具有商業心態的創始人會有很強的建立銷售團隊的能力、快速進入市場的迫切需求以及建立一個大企業的野心。
2、可量化的投入產出
在B2B市場,具有可量化投入產出的解決方案通常可以獲得更多的使用、更短的銷售週期和很少的使用者教育成本。在銷售和營銷方面,也可以輕鬆評估銷售轉化率的改善。在英國,大多數初創企業都將重點放在具有可證明投入產出的領域:
- 20%的英國機器學習初創企業都在服務市場營銷和廣告領域;
- 金融行業是使用機器學習最活躍的領域。
3、客戶準備程度
客戶對一個產品或服務的準備程度通常會按照一個漏斗來評估:意識、瞭解、喜愛、被說服和購買。那麼對於一個機器學習的產品或服務:
- 我們將準備程度新增到漏斗中作為一個階段。一個客戶是否準備好使用機器學習產品,要看兩個方面,一是客戶是否擁有合適的、可訪問的資料集用於機器學習軟體進行訓練和部署,二客戶是否能通過機器學習解決方案來優化或顛覆現有的流程;
- 如果客戶達到了“喜愛”這個階段,我們主要考慮的是信任和控制。信任是對機器學習的信心,例如自動操作和機器學習主導的醫療診斷。另外,即使在信任度很高的情況下,人們也希望參與解決方案。因此,如果維持高人力控制,那麼價值實現和服務的可擴充套件性都會受到影響。
4、是否符合監管
對於深度學習,Nuance的Nils Lenke曾經說過“它就像一個很盒子,你不知道里面發生了什麼,它並不會告訴你它是如何得到結果的”。這就帶來了監管的問題。
據報導,歐盟將在2018年將對“通用資料保護條例”立法,使用者可以要求對一個演算法作出解釋。不僅如此,美國白宮也釋出了“Preparing for the Future ofAI”的報告,裡面也提到“研究人員必須瞭解系統,以便它們得出決策結果的過程透明且能被人們解釋。”
在一些B2B行業,例如銷售、市場,演算法的透明度不是問題,但在其他方面,例如金融科技,可能對於演算法的解釋就比較困難。因此,我們需要仔細評估,這些機器學習初創企業可能面臨的監管阻力的程度,以及他們打算如何回應。
5、部署可擴充套件性
部署困難會限制機器學習公司擴張的步伐。例如:
資料整合要求高,但這些資料集多在一個個孤島裡,可能會花費很長時間;對資源的需求大,限制了獲客速度和利潤。我們跟很多機器學習的公司溝通過,大多數的企業有1/3的員工都是部署人員。
機器學習公司要儘量減少部署的要求,或自動化資料收集、資料統一和部署,這樣會擴張的快一些。
機器學習初創企業如何有效的保證自己創造的價值不被競爭對手搶走?這裡有六個要素。
1、與巨頭的距離
谷歌、亞馬遜、IBM和微軟都提供基於雲的機器學習服務,包括通用的計算機視覺、語音和文書處理等,而且這些服務的能力和範圍將不斷增加。離這些行業巨頭核心領域越遠,初創企業就將擁有更大的防禦能力。
這一距離主要既體現在垂直領域,也體現在通用領域。垂直領域基本集中在醫療健康(谷歌、微軟和IBM)和交通(谷歌),因此早期的機器學習初創企業最好避開這些領域,通用領域則包括計算機視覺、語音和文書處理等。
2、所選領域的複雜性
如果一個企業可選擇的領域是動態複雜的,那麼“護城河”就會很寬很深。
複雜的領域特點:需要廣泛的行業專長,對合規敏感,具有特別複雜的技術壁壘。
3、是否形成資料的網路效應
好的機器學習企業會通過其資料創造網路效應,形成持續發展的競爭優勢:為客戶提供好的保障,從客戶得到更多反饋和資料,用以改善機器學習產品,接下來為客戶提供更好地保障,繼續得到更多的資料……
但要注意的是,一家機器學習的企業只能訪問和應用而不是擁有資料。有些依靠自有資料的企業,在發展初期可能會將獲取資料作為第一位,免費提供軟體,因此收入將會減少,這也是投資人需要注意的。
4、是否擁有專有演算法
儘管在諸如TensorFlow等開源庫中有更好的演算法,但機器學習公司還是需要專有演算法。
在許多領域,包括自然語言處理,資料不足不再是瓶頸。在其他領域,演算法創新可以提高較小資料集的效能。因此一個專有演算法可以提供:更好的準確性、更廣泛的功能、更快的效能、更大的解釋力,以及可以從較小的資料集中訓練出結果。
5、機器學習人才
機器學習人才稀缺而昂貴,根據一項研究,在英國,2016年下半年普通資料科學家的招聘職位比上半年增長了32%,機器學習專家的薪資水平也是最高的。
很多機器學習專家都是從谷歌、亞馬遜、IBM和微軟出來的,初創企業不可能給他們提供同等的薪資水平。人才競爭激烈,初創企業必須表現出接受和留住高素質人員的能力。
6、強大的資本能力
在這個技術要求苛刻的領域,開發最小可行產品(MVP)所需的時間很長,銷售週期長,機器學習人才成本更高,廣泛部署需要資源,這些對資本有很大的需求。
好的機器學習初創公司會充分利用資本來增強競爭優勢。他們會利用自動化來更快的進行部署,利用資本來加快變現,用有競爭力的薪酬來吸引高質量的人才,並將獲客速度最大化。
未來十年,早期機器學習軟體公司都會具有改變企業生態和積累價值的巨大潛力,在英國300個早期機器學習軟體公司中,有些會成為未來行業的領導者。我們會通過這17個要素對他們進行評估和判斷,當然任何企業都不會在每一個要素上都強大,成功因素在相對重要性上有所不同。不過滿足越多的要素,越有成為行業領頭羊的可能。讓我們拭目以待。
自36kr