這位22歲華裔青年,用3年創造出矽谷最新AI獨角獸

dicksonjyl560101發表於2019-08-13
這位22歲華裔青年,用3年創造出矽谷最新AI獨角獸

Scale AI宣佈獲得1億美金C輪融資,公司估值超10億美金,成為矽谷新晉獨角獸。到底什麼業務這麼值錢?

撰文 | 太浪

編輯 | 宇多田

許多大型人工智慧企業們必須承認,在自己「實現智慧化與自動化」的承諾背後,都有著對 Scale AI 的強烈依賴。

Scale AI 是一家成立 3 年的初創企業,相比很多自稱人工智慧公司的理想化目標,這家公司的使命非常現實且簡單——

承認並利用機器學習與人類承包商以及演算法之間的親密聯絡。

Scale AI 開發了一款軟體,試圖用人機協作的方式做資料標記。在許多情況下,這款軟體能夠自動標記大多數物件(物體)。然後,再由人工審查。

如果人工需要干預,系統允許他們點選某處修改,比如,點選一輛汽車的中央;AI 系統還會為他們追蹤目標。過去需要幾個小時才能完成的任務,現在只需要幾分鐘。

Scale AI 在舊金山總部大約只有 100 名員工,但是,它卻構建了一個約有 3 萬名合同工的眾包網路,由這支遍佈世界各地的承包商隊伍負責影像標註工作。

Scale AI 會給承包商詳細的指示,告訴他們要查詢的內容。同時,Scale AI 還在開發軟體,確定最好的標籤。

為了確保承包商的工作質量,Scale AI 還會用 AI 進行審查和培訓承包商。Scale AI 建立了一些演算法,檢查承包商在做什麼,並根據演算法模型進行驗證,確定他們的完成情況是否合乎標準。

Scale AI 的創始人 Alexandr Wang 不願意透露這些合同工是從哪裡找來的,也沒有說他們的收入情況,但他堅稱「工資還不錯」。

「我們沒有試圖優化人力成本,」他強調,「他們因為這份工作所掙到的錢已經達到了他們所在地區工資的 60% 至 70%。」

目前,Waymo、OpenAI、Airbnb、Nuro 和 Lyft 等公司的世界領先的機器學習團隊都在使用 Scale AI 的這個平臺。

Scale AI 以按需或企業服務模式提供服務,並表示,其服務具有可擴充套件性。有媒體報導,單一客戶每年為其付費超過 100 萬美元。

除此以外,Scale AI 還正在尋求將產品銷售給任何一家開發人工智慧技術的公司:

Wang 在一篇文章中寫道,他們的系統以往任何時候都更能理解並驅動對大型語音、文字、影像和其他形式內容的決策。除了自動駕駛領域,他們也可以為電子商務與搜尋、繪圖、機器人技術、AR/VR、線下零售等領域的公司提供資料服務。

這家正在迅速壯大的公司在上週宣佈,已經完成由 Founders Fund(Peter Thiel 的,這個人你應該認識吧)牽頭的 1 億美元 C 輪融資,參與融資的還有知名創投 Accel、Coatue Management、Index Ventures、Spark Capital、Thrive Capital 以及 Instagram 創始人 Kevin Systrom 和 Quora 執行長 Adam d Angelo。

1 一個華裔青年的創業靈感

Scale AI 的創始人 Alexandr Wang 是一名華裔,在新墨西哥州長大,父母都是物理學家。十幾歲的時候,他就在程式設計競賽中表現出色,他還是高中生時就收到了科技公司的工作邀請。因此,他提前從 MIT 提前畢業,在矽谷工作。

2016 年,19 歲的 Wang 與朋友 Lucy Guo 共同成立了 Scale AI,旨在加速 AI 應用程式的開發。2018 年,他們就拿到了 1800 萬美元 B 輪融資,Index Ventures、Accel 和 Y Combinator 都參與了這輪投資。

事實上,Wang 最早萌發創業的想法是在九年級,他和朋友開了一個谷歌線上檔案,記錄下各式各樣的創業創意。

然而,在過去數年裡,他並沒有把創業作為自己唯一的目標,而是全力以赴尋求那些令人振奮、耗費精力以及稍縱即逝的機會。

「簡單而言,我根據決策理論和機器學習中遺憾值最小化這一重要概念行事。」他在文章中寫道。

Wang 在一篇文章中講述了自己的創業經歷:

當在麻省理工學院念大一的時候,他便四處面試,尋找計算機工程和機器學習方面的實習機會,接觸的公司包括 DeepMind、Snapchat Research、OpenDoor 等。

這些機會讓他非常興奮,但同時,也讓他感到無所適從甚至有點失落:

「我希望找到一份自己無法拒絕的工作,但總感覺無非換了一個科技公司打工。從高中開始我已經有了幾次在創業中期企業工作的經歷,因此在上述公司工作對我來說已經算不上成長機會。」

在與 OpenDoor 執行長 Eric Wu 談過心後,Wang 確信,應該創辦一個自己的公司。

「這不僅是一個巨大的成長機會,而且如果不抓住最好時機承擔風險投身創業,那麼將來肯定悔之晚矣。」

這成了他創辦 Scale AI 的起點。

2 有多少人工,才有多少智慧

Wang 相信,機器學習很可能是這個時代最重要的技術變革,它給世界帶來的總體效益將與網際網路相媲美。

在世界上最先進的組織開展 AI 工作後,他注意到,由於缺乏成熟的基礎設施,構建機器學習系統具有挑戰性。特別是,AI 進一步發展的關鍵瓶頸是資料——特別是標記資料集。

2009 年,史丹佛大學李飛飛教授的實驗室釋出 ImageNet 資料集,開啟了現代深度學習時代。大多數情況下,沒有標記的資料,就沒有 AI 演算法模型。

模型迭代和調整,則需要更多的資料。安全、準確和無偏見的 AI 系統依賴於大量高質量的訓練資料。

但獲取、標記和驗證訓練資料的過程是緩慢的、手工的、昂貴的。

以自動駕駛為例,為了讓汽車清楚知道它們周圍都有些什麼東西,首先,你需要先用車上的攝像頭採集周圍的資料;然後,由人工對這些資料進行標記。

一開始,工作人員會看到電腦螢幕上彈出一張圖片,然後用滑鼠畫出所有汽車的輪廓,並在軟體中對它們進行分類。接著,是建築物、停車位、行人、交通燈等等。

事實上,在單張照片中逐點瀏覽每一個物體,花費的時間是 10 分鐘到幾小時不等,而要處理的圖片有數百萬張。

隨後,這些資料才會被反饋到人工智慧系統,只有這樣做以後,汽車才能瞭解周圍世界的情況。

換句話說,每一輛自動駕駛汽車後面,都坐著成千上萬的人,他們的工作就是訓練電腦看東西。他們的觀察結果被反饋給人工智慧軟體,而軟體則只能隨著時間的推移學會如何做同樣的事情。

這從外面看是一層魔術布,而從內裡看則是一項又費力又費錢的苦差事。

要讓人工智慧系統達到人類的水平,需要數十億或數百億個案例。做自動駕駛的公司,每年僱人給他們從車上的攝像頭收集到的照片貼標籤,就要花費數百萬美元。

因此,能夠負擔得起所有培訓的少數幾家大公司和許多負擔不起培訓的大公司之間,也就存在了巨大的差距。

也就是說,高質量標籤資料的瓶頸限制了人工智慧僅能在少數資金充足的科技公司裡發揮作用。

「獲取標籤資料,是構建機器學習模型中最困難的部分。

而 Scale AI 正是構建了一個資料平臺,可以使這些公司能夠擁有構建 AI 系統所需的高質量的大型資料集。」Wang 認為。

3 競爭怎能不激烈

Scale AI 的新客戶包括馬斯克的 OpenAI和零售技術公司 Standard Cognition。

其中,Standard Cognition 正在開發一款軟體,目標是讓零售商的結賬流程全面自動化,定位有點類似於 Amazon Go。

這家公司在舊金山有一個試點商店和一個研究中心——在那裡,人們可以在視訊監控下挑選貨架上的物品。

「我們面臨的終極問題是,『這是番茄醬還是芥末醬?』Standard Cognition 的 CEO Jordan Fisher 在接受採訪時表示,

「如果是番茄醬,我們需要知道它是否是 12.6 盎司的亨氏番茄醬,這樣我們才能給客戶正確的收據。」

但 Scale 能做到的算是獨樹一幟嗎?並不。除了客戶有更高的行業性標註需求,整個資料標註行業實際上競爭激烈。

今年 6 月,Uber 收購了專注於為計算機視覺模型研發訓練資料的創企 Mighty AI。Mighty AI 成立於 2014 年,最初業務針對服裝等物品標記。其後又在自動駕駛掘金熱潮中,成功把業務延伸到該領域。

Uber 宣稱,Mighty AI 可以幫助自己訓練更好的無人車相關演算法,最終推動自動化標註的實現。

此外,亞馬遜也宣稱在其雲產品中提供自動打標服務,而 Hive 和 Alegion 等初創公司也在做類似的事情。

這位22歲華裔青年,用3年創造出矽谷最新AI獨角獸

但 Hive 執行長 Kevin Guo 說,資料標籤(資料標註)只是公司的低端業務,大頭還是來自「為不同行業客戶開發實際的人工智慧模型」。

「我沒有把公司的重心放在打標籤上,因為我不認為它會成為一樁大生意。」Kevin Guo 說,「現在有相當多這樣的公司,老實說,我不認為它們之間有什麼區別。這項業務的護城河還是太窄了。」

這位22歲華裔青年,用3年創造出矽谷最新AI獨角獸

不過,包括 Accel 和 Founders Fund 在內的 Scale AI 的投資者則表示,Scale 的工具更先進,給資料打標籤的速度更快而且更便宜。

「我們知道,在培訓資料瓶頸之外,還有很多問題需要我們去解決,以便繼續加速人工智慧的發展。」Wang 在一篇文章中寫道,

「我們期待,隨著我們的成長,在更廣泛的行業和技術領域加速機器學習的發展。」

https://www.toutiao.com/a6724183559562592782/

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2653484/,如需轉載,請註明出處,否則將追究法律責任。

相關文章