Google VS 亞馬遜 VS 微軟,機器學習服務選誰好?

AI科技大本營發表於2018-04-19

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


譯者 | reason_W

編輯 | Just

出品 | AI科技大本營(公眾號ID:rgznai100)


對大多數企業來說,機器學習聽起來就像航天技術一樣,屬於花費不菲又“高大上”的技術。如果你是想構建一個 Netflix 這種規模的推薦系統,機器學習確實是這樣的。(注:Netflix是美國流媒體巨頭、世界最大的收費視訊網站,曾於 2017 年買下《白夜追凶》全球播放權。)但受萬物皆服務(everything-as-a-service)這一趨勢的影響,機器學習這一複雜的領域也正在變得越來越接地氣。所以現在哪怕你只是一個資料科學領域的新手,並且只想實現一些很容易的目標,也可以立馬開始一個不需要太多投資的機器學習專案。


機器學習領域有一個非常鼓舞人心的故事:有一個日本的農民,他父母的工作是揀選農場的黃瓜。為了幫助父母減輕勞動負擔,他決心要用機器實現黃瓜自動揀選。然而這個農民既沒有機器學習方面的專業知識,也沒有很多的資金預算。但他卻成功地藉助 TensorFlow,利用深度學習知識實現了不同種類黃瓜的識別。


通過使用機器學習服務,你可以很輕鬆地開始你的第一個工作模型的構建工作。哪怕是一個開發能力不那麼強的小團隊,也有能力實現模型預測以獲得有價值的見解。我們已經討論過機器學習策略。現在讓我們來了解一下市場上最流行的機器學習平臺,並考慮一下怎麼選擇基礎架構。


什麼是機器學習即服務?


機器學習即服務(MLaaS)是自動化和半自動化雲平臺的統稱,它涵蓋了大多數基礎架構,如資料預處理、模型訓練和模型評估,以及進一步的預測。而預測結果則可以通過 REST API 與你的內部 IT 架構聯絡起來。


亞馬遜的機器學習服務、微軟 Azure 機器學習雲服務和 Google Cloud AI 服務是目前最領先的三個機器學習服務平臺。它們可以在幾乎不需要任何資料科學專業知識的情況下,提供快速的模型訓練和部署功能。如果你想從一個的軟體工程師團隊中挑人組建一個本地資料科學團隊,那首先就應該考慮這種平臺。你可以先了解一下資料科學團隊結構的資料,熟悉一下它的的角色分配。


在本文中,我們將首先概述 Amazon、Google 和 Microsoft 這三個主要機器學習服務平臺,然後比較這些供應商支援的機器學習 API。注意,這個概述並不是要討論這些平臺的詳細使用說明,而是要討論你在開始閱讀它們的文件之前應該瞭解的東西。


用於定製化預測分析任務的機器學習服務


640?wx_fmt=png



Azure MLstudio 擁有最全面的服務;但如果你的任務需要使用深度神經網路,我們也建議你瞭解一下 Amazon SageMaker 和 Google ML Engine


使用 Amazon ML 進行預測分析


亞馬遜的機器學習服務有兩種型別:使用 Amazon ML 進行預測分析,以及針對資料科學家的SageMaker 工具。


Amazon ML 針對預測分析提供的方案是市場上最具自動化的解決方案之一,也是截止期敏感操作的最佳解決方案。它的服務可以載入來自多個資料來源的資料,包括 Amazon RDS,Amazon  Redshift,CSV 檔案等。所有資料預處理操作都會自動執行:它的服務會識別哪些欄位是類別,哪些資料是數值,並且不需要使用者進一步選擇資料預處理的方法(降維及資料清洗)。


Amazon ML 的預測能力僅限於以下三種選擇:二分類、多類分類和迴歸。也就是說,這個Amazon ML 服務不支援任何無監督學習方法,使用者必須選擇一個目標變數並將其標記為訓練集。當然,使用者也不需要知道任何機器學習方法,因為亞馬遜會在查詢使用者提供的資料後自動選擇演算法。


對 Amazon ML 的使用而言,這種高度自動化操作水平有好有壞。如果你需要一個完全自動化但功能有限的解決方案,這個服務可以滿足你的期望。如果不是,還可以考慮亞馬遜的 SageMaker 工具。


Amazon SageMaker 和基於框架的服務


SageMaker 是一個機器學習環境,它可以提供快速模型構建和部署工具,並以此簡化其他資料科學家的工作。例如,它提供了Jupyter(一種互動式筆記本,支援40多種程式語言)來簡化資料探索和分析,而不需要登陸伺服器(這樣操作十分麻煩)。Amazon 還內建了針對大型資料集和分散式系統計算的演算法,包括:


  • 線性學習器,一種用於分類和迴歸的監督學習方法

  • 為稀疏資料集分類和迴歸任務設計的分解機(Factorization Machines)

  • XGBoost,一種監督 boosted 樹演算法,它通過結合簡單演算法的預測結果來提高分類、迴歸和排序的預測精度

  • 基於 ResNet 的影像分類,也可用於遷移學習

  • Seq2seq,一種用於序列預測的監督演算法(例如翻譯句子,將單詞串轉換成較短的單詞作為摘要等)

  • K-means,一種用於聚類任務的無監督學習方法

  • PCA(Principal component analysis),用於降維

  • LDA(Latent Dirichlet Allocation),一種用於在文件中查詢類別的非監督方法

  • 神經話題模型(NTM),一種非監督的方法,用於探索文件,發現排名靠前的單詞,並定義主題(使用者不能預先定義主題,但可以設定預期數量)


內建的 SageMaker 方法與 Amazon 建議的機器學習 API 有很大程度的交叉,但在這裡,它允許資料科學家自定義的方法,並使用他們自己的資料集。


如果你不想用這些內建模型,還可以新增自己的方法,並利用 SageMaker 的部署特性來執行模型。或者你可以將 SageMaker 與 TensorFlow 和深度學習庫 MXNet 整合在一起。


一般來說,無論是那些有經驗的資料科學家還是那些只需要做專案的人,亞馬遜的機器學習服務都為他們提供了足夠的自由,而不需要使用者再深入準備資料集和建模。對於已經在使用Amazon 環境並且不打算過渡到另一個雲提供商的公司來說,這會是一個很靠譜的選擇。


微軟 Azure 機器學習 Studio


Azure 機器學習 的目的是為新手和有經驗的資料科學家提供一個強大的試驗平臺。微軟的 ML 產品列表與亞馬遜的類似,但是 Azure 在開箱即用的演算法方面看起來更加靈活。


Azure 的服務可以分為兩大類:Azure 機器學習 Studio 和 Bot 服務。接下來我們會首先介紹 Azure ML Studio 的內容。然後針對 Bot 服務的特定 API 和工具部分進行專門介紹。


ML Studio 是 Azure 主要的機器學習服務包。幾乎所有 Azure ML Studio 的操作都必須手動完成。這包括資料探勘、預處理、方法選擇以及建模結果驗證。


使用 Azure 來進行機器學習會經歷一個必要的學習階段。但這也會讓使用者對該領域所有的主要技術有一個更深層次的理解。另一方面,Azure ML 支援圖形化介面,以視覺化工作流中的每一個步驟。使用 Azure 的主要好處或許是我們可以在這個平臺上使用各種演算法。Azure Studio 支援大約 100 種方法,包括分類(二分類+多類)、異常檢測、迴歸、推薦系統和文字分析。值得一提的是,該平臺還支援一個聚類演算法(K-means)。


Azure ML 的另一個重要部分是 Cortana Intelligence Gallery。這是一個機器學習解決方案的集合,由相關社群進行維護,其解決方案可供資料科學家進行開發和重用。對於那些剛剛上手機器學習的人來說,Azure 產品是一個強大的工具,並且非常適合將其介紹給新員工。


Google 預測 API


Google 提供了兩種型別的人工智慧服務:一個是為經驗豐富的資料科學家提供的機器學習引擎,另一個是高度自動化的 Google 預測 API。不幸的是,Google 最近宣佈將在 2018 年 4 月 30 日 Google 預測 API 。


和 Amazon ML 類似,其功能也是隻解決兩個主要問題:分類(二分類和多類)和迴歸。訓練好的模型可以通過 REST API 介面進行部署。


Google 並沒有透露其預測部分究竟用到了哪些演算法,也不允許工程師自定義模型。但從另一個角度來說,Google 的環境最適合那些期限很緊張的使用者進行機器學習,並推出初始版的 ML 模型。但該產品似乎並沒有 Google 所想的那樣受歡迎。由於該功能的棄用,那些之前一直在使用預測 API 的人將不得不使用其他平臺來“重建現有模型”。


所以,Google 預測 API 的接替者會是什麼呢?


Google Cloud 機器學習引擎


預測 API 的高自動化犧牲了該功能的靈活性。而 Google ML 引擎則正好相反。它專門針對經驗豐富的資料科學家進行了非常靈活的設計。Google ML 建議人們使用 Tensorflow 的雲基礎設施作為機器學習的驅動器。原則上 ML 引擎和 SageMaker 很相似。


TensorFlow 是 Google 的另一個產品,它是一個包含大量資料科學工具的開源機器學習庫,而不是機器學習服務。它沒有視覺化的介面,並且相應的學習曲線也會非常陡峭。然而,這個開源庫的目標使用者也包括那些計劃過渡到資料科學的軟體工程師。TensorFlow 非常強大,但主要針對的是深度神經網路任務。


基本上,TensorFlow 和 Google Cloud 服務的結合,代表了三層雲服務模式中的 IaaS 和 PaaS 解決方案結合。我們在數字化轉型的白皮書中談到了這個概念。


對比上面我們介紹到的 MLaaS 平臺,目前在這一市場上似乎 Azure 擁有的工具集功能最多。它涵蓋了大多數與機器學習相關的任務,為構建自定義模型提供了一個視覺化介面,並且為那些不想單純依靠內建功能的人提供了一套可靠的API。但是,它的自動化能力仍然不如亞馬遜的機器學習平臺。


亞馬遜,微軟和 Google 的機器學習 API 對比


除了成熟的平臺之外,你還可以使用高階 API。這些服務的模型都是已經訓練好的模型,輸入資料就可以得到結果。使用 API 不需要機器學習的專業知識。目前,這三個供應商的 API 大致可分為下面三大類:


1)文字識別、翻譯和文字分析。

2)影像+視訊識別及相關分析。

3)具體的未分類服務。


640?wx_fmt=png


微軟的功能列表最豐富。當然,最關鍵的功能所有供應商都會提供。


語音和文字處理 API: Amazon


Amazon 提供了多個針對主流文字分析任務的 API。使用機器學習功能也非常自動化,只需要進行適當的整合即可。


亞馬遜 Lex:Lex API 含有自動語音識別(ASR)和自然語言處理(NLP)功能,可以在你的應用程式中嵌入聊天機器人,這些都是基於深度學習模型實現的。API 可以識別文字和語音內容,而 Lex 介面允許將輸入的識別結果與各種後端解決方案連線到一起。Amazon 也非常鼓勵你使用其 Lambda 雲環境。所以,在使用 Lex 之前,最好也要了解 Lambda。除了獨立的應用程式,Lex 還支援在 Facebook Messenger、Slack 和 Twilio 等聊天軟體上部署聊天機器人。


亞馬遜 Transcribe(語音轉文字):雖然 Lex 是一種複雜的聊天工具,但它僅用於識別語音文字。而 Transcribe 這個工具可以利用多個揚聲器,並識別低質量的電話音訊。這使得這個 API 成為音訊文件分類的首選解決方案。並且這個 API 還可以對呼叫中心資料的進一步文字分析提供良好支援。


亞馬遜 Polly:Polly 服務和 Lex 相反。它用於將文字轉換成語音,這可以讓你的聊天機器人直接用語音進行回覆。這個過程沒有生成文字,而只是讓文字聽起來更像人類。如果你之前用過 Alexa,你就明白了。目前,它支援 25 種語言的女性和男性的聲音,主要是英語和西歐語言。有些語言有多種女性和男性的聲音,所以有多種語音效果可供選擇。和 Lex 一樣,Polly 也被推薦和 Lambda 一起使用。


亞馬遜 Comprehend:理解(Comprehend )是另一組自然語言處理的介面。與 Lex 和 Transcribe不同,Comprehend 主要針對不同的文字分析任務。目前,Comprehend 支援:


  • 實體提取(識別名稱、日期、組織等)

  • 關鍵詞檢測

  • 語言識別

  • 情緒分析(文章立場屬於正面、中性還是負面?)

  • 主題建模(通過分析關鍵字來定義主要主題)


該服務可以幫助使用者分析社交媒體的反應、評論和其他不適合手動分析的文字資料。例如, Comprehend 和 Transcribe 的組合可以用來分析客戶在使用電話客服時的情緒。


亞馬遜 Translate :顧名思義,Translate 服務用於翻譯文字。與基於規則的翻譯方法相比,亞馬遜聲稱該功能使用了神經網路,可以提供更好的翻譯結果。不過目前該功能僅支援以英語為源語言或目標語言的六種語言的翻譯,包括阿拉伯語、漢語、法語、德語、葡萄牙語和西班牙語。


語音和文字處理 API:微軟 Azure 認知服務


和亞馬遜一樣,微軟也建議使用者將其認知服務 API 與使用者的基礎架構整合到一起,來執行那些不需要任何資料科學專業知識的任務。


語音:語音功能包含四個 API,分別應用不同型別的自然語言處理(NLP)技術進行自然語音識別和其他操作:


  • 語音翻譯 API

  • Bing 語音 API 將文字轉換成語音和語音轉換成文字

  • 用於語音驗證任務的語音識別 API

  • 方便使用者在自己的資料和模型上應用 Azure NLP 的語音定製服務


語言:語言功能 API 主要用於和亞馬遜 Comprehend 類似的文字分析:


  • 語言理解智慧服務是一個用於分析含有命令意圖的文字(如“執行 YouTube 應用程式”或“開啟房間的燈”) 的 API

  • 用於情緒分析和主題提取的文字分析 API

  • Bing 拼寫檢查

  • 文字翻譯 API

  • 通過估計單片語合的概率,進行單詞自動補全的 Web 語言模型 API

  • 用於語句分離,詞性標註,以及將文字劃分為有標記的短語的語言分析 API


語音和文字處理 API:Google Cloud 服務


雖然 Google 的語音文字處理 API 與亞馬遜和微軟 Azure 的功能不同,但也有一些有趣且獨特的東西值得關注。


Dialogflow:隨著各種聊天機器人的勢頭越來越猛,Google 也想進來插一腳了。Dialogflow 的核心是自然語言處理技術,目的是在文字中提取意圖,並解釋一個人想要幹什麼。這個 API 可以通過 Java、Node.js 和 Python 來進行調整和自定義。


雲自然語言 API:它的核心功能幾乎跟亞馬遜的 Comprehend 以及微軟的語言服務完全相同。


  • 定義文字中的實體

  • 情緒識別

  • 語法結構分析

  • 主題分類(如食物、新聞、電子產品等)


雲語音 API:這項服務可以識別自然語言。與類似的 API 相比,它的主要優點是 Google 支援大量的語言。目前,它使用的詞彙涵蓋超過 110 種全球語言及其變體。該服務還有一些附加功能:


  • 單詞提示可以對識別到的自定義上下文或單詞進行語音播報(如可以幫助使用者更好地理解本地或行業術語)

  • 過濾不恰當的內容

  • 處理噪聲音訊


雲翻譯 API:基本上,這個 API 就等於在你的產品中直接使用 Google 翻譯。它可以完成包括超過 100 種語言在內的翻譯和自動語言檢測。


除了文字和語音,亞馬遜、微軟和 Google 還提供了相當多的用於影像和視訊分析的 API。


640?wx_fmt=png

目前在 Google Cloud 上可以使用的影像分析工具包最全


雖然影像分析與視訊 API 密切相關,但許多用於視訊分析的工具仍處在開發或測試版本中。例如,Google 為各種影像處理任務提供了很多支援,但是在微軟和 Amazon 上已經沒有視訊分析功能了。


640?wx_fmt=png


微軟看起來功能最多,但由於亞馬遜支援視訊流處理,所以我們仍然認為它是效率最高的視訊分析 API。這個特性有力地擴充套件了使用範圍。


影像和視訊處理 API:亞馬遜 Rekognition


不要以為我們把單詞拼錯了,它確實是這麼拼寫的。Rekognition API 用於影像識別任務,最近還開始支援視訊識別。其功能包括:


  • 目標檢測和分類(在影像中發現並檢測不同的目標,然後定義它們是什麼)

  • 在視訊中,它可以檢測諸如“跳舞”之類的簡單動作,也可以檢測像“滅火”這樣的複雜動作

  • 人臉識別(用於人臉檢測和匹配)和麵部分析(這個功能非常有趣,因為它可以檢測微笑、分析眼睛,甚至在視訊中定義情感情緒)

  • 檢測不恰當的視訊

  • 在圖片和視訊中認出名人(無論目標是誰)


影像和視訊處理 API:微軟 Azure 認知服務


微軟的視覺包結合了六個 API,專注於不同型別的影像、視訊和文字分析。


  • 計算機視覺,用於識別物體,動作(如行走),並定義影像中的主色彩

  • 內容主持人,用於在影像、文字和視訊中檢測不適當的內容

  • Face API,用於檢測人臉,對其進行分組,定義年齡、情緒、性別、姿勢、微笑和麵部毛髮

  • 情感 API,另一種用於描述面部表情的面部識別工具

  • 定製視覺服務,支援使用使用者資料構建自定義影像識別模型

  • 視訊索引器,一種可以在視訊中進行人員查詢,定義語音情緒,並標記關鍵字的工具


影像和視訊處理 API:Google Cloud 服務


雲視覺API:該工具是專門為影像識別任務構建的,對查詢特定影像屬性非常有用:


  • 物體標識

  • 面部表情檢測和分析

  • 地標查詢和場景描述(如假期、婚禮等)

  • 在影像中尋找文字並進行文字識別

  • 主色彩


雲視訊智慧:Google 的視訊識別 API 是早期開發的,因此它的功能同亞馬遜的 Rekognition 和微軟認知服務提供的功能相比要少一些。目前,API 提供了以下工具集:


  • 物體標記和行為定義。

  • 識別明確的內容

  • 演講語音轉文字


雖然 Google AI 服務在功能上要少一些,但是 Google API 的優勢在於 Google 可以訪問海量資料集


特定的 API 和工具


在這裡,我們將討論來自 Microsoft 和 Google 的特定 API 產品和工具。這裡不包括 Amazon 的原因是,它們的 API 只涉及上文談到的文字分析和影像+視訊分析。當然,這些特定 API 的一些能力在 Amazon 產品中也有體現。


Azure Service Bot 框架:微軟為其使用者提供了靈活的 Bot 開發工具。該服務基本上包含了構建、測試和部署使用不同程式語言的 Bot 的成熟環境。


有趣的是,Bot 服務並不需要機器學習方法。微軟為機器人提供了 5 個模板(basic, form, language understanding, active, and Q&A),只有語言理解型別需要高階 AI 技術。


現在你可以使用.NET 和 Node.js 技術在 Azure 上構建 Bot,並將它們部署到以下平臺和服務中:


  • 必應

  • Cortana

  • Skype

  • Web Chat

  • Office 365 郵件

  • GroupMe

  • Facebook Messenger

  • Slack

  • Kik

  • Telegram

  • Twilio


微軟Bing搜尋:微軟提供了與 Bing 的核心搜尋功能相連線的 7 個 API,包括自動提示、新聞、圖片和視訊搜尋。


微軟知識:這個 API 將文字分析和一系列獨特的任務結合在一起:


  • 推薦系統 API,用於建立支援個性化購買的推薦系統

  • 知識探索服務,允許通過輸入自然語言查詢來進行資料庫資料檢索、資料視覺化和自動完成查詢。

  • 實體連結智慧 API,用於突出顯示特定實體的名稱和短語(例如,年齡),並確保消除歧義。

  • 學術知識 API,用於單詞自動補全,在單詞和概念中找到相似的文件,並在文件中進行圖模式搜尋。

  • QnA Maker API,可用於大量問答及變體的匹配,構建客服聊天機器人和應用程式。

  • 自定義決策服務,一種增強學習工具,根據使用者的喜好對不同型別的內容(如連結、廣告等)進行個性化定製和排序


Google Cloud 職位發現:這個 API 還處於早期開發階段,但它可能很快就會重新定義我們今天的職位搜尋能力。與傳統的依靠精確的關鍵字匹配的搜尋引擎不同,Google 使用機器學習來尋找高度變化的職位描述之間的關聯,從而避免模稜兩可的關鍵字。例如,它努力減少不相關的或太寬泛的反饋,比如把所有關鍵詞帶有“assistant”的工作作為“銷售助理”的查詢結果。這個 API 的主要功能是什麼呢?


  • 修正職位查詢中的拼寫錯誤

  • 匹配期望的資歷水平

  • 在不同的表達和行業術語中找到相關的工作(例如:在查詢“服務人員”時,返回“咖啡師”而不是“網路專家”;或在查詢“商業擴充”時返回“運營專員”)

  • 處理首字母縮略詞(例如查詢“HR”時,返回“人力資源助理”的查詢結果)

  • 匹配多樣化的職位描述


IBM Watson 和其他平臺


我們上面描述的三個平臺都提供了相當詳細的文件來幫助使用者開始機器學習實驗,並在公司基礎架構中部署經過訓練的模型。還有一些來自初創公司的機器學習服務解決方案,如 PredicSis 和 BigML,也受到了資料科學家的推崇。


那麼 IBM Watson Analytics 怎麼樣呢?


就商業預測的目的來說,IBM Watson Analytics 還不是一個完善的機器學習平臺。目前,Watson 的優勢是視覺化資料並描述不同的數值如何相互作用。它還提供跟 Google 類似的視覺識別服務和一組其他認知服務(API)。


Watson 目前的問題是,這個系統目前只能執行一些對非專業人員來說都很容易操作的狹窄而相對簡單的任務。當涉及到自定義機器學習或預測任務時,IBM Watson 就差遠了。


資料儲存


如果你的資料科學家還能操作流行的儲存解決方案,那麼為了收集資料和進一步處理機器學習去尋找合適的儲存就容易多了。


在大多數情況下,機器學習需要 SQL 和 NoSQL 資料庫方案,這些方案由許多已經建立且可信的解決方案提供支援,如 Hadoop 分散式檔案系統(HDFS)、Cassandra、Amazon S3 和 Redshift。對於那些在開始機器學習之前使用強大儲存系統的組織來說,這不是多麼困難的事。如果你計劃使用一些機器學習服務系統,最直接的方法就是讓儲存服務提供商和機器學習服務提供商保持一致,因為這會減少很多配置資料來源的時間。


但是,也有一些平臺可以很容易地與其他儲存平臺整合。例如,Azure ML 主要整合了其他Microsoft 產品(Azure SQL、Azure 表、Azure Blob),但也支援 Hadoop 和其他一些資料來源選項。這包括從桌面或伺服器直接上傳資料。如果你的機器學習工作流是多樣化的,並且資料來源很多,那麼在這些平臺上使用機器學習服務可能就會面臨很多挑戰。


建模和計算


我們已經討論的機器學習服務解決方案都提供了計算能力。但如果學習流程是在內部執行的,那麼遲早會面臨計算挑戰,機器學習在大多數情況下都需要大量的計算能力。無論大資料時代有沒有到來,資料取樣(採集一個有組織的子集)都是一個與之相關的實踐。雖然模型原型可以在膝上型電腦上完成,但使用大型資料集訓練複雜的模型需要投入更強大的硬體。


這同樣適用於資料預處理,在普通的辦公裝置上這甚至可能花費數天時間。在一個截止期敏感的環境中——有時需要修改模型,每週或每天都要重新訓練——這根本不可行。為了保證高效能運算,可以考慮下面三種可行的處理方法:


  • 硬體加速。如果你做的是相對簡單的任務,並且不會將模型應用到大資料上,可以使用固態硬碟(ssd)來完成資料準備或使用分析軟體等任務。計算密集型操作可以通過一個或多個圖形處理單元(GPU)來處理。許多軟體庫都支援使用 GPU 執行用 Python 等高階語言編寫的模型。


  • 考慮分散式計算。分散式計算意味著將任務劃分到多臺機器上,但這種方法並不適用於所有的機器學習技術。


  • 使用雲端計算處理資料大規模擴充套件。如果你的模型要處理的客戶相關資料有密集的高峰時段,可以通過雲端計算服務來處理這種快速的資料規模擴充套件。而對於只需要在內部部署資料的公司而言,私有云架構也非常值得考慮。


未來展望


這麼多解決方案很容易讓人看花了眼。它們在演算法上有不同,在需要的技能上也有所不同,最終在任務上有所不同。這種情況在這個新興市場很常見,甚至於我們上文討論的三個主要解決方案之間都還沒有形成完全的競爭關係。不僅如此,這個市場變化的速度也令人印象深刻。很有可能在你堅持一個供應商的時候,另一個供應商就突然推出了一些符合你業務需求的服務。


正確的做法是儘可能早地確立你計劃通過機器學習實現的目標,但這並不容易。如果你缺乏資料科學或者其他領域的專業知識,那麼要打通資料科學和商業價值之間的橋樑就非常棘手。在與客戶討論機器學習應用程式時,我們經常會遇到這個問題。處理這個問題的方法通常是將一般問題簡化為單個屬性的問題,不管是預測價格還是其它數值(物件的類別或將物件分成多個組),一旦找到該屬性,決定供應商並選擇服務內容就會很簡單。


DCVC 創始合夥人 Bradford Cross 認為,MLaaS 不是一種可行的商業模式。根據他的說法,在將要使用開源產品的資料科學家和將要購買工具解決任務的高管兩種角色之間有著相當大的差距。然而,目前業界似乎正在克服這個“痼疾”。為了在擁有多功能資料工具的同時避免昂貴的人才投入,未來將有更多的公司轉向機器學習服務。


題圖來自 oresdatascience


原文連結:

https://www.altexsoft.com/blog/datascience/comparing-machine-learning-as-a-service-amazon-microsoft-azure-google-cloud-ai/




小問卷


640?wx_fmt=png

640?wx_fmt=png

AI科技大本營公眾號ID:rgznai100640?wx_fmt=jpeg


☟☟☟點選 | 閱讀原文 | 檢視更多精彩內容

相關文章