16個用於資料科學和機器學習的頂級平臺

dicksonjyl560101發表於2019-07-07



2019-04-12 17:43:08

調研機構Gartner公司將資料科學和機器學習平臺定義為“具有凝聚力的軟體應用程式,它提供了建立多種資料科學解決方案以及將這些解決方案合併到業務流程、周圍基礎設施和產品中所必需的基本構建塊的混合體。” 來源:企業網D1Net

這樣的平臺支援資料科學家在整個資料和分析管道中執行任務。這些任務包括與資料訪問和接收、資料準備、互動式探索和視覺化、功能工程、高階建模、測試、培訓、部署和效能工程相關的任務。考慮到這一點,Gartner公司釋出了一份魔力象限報告,其中介紹了資料科學和機器學習這一領域的16個領先廠商和平臺。



領導者

Gartner公司分析師寫道:“魔力象限中的領導者在資料科學和機器學習市場中擁有強大的影響力和重要的知識分享能力。他們在整個探索、模型開發和實施過程中展示了深度和廣度的優勢。在提供出色服務和支援的同時,領導者也能靈活應對瞬息萬變的市場環境。熟練使用領導者平臺的資料科學家專業人員數量巨大並且不斷增長。領導者在影響市場增長和方向方面處於最有利的地位。它們涉及所有行業、地理位置、資料域和用例,因此,對該市場有著紮實的理解和戰略。他們不僅能夠根據當前的市場條件,專注於有效地執行,而且他們還擁有堅實和強大的路線圖,以利用這一快速轉型行業的新發展和先進技術。他們提供思想領導和創新差異化,經常在實施過程中顛覆市場。”

(1)Alteryx公司

Alteryx公司總部位於加利福尼亞州歐文市。Gartner公司分析師表示,“Alteryx公司提供統一的機器學習平臺Alteryx Analytics,使公民資料科學家能夠在單一工作流程中構建模型。2017年中期,Alteryx公司收購了專注於模型部署和管理的資料科學供應商Yhat公司。Alteryx公司於2017年初在紐約證券交易所發行首次公開募股(IPO),加強了其投資擴充套件和增強其平臺的能力。Alteryx公司已經從挑戰者象限發展到領導者象限。這得益於強大的執行力(在收入增長和客戶獲取方面),其具有令人印象深刻的客戶滿意度,以及專注於幫助組織灌輸資料和分析文化。”

(2)H20.ai公司

H2O.ai公司總部位於加州山景城。Gartner公司分析師表示,“H2O.ai公司提供了一個開源的機器學習平臺,對於這個魔力象限,我們評估了核心元件H2O Flow,H2O Steam;用於Spark整合H2O Sparkling Water;以及提供深度學習能力的H2O Deep Water。H2O.ai已從先前魔力象限的夢想者發展為領導者。它透過重大的商業擴張繼續取得進展,並鞏固了其作為思想領袖和創新者的地位。”

(3)KNIME公司

KNIME公司總部位於瑞士蘇黎世。Gartner公司表示,“KNIME公司提供完全開源的KNIME分析平臺,全球有超過100,000人使用。KNIME提供商業支援和商業擴充套件,以促進企業部署的協作、安全性和效能。在過去的一年中,KNIME公司為AWS和Microsoft Azure引入了其雲平臺版本,更加註重資料質量,擴充套件了其深度學習功能,並將其部分商業功能轉換為開源。KNIME正在加速其產品開發和客戶獲取工作。KNIME的平臺被大多數行業和世界上大多數地區使用。該供應商展示了對市場的深刻理解,強大的產品戰略和所有用例的優勢。這些屬性共同鞏固了其作為領導者的地位。”

(4)RapidMiner公司

RapidMiner公司總部位於馬薩諸塞州波士頓。Gartner公司分析師表示,“RapidMiner公司的平臺包括RapidMiner Studio、RapidMiner Server和RapidMiner Radoop。RapidMiner Studio是模型開發工具,提供免費版和商業版;它的價格取決於邏輯處理器的數量和模型使用的資料量。透過採用免費版,客戶可以獲得一個邏輯處理器和10,000行資料。 RapidMiner Server旨在共享、協作和維護模型。RapidMiner Radoop將RapidMiner的執行直接擴充套件到Hadoop環境中。RapidMiner公司仍然是一個領導者,為全方位的資料科學家和資料科學團隊提供全面且易於使用的平臺。RapidMiner透過引入新的生產力和效能能力,繼續強調核心資料科學以及模型開發和執行的速度。”

(5)SAS公司

SAS公司總部位於北卡羅來納州卡里市。Gartner公司分析師表示,“SAS公司為分析和資料科學提供了許多軟體產品。對於這個Magic Quadrant,我們評估了SAS Enterprise Miner(EM)和SAS Visual Analytics產品套件,其中包括Visual Statistics和Visual Data Mining以及Machine Learning。SAS仍然是領導者,但在視覺完整性和執行能力方面已經失去了一些基礎。Visual Analytics套件因其Viya雲就緒架構而顯示出發展前景,該架構比以前的SAS架構更加開放,並且使得廣泛的使用者更容易訪問分析。然而,其令人困惑的多產品策略影響了SAS的視覺完整性,並且高許可成本的感知削弱了其執行能力。隨著市場焦點轉向開源軟體和靈活性,SAS公司提供有凝聚力的開放平臺的速度緩慢,並已經為此付出了代價。”



挑戰者

Gartner公司分析師表示,“挑戰者擁有穩固的存在、可信度、可行性和強大的產品能力。然而,他們可能不會像領導者那樣展示思想領導力和創新能力。挑戰者主要有兩種型別。長期建立的資料科學和機器學習供應商,因其穩定性、可預測性和長期客戶關係而取得成功。他們需要振興發展願景,以便與市場發展保持同步,並變得更具影響力和創新性。如果他們繼續做一直在做的事情,其業務增長和市場存在可能會受到損害。在相關市場中建立良好基礎的供應商,正在進入資料科學和機器學習市場,其解決方案可擴充套件現有客戶的現有平臺,但對許多潛在新客戶而言也是合理的選擇。由於這些供應商證明他們可以影響這個市場,並提供明確的方向和願景,他們可能會發展成領導者。”

(1)MathWorks公司

MathWorks公司是一家總部位於馬薩諸塞州內蒂克的私營公司。Gartner公司分析師表示,“Mathwork的兩個主要產品是MATLAB和Simulink,但只有MATLAB符合此魔力象限的入選標準。MathWorks公司仍然是挑戰者。它的執行能力得益於其在一般高階分析領域的持續可見性,重要的安裝基礎和強大的客戶關係,但受到參考客戶對關鍵能力的平均分數的影響。其完整的願景受限於其對工程和高階財務用例的關注。”

(2)TIBCO Software公司

TIBCO Software公司位於加利福尼亞州的帕洛阿爾託。Gartner公司分析師表示,“基於其在分析和商務智慧領域的地位,TIBCO公司於2017年6月從Quest Software收購了成熟的Statistica平臺,進入了資料科學和機器學習市場。此外,2017年11月,TIBCO宣佈收購Alpine Data,這是之前魔力象限的遠見者。在執行能力方面,此魔力象限僅評估TIBCO公司在Statistica平臺上的能力。 TIBCO的其他收購僅對其完整性有所貢獻。 TIBCO作為挑戰者進入這個魔力象限。Statistica平臺擁有龐大而成熟的客戶群,並在三個最典型的用例中獲得高分:業務探索、高階原型設計和生產改進。”



遠見者

Gartner公司表示,“遠見者通常是規模較小的供應商或代表正在塑造或有可能影響市場的趨勢的新進入者。然而,可能會擔心這些供應商能夠有效地繼續執行並隨著他們的成長而擴充套件。它們通常在市場上並不為人所知,因此相對於挑戰者和領導者而言,它們的領導力往往較低。遠見者有強烈的願景和支援路線圖。他們在解決市場需求方面具有創新精神。雖然他們提供的功能通常具有創新性和可靠性,但在產品的完整性和廣度上往往存在差距。”

遠見者值得考慮,因為他們可能:

提供啟動創新計劃的機會。

提供一些引人注目的差異化功能,作為現有解決方案的補充或替代,並提供競爭優勢。

更容易受到產品路線圖和方法的影響。

(1)Databricks公司

Databricks公司總部位於加利福尼亞州舊金山。Gartner公司分析師表示,“Databricks公司在雲中提供基於Apache Spark的Databricks統一分析平臺。除Spark外,它還為Amazon Web Services(AWS)提供安全性、可靠性、操作性、效能和實時支援的專有功能。Databricks公司於2017年11月宣佈推出一款Microsoft Azure Databricks平臺,該平臺未在此魔力象限中考慮,因為它在評估時通常不可用。Databricks公司是這個魔力象限的新進入者。作為遠見者,它利用開源社群和自己的Spark專業知識,提供一個易於訪問且熟悉的平臺。除資料科學和機器學習外,Databricks公司還專注於資料工程。2017年D輪融資額為1.4億美元,為Databricks公司提供了大量資源,可以擴充套件其部署選項並實現其願景。”

(2)Dataiku

Dataiku公司總部位於紐約市,在法國巴黎設有總部。Gartner分析師表示,“Dataiku公司提供的資料科學工作室(DSS)專注於跨學科協作和易用性,透過使使用者能夠快速啟動機器學習專案,Dataiku仍然是一個遠見者,並且是許多資料科學需求的熱門選擇。它的完整性願景是由於其合作和開源支援,這也是其產品路線圖的重點。由於用例方面的廣度相對較差以及自動化和資料流的不足,其整體視覺分數低於之前的魔力象限。由於操作和擴充套件機器學習模型的一些困難,Dataiku公司的執行能力也有所下降。”

(3)Domino公司

Domino公司(Domino Data Lab)總部位於加利福尼亞州舊金山。Gartner公司分析師表示,“Domino公司提供了Domino資料科學平臺。這是專家資料科學團隊的端到端解決方案。該平臺專注於整合開源和專有工具生態系統的工具,協作、可重複性以及模型開發和部署的集中化。Domino公司成立於2013年,是該市場知名廠商,並繼續在資料科學家中獲得知名度。Domino公司堅持其作為遠見者的地位。它的執行能力雖然得到了改進,但在機器學習生命週期(資料訪問、資料準備、資料探索和視覺化)開始時功能較弱仍然受到阻礙。然而,在過去一年中,多米諾已經證明了在競爭激烈的市場中贏得新使用者並獲得領導力的能力。”

(4)IBM公司

IBM公司總部位於紐約阿蒙克。Gartner分析師表示,“IBM提供了許多分析解決方案。對於這個魔力象限,我們評估了SPSS,其中包括SPSS Modeler和SPSS Statistics。資料科學體驗(DSX)是第二個資料科學和機器學習產品,不符合我們對執行能力軸的評估標準,但確實有助於IBM的完整性。IBM現在是一個遠見者,相對於其他供應商而言,在遠見者的完整性和執行能力方面已經失去了優勢。然而,IBM公司的DSX產品有可能激發更全面和創新的願景。IBM公司已宣佈計劃在2018年為其SPSS產品提供新介面,該介面將SPSS Modeler完全整合到DSX中。”

(5)微軟公司

微軟公司總部位於華盛頓州雷德蒙市。Gartner公司分析師表示,“微軟為資料科學和機器學習提供了許多軟體產品。在雲端,它提供Azure機器學習(包括Azure機器學習工作室),Azure資料工廠、Azure流分析、Azure HDInsight、Azure資料湖和Power BI。對於本地工作負載,微軟公司提供帶有機器學習服務的SQL Server,該服務於2017年9月釋出。在此魔力象限的截止日期之後。只有Azure機器學習工作室符合此魔力象限的納入標準,儘管微軟公司具有更廣泛的高階分析產品確實影響了我們對其完整性的評估。但微軟公司仍然是一個遠見者。它獲得這個地位主要是因為其市場響應能力和產品可行性得分較低,因為Azure機器學習工作室的純雲特性限制了它在許多需要內部部署選項的高階分析用例中的可用性。”



利基企業

Gartner公司分析師解釋說:“利基公司在特定行業或方法中表現出優勢,或與特定技術堆疊完美結合。一些利基公司表現出一定程度的遠見,這表明他們有可能成為遠見者。然而,相對於市場上的其他公司,他們往往難以讓自己的願景引人注目,也可能在努力創造創新和思想領導的歷史記錄,從而使他們成為遠見者。如果其他利基企業繼續以增強其在市場中的勢頭和吸引力的方式執行任務,他們可能會成為挑戰者。”

(1)Anaconda公司

Anaconda公司前身為Continuum Analytics,該公司總部位於德克薩斯州奧斯汀市。Gartner分析師解釋說,“Anaconda公司銷售Anaconda Enterprise 5.0,這是一個基於互動式筆記本概念的開源開發環境。它還提供了一個鬆散耦合的分發環境,可以訪問各種開源開發環境和開源庫,主要是基於Python。Anaconda公司的優勢在於它能夠聯合併為大量不斷構建機器學習功能的Python開發人員提供中央訪問點。然而,Anaconda公司對這些開發人員在質量、可靠性和可持續性方面的努力幾乎沒有控制權。 Anaconda透過Anaconda Cloud培育廣泛的開發者社群。Anaconda作為利基公司的地位反映了它對於熟練掌握Python的經驗豐富的資料科學家的適用性。”

(2)Angoss公司

總部位於加拿大多倫多的Angoss公司於2018年1月被Datawatch公司收購。Gartner公司分析師表示,“由於收購的延遲,相對於魔力象限流程,以及不確定的影響,它在文件中的名稱仍為Angoss公司。此評估涵蓋以下產品:該公司最基本的產品KnowledgeSEEKER,主要針對桌面環境中的公民資料科學家;KnowledgeSTUDIO,包含比KnowledgeSEEKER更多的模型和功能;以及新推出的KnowledgeENTERPRISE,這是一款包含全系列功能的旗艦產品。 Angoss公司與銀行客戶有著長期的合作經驗。這有助於向銀行業和其他具有類似資料和分析需求的行業提供服務,例如保險、運輸和公用事業。”

(3)SAP公司

SAP總部位於德國瓦爾多夫。Gartner公司分析師表示,“SAP公司再次將其平臺重新命名為:SAP Business Objects Predictive Analytics。該平臺具有許多元件,例如用於資料集準備和特徵工程的Data Manager,用於公民資料科學家的Automated Modeler,用於更復雜機器學習的Predictive Composer以及用於操作的Predictive Factory。SAP Leonardo機器學習和SAP Leonardo生態系統的其他元件對SAP在此魔力象限中的執行能力沒有貢獻。在過去的一年中,SAP公司在幾個方面取得了很好的進展,但在其他方面仍然落後。它是一個利基企業,因為相對於其他公司來說,其客戶滿意度低,缺乏思想共享。”

(4)Teradata公司

Teradata公司總部位於加利福尼亞州聖地亞哥。Gartner公司分析師表示,“Teradata公司統一資料架構(UDA)是一個企業分析生態系統,它結合了開源和商業技術,提供分析功能。UDA包括Aster Analytics、Teradata資料庫、Hadoop和資料管理工具。儘管Teradata公司具有強大的運營能力,但它仍然缺乏統一的端到端技術平臺。Teradata公司保持了其內在的效能和可靠性優勢,但其在資料科學開發方面缺乏凝聚力和易用性,削弱了其執行能力和在視覺完整性方面取得的進展。它仍然是一個利基企業。”


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2649765/,如需轉載,請註明出處,否則將追究法律責任。

相關文章