一文了解用於ML/AI工作流的開源編排器Flyte
Flyte是一個開源的編排工具,用於管理機器學習和人工智慧專案的工作流。它執行在Kubernetes之上。
用於人工智慧和機器學習的資料是否需要自己的工作流和編排系統?據Union.ai認為是的,它確實提供了一種名為Flyte的開源解決方案,該解決方案提供了工作流和編排,以滿足資料而非軟體的獨特需求。
Union.AI首席營銷官兼開發者關係主管Martin Stein表示:“我們從使用編排器進行機器學習的人那裡得到的第一個反饋是,這些編排器不是為人工智慧工作流、機器學習工作流而生的,他們被迫寫YAML程式碼,被迫理解Docker檔案,被迫去做機器學習工程師、資料科學家和研究人員不會做的事情。”
他補充道,基本上,使用Flyte,開發人員編寫程式碼,然後在本地或遠端執行。
Union.ai首席機器學習工程師Niels Bantilan表示:“我們的論點是,軟體與機器學習有著根本的不同,儘管它們是相關的。在我們看來,軟體和機器學習之間的主要區別在於,軟體是無狀態的,另一方面,資料和模型一直在變化。”
Flyte是面向機器學習的編排器
“什麼是編排?以音樂類比,管絃樂隊中的指揮將是協調的中心點,它告訴每個部分的每個樂器何時演奏、如何演奏以及什麼是動態的,本質上,它是一個軟體編配器。工作流編排器在抽象層次上非常相似,在進行某些計算後進行協調,在執行某些資料時進行處理它從哪裡被推到哪裡,並從本質上協調整個系統以實現一些期望的行為。”
他認為,Flyte透過豐富的工具解決了這些問題。
Union.ai認為,一個好的資料和人工智慧編排器可以提供:
——管理和安全:RBAC、資料所有權、多租戶和排程。
——監控和視覺化:資料沿襲、資料視覺化、工作流視覺化、任務級觀察能力。
——效能和準確性:強型別介面,GPU加速,並行,產生信令。
——工作流效率:任務內檢查點;從故障中恢復;重新執行單個任務;快取;點/可搶佔例項;超時;動態資源配置;通知。
——靈活性:任務內檢查點;版本控制;依賴關係隔離;多雲支援。
Flyte實現了上面每一個要點。
Stein解釋道:“大多數編排器都不像Flyte那樣。Flyte是極少數真正超越Airflow等僅限資料的編排器的產品之一。例如,Airflow沒有快取,沒有任務內檢查點,實際上不是為ML管道而構建的。它是為資料管道而構建。”
他補充道,AWS的SageMaker也存在同樣的問題。
Flyte透過自動化基礎設施挑戰來工作。
Stein說:“並行和GPU之類的東西——你不必專門為Flyte編寫任何功能。這真的很重要,因為Flyte會自動完成這項工作,這樣你就不必在Python程式碼中輸入‘Please run in parallel,yada,yada、yada’,decorator會在任務級別上指定想要執行多少機器,或者需要多少計算。”
該雲原生編排平臺是在Kubernetes之上構建的,如果單獨執行Flyte,需要Kubernete工程師的幫助。
它不是ML運維工具,但…
Stein說,Flyte經常被誤認為是ML Ops工具。事實並非如此。
Stein說:“我們在Flyte上執行MLOps,這樣你就可以把權重和偏見、y日誌或任何想要的東西帶到一起,我們把這些東西連線在一起,讓它們完美地工作。這就是編排器的真正力量。”
他補充道,它確實可以讓你看到完整的機器學習工作流,其中一個工作流與另一個工作流掛鉤。Stein說,這確保了資料科學家能夠看到從開始到結束的一切。
Bantilan說:“你可能有一個資料團隊和一個分類模型團隊,一個預測模型團隊,他們都可以使用同一個平臺,也就是Flyte,在同一個工作空間裡一起工作,但仍然不會互相踩到。”
該開源工具還擁有50個整合,包括DataBricks和Anyscale with Ray。
Stein說:“我們無法訪問你的任何資料,這是最重要的。”
來自 “ 開源雲中文社群 ”, 原文作者:開源雲中文社群;原文連結:https://mp.weixin.qq.com/s/iE4wD8hjR6ETieBLzIz1qA,如有侵權,請聯絡管理員刪除。
相關文章
- 不要讓你的開源專案「裸奔」,一文了解開源證書
- 基於 .NET 的開源工作流引擎框架框架
- 伺服器太多了不好管?UCloud基於的資源編排工具詳解伺服器Cloud
- 一文了解 Java 中的構造器Java
- 多雲編排推動開源身份管理
- 編排的藝術|K8S中的容器編排和應用編排K8S
- Ory Kratos: 用 Go 編寫的開源身份伺服器Go伺服器
- kestra: 無限可擴充套件的開源編排和排程平臺套件
- 一款由AI編寫,簡潔而實用的開源IP資訊檢視器AI
- AI - 一文了解AIOps的含義、特點與功用AI
- 一文了解RPA財務機器人應用場景機器人
- 開源的.Net 工作流引擎Elsa初試——建立工作流伺服器和圖形化工作流配置管理應用伺服器
- 使用Zeebe實現微服務工作流編排 - Berndruecker微服務
- Airbyte如何使用Temporal擴充套件工作流程編排?AI套件
- 寫給小白的開源編譯器編譯
- 一文讀懂:開源大資料排程系統Taier1.2版本新增的「工作流」到底是什麼?大資料AI
- Unity開源技能編輯器Unity
- 最小許可權的容器編排:編排器的使用方法探討
- 開源工作流設計器(流程設計器)哪個好
- 一文了解如何原始碼編譯Rainbond基礎元件原始碼編譯AI元件
- Meta將PyTorch獻給Linux基金會,將AI/ML帶回研究/開源根源?PyTorchLinuxAI
- 【Java分享客棧】一文搞定京東零售開源的AsyncTool,徹底解決非同步編排問題。Java非同步
- .NET 開源工作流: Slickflow流程引擎高階開發(八) -- 審批閘道器(ApprovalOrSplit)模式的應用APP模式
- AI 開發的捷徑:工作流模式AI模式
- 一文了解MysqlMySql
- 一文了解cookieCookie
- 深入工作流排程的核心
- 移動應用AI化成新戰場?詳解蘋果最新Core ML模型構建基於機器學習的智慧應用AI蘋果模型機器學習
- 一文帶你看透kubernetes 容器編排系統
- 一文了解強化學習的商業應用2強化學習
- 一文了解 DataLeap 中的 Notebook
- 開源元件編排引擎LiteFlow釋出里程碑版本2.5.0元件
- Azkaban工作流排程
- 7 個有助於 AI 技術的最佳開源工具AI開源工具
- 8K Star,一款開源仿Notion且AI強化的編輯器:NovelAI
- 一文了解主流線上公共 MQTT 伺服器MQQT伺服器
- 開源AwaitableCompletionSource,用於取代TaskCompletionSourceAI
- 基於java+vue.js的國產新款開源的工作流引擎系統JavaVue.js