一文了解用於ML/AI工作流的開源編排器Flyte

danny_2018發表於2023-04-24

Flyte是一個開源的編排工具,用於管理機器學習和人工智慧專案的工作流。它執行在Kubernetes之上。

用於人工智慧和機器學習的資料是否需要自己的工作流和編排系統?據Union.ai認為是的,它確實提供了一種名為Flyte的開源解決方案,該解決方案提供了工作流和編排,以滿足資料而非軟體的獨特需求。

Union.AI首席營銷官兼開發者關係主管Martin Stein表示:“我們從使用編排器進行機器學習的人那裡得到的第一個反饋是,這些編排器不是為人工智慧工作流、機器學習工作流而生的,他們被迫寫YAML程式碼,被迫理解Docker檔案,被迫去做機器學習工程師、資料科學家和研究人員不會做的事情。”

他補充道,基本上,使用Flyte,開發人員編寫程式碼,然後在本地或遠端執行。

Union.ai首席機器學習工程師Niels Bantilan表示:“我們的論點是,軟體與機器學習有著根本的不同,儘管它們是相關的。在我們看來,軟體和機器學習之間的主要區別在於,軟體是無狀態的,另一方面,資料和模型一直在變化。”

Flyte是面向機器學習的編排器

“什麼是編排?以音樂類比,管絃樂隊中的指揮將是協調的中心點,它告訴每個部分的每個樂器何時演奏、如何演奏以及什麼是動態的,本質上,它是一個軟體編配器。工作流編排器在抽象層次上非常相似,在進行某些計算後進行協調,在執行某些資料時進行處理它從哪裡被推到哪裡,並從本質上協調整個系統以實現一些期望的行為。”

他認為,Flyte透過豐富的工具解決了這些問題。

Union.ai認為,一個好的資料和人工智慧編排器可以提供:

——管理和安全:RBAC、資料所有權、多租戶和排程。

——監控和視覺化:資料沿襲、資料視覺化、工作流視覺化、任務級觀察能力。

——效能和準確性:強型別介面,GPU加速,並行,產生信令。

——工作流效率:任務內檢查點;從故障中恢復;重新執行單個任務;快取;點/可搶佔例項;超時;動態資源配置;通知。

——靈活性:任務內檢查點;版本控制;依賴關係隔離;多雲支援。

Flyte實現了上面每一個要點。

Stein解釋道:“大多數編排器都不像Flyte那樣。Flyte是極少數真正超越Airflow等僅限資料的編排器的產品之一。例如,Airflow沒有快取,沒有任務內檢查點,實際上不是為ML管道而構建的。它是為資料管道而構建。”

他補充道,AWS的SageMaker也存在同樣的問題。

Flyte透過自動化基礎設施挑戰來工作。

Stein說:“並行和GPU之類的東西——你不必專門為Flyte編寫任何功能。這真的很重要,因為Flyte會自動完成這項工作,這樣你就不必在Python程式碼中輸入‘Please run in parallel,yada,yada、yada’,decorator會在任務級別上指定想要執行多少機器,或者需要多少計算。”

該雲原生編排平臺是在Kubernetes之上構建的,如果單獨執行Flyte,需要Kubernete工程師的幫助。

它不是ML運維工具,但…

Stein說,Flyte經常被誤認為是ML Ops工具。事實並非如此。

Stein說:“我們在Flyte上執行MLOps,這樣你就可以把權重和偏見、y日誌或任何想要的東西帶到一起,我們把這些東西連線在一起,讓它們完美地工作。這就是編排器的真正力量。”

他補充道,它確實可以讓你看到完整的機器學習工作流,其中一個工作流與另一個工作流掛鉤。Stein說,這確保了資料科學家能夠看到從開始到結束的一切。

Bantilan說:“你可能有一個資料團隊和一個分類模型團隊,一個預測模型團隊,他們都可以使用同一個平臺,也就是Flyte,在同一個工作空間裡一起工作,但仍然不會互相踩到。”

該開源工具還擁有50個整合,包括DataBricks和Anyscale with Ray。

Stein說:“我們無法訪問你的任何資料,這是最重要的。”

來自 “ 開源雲中文社群 ”, 原文作者:開源雲中文社群;原文連結:https://mp.weixin.qq.com/s/iE4wD8hjR6ETieBLzIz1qA,如有侵權,請聯絡管理員刪除。

相關文章