ploomber:建立ML資料管道的最有效率方式
Jupyter等開發工具在資料科學家中很流行,因為它們提供了一個環境以視覺化和互動方式探索資料。但是,在部署專案時,我們必須確保分析能夠在 Airflow 或 Argo 等生產環境中可靠執行;這導致資料科學家在他們的notebooks和這些生產工具之間來回移動程式碼。
此外,資料科學家必須花時間學習不熟悉的框架和編寫管道程式碼,這嚴重延遲了部署過程。
Ploomber 透過提供以下解決方案來解決這個問題:
- 使用靜態分析自動推斷任務執行順序的工作流編排器。
- 引導專案的合理佈局。
- 與 Jupyter 整合的開發環境。
- 無需更改程式碼即可匯出到生產系統(Kubernetes、Airflow 和 AWS Batch)的能力。
Ploomber是構建資料管道的最快方法。使用您最喜歡的編輯器(Jupyter、VSCode、PyCharm)進行互動式開發和部署,無需更改程式碼。你在用傳統notebooks嗎?ploomber只需一個命令就可以將它們重構為在Kubernetes、Airflow、AWS Batch中執行模組化管道。
特點:
- 一個簡單的 YAML API 可以快速上手,一個強大的 Python API 可以提供完全的靈活性。
- 自動快取管道以前的結果,並且僅重新計算自上次執行以來已更改的任務。
- 在單臺機器上作為 shell 指令碼執行,或者在Kubernetes、Airflow、AWS Batch或SLURM中分散式執行。
- 從舊版notebooks自動遷移,會自動將它們轉換為可維護的模組化管道。
- 使用 Ploomber 可在 30 分鐘內開發和部署機器學習管道
相關文章
- Kafka聯結器建立資料管道Kafka
- mysql資料庫的檔案建立方式MySql資料庫
- 資料就是最有價值的資產
- 2.5.8 指定OMF方式建立資料庫資料庫
- ML-資料分析模板
- 演算法鏈與管道(上):建立管道演算法
- Spark ML包,資料探勘示例資料AffairsSparkAI
- 《Python Cookbook 3rd》筆記(4.13):建立資料處理管道Python筆記
- 大資料基礎教程:建立RDD的二種方式大資料
- 資料管道架構概述架構
- 15個全球最有影響力的大資料公司大資料
- 12c 簡單至極的靜默方式建立資料庫資料庫
- msyql 同步管道方式快速匯入redisRedis
- 資料視覺化最有價值的50個圖表視覺化
- 靜默方式安裝、升級oracle(二): 建立資料庫Oracle資料庫
- 【手工建庫】手工方式建立 ORACLE資料庫全程記錄Oracle資料庫
- 如何提升SQLServer Delete資料的效率SQLServerdelete
- MySQL:JDBC批量插入資料的效率MySqlJDBC
- 資料庫的優化和效率資料庫優化
- 優化資料庫EXP的效率優化資料庫
- 什麼是冪等資料管道? - Alaro
- 迭代器,迭代器塊和資料管道
- Laravel指東:使用模型建立 uuid 主鍵資料的兩種方式Laravel模型UI
- 資料科學和 ML 領域常用的 Python 庫資料科學Python
- Mac下提升工作效率的方式Mac
- JavaScript 建立物件的方式JavaScript物件
- js建立物件的方式JS物件
- MongoDB 聚合嵌入的陣列(扁平化資料+管道)MongoDB陣列
- Oracle安裝軟體及建立資料庫(字元安裝方式)Oracle資料庫字元
- python--建立一個與已有DataFrame行數相同的資料框的方式Python
- 使用 csv 匯入的方式在 SAP S/4HANA 裡建立 employee 資料
- Linux大檔案重定向和管道的效率對比總結Linux
- 如何提升scrapy爬取資料的效率
- 資料庫的最佳化和效率資料庫
- MYSQL CPU部分單核佔滿會影響建立資料庫連線效率?MySql單核資料庫
- 程式設計優化之管道資料流程式設計優化
- Flutter——ListView的建立方式FlutterView
- Seam @Name 建立元件的方式?元件