ploomber:建立ML資料管道的最有效率方式
Jupyter等開發工具在資料科學家中很流行,因為它們提供了一個環境以視覺化和互動方式探索資料。但是,在部署專案時,我們必須確保分析能夠在 Airflow 或 Argo 等生產環境中可靠執行;這導致資料科學家在他們的notebooks和這些生產工具之間來回移動程式碼。
此外,資料科學家必須花時間學習不熟悉的框架和編寫管道程式碼,這嚴重延遲了部署過程。
Ploomber 透過提供以下解決方案來解決這個問題:
- 使用靜態分析自動推斷任務執行順序的工作流編排器。
- 引導專案的合理佈局。
- 與 Jupyter 整合的開發環境。
- 無需更改程式碼即可匯出到生產系統(Kubernetes、Airflow 和 AWS Batch)的能力。
Ploomber是構建資料管道的最快方法。使用您最喜歡的編輯器(Jupyter、VSCode、PyCharm)進行互動式開發和部署,無需更改程式碼。你在用傳統notebooks嗎?ploomber只需一個命令就可以將它們重構為在Kubernetes、Airflow、AWS Batch中執行模組化管道。
特點:
- 一個簡單的 YAML API 可以快速上手,一個強大的 Python API 可以提供完全的靈活性。
- 自動快取管道以前的結果,並且僅重新計算自上次執行以來已更改的任務。
- 在單臺機器上作為 shell 指令碼執行,或者在Kubernetes、Airflow、AWS Batch或SLURM中分散式執行。
- 從舊版notebooks自動遷移,會自動將它們轉換為可維護的模組化管道。
- 使用 Ploomber 可在 30 分鐘內開發和部署機器學習管道
相關文章
- Kafka聯結器建立資料管道Kafka
- 2.5.8 指定OMF方式建立資料庫資料庫
- 《Python Cookbook 3rd》筆記(4.13):建立資料處理管道Python筆記
- 演算法鏈與管道(上):建立管道演算法
- 大資料基礎教程:建立RDD的二種方式大資料
- ML-資料分析模板
- 資料管道架構概述架構
- Laravel指東:使用模型建立 uuid 主鍵資料的兩種方式Laravel模型UI
- msyql 同步管道方式快速匯入redisRedis
- python--建立一個與已有DataFrame行數相同的資料框的方式Python
- 靜默方式安裝、升級oracle(二): 建立資料庫Oracle資料庫
- 資料視覺化最有價值的50個圖表視覺化
- JavaScript 建立物件的方式JavaScript物件
- js建立物件的方式JS物件
- 如何提升SQLServer Delete資料的效率SQLServerdelete
- MySQL:JDBC批量插入資料的效率MySqlJDBC
- Linux大檔案重定向和管道的效率對比總結Linux
- 什麼是冪等資料管道? - Alaro
- MongoDB 聚合嵌入的陣列(扁平化資料+管道)MongoDB陣列
- 使用 csv 匯入的方式在 SAP S/4HANA 裡建立 employee 資料
- SpringBoot注入資料的方式Spring Boot
- MYSQL CPU部分單核佔滿會影響建立資料庫連線效率?MySql單核資料庫
- 如何提升scrapy爬取資料的效率
- 程式設計優化之管道資料流程式設計優化
- Flutter——ListView的建立方式FlutterView
- iPaas資料傳輸的方式
- ETL的資料脫敏方式
- 如何建立良好的資料模型?模型
- 建立資料庫資料庫
- Amazon Redshift簡化資料管道背後的技術邏輯
- 實戰 | 使用 Kotlin Flow 構建資料流 "管道"Kotlin
- 資料導向下製造業的生產效率、交易效率提升辦法
- NSTimer的八種建立方式
- java建立物件的五種方式Java物件
- Java 建立類的四種方式Java
- Map的某種建立方式
- JavaScript物件與建立物件的方式JavaScript物件
- jdk建立執行緒的方式JDK執行緒