Pgloader極簡教程

Naylor發表於2024-11-20

原文網址 : https://www.cnblogs.com/Naylor/p/18556038

簡介
安裝
- 安裝概述
- CentOS編譯安裝
使用
- 命令列
- 配置檔案遷移
- 可能遇到的錯誤
- 更多配置參考
總結
引用

簡介

pgloader是一個資料同步工具，用來將資料從其它地方遷移到postgresql中，支援從如下源遷移：

檔案：CSV、Fixed Format、Postgres COPY text format、DBF、IXF
資料庫系統：SQLite、MySql、MSSQLServer、PostgreSQL、Redshift

應用場景

需要往postgresql中匯入資料的時候，如資料遷移。

安裝

安裝概述

安裝方式比較豐富，詳見 https://pgloader.readthedocs.io/en/latest/install.html 。

遺憾的是未提供CentOS環境編譯好的程式供下載，所以需要手動編譯安裝。

CentOS編譯安裝

去官網下載最新原始碼：

https://github.com/dimitri/pgloader

將原始碼放到 /usr/bin下，本文為例：


[root@bogon pgloader-3.6.9]# pwd
/usr/local/pgloader-3.6.9

如果下載的是原始碼壓縮包需要使用如下命令解壓：


tar -zxvf pgloader-3.6.9.tar.gz

賦予指令碼執行許可權：

cd /usr/local/pgloader-3.6.9


chmod -R 777 *

執行 bootstrap-centos7.sh 指令碼，下載相關依賴


bootstrap-centos7.sh

執行編譯：


make  pgloader

如果有提示到 ("libcrypto.so.1.1" "libcrypto.so.1.0.0" "libcrypto.so.3" "libcrypto.so") 沒有找到或者相關資訊
需要先安裝 openssl


yum -y install openssl openssl-devel

複製編譯好的程式到系統執行目錄 /usr/local/bin/ 下


cp  /usr/local/pgloader-3.6.9/build/bin/pgloader        /usr/local/bin/

檢視是否安裝好了：


[root@bogon home]# pgloader --version
pgloader version "3.6.7~devel"
compiled with SBCL 2.2.5

使用

pgloader 有兩種常見的使用方式：

透過命令列
透過遷移配置檔案

命令列

如下命令列：

pgloader mysql://user:password@ip:3306/dbName postgresql://user:password@ip:5432/dbName

將名為dbName的資料庫結構和資料從mysql遷移到postgresql
pgloader 為上述 /usr/local/bin/pgloader 的可執行檔案
後面是mysql 的連線資訊， postgresql 的連線資訊，中間使用空格分隔
需要使用有寫入許可權的賬號，建議使用root使用者操作

配置檔案遷移

另外一種方式就是編寫遷移配置檔案，然後使用 pgloader sync.load 命令執行配置檔案。

如下配置檔案演示了僅同步mysql的source_db庫中的ramble_doc 表到 postgresql中的target_db庫中，執行完畢之後將在postgresql中新建一個名為ramble_doc 的表，並新增資料。

LOAD DATABASE
     FROM     mysql://root:xxx@192.168.1.92:3306/source_db
     INTO     postgresql://postgres:xxx@192.168.1.24:5432/target_db

INCLUDING ONLY TABLE NAMES matching 'ramble_doc' ;

LOAD DATABASE ：表示從資料庫執行遷移
FROM ：源資料庫連線資訊
INTO ：目標資料庫連線資訊
INCLUDING ONLY TABLE NAMES matching ：僅包含匹配的表
最後那個分號不可少
配置檔案需要按照格式編寫，如縮排

如下配置檔案演示了同步mysql 的source_db庫下所有表到postgresql的target_db庫下面，包含表結構和資料。

LOAD DATABASE
     FROM     mysql://root:xxx@192.168.1.92:3306/source_db
     INTO     postgresql://postgres:xxx@192.168.1.24:5432/target_db
     WITH batch rows = 10000 , batch size =200MB , prefetch rows  = 5000 , workers = 4 ,concurrency = 3
;

WITH：with 後面可以追加一些附屬引數，各個引數使用英文逗號分隔。常見的引數如：是否需要同步資料還是僅同步結構，是否在寫入資料前先刪除表等
batch rows ：在同步資料的時候分批插入postgresql的行數，預設為2.5萬。
batch size：每批最大資料大小，設定此引數可避免出現記憶體溢位
prefetch rows：在同步資料的時候分批從mysql讀取的行數，預設為1000。
workders：執行緒數量
concurrency：併發執行緒數量

可能遇到的錯誤

記憶體溢位

報錯資訊為：


Heap exhausted during garbage collection: 64 bytes available, 80 requested.


垃圾回收期間堆已耗盡：可用64個位元組，請求80個位元組。

解決方案為調優分批數量和併發數量，需要根據源資料庫資料量，硬體情況不斷嘗試。

總結

pgloader是一個資料庫遷移工具，花一點點時間研究一下如何使用，將在資料庫遷移的時候起到事半功倍的效果，往往比自己編寫遷移指令碼更加完善和可靠。

引用

官網：https://pgloader.readthedocs.io/en/latest/
github：https://github.com/dimitri/pgloader

Nginx 極簡教程
2019-03-14
Nginx
SpringCloudStream極簡教程
2024-12-06
SpringGCCloud
Rust極簡教程
2022-03-29
Rust
Nacos極簡教程
2022-02-12
阿里DataX極簡教程
2024-05-16
阿里
Rust-Sqlx極簡教程
2022-03-28
RustSQL
AI 繪畫極簡教程
2022-07-04
AI
Shell程式設計——極簡教程
2018-04-08
程式設計
dockerfile-maven-plugin極簡教程
2020-10-12
DockerMavenPlugin
pgloader2.3.2使用
2018-04-04
極簡程式碼神器：Lombok使用教程
2019-10-10
Lombok
python極簡教程08：物件的方法
2022-01-20
Python物件
vue-router路由之路-極簡教程
2022-12-15
Vue路由
rhel7 pgloader使用
2018-04-12
Flink安裝極簡教程-單機版
2019-01-29
極簡Typescript+Node.js 安裝教程
2018-12-25
TypeScriptNode.js
python極簡教程01：基礎變數
2021-12-31
Python變數
最強人工智慧 OpenAI 極簡教程
2022-07-12
人工智慧OpenAI
Java執行緒池ThreadPoolExecutor極簡教程
2022-05-25
Java執行緒thread
Python 從入門到爬蟲極簡教程
2019-02-16
Python爬蟲
python極簡教程06：生成式和裝飾器
2022-01-14
Python
Spring Boot 整合 Activiti 工作流引擎極簡教程
2021-06-24
Spring Boot
python極簡教程07：封裝、多型和繼承
2022-01-17
Python封裝多型繼承
python極簡教程05：生成器和匿名函式
2022-01-12
Python函式
內網穿透教程，簡單，便捷，極速穿透內網埠
2020-11-28
內網穿透
極簡教程！教你快速將K3s與Cloud Controller整合
2020-04-20
CloudController
超實用的 Nginx 極簡教程，覆蓋了常用場景
2019-04-28
Nginx
dingo 極簡 Transformer
2019-05-21
GoORM
想讀Spring原始碼？先從這篇「極簡教程」開始吧...
2020-04-07
Spring原始碼
SpringBoot極簡整合Shiro
2019-07-12
Spring Boot
Java JMS 極簡演示
2021-06-23
Java
Elasticsearch 極簡入門
2020-11-25
Elasticsearch
自制 os 極簡教程1：寫一個作業系統有多難
2020-11-13
作業系統
極簡Kotlin-For-Android(一)
2018-12-19
KotlinAndroid
一個極簡的RePlugin
2018-07-09
Plugin
Flutter 極簡 App 程式碼簡單解讀
2020-05-29
FlutterAPP
Virtual Dom && Diff原理，極簡版
2019-02-28
Mac極簡軟體清單
2019-01-15
Mac

Pgloader極簡教程

簡介

安裝

安裝概述

CentOS編譯安裝

使用

命令列

配置檔案遷移

可能遇到的錯誤

更多配置參考

總結

引用

相關文章