MySQL 線上DDL "gh-ost"
大表的DDL的變更大部分都是使用Percona的pt-online-schema-change,本文說明下另一種工具gh-ost的使用:不依賴於觸發器,是因為他是透過模擬從庫,在row binlog中獲取增量變更,再非同步應用到ghost表的。
1、下載安裝地址:
2、引數說明:gh-ost --help
Usage of gh-ost:
--aliyun-rds:是否在阿里雲資料庫上執行。true
--allow-master-master:是否允許gh-ost執行在雙主複製架構中,一般與-assume-master-host引數一起使用
--allow-nullable-unique-key:允許gh-ost在資料遷移依賴的唯一鍵可以為NULL,預設為不允許為NULL的唯一鍵。如果資料遷移(migrate)依賴的唯一鍵允許NULL值,則可能造成資料不正確,請謹慎使用。
--allow-on-master:允許gh-ost直接執行在主庫上。預設gh-ost連線的從庫。
--alter string:DDL語句
--approve-renamed-columns ALTER:如果你修改一個列的名字,gh-ost將會識別到並且需要提供重新命名列名的原因,預設情況下gh-ost是不繼續執行的,除非提供-approve-renamed-columns ALTER。
--ask-pass:MySQL密碼
--assume-master-host string:為gh-ost指定一個主庫,格式為”ip:port”或者”hostname:port”。在這主主架構裡比較有用,或則在gh-ost發現不到主的時候有用。
--assume-rbr:確認gh-ost連線的資料庫例項的binlog_format=ROW的情況下,可以指定-assume-rbr,這樣可以禁止從庫上執行stop slave,start slave,執行gh-ost使用者也不需要SUPER許可權。
--check-flag
--chunk-size int:在每次迭代中處理的行數量(允許範圍:100-100000),預設值為1000。
--concurrent-rowcount:該引數如果為True(預設值),則進行row-copy之後,估算統計行數(使用explain select count(*)方式),並調整ETA時間,否則,gh-ost首先預估統計行數,然後開始row-copy。
--conf string:gh-ost的配置檔案路徑。
--critical-load string:一系列逗號分隔的status-name=values組成,當MySQL中status超過對應的values,gh-ost將會退出。-critical-load Threads_connected=20,Connections=1500,指的是當MySQL中的狀態值Threads_connected>20,Connections>1500的時候,gh-ost將會由於該資料庫嚴重負載而停止並退出。
Comma delimited status-name=threshold, same format as --max-load. When status exceeds threshold, app panics and quits
--critical-load-hibernate-seconds int :負載達到critical-load時,gh-ost在指定的時間內進入休眠狀態。 它不會讀/寫任何來自任何伺服器的任何內容。
--critical-load-interval-millis int:當值為0時,當達到-critical-load,gh-ost立即退出。當值不為0時,當達到-critical-load,gh-ost會在-critical-load-interval-millis秒數後,再次進行檢查,再次檢查依舊達到-critical-load,gh-ost將會退出。
--cut-over string:選擇cut-over型別:atomic/two-step,atomic(預設)型別的cut-over是github的演算法,two-step採用的是facebook-OSC的演算法。
--cut-over-exponential-backoff
--cut-over-lock-timeout-seconds int:gh-ost在cut-over階段最大的鎖等待時間,當鎖超時時,gh-ost的cut-over將重試。(預設值:3)
--database string:資料庫名稱。
--debug:debug模式。
--default-retries int:各種操作在panick前重試次數。(預設為60)
--discard-foreign-keys:該引數針對一個有外來鍵的表,在gh-ost建立ghost表時,並不會為ghost表建立外來鍵。該引數很適合用於刪除外來鍵,除此之外,請謹慎使用。
--dml-batch-size int:在單個事務中應用DML事件的批次大小(範圍1-100)(預設值為10)
--exact-rowcount:準確統計表行數(使用select count(*)的方式),得到更準確的預估時間。
--execute:實際執行alter&migrate表,預設為noop,不執行,僅僅做測試並退出,如果想要ALTER TABLE語句真正落實到資料庫中去,需要明確指定-execute
--exponential-backoff-max-interval int
--force-named-cut-over:如果為true,則'unpostpone | cut-over'互動式命令必須命名遷移的表
--force-table-names string:在臨時表上使用的表名字首
--heartbeat-interval-millis int:gh-ost心跳頻率值,預設為500
--help
--hooks-hint string:任意訊息透過GH_OST_HOOKS_HINT注入到鉤子
--hooks-path string:hook檔案存放目錄(預設為empty,即禁用hook)。hook會在這個目錄下尋找符合約定命名的hook檔案來執行。
--host string :MySQL IP/hostname
--initially-drop-ghost-table:gh-ost操作之前,檢查並刪除已經存在的ghost表。該引數不建議使用,請手動處理原來存在的ghost表。預設不啟用該引數,gh-ost直接退出操作。
--initially-drop-old-table:gh-ost操作之前,檢查並刪除已經存在的舊錶。該引數不建議使用,請手動處理原來存在的ghost表。預設不啟用該引數,gh-ost直接退出操作。
--initially-drop-socket-file:gh-ost強制刪除已經存在的socket檔案。該引數不建議使用,可能會刪除一個正在執行的gh-ost程式,導致DDL失敗。
--master-password string :MySQL 主密碼
--master-user string:MysQL主賬號
--max-lag-millis int:主從複製最大延遲時間,當主從複製延遲時間超過該值後,gh-ost將採取節流(throttle)措施,預設值:1500s。
--max-load string:逗號分隔狀態名稱=閾值,如:'Threads_running=100,Threads_connected=500'. When status exceeds threshold, app throttles writes
--migrate-on-replica:gh-ost的資料遷移(migrate)執行在從庫上,而不是主庫上。
--nice-ratio float:每次chunk時間段的休眠時間,範圍[0.0…100.0]。0:每個chunk時間段不休眠,即一個chunk接著一個chunk執行;1:每row-copy 1毫秒,則另外休眠1毫秒;0.7:每row-copy 10毫秒,則另外休眠7毫秒。
--ok-to-drop-table:gh-ost操作結束後,刪除舊錶,預設狀態是不刪除舊錶,會存在_tablename_del表。
--panic-flag-file string:當這個檔案被建立,gh-ost將會立即退出。
--password string :MySQL密碼
--port int :MySQL埠,最好用從庫
--postpone-cut-over-flag-file string:當這個檔案存在的時候,gh-ost的cut-over階段將會被推遲,資料仍然在複製,直到該檔案被刪除。
--quiet:靜默模式。
--replica-server-id uint : gh-ost的server_id
--replication-lag-query string:棄用
--serve-socket-file string:gh-ost的socket檔案絕對路徑。
--serve-tcp-port int:gh-ost使用埠,預設為關閉埠。
--skip-foreign-key-checks:確定你的表上沒有外來鍵時,設定為'true',並且希望跳過gh-ost驗證的時間-skip-renamed-columns ALTER
--skip-renamed-columns ALTER:如果你修改一個列的名字(如change column),gh-ost將會識別到並且需要提供重新命名列名的原因,預設情況下gh-ost是不繼續執行的。該引數告訴gh-ost跳該列的資料遷移,讓gh-ost把重新命名列作為無關緊要的列。該操作很危險,你會損失該列的所有值。
--stack:新增錯誤堆疊追蹤。
--switch-to-rbr:讓gh-ost自動將從庫的binlog_format轉換為ROW格式。
--table string:表名
--test-on-replica:在從庫上測試gh-ost,包括在從庫上資料遷移(migration),資料遷移完成後stop slave,原表和ghost表立刻交換而後立刻交換回來。繼續保持stop slave,使你可以對比兩張表。
--test-on-replica-skip-replica-stop:當-test-on-replica執行時,該參數列示該過程中不用stop slave。
--throttle-additional-flag-file string:當該檔案被建立後,gh-ost操作立即停止。該引數可以用在多個gh-ost同時操作的時候,建立一個檔案,讓所有的gh-ost操作停止,或者刪除這個檔案,讓所有的gh-ost操作恢復。
--throttle-control-replicas string:列出所有需要被檢查主從複製延遲的從庫。
--throttle-flag-file string:當該檔案被建立後,gh-ost操作立即停止。該引數適合控制單個gh-ost操作。-throttle-additional-flag-file string適合控制多個gh-ost操作。
--throttle-http string
--throttle-query string:節流查詢。每秒鐘執行一次。當返回值=0時不需要節流,當返回值>0時,需要執行節流操作。該查詢會在資料遷移(migrated)伺服器上操作,所以請確保該查詢是輕量級的。
--timestamp-old-table:在舊錶名中使用時間戳。 這會使舊錶名稱具有唯一且無衝突的交叉遷移
--tungsten:告訴gh-ost你正在執行的是一個tungsten-replication拓撲結構。
--user string :MYSQL使用者
--verbose
--version
3、使用說明:條件是操作的MySQL上需要的binlog模式是ROW。如果在一個從上測試也必須是ROW模式,還要開啟log_slave_updates。根據上面的引數說明按照需求進行調整。
4、環境: 主庫:192.168.1.7 從庫:192.168.1.8
DDL過程:
① 檢查有沒有外來鍵和觸發器。
② 檢查表的主鍵資訊。
③ 檢查是否主庫或從庫,是否開啟log_slave_updates,以及binlog資訊
④ 檢查gho和del結尾的臨時表是否存在
⑤ 建立ghc結尾的表,存資料遷移的資訊,以及binlog資訊等
---以上校驗階段
⑥ 初始化stream的連線,新增binlog的監聽
---以下遷移階段
⑥ 建立gho結尾的臨時表,執行DDL在gho結尾的臨時表上
⑦ 開啟事務,按照主鍵id把源表資料寫入到gho結尾的表上,再提交,以及binlog apply。
---以下cut-over階段
⑧ lock源表,rename 表:rename 源表 to 源_del表,gho表 to 源表。
⑨ 清理ghc表。
一. 單例項上DDL: 單個例項相當於主庫,需要開啟--allow-on-master引數和ROW模式。
gh-ost --user="root" --password="root" --host=192.168.1.7 --database="test" --table="t1" --alter="ADD COLUMN cc2 varchar(10),add column cc3 int not null default 0 comment 'test' " --allow-on-master --execute
二. 主從上DDL:有2個選擇,一是按照1直接在主上執行同步到從上,另一個連線到從庫,在主庫做遷移(只要保證從庫的binlog為ROW即可,主庫不需要保證)
gh-ost --user="root" --password="root" --host=192.168.1.8 --database="test" --table="t" --initially-drop-old-table --alter="ADD COLUMN y1 varchar(10),add column y2 int not null default 0 comment 'test' " --execute
此時的操作大致是:
1、行資料在主庫上讀寫
2、讀取從庫的二進位制日誌,將變更應用到主庫
3、在從庫收集表格式,欄位&索引,行數等資訊
4、在從庫上讀取內部的變更事件(如心跳事件)
5、在主庫切換表
在執行DDL中,從庫會執行一次stop/start slave,要是確定從的binlog是ROW的話可以新增引數:--assume-rbr。如果從庫的binlog不是ROW,可以用引數--switch-to-rbr來轉換成ROW,此時需要注意的是執行完畢之後,binlog模式不會被轉換成原來的值。--assume-rbr和--switch-to-rbr引數不能一起使用。
三. 在從上進行DDL測試:
gh-ost --user="root" --password="root" --host=192.168.1.8 --database="test" --table="t" --alter="ADD COLUMN abc1 varchar(10),add column abc2 int not null default 0 comment 'test' " --test-on-replica --switch-to-rbr --execute
引數--test-on-replica:在從庫上測試gh-ost,包括在從庫上資料遷移(migration),資料遷移完成後stop slave,原表和ghost表立刻交換而後立刻交換回來。繼續保持stop slave,使你可以對比兩張表。如果不想stop slave,則可以再新增引數:--test-on-replica-skip-replica-stop
上面三種是gh-ost操作模式,上面的操作中,到最後不會清理臨時表,需要手動清理,再下次執行之前果然臨時表還存在,則會執行失敗,可以透過引數進行刪除:
1、--initially-drop-ghost-table:gh-ost操作之前,檢查並刪除已經存在的ghost表。該引數不建議使用,請手動處理原來存在的ghost表。預設不啟用該引數,gh-ost直接退出操作
2、--initially-drop-old-table:gh-ost操作之前,檢查並刪除已經存在的舊錶。該引數不建議使用,請手動處理原來存在的ghost表。預設不啟用該引數,gh-ost直接退出操作
3、--initially-drop-socket-file:gh-ost強制刪除已經存在的socket檔案。該引數不建議使用,可能會刪除一個正在執行的gh-ost程式,導致DDL失敗
4、--ok-to-drop-table:gh-ost操作結束後,刪除舊錶,預設狀態是不刪除舊錶,會存在_tablename_del表
還有其他的一些引數,比如:--exact-rowcount、--max-lag-millis、--max-load等等,可以看上面的說明,具體大部分常用的引數命令如下:
gh-osc --user= --password= --host= --database= --table= --max-load=Threads_running=30, --chunk-size=1000 --serve-socket-file=/tmp/gh-ost.test.sock --exact-rowcount --allow-on-master/--test-on-replica --initially-drop-ghost-table/--initially-drop-old-table/--initially-drop-socket-file --max-lag-millis= --max-load='Threads_running=100,Threads_connected=500' --ok-to-drop-table
四.額外說明:終止、暫停、限速
gh-ost --user="root" --password="root" --host=192.168.1.7 --database="test" --table="t1" --alter="ADD COLUMN o2 varchar(10),add column o1 int not null default 0 comment 'test' " --exact-rowcount --serve-socket-file=/tmp/gh-ost.t1.sock --panic-flag-file=/tmp/gh-ost.panic.t1.flag --postpone-cut-over-flag-file=/tmp/ghost.postpone.t1.flag --allow-on-master --execute
① 標示檔案終止執行:--panic-flag-file
建立檔案終止執行,例子中建立/tmp/gh-ost.panic.t1.flag檔案,終止正在執行的gh-ost,臨時檔案清理需要手動進行。
② 表示檔案禁止cut-over進行,即禁止表名切換,資料複製正常進行。--postpone-cut-over-flag-file
建立檔案延遲cut-over進行,即推遲切換操作。例子中建立/tmp/ghost.postpone.t1.flag檔案,gh-ost 會完成行復制,但並不會切換表,它會持續的將原表的資料更新操作同步到臨時表中。
③ 使用socket監聽請求,操作者可以在命令執行後更改相應的引數。--serve-socket-file,--serve-tcp-port(預設關閉)
建立socket檔案進行監聽,透過介面進行引數調整,當執行操作的過程中發現負載、延遲上升了,不得不終止操作,重新配置引數,如 chunk-size,然後重新執行操作命令,可以透過scoket介面進行動態調整。如:
暫停操作:
#暫停
echo throttle | socat - /tmp/gh-ost.test.t1.sock
#恢復
echo no-throttle | socat - /tmp/gh-ost.test.t1.sock
修改限速引數:
echo chunk-size=100 | socat - /tmp/gh-ost.t1.sock
echo max-lag-millis=200 | socat - /tmp/gh-ost.t1.sock
echo max-load=Thread_running=3 | socat - /tmp/gh-ost.t1.sock
結論:雖然gh-ost不需要觸發器,對於主庫的壓力和效能影響也小很多,但是針對高併發的場景進行DDL效率還是比pt-osc低,所以還是需要在業務低峰的時候處理。
封裝指令碼:gh-ost.py
#!/bin/env python
# -*- encoding: utf-8 -*-
#----------------------------------------------
# Purpose: gh-ost
# Created: 2018-06-16
#----------------------------------------------
import MySQLdb
import re
import sys
import time
import subprocess
import os
from optparse import OptionParser
def calc_time(func):
def _deco(*args, **kwargs):
begin_time = time.time()
func(*args, **kwargs)
cost_time = time.time() - begin_time
print 'cost time: %ss' % round(cost_time,2)
return _deco
def get_table_count(conn,dbname,tbname):
query = ''' SELECT count(*) FROM %s.%s ''' %(dbname,tbname)
cursor = conn.cursor()
cursor.execute(query)
row_nums = cursor.fetchone()
cursor.close()
conn.close()
return row_nums
def online_ddl(conn,ddl_cmd):
cursor = conn.cursor()
cursor.execute(ddl_cmd)
conn.commit()
cursor.close()
conn.close()
#@calc_time
def run_cmd(cmd):
p = subprocess.Popen(cmd, shell=True)
return p,p.pid
def drop_ghost_table(conn,ghost_name_list):
try:
cursor = conn.cursor()
query = ''' DROP TABLE IF EXISTS %s; ''' %(ghost_name_list)
cursor.execute(query)
conn.commit()
cursor.close()
conn.close()
except Exception,e:
print e
if __name__ == "__main__":
parser = OptionParser()
parser.add_option("-P", "--Port", help="Port for search", dest="port")
parser.add_option("-D", "--Dbname", help="the Dbname to use", dest="dbname")
parser.add_option("-T", "--Table", help="the Table to use", dest="tablename")
(options, args) = parser.parse_args()
if not options.port:
print 'params port need to apply'
exit()
if not options.dbname:
print 'params dbname need to apply'
exit()
if not options.tablename:
print 'params tablename need to apply'
exit()
gh_ost_socket = '/tmp/gh-ost.%s.%s.sock' %(options.dbname,options.tablename)
#終止標誌
panic_flag = '/tmp/gh-ost.panic.%s.%s.flag' %(options.dbname,options.tablename)
# postpone_flag = '/tmp/gh-ost.postpone.%s.%s.flag' %(options.dbname,options.tablename)
#暫停標誌
throttle_flag = '/tmp/gh-ost.throttle.%s.%s' %(options.dbname,options.tablename)
# socket = '/data/%s/tmp/mysql.sock' %(options.port)
socket = '/var/run/mysqld/mysqld.sock'
get_conn = MySQLdb.connect(host='192.168.163.131', port=int(options.port), user='root', passwd='root', db=options.dbname, unix_socket=socket,charset='utf8')
conn = MySQLdb.connect(host='192.168.163.131', port=int(options.port), user='root', passwd='root', db=options.dbname, unix_socket=socket,charset='utf8')
(table_count,) = get_table_count(get_conn,options.dbname,options.tablename)
print ("\033[0;32m%s\033[0m" % "表的數量:%s" %table_count)
DDL_CMD = raw_input('Enter DDL CMD : ').replace('`','')
gh_command_list = re.split('[ ]+',DDL_CMD)
if gh_command_list[0].upper() == 'CHANGE' and gh_command_list[1] != gh_command_list[2]:
print ("\033[0;31m%s\033[0m" % "renamed columns' data will be lost,pt-osc exit...")
exit()
if table_count <= 10000:
ddl = ''' ALTER TABLE %s %s ''' %(options.tablename,DDL_CMD)
print ("\033[0;36m%s\033[0m" %ddl)
print ("\033[0;32m%s\033[0m" % "online ddl ...")
online_ddl(conn,ddl)
print ("\033[0;32m%s\033[0m" % "執行完成 ...")
exit()
else:
MAX_LOAD = raw_input('Enter Max Threads_running【25】 : ')
if not MAX_LOAD:
Threads_running = 25
else:
try:
Threads_running = int(MAX_LOAD)
except ValueError:
print ("\033[0;31m%s\033[0m" % "輸入型別錯誤,退出...")
exit()
CHUNK_SIZE = raw_input('Enter Max chunk-size【1000】 : ')
if not CHUNK_SIZE:
chunk_size = 1000
else:
try:
chunk_size = int(CHUNK_SIZE)
except ValueError:
print ("\033[0;31m%s\033[0m" % "輸入型別錯誤,退出...")
exit()
print ("\033[0;32m%s\033[0m" % "gh-ost ddl ...")
#--postpone-cut-over-flag-file=%s
gh_command = '''/usr/bin/gh-ost --user="root" --password="root" --host=192.168.163.131 --port=%s --database="%s" --table="%s" --allow-on-master --max-load='Threads_running=%d' --chunk-size=%d --serve-socket-file=%s --panic-flag-file=%s --throttle-additional-flag-file=%s --alter="%s" --execute ''' %(options.port,options.dbname,options.tablename,Threads_running,chunk_size,gh_ost_socket,panic_flag,throttle_flag,DDL_CMD)
print ("\033[0;36m%s\033[0m" %gh_command)
child,pid = run_cmd(gh_command)
print ("\033[0;31mgh-ost's PID:%s\033[0m" %pid)
print ("\033[0;33m建立:【touch %s】檔案,暫停DDL ...\033[0m" %throttle_flag)
try:
child.wait()
except:
child.terminate()
#clean
ghost_name_list = '_%s_ghc,_%s_gho' %(options.tablename,options.tablename)
drop_ghost_table(conn,ghost_name_list)
if os.path.exists(gh_ost_socket):
os.system('rm -r %s' %gh_ost_socket)
print ("\033[0;32m%s\033[0m" % "清理完成 ...")
exit()
print ("\033[0;32m%s\033[0m" % "清理完成 ...")
exit()
finally :
pass
執行指令碼:
python gh-ost.py -P3306 -Dyoon -Thank
#!/bin/env python
# -*- encoding: utf-8 -*-
#----------------------------------------------
# Purpose: gh-ost
# Created: 2018-06-16
#----------------------------------------------
import MySQLdb
import re
import sys
import time
import subprocess
import os
from optparse import OptionParser
def calc_time(func):
def _deco(*args, **kwargs):
begin_time = time.time()
func(*args, **kwargs)
cost_time = time.time() - begin_time
print 'cost time: %ss' % round(cost_time,2)
return _deco
def get_table_count(conn,dbname,tbname):
query = ''' SELECT count(*) FROM %s.%s ''' %(dbname,tbname)
cursor = conn.cursor()
cursor.execute(query)
row_nums = cursor.fetchone()
cursor.close()
conn.close()
return row_nums
def online_ddl(conn,ddl_cmd):
cursor = conn.cursor()
cursor.execute(ddl_cmd)
conn.commit()
cursor.close()
conn.close()
#@calc_time
def run_cmd(cmd):
p = subprocess.Popen(cmd, shell=True)
return p,p.pid
def drop_ghost_table(conn,ghost_name_list):
try:
cursor = conn.cursor()
query = ''' DROP TABLE IF EXISTS %s; ''' %(ghost_name_list)
cursor.execute(query)
conn.commit()
cursor.close()
conn.close()
except Exception,e:
print e
if __name__ == "__main__":
parser = OptionParser()
parser.add_option("-P", "--Port", help="Port for search", dest="port")
parser.add_option("-D", "--Dbname", help="the Dbname to use", dest="dbname")
parser.add_option("-T", "--Table", help="the Table to use", dest="tablename")
parser.add_option("-H", "--host", help="the host to use", dest="host")
(options, args) = parser.parse_args()
if not options.port:
print 'params port need to apply'
exit()
if not options.dbname:
print 'params dbname need to apply'
exit()
if not options.tablename:
print 'params tablename need to apply'
exit()
if not options.host:
print 'params host need to apply'
exit()
gh_ost_socket = '/tmp/gh-ost.%s.%s.sock' %(options.dbname,options.tablename)
#終止標誌
panic_flag = '/tmp/gh-ost.panic.%s.%s.flag' %(options.dbname,options.tablename)
# postpone_flag = '/tmp/gh-ost.postpone.%s.%s.flag' %(options.dbname,options.tablename)
#暫停標誌
throttle_flag = '/tmp/gh-ost.throttle.%s.%s' %(options.dbname,options.tablename)
# socket = '/data/%s/tmp/mysql.sock' %(options.port)
socket = '/var/run/mysqld/mysqld.sock'
get_conn = MySQLdb.connect(host=options.host, port=int(options.port), user='yoon', passwd='yoon123!@#', db=options.dbname, unix_socket=socket,charset='utf8')
conn = MySQLdb.connect(host=options.host, port=int(options.port), user='yoon', passwd='yoon123!@#', db=options.dbname, unix_socket=socket,charset='utf8')
(table_count,) = get_table_count(get_conn,options.dbname,options.tablename)
print ("\033[0;32m%s\033[0m" % "表的數量:%s" %table_count)
DDL_CMD = raw_input('Enter DDL CMD : ').replace('`','')
gh_command_list = re.split('[ ]+',DDL_CMD)
if gh_command_list[0].upper() == 'CHANGE' and gh_command_list[1] != gh_command_list[2]:
print ("\033[0;31m%s\033[0m" % "renamed columns' data will be lost,pt-osc exit...")
exit()
if table_count <= 10000:
ddl = ''' ALTER TABLE %s %s ''' %(options.tablename,DDL_CMD)
print ("\033[0;36m%s\033[0m" %ddl)
print ("\033[0;32m%s\033[0m" % "online ddl ...")
online_ddl(conn,ddl)
print ("\033[0;32m%s\033[0m" % "執行完成 ...")
exit()
else:
MAX_LOAD = raw_input('Enter Max Threads_running【25】 : ')
if not MAX_LOAD:
Threads_running = 25
else:
try:
Threads_running = int(MAX_LOAD)
except ValueError:
print ("\033[0;31m%s\033[0m" % "輸入型別錯誤,退出...")
exit()
CHUNK_SIZE = raw_input('Enter Max chunk-size【1000】 : ')
if not CHUNK_SIZE:
chunk_size = 1000
else:
try:
chunk_size = int(CHUNK_SIZE)
except ValueError:
print ("\033[0;31m%s\033[0m" % "輸入型別錯誤,退出...")
exit()
print ("\033[0;32m%s\033[0m" % "gh-ost ddl ...")
#--postpone-cut-over-flag-file=%s
gh_command = '''/usr/bin/gh-ost --user="yoon" --password="yoon123!@#" --host="%s" --port=%s --database="%s" --table="%s" --allow-on-master --max-load='Threads_running=%d' --chunk-size=%d --serve-socket-file=%s --panic-flag-file=%s --throttle-additional-flag-file=%s --alter="%s" --execute ''' %(options.host,options.port,options.dbname,options.tablename,Threads_running,chunk_size,gh_ost_socket,panic_flag,throttle_flag,DDL_CMD)
print ("\033[0;36m%s\033[0m" %gh_command)
child,pid = run_cmd(gh_command)
print ("\033[0;31mgh-ost's PID:%s\033[0m" %pid)
print ("\033[0;33m建立:【touch %s】檔案,暫停DDL ...\033[0m" %throttle_flag)
try:
child.wait()
except:
child.terminate()
#clean
ghost_name_list = '_%s_ghc,_%s_gho' %(options.tablename,options.tablename)
drop_ghost_table(conn,ghost_name_list)
if os.path.exists(gh_ost_socket):
os.system('rm -r %s' %gh_ost_socket)
print ("\033[0;32m%s\033[0m" % "清理完成 ...")
exit()
print ("\033[0;32m%s\033[0m" % "清理完成 ...")
exit()
finally :
pass
執行:
python gh-ost.py -H192.168.1.7 -P3306 -Dyoon -Thank
總結:
gh-ost 放棄了觸發器,使用 binlog 來同步。gh-ost 作為一個偽裝的備庫,可以從主庫/備庫上拉取 binlog,過濾之後重新應用到主庫上去,相當於主庫上的增量操作透過 binlog 又應用回主庫本身,不過是應用在幽靈表上。
gh-ost 首先連線到主庫上,根據 alter 語句建立幽靈表,然後作為一個”備庫“連線到其中一個真正的備庫上,一邊在主庫上複製已有的資料到幽靈表,一邊從備庫上拉取增量資料的 binlog,然後不斷的把 binlog 應用回主庫。圖中 cut-over 是最後一步,鎖住主庫的源表,等待 binlog 應用完畢,然後替換 gh-ost 表為源表。gh-ost 在執行中,會在原本的 binlog event 裡面增加以下 hint 和心跳包,用來控制整個流程的進度,檢測狀態等。這種架構帶來諸多好處,例如:
整個流程非同步執行,對於源表的增量資料操作沒有額外的開銷,高峰期變更業務對效能影響小。
降低寫壓力,觸發器操作都在一個事務內,gh-ost 應用 binlog 是另外一個連線在做。
可停止,binlog 有位點記錄,如果變更過程發現主庫效能受影響,可以立刻停止拉binlog,停止應用 binlog,穩定之後繼續應用。
可測試,gh-ost 提供了測試功能,可以連線到一個備庫上直接做 Online DDL,在備庫上觀察變更結果是否正確,再對主庫操作,心裡更有底。
參考文件:
線上DDL工具gh-ost安裝文件.md
https://www.cnblogs.com/zhoujinyi/p/9187421.html
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28939273/viewspace-2703145/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- MySQL線上DDL工具 gh-ostMySql
- mysql 原生 線上DDL 的bug .MySql
- MySQL5.7 InnoDB線上DDL操作MySql
- 線上更改MySQL表結構工具gh-ost的特點介紹MySql
- MySQL5.6 Online DDL線上狀態總結MySql
- 一個 MySQL 線上 DDL 工具 — pt-online-schema-changeMySql
- MySQL DDL操作表MySql
- gh-ost安裝
- MySQL DDL執行方式-Online DDL介紹MySql
- 對比上次MySQL的DDLMySql
- MySQL Online DDL 概述MySql
- Limitations of Online DDL for MySQLMITMySql
- gh-ost的學習
- 【實驗】【MySQL】MySQL的DDL語言演示MySql
- 【MySQL】gh-ost改雙主表結構主鍵衝突問題MySql
- mysql DDL時鎖表的排查MySql
- 詳談 MySQL 8.0 原子 DDL 原理MySql
- MySQL - DDL詳解(Data Definition Language)MySql
- ORACLE表生成MYSQL建表DDLOracleMySql
- MySQL 5.7 Online DDL OverviewMySqlView
- Mysql 基礎操作 DDL DML DCLMySql
- mysql online ddl的演化MySql
- 04 MySQL 表的基本操作-DDLMySql
- MySQL Online DDL詳解MySql
- MySQL之資料定義語言(DDL)MySql
- MySQL全面瓦解4:資料定義-DDLMySql
- MySQL 常用DDL執行方式總結MySql
- MySQL 5.6 Online DDL.mdMySql
- MySQL的DDL和DML操作語法MySql
- 【Mysql】MySQL 5.6中如何定位DDL被阻塞的問題MySql
- mysql之 openark-kit online ddlMySql
- MySQL(十三)DDL之庫和表的管理MySql
- MySQL 5.7 online DDL特性介紹MySql
- 【MySQL】online ddl 思維導圖MySql
- MySQL入門---(一)SQL的DDL語句MySql
- MySQL 中如何定位 DDL 被阻塞的問題MySql
- MySQL & MariaDB Online DDL 參考指南MySql
- 【Mysql】Mysql線上安裝其它引擎MySql