概述
快照代理準備已釋出表的架構和初始資料檔案以及其他物件、儲存快照檔案並記錄分發資料庫中的同步資訊。 快照代理在分發伺服器上執行;SQLServer2016版本對快照代理做了一些比較好的優化,接下來詳細瞭解一下快照的執行過程。
一、快照代理檔案
在執行快照作業是會在指定的快照目錄生成4種型別的檔案。
BCP檔案:釋出物件的資料檔案。
IDX檔案:索引建立指令碼檔案
PRE檔案:複製快照指令碼檔案。
SCH檔案:架構建立指令碼檔案
二、預設快照代理配置檔案
-BcpBachSize:每一次執行bcp操作copy的最大記錄行數,預設是10萬行。
-HistoryVerboseLevel:指定在快照操作過程中記錄的歷史記錄大小。
-LoginTimeout:登入超時前等待的秒數。 預設值為 15 秒。
-QueryTimeOut:查詢超時前等待的秒數。預設值為 1800 秒
備註:通過右鍵快照代理-快照代理配置檔案;可以配置快照代理。
三、對比不同版本快照代理
接下來測試對比2億的記錄表生成快照
1.bcp檔案數量對比
2008R2
2016SP1
這裡重點說一下BCP檔案,因為應用快照到訂閱伺服器是以BCP檔案為基本單位,也就是說不管你的BCP檔案有多大都是一次性bulk到訂閱伺服器,所以BCP檔案越大每次應用的時間就會越長。如果一個BCP檔案太大可能會導致插入到訂閱端失敗。
從上圖可以看到同樣是2億的記錄,2008R2總共有8個BCP檔案,而且最大的BCP檔案大小將近1G其它的都才幾兆;2016有16個BCP檔案,並且前15個都是50M左右資料比較均勻。接下來看下圖的每個BCP檔案的記錄對比。
2.快照生成詳細過程對比
2008r2
2016SP1
從生成的BCP檔案記錄對比來看:
2008R2:前7個檔案每個檔案記錄數大概70萬左右,最後一個檔案記錄1.1億。
2016:前15個檔案每個檔案記錄700萬左右,最後一個檔案78萬。
說明:
2008R2前7個檔案每個檔案大概儲存的記錄量是70萬剩下的記錄都會儲存到最後一個檔案,所以2008R2比較適合的表記錄數是600萬左右。
2016前15個檔案每個檔案大概儲存的記錄量是700萬剩下的記錄都會儲存到最後一個檔案,2016適合的表記錄數1.2億左右。
共同缺點:表記錄超過“適合的複製表記錄數”後剩下資料會全部儲存到最後個bcp檔案中。
3.分發對比
接下來看一下分發的詳細過程
從2008R2分發記錄過程中可以看到每次BULK都是以bcp檔案為單位,複製最後一個bcp檔案花費了大概22分鐘,而前面的每個檔案都是十幾秒;還是由於我當前的表只有三個欄位而且除了主鍵沒有索引否則的時間就更長了。
四、快照生成過程
複製快照代理是一個可執行檔案,用於準備快照檔案(其中包含已釋出表和資料庫物件的架構及資料),然後將這些檔案儲存在快照資料夾中,並在分發資料庫中記錄同步作業。
從上圖可以瞭解整個快照的生成過程。
五、語法
snapshot [ -?] -Publisher server_name[\instance_name] -Publication publication_name [-70Subscribers] [-BcpBatchSize bcp_batch_size] [-DefinitionFile def_path_and_file_name] [-Distributor server_name[\instance_name]] [-DistributorDeadlockPriority [-1|0|1] ] [-DistributorLogin distributor_login] [-DistributorPassword distributor_password] [-DistributorSecurityMode [0|1] ] [-DynamicFilterHostName dynamic_filter_host_name] [-DynamicFilterLogin dynamic_filter_login] [-DynamicSnapshotLocation dynamic_snapshot_location] [-EncryptionLevel [0|1|2]] [-FieldDelimiter field_delimiter] [-HistoryVerboseLevel [0|1|2|3] ] [-HRBcpBlocks number_of_blocks ] [-HRBcpBlockSize block_size ] [-HRBcpDynamicBlocks ] [-KeepAliveMessageInterval keep_alive_interval] [-LoginTimeOut login_time_out_seconds] [-MaxBcpThreads number_of_threads ] [-MaxNetworkOptimization [0|1]] [-Output output_path_and_file_name] [-OutputVerboseLevel [0|1|2] ] [-PacketSize packet_size] [-ProfileName profile_name] [-PublisherDB publisher_database] [-PublisherDeadlockPriority [-1|0|1] ] [-PublisherFailoverPartner server_name[\instance_name] ] [-PublisherLogin publisher_login] [-PublisherPassword publisher_password] [-PublisherSecurityMode [0|1] ] [-QueryTimeOut query_time_out_seconds] [-ReplicationType [1|2] ] [-RowDelimiter row_delimiter] [-StartQueueTimeout start_queue_timeout_seconds] [-UsePerArticleContentsView use_per_article_contents_view]
引數
-?
輸出所有可用的引數。
-Publisher server_name[\instance_name]
釋出伺服器的名稱。 為該伺服器上的 Microsoft SQL Server 預設例項指定 server_name。 為該伺服器上的 server_name\instance_name instance_name SQL Server 預設例項指定 server_name。
-Publication 釋出
釋出的名稱。 只有將釋出設定為總是使快照可用於新訂閱或重新初始化的訂閱時,此引數才有效。
-70Subscribers
如果有任何訂閱伺服器在執行 SQL Server 7.0 版,則必須使用此引數。
-BcpBatchSize bcp batch\ size
在一次大容量複製操作中傳送的行數。 執行 bcp in 操作時,批的大小為要作為一個事務傳送到伺服器的行數,並且也是分發代理記錄 bcp 進度訊息之前必須傳送的行數。 當執行 bcp out 操作時,將使用固定批大小 1000。 值為 0 表示不記錄任何訊息。
-DefinitionFile def_path_and_file_name
代理定義檔案的路徑。 代理定義檔案中包含該代理的命令列引數。 檔案的內容被當作可執行檔案進行分析。 使用雙引號 (") 指定包含任意字元的引數值。
-Distributor server_name[\instance_name]
分發伺服器名稱。 為該伺服器上的 預設例項指定 server_name SQL Server 。 為該伺服器上的 server_name\instance_name instance_name SQL Server 預設例項指定 server_name。
-DistributorDeadlockPriority [-1|0|1]
死鎖發生時快照代理連線到分發伺服器的優先順序。 指定此引數是為了解決快照生成期間在快照代理和使用者應用程式之間發生的死鎖問題。
DistributorDeadlockPriority 值 |
說明 |
-1 |
在分發伺服器上發生死鎖時,應用程式而非快照代理優先。 |
0 (預設值) |
未分配優先順序。 |
1 |
在分發伺服器上發生死鎖時,快照代理優先。 |
-DistributorLogin distributor_login
使用 SQL Server 身份驗證連線到分發伺服器時所用的登入名。
-DistributorPassword distributor_password
使用 SQL Server 身份驗證連線到分發伺服器時使用的密碼。 。
-DistributorSecurityMode [ 0| 1]
指定分發伺服器的安全模式。 值 0 指示 SQL Server 身份驗證模式(預設設定),值 1 指示 Windows 身份驗證模式。
-DynamicFilterHostName dynamic_filter_host_name
在建立動態快照時,用來為篩選中的 HOST_NAME (Transact-SQL) 設定值。 例如,如果為專案指定了子集篩選器子句 rep_id =
HOST_NAME() ,並且在呼叫合併代理之前將 DynamicFilterHostName 屬性設定為“FBJones”,則只會複製 rep_id 列中具有“FBJones”的行。
-DynamicFilterLogin dynamic_filter_login
在建立動態快照時,用來為篩選中的 SUSER_SNAME (Transact-SQL) 設定值。 例如,如果為專案指定了子集篩選器子句 user_id =
SUSER_SNAME() ,並且在呼叫 SQLSnapshot 物件的 Run 方法之前將 DynamicFilterLogin 屬性設定為“rsmith”,則只將 user_id 列中具有“rsmith”的行包括在快照中。
-DynamicSnapshotLocation dynamic_snapshot_location
應生成動態快照的位置。
-EncryptionLevel [ 0 | 1 | 2 ]
建立連線時快照代理使用的安全套接字層 (SSL) 加密的等級。
EncryptionLevel 值 |
說明 |
0 |
指定不使用 SSL。 |
1 |
指定使用 SSL,但是代理不驗證 SSL 伺服器證照是否已由可信的頒發者進行簽名。 |
2 |
指定使用 SSL,並驗證證照。 |
-FieldDelimiter field_delimiter
在 SQL Server 大容量複製資料檔案中用於標記欄位末尾的字元或字元序列。 預設值為 \n<x$3>\n。
-HistoryVerboseLevel [ 1| 2| 3]
指定在快照操作過程中記錄的歷史記錄大小。 選擇 1可將歷史日誌記錄對效能的影響減至最小。
HistoryVerboseLevel 值 |
說明 |
0 |
進度訊息將寫入控制檯或輸出檔案。 不在分發資料庫中記錄歷史記錄。 |
1 |
總是更新具有相同狀態(啟動、進行中、成功等)的上一歷史記錄訊息。 如果不存在狀態相同的上一記錄,將插入新記錄。 |
2 (預設值) |
除非記錄為空閒訊息或長時間執行的作業訊息等資訊(此時將更新上一記錄),否則插入新的歷史記錄。 |
3 |
始終插入新記錄,除非它與空閒訊息有關。 |
-HRBcpBlocks number_of_blocks
在編寫器執行緒和讀取器執行緒之間排隊的 bcp 資料塊的數量。 預設值為 50。 HRBcpBlocks 僅用於 Oracle 釋出。
備註
此引數用於通過 Oracle 釋出伺服器優化 bcp 的效能。
-HRBcpBlockSizeblock_size
每個 bcp 資料塊的大小(以 KB 為單位)。 預設值為 64 KB。 HRBcpBlocks 僅用於 Oracle 釋出。
備註
此引數用於通過 Oracle 釋出伺服器優化 bcp 的效能。
-HRBcpDynamicBlocks
每個 bcp 資料塊的大小是否可以動態增長。 HRBcpBlocks 僅用於 Oracle 釋出。
備註
此引數用於通過 Oracle 釋出伺服器優化 bcp 的效能。
-KeepAliveMessageInterval keep_alive_interval
快照代理在向 MSsnapshot_history 表中記錄“waiting for backend message”之前等待的時間(以秒為單位)。 預設值為 300 秒。
-LoginTimeOut login_time_out_seconds
登入超時前等待的秒數。 預設值為 15 秒。
-MaxBcpThreads number_of_threads
指定可以並行執行的大容量複製操作的數量。 同時存在的執行緒和 ODBC 連線的最大數量為 MaxBcpThreads 或顯示在分發資料庫中同步事務中的大容量複製請求數中較小的那一個。 MaxBcpThreads 的值必須大於 0 ,並且不存在任何硬編碼的上限。 預設值為 1。
- MaxNetworkOptimization [ 0| 1]
是否將無關刪除操作傳送到訂閱伺服器。 無關刪除操作是針對不屬於訂閱伺服器分割槽的行傳送到訂閱伺服器的 DELETE 命令。 無關刪除操作不會影響資料的完整性或收斂,但它們會導致不必要的網路通訊。 MaxNetworkOptimization 的預設值是 0。 將 MaxNetworkOptimization 設定為 1 可將不相關的刪除操作發生的機會減至最小,從而減少網路通訊,並最大程度地優化網路。如果存在多個級別的聯接篩選器和複雜子集篩選器,則將此引數設定為 1 還會增加後設資料的儲存並導致釋出伺服器效能下降。 您應仔細評估您的複製拓撲,僅當無關刪除操作導致的網路通訊高到無法接受時才應將 MaxNetworkOptimization 設定為 1 。
備註
僅當合併發布的同步優化選項(sp_addmergepublication (Transact-SQL) 的 @keep_partition_changes 引數)設定為 true 時,將此引數設定為 1 才是有用的。
-Output output_path_and_file_name
代理輸出檔案的路徑。 如果未提供檔名,則向控制檯傳送該輸出。 如果指定的檔名已存在,會將輸出追加到該檔案。
-OutputVerboseLevel [ 0| 1| 2]
指定輸出是否應提供詳細內容。
OutputVerboseLevel 值 |
說明 |
0 |
僅輸出錯誤訊息。 |
1 (預設值) |
輸出所有進度報告訊息(預設值)。 |
2 |
輸出所有錯誤訊息和進度報告訊息,這對於除錯很有用。 |
-PacketSize packet_size
快照代理連線到 SQL Server時使用的資料包大小(以位元組為單位)。 預設值為 8192 位元組。
備註
除非您確信能夠提高效能,否則不要更改資料包的大小。 對於大多數應用程式而言,預設資料包大小為最佳數值。
-ProfileName profile_name
指定用於代理引數的代理配置檔案。 如果 ProfileName 為 NULL,則將禁用代理配置檔案。 如果未指定 ProfileName ,則使用該代理型別的預設配置檔案。
-PublisherDB publisher_database
釋出資料庫的名稱。 Oracle 釋出伺服器不支援該引數。
-PublisherDeadlockPriority [-1|0|1]
死鎖發生時快照代理連線到釋出伺服器的優先順序。 指定此引數是為了解決快照生成期間在快照代理和使用者應用程式之間發生的死鎖問題。
PublisherDeadlockPriority 值 |
說明 |
-1 |
在釋出伺服器上發生死鎖時,應用程式而非快照代理優先。 |
0 (預設值) |
未分配優先順序。 |
1 |
在釋出伺服器上發生死鎖時,快照代理優先。 |
-PublisherFailoverPartner server_name[\instance_name]
指定參加與釋出資料庫進行的資料庫映象會話的 SQL Server 故障轉移夥伴例項。
-PublisherLogin publisher_login
使用 SQL Server 身份驗證連線到釋出伺服器時所用的登入名。
-PublisherPassword publisher_password
使用 SQL Server 身份驗證連線到釋出伺服器時使用的密碼。 。
-PublisherSecurityMode [ 0| 1]
指定釋出伺服器的安全模式。 值 0 指示 SQL Server 身份驗證(預設值),值 1 指示 Windows 身份驗證模式。
-QueryTimeOut query_time_out_seconds
查詢超時前等待的秒數。預設值為 1800 秒。
-ReplicationType [ 1| 2]
指定複製的型別。 值 1 指示事務複製,值 2 指示合併複製。
-RowDelimiter row_delimiter
在 SQL Server 大容量複製資料檔案中用於標記行尾的字元或字元序列。 預設值為 \n<,@g>\n。
-StartQueueTimeout start_queue_timeout_seconds
當執行的並發動態快照程式數達到由 sp_addmergepublication (Transact-SQL) 的 @max_concurrent_dynamic_snapshots 屬性設定的限制值時,快照代理等待的最大秒數。 如果在經過最大秒數之後快照代理仍在等待,快照代理將退出。 值 0 表示代理將無限期地等待,儘管可以將其取消。
- UsePerArticleContentsView use_per_article_contents_view
已不推薦使用此引數,支援它是為了能夠向後相容。
總結
由於在生成快照需要擁有物件的架構鎖,所以在生成快照的過程中表物件是隻讀的。如果對大表生成快照千萬不要選擇在業務繁忙的時候否則有可能造成系統癱瘓,2016生成快照的時間比2008要快很多。通過對比可以發現2016的複製生成快照比2008效能提升了很多。但是從2014到2016BCP檔案從32個變成16個不知道是出於什麼原因。
備註: 作者:pursuer.chen 部落格:http://www.cnblogs.com/chenmh 本站點所有隨筆都是原創,歡迎大家轉載;但轉載時必須註明文章來源,且在文章開頭明顯處給明連結,否則保留追究責任的權利。 《歡迎交流討論》 |