年后在進行騰訊二面的時候,寫完算法的后問的第一個問題就是,MySQL的半同步是什么?我當時直接懵了,我以為是問的MySQL的兩階段提交的問題呢?結(jié)果確認了一下后不是兩階段提交,然后面試官看我連問的是啥都不知道,就直接跳過這個問題,直接聊下一個問題了。所以這次總結(jié)一下這部分的知識內(nèi)容,文字內(nèi)容比較多,可能會有些枯燥,但對于這方面感興趣的人來說還是比較有意思的。
我們的一般在大規(guī)模的項目上,都是使用MySQL的復制功能來創(chuàng)建MySQL的主從集群的。主要是可以通過為服務器配置一個或多個備庫的方式來進行數(shù)據(jù)同步。復制的功能不僅有利于構(gòu)建高性能應用,同時也是高可用、可擴展性、災難恢復、備份以及數(shù)據(jù)倉庫等工作的基礎。
說的通俗一點,通過MySQL的主從復制來實現(xiàn)讀寫分離,相比單點數(shù)據(jù)庫又讀又寫來說,提升了業(yè)務系統(tǒng)性能,優(yōu)化了用戶體驗。另外通過主從復制實現(xiàn)了數(shù)據(jù)庫的高可用,當主節(jié)點MySQL掛了的時候,可以用從庫來頂上。
MySQL支持三種復制方式:
MySQL的復制原理概述上來講大體可以分為這三步
主要過程如下圖:
下面來詳細說一下復制的這三步:
第一步:是在主庫上記錄二進制日志,首先主庫要開啟binlog日志記錄功能,并授權(quán)Slave從庫可以訪問的權(quán)限。這里需要注意的一點就是binlog的日志里的順序是按照事務提交的順序來記錄的而非每條語句的執(zhí)行順序。
第二步:從庫將binLog復制到其本地的RelayLog中。首先從庫會啟動一個工作線程,稱為I/O線程,I/O線程跟主庫建立一個普通的客戶端連接,然后主庫上啟動一個特殊的二進制轉(zhuǎn)儲(binlog dump)線程,此轉(zhuǎn)儲線程會讀取binlog中的事件。當追趕上主庫后,會進行休眠,直到主庫通知有新的更新語句時才繼續(xù)被喚醒。 這樣通過從庫上的I/O線程和主庫上的binlog dump線程,就將binlog數(shù)據(jù)傳輸?shù)綇膸焐系膔elaylog中了。
第三步:從庫中啟動一個SQL線程,從relaylog中讀取事件并在備庫中執(zhí)行,從而實現(xiàn)備庫數(shù)據(jù)的更新。
==這種復制架構(gòu)實現(xiàn)了獲取事件和重放事件的解耦,運行I/O線程能夠獨立于SQL線程之外工作。但是這種架構(gòu)也限制復制的過程,最重要的一點是在主庫上并發(fā)運行的查詢在備庫中只能串行化執(zhí)行,因為只有一個SQL線程來重放中繼日志中的事件。==
說到這個主從復制的串行化執(zhí)行的問題,我就想到了一個之前在工作中遇到的一個問題,就是有這么一個業(yè)務場景,我們有一個操作是初始化一批數(shù)據(jù),數(shù)據(jù)是從一個外部系統(tǒng)的接口中獲取的,然后我是通過線程池里的多個線程并行從外部系統(tǒng)的接口中獲取數(shù)據(jù),每個線程獲取到數(shù)據(jù)后,直接插入到數(shù)據(jù)庫中。然后在數(shù)據(jù)全部入庫完成后,然后去執(zhí)行批量查詢,將剛插入到數(shù)據(jù)庫中的數(shù)據(jù)查詢出來,放到ElasticSearch中。結(jié)果每次放入到ES中的數(shù)據(jù)總是不完整,后來研究了半天都不行,最終是讓查詢也走的主庫才解決的問題。當時不知道是MySQL主從復制的串行化從而導致的這個問題。
MySQL的主從復制其實是支持,異步復制、半同步復制、GTID復制等多種復制模式的。
MySQL的默認復制模式就是異步模式,主要是指MySQL的主服務器上的I/O線程,將數(shù)據(jù)寫到binlong中就直接返回給客戶端數(shù)據(jù)更新成功,不考慮數(shù)據(jù)是否傳輸?shù)綇姆掌?,以及是否寫入到relaylog中。在這種模式下,復制數(shù)據(jù)其實是有風險的,一旦數(shù)據(jù)只寫到了主庫的binlog中還沒來得急同步到從庫時,就會造成數(shù)據(jù)的丟失。
但是這種模式確也是效率最高的,因為變更數(shù)據(jù)的功能都只是在主庫中完成就可以了,從庫復制數(shù)據(jù)不會影響到主庫的寫數(shù)據(jù)操作。
上面我也說了,這種異步復制模式雖然效率高,但是數(shù)據(jù)丟失的風險很大,所以就有了后面要介紹的半同步復制模式。
MySQL從5.5版本開始通過以插件的形式開始支持半同步的主從復制模式。什么是半同步主從復制模式呢? 這里通過對比的方式來說明一下:
半同步復制模式,可以很明確的知道,在一個事務提交成功之后,此事務至少會存在于兩個地方一個是主庫一個是從庫中的某一個。主要原理是,在master的dump線程去通知從庫時,增加了一個ACK機制,也就是會確認從庫是否收到事務的標志碼,master的dump線程不但要發(fā)送binlog到從庫,還有負責接收slave的ACK。當出現(xiàn)異常時,Slave沒有ACK事務,那么將自動降級為異步復制,直到異常修復后再自動變?yōu)榘胪綇椭?/p>
MySQL半同步復制的流程如下:
半同步復制的隱患
半同步復制模式也存在一定的數(shù)據(jù)風險,當事務在主庫提交完后等待從庫ACK的過程中,如果Master宕機了,這個時候就會有兩種情況的問題。
為了解決上面的隱患,MySQL從5.7版本開始,增加了一種新的半同步方式。新的半同步方式的執(zhí)行過程是將“Storage Commit”這一步移動到了“Write Slave dump”后面。這樣保證了只有Slave的事務ACK后,才提交主庫事務。MySQL 5.7.2版本新增了一個參數(shù)來進行配置:rpl_semi_sync_master_wait_point,此參數(shù)有兩個值可配置:
MySQL從5.7.2版本開始,默認的半同步復制方式就是AFTER_SYNC方式了,但是方案不是萬能的,因為AFTER_SYNC方式是在事務同步到Slave后才提交主庫的事務的,若是當主庫等待Slave同步成功的過程中Master掛了,這個Master事務提交就失敗了,客戶端也收到了事務執(zhí)行失敗的結(jié)果了,但是Slave上已經(jīng)將binLog的內(nèi)容寫到Relay Log里了,這個時候,Slave數(shù)據(jù)就會多了,但是多了數(shù)據(jù)一般問題不算嚴重,多了總比少了好。MySQL,在沒辦法解決分布式數(shù)據(jù)一致性問題的情況下,它能保證的是不丟數(shù)據(jù),多了數(shù)據(jù)總比丟數(shù)據(jù)要好。
這里說幾個的半同步復制模式的參數(shù):
mysql> show variables like '%Rpl%'; +-------------------------------------------+------------+ | Variable_name | Value | +-------------------------------------------+------------+ | rpl_semi_sync_master_enabled | ON | | rpl_semi_sync_master_timeout | 10000 | | rpl_semi_sync_master_trace_level | 32 | | rpl_semi_sync_master_wait_for_slave_count | 1 | | rpl_semi_sync_master_wait_no_slave | ON | | rpl_semi_sync_master_wait_point | AFTER_SYNC | | rpl_stop_slave_timeout | 31536000 | +-------------------------------------------+------------+
-- 半同步復制模式開關(guān) rpl_semi_sync_master_enabled -- 半同步復制,超時時間,單位毫秒,當超過此時間后,自動切換為異步復制模式 rpl_semi_sync_master_timeout -- MySQL 5.7.3引入的,該變量設置主需要等待多少個slave應答,才能返回給客戶端,默認為1。 rpl_semi_sync_master_wait_for_slave_count -- 此值代表當前集群中的slave數(shù)量是否還能夠滿足當前配置的半同步復制模式,默認為ON,當不滿足半同步復制模式后,全部Slave切換到異步復制,此值也會變?yōu)镺FF rpl_semi_sync_master_wait_no_slave -- 代表半同步復制提交事務的方式,5.7.2之后,默認為AFTER_SYNC rpl_semi_sync_master_wait_point
MySQL從5.6版本開始推出了GTID復制模式,GTID即全局事務ID (global transaction identifier)的簡稱,GTID是由UUID+TransactionId組成的,UUID是單個MySQL實例的唯一標識,在第一次啟動MySQL實例時會自動生成一個server_uuid, 并且默認寫入到數(shù)據(jù)目錄下的auto.cnf(mysql/data/auto.cnf)文件里。TransactionId是該MySQL上執(zhí)行事務的數(shù)量,隨著事務數(shù)量增加而遞增。這樣保證了GTID在一組復制中,全局唯一。
這樣通過GTID可以清晰的看到,當前事務是從哪個實例上提交的,提交的第多少個事務。
來看一個GTID的具體形式:
mysql> show master status; +-----------+----------+--------------+------------------+-------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +-----------+----------+--------------+------------------+-------------------------------------------+ | on.000003 | 187 | | | 76147e28-8086-4f8c-9f98-1cf33d92978d:1-322| +-----------+----------+--------------+------------------+-------------------------------------------+ 1 row in set (0.00 sec)
由于GTID在一組主從復制集群中的唯一性,從而保證了每個GTID的事務只在一個MySQL上執(zhí)行一次。 那么是怎么實現(xiàn)這種機制的呢?GTID的原理又是什么樣的呢?
當從服務器連接主服務器時,把自己執(zhí)行過的GTID(Executed_Gtid_Set: 即已經(jīng)執(zhí)行的事務編碼)以及獲取到GTID(Retrieved_Gtid_Set: 即從庫已經(jīng)接收到主庫的事務編號)都傳給主服務器。主服務器會從服務器缺少的GTID以及對應的transactionID都發(fā)送給從服務器,讓從服務器補全數(shù)據(jù)。當主服務器宕機時,會找出同步數(shù)據(jù)最成功的那臺conf服務器,直接將它提升為主服務器。若是強制要求某一臺不是同步最成功的一臺從服務器為主,會先通過change命令到最成功的那臺服務器,將GTID進行補全,然后再把強制要求的那臺機器提升為主。
主要數(shù)據(jù)同步機制可以分為這幾步:
初始結(jié)構(gòu)如下圖
通過上圖我們可以看出來,當Master掛掉后,Slave-1執(zhí)行完了Master的事務,Slave-2延時一些,所以沒有執(zhí)行完Master的事務,這個時候提升Slave-1為主,Slave-2連接了新主(Slave-1)后,將最新的GTID傳給新主,然后Slave-1就從這個GTID的下一個GTID開始發(fā)送事務給Slave-2。這種自我尋找復制位置的模式減少事務丟失的可能性以及故障恢復的時間。
通過上面的分析我們可以得出GTID的優(yōu)勢是:
GTID的缺點也很明顯:
其實GTID的這部分內(nèi)容挺多的,如果有想深入研究的可以去看看這篇文章。 最后說幾個開啟GTID的必備條件:
gtid_mode=on (必選) #開啟gtid功能 log_bin=log-bin=mysql-bin (必選) #開啟binlog二進制日志功能 log-slave-updates=1 (必選) #也可以將1寫為on enforce-gtid-consistency=1 (必選) #也可以將1寫為on
gtid_mode=on (必選) enforce-gtid-consistency=1 (必選) log_bin=mysql-bin (可選) #高可用切換,最好開啟該功能 log-slave-updates=1 (可選) #高可用切換,最好打開該功能
以上就是詳解MySQL的半同步的詳細內(nèi)容,更多關(guān)于MySQL的半同步的資料請關(guān)注腳本之家其它相關(guān)文章!