MySQL中使用binlog時格式該如何選擇
每一條會修改數據的sql都會記錄到master的bin-log中。slave在復制的時候sql進程會解析成和原來master端執行過的相同的sql來再次執行。
優點:statement level下的優點,首先就是解決了row level下的缺點,不需要記錄每一行數據的變化,減少bin-log日志量,節約io,提高性能。因為他只需要記錄在master上所執行的語句的細節,以及執行語句時候的上下文的信息。
缺點:由于它是記錄的執行語句,所以為了讓這些語句在slave端也能正確執行,那么他還必須記錄每條語句在執行的時候的一些相關信息,也就是上下文信息,以保證所有語句在slave端被執行的時候能夠得到和在master端執行時候相同的結果。另外就是,由于mysql現在發展比較快,很多的新功能加入,使mysql的復制遇到了不小的挑戰,自然復制的時候涉及到越復雜的內容,bug也就越容易出現。在statement level下,目前已經發現的就有不少情況會造成mysql的復制問題,主要是修改數據的時候使用了某些特定的函數或者功能的時候會出現,比如sleep()在有些版本就不能正確復制。
2.rowlevel模式日志中會記錄成每一行數據被修改的形式,然后在slave端再對相同的數據進行修改
優點:bin-log中可以不記錄執行的sql語句的上下文相關的信息,僅僅只需要記錄那一條記錄被修改了,修改成什么樣了。所以row level的日志的內容會非常清楚的記錄下每一行數據修改的細節。而且不會出現某些特定情況下的存儲過程,或function,以及trigger的調用和觸發無法被正確復制的問題。
缺點:row level下,所有的執行的語句當記錄到日志中的時候,都將以每行記錄的修改記錄,這樣可能會產生大量的日志內容,比如有這樣一條update語句:update product set owner_member_id=’d’ where owner_member_id=’a’,執行之后,日志中記錄的不是這條update語句所對應的事件(mysql是以事件的形式來記錄bin-log日志),而是這條語句所更新的每一條記錄的變化情況,這樣就記錄成很多條記錄被更新的很多事件。自然,bin-log日志的量會很大。
3.mixed模式實際上就是前兩種模式的結合,在mixed模式下,mysql會根據執行的每一條具體的sql語句來區分對待記錄的日志形式,也就是在statement和row之間選一種。新版本中的statement level還是和以前一樣,僅僅記錄執行的語句。而新版本的mysql中對row level模式被做了優化,并不是所有的修改都會以row level來記錄,像遇到表結構變更的時候就會以statement模式來記錄,如果sql語句確實就是update或者delete 等修改數據的語句,那么還是會記錄所有行的變更。
二、我們使用binlog時應該選擇什么格式呢通過上面的介紹我們知道了binlog_format為STATEMENT在一些場景下能夠節省IO、加快同步速度,但是對于InnoDB這種事務引擎,在READ-COMMITTED、READ-UNCOMMITTED隔離級別或者參數innodb_locks_unsafe_for_binlog為ON時,禁止binlog_format=statement下的寫入,同時對于binlog_format=mixed這種對于非事務引擎、其他隔離級別默認寫statement格式的模式也只會記錄row格式。
> select @@tx_isolation;+----------------+| @@tx_isolation |+----------------+| READ-COMMITTED |+----------------+> create table t(c1 int) engine=innodb;> set binlog_format=statement;> insert into t values(1);ERROR 1665 (HY000): Cannot execute statement: impossible to write to binary log since BINLOG_FORMAT = STATEMENT and at least one table uses a storage engine limited to row-based logging. InnoDB is limited to row-logging when transaction isolation level is READ COMMITTED or READ UNCOMMITTED.> set binlog_format=’mixed’;> show binlog events in ’mysql-bin.000004’G*************************** 3. row *************************** Log_name: mysql-bin.000002 Pos: 287 Event_type: Gtid Server_id: 3258621899End_log_pos: 335 Info: SET @@SESSION.GTID_NEXT= ’ed0eab2f-dfb0-11e7-8ad8-a0d3c1f20ae4:9375’*************************** 4. row *************************** Log_name: mysql-bin.000002 Pos: 335 Event_type: Query Server_id: 3258621899End_log_pos: 407 Info: BEGIN*************************** 5. row *************************** Log_name: mysql-bin.000002 Pos: 407 Event_type: Table_map Server_id: 3258621899End_log_pos: 452 Info: table_id: 124 (test.t)*************************** 6. row *************************** Log_name: mysql-bin.000002 Pos: 452 Event_type: Write_rows_v1 Server_id: 3258621899End_log_pos: 498 Info: table_id: 124 flags: STMT_END_F*************************** 7. row *************************** Log_name: mysql-bin.000002 Pos: 498 Event_type: Xid Server_id: 3258621899End_log_pos: 529 Info: COMMIT /* xid=18422 */
為什么READ-COMMITTED(RC)、READ-UNCOMMITTED下無法使用statement格式binlog?這是因為語句在事務中執行時,能夠看到其他事務提交或者正在寫入的數據。事務提交后binlog寫入,然后在從庫回放,就會看到的數據會與主庫寫入時候不對應。
例如:
有表:
+------+------+| a | b |+------+------+| 10 | 2 || 20 | 1 |+------+------+
我們做如下操作:
session1在事務中做update,UPDATE t1 SET a=11 where b=2;滿足條件的有行(10,2)的一條記錄,并未提交。 session2也做update操作,將行(20,1)更新為(20,2)并提交。 然后前面的sesssion1提交對行(10,2)的更新。如果binlog中使用Statement格式記錄,在slave回放的時候,session2中的更新由于先提交會先回放,將行(20,1)更新為(20,2)。隨后回放session1的語句UPDATE t1 SET a=11 where b=2;語句就會將更新(10,2)和(20,2)兩行為(11,2)。這就導致主庫行為(11, 2), (20,2),slave端為(11,2), (11, 2)。
三、問題分析上面是通過一個具體的例子說明。本質原因是RC事務隔離級別并不滿足事務串行化執行要求,沒有解決不可重復和幻象讀。
對于Repetable-Read和Serializable隔離級別就沒關系,Statement格式記錄。這是因為對于RR和Serializable,會保證可重復讀,在執行更新時候除了鎖定對應行還會在可能插入滿足條件行的時候加GAP Lock。上述case更新時,session1更新b =2的行時,會把所有行和范圍都鎖住,這樣session2在更新的時候就需要等待。從隔離級別的角度看Serializable滿足事務的串行化,因此binlog串行記錄事務statement格式是可以的。同時InnoDB的RR隔離級別實際已經解決了不可重復讀和幻象讀,滿足了ANSI SQL標準的事務隔離性要求。
READ-COMMITTED、READ-UNCOMMITTED的binlog_format限制可以說對于所有事務引擎都適用。
四、拓展內容對于InnoDB RR和Serializable隔離級別下就一定能保證binlog記錄Statement格式么?也不一定。在Innodb中存在參數innodb_locks_unsafe_for_binlog控制GAP Lock,該參數默認為OFF:
mysql> show variables like ’innodb_locks_unsafe_for_binlog’;+--------------------------------+-------+| Variable_name | Value |+--------------------------------+-------+| innodb_locks_unsafe_for_binlog | OFF |+--------------------------------+-------+1 row in set (0.01 sec)
即RR級別及以上除了行鎖還會加GAP Lock。但如果該參數設置為ON,對于當前讀就不會加GAP Lock,即在RR隔離級別下需要加Next-key lock的當前讀蛻化為READ-COMMITTED。所以如果此參數設置為ON時即便使用的事務隔離級別為Repetable-Read也不能保證從庫數據的正確性。
五、總結對于線上業務,如果使用InnoDB等事務引擎,除非保證RR及以上隔離級別的寫入,一定不要設置為binlog_format為STATEMENT,否則業務就無法寫入了。而對于binlog_format為Mixed模式,RR隔離級別以下這些事務引擎也一定寫入的是ROW event。
到此這篇關于MySQL中使用binlog時格式該如何選擇的文章就介紹到這了,更多相關MySQL使用binlog時格式選擇內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!
相關文章:
