文章詳情頁

淺談MySQL 統(tǒng)計行數(shù)的 count

瀏覽：2日期：2023-10-14 07:45:04

MySQL count() 函數(shù)我們并不陌生，用來統(tǒng)計每張表的行數(shù)。但如果你的表越來越大，且是 InnoDB 引擎的話，會發(fā)現(xiàn)計算的速度會越來越慢。在這篇文章里，會先介紹 count() 實現(xiàn)的原理及原因，然后是 count 不同用法的性能分析，最后給出需要頻繁改變并需要統(tǒng)計表行數(shù)的解決方案。

Count() 的實現(xiàn)

InnoDB 和 MyISAM 是 MySQL 常用的數(shù)據(jù)引擎，由于兩者實現(xiàn)的不同，導(dǎo)致 count() 操作計算的效率也不同。

對于 MyISAM 來說，它把每個表的總行數(shù)都存在了磁盤上，因此使用 count(*) 計算時，效率很高直接返回結(jié)果。但如果加入了 where 條件，依然會進行搜索，所以效率是不高的。

對于 InnoDB 來說，在進行 count(*) 運算時，會把數(shù)據(jù)從引擎中一行行讀出來，然后累計計數(shù)，自然表大了之后，效率就變低了。

那么，為什么 InnoDB 不能像 MyISAM 在表中記錄呢？原因就在于 InnoDB 比 MyISAM 多了支持事務(wù)的特性，同時也需要一定的取舍。由于 MVCC 的控制，使得 MySQL 具有并發(fā)的能力，也就是說對于同一時刻，InnoDB 返回的表的行數(shù)是不一定的，事務(wù)看到的行數(shù)與開啟后的一致性視圖有關(guān)，換句話說，每個事務(wù)能看到的數(shù)據(jù)版本是不一樣的，只能一行行拿出來進行判斷。

像下面的事務(wù)，假設(shè)表 t 有 10000 條數(shù)據(jù)：

Session A Session B Session C select count(*) from t; insert into t (); begin; insert into t(); select count(*) from t; select count(*) from t; select count(*) from t; 10000; 結(jié)果是 10002 結(jié)果是 10001

對于 Session A 來說，Session B 未提交不可見，Session C 提交了，但是在 Session A 啟動后提交的，也不可見。所以是 10000.

而對于 Session B 而言，Session C 在啟動之前提交，自己又插入了一條，所以結(jié)果是 10002.

其實 InnoDB 在進行 count(*) 操作時，還是做了優(yōu)化的，在進行 count(*) 操作時，由于普通索引會保存主鍵的 id 值，所以會找到最小的那顆普通索引樹進行查找，而不是去遍歷主鍵索引樹。

在保證邏輯正確的前提下，減少掃描的數(shù)據(jù)量，是數(shù)據(jù)庫系統(tǒng)設(shè)計的通用法則。

另外在使用 show table status 時，也可以查詢出行數(shù)，而且速度很快，但需要注意的是，該命令是通過索引統(tǒng)計的值來采樣估算的。官方文檔說誤差可以有 40%-50%.

但如果我們真的需要實時的獲取的某個表的行數(shù)，應(yīng)該怎么辦呢？

手動保存表的數(shù)量

用緩存系統(tǒng)來保存計數(shù)

對于進行更新的表，可能會想到用緩存系統(tǒng)來支持。比如 Redis 里來保存某個表總行數(shù)。

每次插入數(shù)據(jù)庫時，Redis 計數(shù)加一，相反則減一，這樣看起來讀寫操作都很快，但會存在一些問題。

緩存系統(tǒng)會丟失更新：

對于 Redis 在內(nèi)存中的數(shù)據(jù)，需要定期的同步到磁盤中，但對于 Redis 異常重啟，就沒有辦法了。比如在 Redis 中插入后，Redis 重啟，數(shù)據(jù)沒有持久化到硬盤。這時可以在重啟 Redis 后，從數(shù)據(jù)庫執(zhí)行下 count(*) 操作,然后更新到 Redis 中。一次全表掃描還是可行的。

邏輯不精確：

假設(shè)一個頁面中，需要顯示一張表的行數(shù)，以及每一條數(shù)據(jù)。在實現(xiàn)時，可以先從 Redis 取數(shù)量，然后從數(shù)據(jù)庫里取記錄。

但可能會出現(xiàn)這樣的情況：

數(shù)據(jù)庫查到 100 行結(jié)果里有最新插入的記錄，而 Redis 計數(shù)里少 1. 數(shù)據(jù)庫查到 100 行結(jié)果沒有最新的記錄，但 Redis 計數(shù)卻多了 1. Session A Session B 插入一條數(shù)據(jù)； T1 讀 Redis 計數(shù)； T2 從數(shù)據(jù)庫中查記錄； Redis 計數(shù)加 1; T3

對于 Session B 來說，在 T2 時刻，會發(fā)現(xiàn) Redis 的數(shù)量比數(shù)據(jù)庫少 1 條。

Session A Session B Redis 計數(shù)加 1; T1 讀 Redis 計數(shù)； T2 從數(shù)據(jù)庫中查記錄；插入一條數(shù)據(jù)； T3

對于 Session B 來說，在 T2 時刻，會發(fā)現(xiàn) Redis 的數(shù)量比數(shù)據(jù)庫多 1 條。

其實產(chǎn)生問題的原因就是因為 Redis 和數(shù)據(jù)庫查記錄沒有在同一個事務(wù)中。

用數(shù)據(jù)庫保存

由于 InnoDB 引擎的支持，MySQL 本身是支持事務(wù)的，所以將 Redis 的插入操作換成在數(shù)據(jù)庫的更新操作，就可以利用在RR級別下的事務(wù)特性，進而保證數(shù)據(jù)的精確性。

而且還有一點，由于 redo log 的支持，在 MySQL 發(fā)生異常時，是可以保證 crash-safe。

不同 count 用法的執(zhí)行效率

count() 本身是一個聚合函數(shù)，對于返回的結(jié)果集，一行行地判斷。如果參數(shù)不是 NULL 的話，會一直累加，最后返回結(jié)果。

所以 count(*), count(id), count(1) 表示都是返回滿足條件的結(jié)果集總行數(shù)。

而 count(字段)，則表示滿足條件的數(shù)據(jù)行里，不為 NULL 的字段。

對于 count(id) 來說，InnoDB 會遍歷整張表，把每行 id 取出來，給 server 層。Server 判斷 id 是否為空，然后累加。

對于 count(1) 來說，InnoDB 會遍歷整張表，但不取值。Server 層會自己放入 1，然后累加。

所以對于 count(1) 的執(zhí)行會比 count(*) 要快，少了解析數(shù)據(jù)行以及拷貝字段值的操作。

對于 count(字段) 來說，如果字段定義時是 not null, 會一行行讀出，并判斷不能為 null，然后累加。如果定義時可以為 null，執(zhí)行時，需要將值去除，判斷不是 null 才累加。

count(*) 除外，專門做了優(yōu)化，不取值，直接按行累加，并且會找到最小的索引樹進行計算。

總結(jié)

MySQL count() 函數(shù)的執(zhí)行效率和底層的數(shù)據(jù)引擎有關(guān)。MyISAM 不加 where 條件，查詢會很快，但不支持事務(wù)。InnoDB 支持事務(wù)，由于 MVCC 的實現(xiàn)，導(dǎo)致每次查詢都需要一行行的掃描，效率不高。

解決方法可以通過設(shè)計外部緩存如 Redis，保存記錄。但存在異常重啟和數(shù)據(jù)不準(zhǔn)確的情況?？梢酝ㄟ^在 InnoDB 中新建一張表，保存記錄這樣的解決方案。

最后，InnoDB 對 count(*) 做了獨立的優(yōu)化，而其他的 count 操作，則需要額外的操作。

以上就是淺談MySQL 統(tǒng)計行數(shù)的 count的詳細內(nèi)容，更多關(guān)于Mysql count的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

上一條：快速了解MySQL 索引下一條：快速學(xué)習(xí)MySQL基礎(chǔ)知識

相關(guān)文章：

1. mybatis plus代碼生成工具的實現(xiàn)代碼2. 讓SQL Server也能使用2G以上內(nèi)存3. Microsoft Office Access凍結(jié)字段的方法4. DB2 9（Viper）快速入門5. Microsoft Office Access隱藏和顯示字段的方法6. Access創(chuàng)建一個簡單MIS管理系統(tǒng)7. SQLSERVER 臨時表和表變量的區(qū)別匯總8. SQL Server數(shù)據(jù)庫連接查詢和子查詢實戰(zhàn)案例9. How to access eclipse workspace?10. SQL語句中的ON DUPLICATE KEY UPDATE使用

排行榜

					
					提高速度 優(yōu)化SQL Server數(shù)據(jù)庫查詢
Microsoft Office Access凍結(jié)字段的方法
DB2 9（Viper）快速入門
提高商業(yè)智能環(huán)境中DB2查詢的性能（2）
SQL Server自動生成日期加數(shù)字的序列號
Microsoft Office Access隱藏和顯示字段的方法
Access創(chuàng)建一個簡單MIS管理系統(tǒng)
SQLSERVER 臨時表和表變量的區(qū)別匯總
SQL語句中的ON DUPLICATE KEY UPDATE使用
How to access eclipse workspace?
讓SQL Server也能使用2G以上內(nèi)存
				

熱門標(biāo)簽

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

淺談MySQL 統(tǒng)計行數(shù)的 count