MySQL COUNT函數(shù)的使用與優(yōu)化
COUNT 是一個(gè)專(zhuān)用的函數(shù),通常有兩種不同的方式:計(jì)算值和數(shù)據(jù)行。值指的是非空(Non-NULL)表達(dá)式(NULL表示值缺失)。如果我們?cè)?COUNT的參數(shù)中指定了列名或其他表達(dá)式,則 COUNT 函數(shù)是計(jì)算該表達(dá)式擁有值的次數(shù)。這讓很多人困惑,相當(dāng)一部分的原因是值和 NULL 的概念是模糊的。
另一種 COUNT 的形式是簡(jiǎn)單地計(jì)算結(jié)果集的數(shù)據(jù)行數(shù)。這是在 MySQL 知道 COUNT 函數(shù)參數(shù)的表達(dá)式不可能為 NULL 時(shí)的計(jì)算方式。最為典型的例子是 COUNT(*),你也許會(huì)以為這是展開(kāi)數(shù)據(jù)表的全部列的一種替代形式。事實(shí)上,它會(huì)忽略了全部列而僅僅對(duì)數(shù)據(jù)行數(shù)進(jìn)行記數(shù)。
一個(gè)經(jīng)常犯的錯(cuò)誤是我們?cè)?COUNT 的參數(shù)里指定了列名然后以為是對(duì)數(shù)據(jù)行進(jìn)行計(jì)數(shù)。如果你是想獲取結(jié)果中的行數(shù),你應(yīng)該一直使用 COUNT(*),這會(huì)使得你的查詢(xún)語(yǔ)句意圖更明確并且可以避免性能問(wèn)題。
MyISAM 的“神奇”之處一個(gè)常見(jiàn)的誤解是 MyISAM 對(duì)于 COUNT 查詢(xún)來(lái)說(shuō)會(huì)非常快。MyISAM 的 COUNT 查詢(xún)確實(shí)快,但這種快的場(chǎng)景十分有限:COUNT()查詢(xún)并且沒(méi)有 WHERE 條件時(shí)才能達(dá)到這樣的效果,而實(shí)際這種場(chǎng)景很少見(jiàn)。MySQL 能夠?qū)@個(gè)語(yǔ)句進(jìn)行優(yōu)化的原因是存儲(chǔ)引擎總是知道數(shù)據(jù)表的準(zhǔn)確行數(shù)。如果 MySQL 知道一個(gè)列col不可能為 NULL,它也會(huì)將 COUNT(col) 轉(zhuǎn)換為 COUNT()來(lái)進(jìn)行優(yōu)化。
MyISAM在 COUNT 查詢(xún)中有 WHERE條件、或其他對(duì)值進(jìn)行計(jì)數(shù)時(shí) 并沒(méi)有“神奇”之處。相比其他存儲(chǔ)引擎可能快也可能慢,這取決于很多其他因素。
簡(jiǎn)單的COUNT優(yōu)化當(dāng)你想要對(duì)數(shù)據(jù)行的索引覆蓋不高的情況,又需要統(tǒng)計(jì)所有行數(shù)量時(shí)可以采用 MyISAM 引擎的 COUNT(*)來(lái)進(jìn)行優(yōu)化。下面的例子使用了標(biāo)準(zhǔn)的世界數(shù)據(jù)庫(kù)去展示查找 ID 大于5的城市數(shù)量時(shí)的優(yōu)化力度,你寫(xiě)出的SQL 語(yǔ)句可能如下所示:
SELECT COUNT(*) FROM world.City WHERE ID > 5;
如果使用 SHOW STATUS 檢查查詢(xún)的話會(huì)發(fā)現(xiàn)掃描了4079行。而如果是采用負(fù)向條件查詢(xún),并且減去那些 ID 小于等于5的城市數(shù)量的話,你會(huì)發(fā)現(xiàn)可以將掃描結(jié)果減少到5行。
SELECT (SELECT COUNT(*) FROM world.City) - COUNT(*) FROM world.City WHERE ID <= 5;
這個(gè)查詢(xún)會(huì)讀取更少的行是因?yàn)樵诓樵?xún)優(yōu)化階段將查詢(xún)轉(zhuǎn)換為了常量,使用 EXPLAIN 可以看到:
id select_type table rows Extra 1 PRIMARY City 6 Using where; Using index 2 SUBQUERY NULL NULL Select tables optimized way
一個(gè)常見(jiàn)的問(wèn)題是如何在一個(gè)查詢(xún)語(yǔ)句中完成對(duì)同一列的不同值的數(shù)量的查詢(xún)。例如,你想通過(guò)一條查詢(xún)語(yǔ)句查出不同顏色對(duì)應(yīng)的數(shù)量。你不能使用諸如 SELECT COUNT(color = ’blue’ OR color=’red’) FROM items來(lái)完成查詢(xún),因?yàn)檫@樣不會(huì)區(qū)分出不同顏色相應(yīng)的數(shù)量。而你也不能將顏色放入 WHERE 條件中,例如 SELECT COUNT(*) FROM items WHERE color = ’blue’ AND color = ’red’由于顏色本身是互斥的,因此可以用下面的方法解決這一問(wèn)題:
SELECT SUM(IF(color = ’blue’, 1, 0)) AS blue, SUM(IF(color = ’red’, 1, 0)) as red FROM items;
還有一種變通的形式是不是要 SUM,而是 COUNT,只是保證了沒(méi)有值的表達(dá)式的判決表達(dá)式是 false:
SELECT COUNT(color = ’blue’ OR NULL) as blue,COUNT(color = ’red’ OR NULL) as red FROM items;使用近似值
有時(shí)候并不需要精確的數(shù)量,這個(gè)時(shí)候就可以使用近似值。在 EXPLAIN優(yōu)化器中給出的估計(jì)行數(shù)通常可以滿足這種場(chǎng)景,此時(shí)可以使用 EXPLAIN 來(lái)替代真實(shí)的查詢(xún)。
在很多情況下,一個(gè)準(zhǔn)確的數(shù)量與近似值相比低效很多。一個(gè)客戶曾經(jīng)要求統(tǒng)計(jì)他們網(wǎng)站的活躍用戶數(shù)量。用戶數(shù)量被緩存并每隔30分鐘更新一次。這本身就不準(zhǔn)確,因此使用估計(jì)值是可以接受的。這個(gè)查詢(xún)使用了多個(gè) WHERE 條件去保證不會(huì)統(tǒng)計(jì)非活躍用戶或默認(rèn)用戶(擁有特殊的 ID)。移除這些條件,并稍微修改一下 count 操作就可以變得更高效。一個(gè)更進(jìn)一步的優(yōu)化是移除不必要的 DISTINCT 操作,從而移除掉一次 filesort 操作。優(yōu)化后的查詢(xún)速度更快,且返回了幾乎準(zhǔn)確的結(jié)果。
更復(fù)雜的優(yōu)化通常來(lái)說(shuō),COUNT查詢(xún)很難優(yōu)化,這是因?yàn)樗ǔP枰y(tǒng)計(jì)很多行(訪問(wèn)很多數(shù)據(jù)),在 MySQL 中其他可選的辦法是使用覆蓋索引。如果那還不夠的話,可能需要對(duì)整個(gè)系統(tǒng)應(yīng)用架構(gòu)進(jìn)行調(diào)整了。例如考慮統(tǒng)計(jì)數(shù)據(jù)表,或者使用外部的緩存系統(tǒng)(如 Memcached)。我們往往會(huì)面臨一個(gè)類(lèi)似的兩難問(wèn)題:快速、準(zhǔn)確和簡(jiǎn)單——你只能從中選擇兩項(xiàng)!
以上就是MySQL COUNT函數(shù)的使用與優(yōu)化的詳細(xì)內(nèi)容,更多關(guān)于MySQL COUNT的使用與優(yōu)化的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 快速解決mysql導(dǎo)出scv文件亂碼、躥行的問(wèn)題2. 用SQL SERVER記錄站點(diǎn)日志3. mssql鎖基礎(chǔ)教程4. MySQL基礎(chǔ)教程9 —— 函數(shù)之日期和時(shí)間函數(shù)5. Microsoft Office Access修改代碼字體大小的方法6. Mybatis查詢(xún)方法如何實(shí)現(xiàn)沒(méi)有返回值7. DB2 XML 全文搜索之為文本搜索做準(zhǔn)備8. MySQL 千萬(wàn)級(jí)數(shù)據(jù)量如何快速分頁(yè)9. centos 7安裝mysql5.5和安裝 mariadb使用的命令10. debian10 mariadb安裝過(guò)程詳解
