MySQL基礎教程3 —— 數據類型之字符串類型
字符串類型指CHAR、VARCHAR、BINARY、VARBINARY、BLOB、TEXT、ENUM和SET。該節描述了這些類型如何工作以及如何在查詢中使用這些類型。
1.CHAR和VARCHAR類型CHAR和VARCHAR類型類似,但它們保存和檢索的方式不同。它們的最大長度和是否尾部空格被保留等方面也不同。在存儲或檢索過程中不進行大小寫轉換。
CHAR和VARCHAR類型聲明的長度表示你想要保存的最大字符數。例如,CHAR(30)可以占用30個字符。
CHAR列的長度固定為創建表時聲明的長度。長度可以為從0到255的任何值。當保存CHAR值時,在它們的右邊填充空格以達到指定的長度。當檢索到CHAR值時,尾部的空格被刪除掉。在存儲或檢索過程中不進行大小寫轉換。
VARCHAR列中的值為可變長字符串。長度可以指定為0到65,535之間的值。(VARCHAR的最大有效長度由最大行大小和使用的字符集確定。整體最大長度是65,532字節)。
同CHAR對比,VARCHAR值保存時只保存需要的字符數,另加一個字節來記錄長度(如果列聲明的長度超過255,則使用兩個字節)。
VARCHAR值保存時不進行填充。當值保存和檢索時尾部的空格仍保留,符合標準SQL。
如果分配給CHAR或VARCHAR列的值超過列的最大長度,則對值進行裁剪以使其適合。如果被裁掉的字符不是空格,則會產生一條警告。如果裁剪非空格字符,則會造成錯誤(而不是警告)并通過使用嚴格SQL模式禁用值的插入。
下面的表顯示了將各種字符串值保存到CHAR(4)和VARCHAR(4)列后的結果,說明了CHAR和VARCHAR之間的差別:
值CHAR(4)存儲需求VARCHAR(4)存儲需求’’’’4個字節’’1個字節’ab’’ab’4個字節’ab ’3個字節’abcd’’abcd’4個字節’abcd’5個字節’abcdefgh’’abcd’4個字節’abcd’5個字節請注意上表中最后一行的值只適用不使用嚴格模式時;如果MySQL運行在嚴格模式,超過列長度不的值不保存,并且會出現錯誤。
從CHAR(4)和VARCHAR(4)列檢索的值并不總是相同,因為檢索時從CHAR列刪除了尾部的空格。通過下面的例子說明該差別:
mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));Query OK, 0 rows affected (0.02 sec)mysql> INSERT INTO vc VALUES (’ab ’, ’ab ’);Query OK, 1 row affected (0.00 sec)mysql> SELECT CONCAT(v, ’+’), CONCAT(c, ’+’) FROM vc;+----------------+----------------+| CONCAT(v, ’+’) | CONCAT(c, ’+’) |+----------------+----------------+| ab + | ab+ |+----------------+----------------+1 row in set (0.00 sec)
根據分配給列的字符集校對規則對CHAR和VARCHAR列中的值進行排序和比較。
請注意所有MySQL校對規則屬于PADSPACE類。這說明在MySQL中的所有CHAR和VARCHAR值比較時不需要考慮任何尾部空格。例如:
mysql> CREATE TABLE names (myname CHAR(10), yourname VARCHAR(10));Query OK, 0 rows affected (0.09 sec)mysql> INSERT INTO names VALUES (’Monty ’, ’Monty ’);Query OK, 1 row affected (0.00 sec)mysql> SELECT myname = ’Monty ’, yourname = ’Monty ’ FROM names;+--------------------+----------------------+| myname = ’Monty ’ | yourname = ’Monty ’ |+--------------------+----------------------+| 1 | 1 |+--------------------+----------------------+1 row in set (0.00 sec)
請注意所有MySQL版本均如此,并且它不受SQL服務器模式的影響。
對于尾部填充字符被裁剪掉或比較時將它們忽視掉的情形,如果列的索引需要唯一的值,在列內插入一個只是填充字符數不同的值將會造成復制鍵值錯誤。
CHAR BYTE是CHAR BINARY的別名。這是為了保證兼容性。
ASCII屬性為CHAR列分配latin1字符集。UNICODE屬性分配ucs2字符集。
2.BINARY和VARBINARY類型BINARY和VARBINARY類類似于CHAR和VARCHAR,不同的是它們包含二進制字符串而不要非二進制字符串。也就是說,它們包含字節字符串而不是字符字符串。這說明它們沒有字符集,并且排序和比較基于列值字節的數值值。
BINARY和VARBINARY允許的最大長度一樣,如同CHAR和VARCHAR,不同的是BINARY和VARBINARY的長度是字節長度而不是字符長度。
BINARY和VARBINARY數據類型不同于CHAR BINARY和VARCHAR BINARY數據類型。對于后一種類型,BINARY屬性不會將列視為二進制字符串列。相反,它致使使用列字符集的二元 校對規則,并且列自身包含非二進制字符字符串而不是二進制字節字符串。例如CHAR(5) BINARY被視為CHAR(5) CHARACTER SET latin1 COLLATE latin1_bin,假定默認字符集是latin1。這不同于BINARY(5),它保存5字節二進制字符串,沒有字符集或 校對規則。
當保存BINARY值時,在它們右邊填充值以達到指定長度。填充值是0x00(零字節)。插入值時在右側添加0x00on,并且選擇時不刪除尾部的字節。比較時所有字節很重要,包括ORDER BY和DISTINCT操作。比較時0x00字節和空格是不同的,0x00<空格。
例如:對于一個BINARY(3)列,當插入時’a’變為’a0’。’a0’插入時變為’a00’。當選擇時兩個插入的值均不更改。
對于VARBINARY,插入時不填充字符,選擇時不裁剪字節。比較時所有字節很重要,包括ORDER BY和DISTINCT操作。比較時0x00字節和空格是不同的,0x00<空格。
對于尾部填充字符被裁剪掉或比較時將它們忽視掉的情形,如果列的索引需要唯一的值,在列內插入一個只是填充字符數不同的值將會造成復制鍵值錯誤。
如果你計劃使用這些數據類型來保存二進制數據并且需要檢索的值與保存的值完全相同,應考慮前面所述的填充和裁剪特征。下面的例子說明了用0x00填充的BINARY值如何影響列值比較:
mysql> CREATE TABLE t (c BINARY(3));Query OK, 0 rows affected (0.01 sec)mysql> INSERT INTO t SET c = ’a’;Query OK, 1 row affected (0.01 sec)mysql> SELECT HEX(c), c = ’a’, c = ’a00’ from t;+--------+---------+-------------+| HEX(c) | c = ’a’ | c = ’a00’ |+--------+---------+-------------+| 610000 | 0 | 1 |+--------+---------+-------------+1 row in set (0.09 sec)
如果檢索的值必須與指定進行存儲而沒有填充的值相同,最好使用BLOB數據類型。
創建表時,MySQL可以默默更改BINARY或VARBINARY列的類型。
3.BLOB和TEXT類型BLOB是一個二進制大對象,可以容納可變數量的數據。有4種BLOB類型:TINYBLOB、BLOB、MEDIUMBLOB和LONGBLOB。它們只是可容納值的最大長度不同。
有4種TEXT類型:TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT。這些對應4種BLOB類型,有相同的最大長度和存儲需求。
BLOB列被視為二進制字符串(字節字符串)。TEXT列被視為非二進制字符串(字符字符串)。BLOB列沒有字符集,并且排序和比較基于列值字節的數值值。TEXT列有一個字符集,并且根據字符集的 校對規則對值進行排序和比較。
在TEXT或BLOB列的存儲或檢索過程中,不存在大小寫轉換。
當未運行在嚴格模式時,如果你為BLOB或TEXT列分配一個超過該列類型的最大長度的值值,值被截取以保證適合。如果截掉的字符不是空格,將會產生一條警告。使用嚴格SQL模式,會產生錯誤,并且值將被拒絕而不是截取并給出警告。
在大多數方面,可以將BLOB列視為能夠足夠大的VARBINARY列。同樣,可以將TEXT列視為VARCHAR列。BLOB和TEXT在以下幾個方面不同于VARBINARY和VARCHAR:
·當保存或檢索BLOB和TEXT列的值時不刪除尾部空格。(這與VARBINARY和VARCHAR列相同)。
請注意比較時將用空格對TEXT進行擴充以適合比較的對象,正如CHAR和VARCHAR。
·對于BLOB和TEXT列的索引,必須指定索引前綴的長度。對于CHAR和VARCHAR,前綴長度是可選的。
·BLOB和TEXT列不能有 默認值。
LONG和LONG VARCHAR對應MEDIUMTEXT數據類型。這是為了保證兼容性。如果TEXT列類型使用BINARY屬性,將為列分配列字符集的二元 校對規則。
MySQL連接程序/ODBC將BLOB值定義為LONGVARBINARY,將TEXT值定義為LONGVARCHAR。
由于BLOB和TEXT值可能會非常長,使用它們時可能遇到一些約束:
·當排序時只使用該列的前max_sort_length個字節。max_sort_length的 默認值是1024;該值可以在啟動mysqld服務器時使用--max_sort_length選項進行更改。
運行時增加max_sort_length的值可以在排序或組合時使更多的字節有意義。任何客戶端可以更改其會話max_sort_length變量的值:
mysql> SET max_sort_length = 2000;mysql> SELECT id, comment FROM tbl_name -> ORDER BY comment;
當你想要使超過max_sort_length的字節有意義,對含長值的BLOB或TEXT列使用GROUP BY或ORDER BY的另一種方式是將列值轉換為固定長度的對象。標準方法是使用SUBSTRING函數。例如,下面的語句對comment列的2000個字節進行排序:
mysql> SELECT id, SUBSTRING(comment,1,2000) FROM tbl_name -> ORDER BY SUBSTRING(comment,1,2000);
·BLOB或TEXT對象的最大大小由其類型確定,但在客戶端和服務器之間實際可以傳遞的最大值由可用內存數量和通信緩存區大小確定。你可以通過更改max_allowed_packet變量的值更改消息緩存區的大小,但必須同時修改服務器和客戶端程序。例如,可以使用mysql和mysqldump來更改客戶端的max_allowed_packet值。
每個BLOB或TEXT值分別由內部分配的對象表示。這與其它列類型形成對比,后者是當打開表時為每1列分配存儲引擎。
4.ENUM類型ENUM是一個字符串對象,其值來自表創建時在列規定中顯式枚舉的一列值。
在某些情況下,ENUM值也可以為空字符串(’’)或NULL:
·如果你將一個非法值插入ENUM(也就是說,允許的值列之外的字符串),將插入空字符串以作為特殊錯誤值。該字符串與“普通”空字符串不同,該字符串有數值值0。后面有詳細討論。
·如果將ENUM列聲明為允許NULL,NULL值則為該列的一個有效值,并且 默認值為NULL。如果ENUM列被聲明為NOT NULL,其默認值為允許的值列的第1個元素。
每個枚舉值有一個索引:
·來自列規定的允許的值列中的值從1開始編號。
·空字符串錯誤值的索引值是0。這說明你可以使用下面的SELECT語句來找出分配了非法ENUM值的行:
·mysql> SELECT * FROM tbl_name WHERE enum_col=0;
·NULL值的索引是NULL。
例如,定義為ENUM的列(’one’,’two’,’three’)可以有下面所示任何值。還顯示了每個值的索引:
值索引NULLNULL’’0’one’1’two’2’three’3枚舉最多可以有65,535個元素。
當創建表時,ENUM成員值的尾部空格將自動被刪除。
當檢索時,保存在ENUM列的值使用列定義中所使用的大小寫來顯示。請注意可以為ENUM列分配字符集和 校對規則。對于二進制或大小寫敏感的校對規則,當為列分配值時應考慮大小寫。
如果在數值上下文中檢索一個ENUM值,將返回列值的索引。例如,你可以這樣從ENUM列搜索數值值:
mysql> SELECT enum_col+0 FROM tbl_name;
如果將一個數字保存到ENUM列,數字被視為索引,并且保存的值是該索引對應的枚舉成員。(但是,這不適合LOAD DATA,它將所有輸入視為字符串)。不建議使用類似數字的枚舉值來定義一個ENUM列,因為這很容易引起混淆。例如,下面的列含有字符串值’0’、’1’和’2’的枚舉成員,但數值索引值為1、2和3:
numbers ENUM(’0’,’1’,’2’)
根據枚舉成員在列定義中列出的順序對ENUM值進行排序。(換句話說,ENUM值根據索引編號進行排序)。例如,對于ENUM(’a’,’b’),’a’排在’b’前面,但對于ENUM(’b’,’a’),’b’排在’a’前面。空字符串排在非空字符串前面,并且NULL值排在所有其它枚舉值前面。要想防止意想不到的結果,按字母順序規定ENUM列。還可以使用GROUP BY CAST(col AS CHAR)或GROUP BY CONCAT(col)來確保按照詞匯對列進行排序而不是用索引數字。
如果你想要確定一個ENUM列的所有可能的值,使用SHOW COLUMNS FROMtbl_nameLIKEenum_col,并解析輸出中第2列的ENUM定義。
5.SET類型SET是一個字符串對象,可以有零或多個值,其值來自表創建時規定的允許的一列值。指定包括多個SET成員的SET列值時各成員之間用逗號(‘,’)間隔開。這樣SET成員值本身不能包含逗號。
例如,指定為SET(’one’, ’two’) NOT NULL的列可以有下面的任何值:
’’’one’’two’’one,two’
SET最多可以有64個不同的成員。
當創建表時,SET成員值的尾部空格將自動被刪除。
當檢索時,保存在SET列的值使用列定義中所使用的大小寫來顯示。請注意可以為SET列分配字符集和 校對規則。對于二進制或大小寫敏感的校對規則,當為列分配值時應考慮大小寫。
MySQL用數字保存SET值,所保存值的低階位對應第1個SET成員。如果在數值上下文中檢索一個SET值,檢索的值的位設置對應組成列值的SET成員。例如,你可以這樣從一個SET列檢索數值值:
mysql> SELECT set_col+0 FROM tbl_name;
如果將一個數字保存到SET列中,數字中二進制表示中的位確定了列值中的SET成員。對于指定為SET(’a’,’b’,’c’,’d’)的列,成員有下面的十進制和二進制值:
SET成員十進制值二進制值’a’10001’b’20010’c’40100’d’81000如果你為該列分配一個值9,其二進制形式為1001,因此第1個和第4個SET值成員’a’和’d’被選擇,結果值為’a,d’。
對于包含多個SET元素的值,當插入值時元素所列的順序并不重要。在值中一個給定的元素列了多少次也不重要。當以后檢索該值時,值中的每個元素出現一次,根據表創建時指定的順序列出元素。例如,假定某個列指定為SET(’a’,’b’,’c’,’d’):
mysql> CREATE TABLE myset (col SET(’a’, ’b’, ’c’, ’d’));
插入值’a,d’、’d,a’、’a,d,d’、’a,d,a’和’d,a,d’:
mysql> INSERT INTO myset (col) VALUES -> (’a,d’), (’d,a’), (’a,d,a’), (’a,d,d’), (’d,a,d’);Query OK, 5 rows affected (0.01 sec)Records: 5 Duplicates: 0 Warnings: 0
當檢索時所有這些值顯示為’a,d’:
mysql> SELECT col FROM myset;+------+| col |+------+| a,d || a,d || a,d || a,d || a,d |+------+5 rows in set (0.04 sec)
如果將SET列設置為一個不支持的值,則該值被忽略并發出警告:
mysql> INSERT INTO myset (col) VALUES (’a,d,d,s’);Query OK, 1 row affected, 1 warning (0.03 sec)mysql> SHOW WARNINGS;+---------+------+------------------------------------------+| Level | Code | Message |+---------+------+------------------------------------------+| Warning | 1265 | Data truncated for column ’col’ at row 1 |+---------+------+------------------------------------------+1 row in set (0.04 sec)mysql> SELECT col FROM myset;+------+| col |+------+| a,d || a,d || a,d || a,d || a,d || a,d |+------+6 rows in set (0.01 sec)
SET值按數字順序排序。NULL值排在非NULLSET值的前面。
通常情況,可以使用FIND_IN_SET()函數或LIKE操作符搜索SET值:
mysql> SELECT * FROM tbl_name WHERE FIND_IN_SET(’value’,set_col)>0;mysql> SELECT * FROM tbl_name WHERE set_col LIKE ’%value%’;
第1個語句找出SET_col包含valueset成員的行。第2個類似,但有所不同:它在其它地方找出set_col包含value的行,甚至是在另一個SET成員的子字符串中。
下面的語句也是合法的:
mysql> SELECT * FROM tbl_name WHERE set_col & 1;mysql> SELECT * FROM tbl_name WHERE set_col = ’val1,val2’;
第1個語句尋找包含第1個set成員的值。第2個語句尋找一個確切匹配的值。應注意第2類的比較。將set值與’val1,val2’比較返回的結果與同’val2,val1’比較返回的結果不同。指定值時的順序應與在列定義中所列的順序相同。
如果想要為SET列確定所有可能的值,使用SHOW COLUMNS FROMtbl_nameLIKEset_col并解析輸出中第2列的SET定義。
相關文章: