談mysql中utf8和utf8mb4區別

航空母艦發表於2016-11-28

MySQL在5.5.3之後增加了這個utf8mb4的編碼，mb4就是most bytes 4的意思，專門用來相容四位元組的unicode。好在utf8mb4是utf8的超集，除了將編碼改為utf8mb4外不需要做其他轉換。當然，為了節省空間，一般情況下使用utf8也就夠了。

二、內容描述

那上面說了既然utf8能夠存下大部分中文漢字,那為什麼還要使用utf8mb4呢? 原來mysql支援的 utf8 編碼最大字元長度為 3 位元組，如果遇到 4 位元組的寬字元就會插入異常了。三個位元組的 UTF-8 最大能編碼的 Unicode 字元是 0xffff，也就是 Unicode 中的基本多文種平面(BMP)。也就是說，任何不在基本多文字平面的 Unicode字元，都無法使用 Mysql 的 utf8 字符集儲存。包括 Emoji 表情(Emoji 是一種特殊的 Unicode 編碼，常見於 ios 和 android 手機上)，和很多不常用的漢字，以及任何新增的 Unicode 字元等等。

三、問題根源

最初的 UTF-8 格式使用一至六個位元組，最大能編碼 31 位字元。最新的 UTF-8 規範只使用一到四個位元組，最大能編碼21位，正好能夠表示所有的 17個 Unicode 平面。

utf8 是 Mysql 中的一種字符集，只支援最長三個位元組的 UTF-8字元，也就是 Unicode 中的基本多文字平面。

Mysql 中的 utf8 為什麼只支援持最長三個位元組的 UTF-8字元呢？我想了一下，可能是因為 Mysql 剛開始開發那會，Unicode 還沒有輔助平面這一說呢。那時候，Unicode 委員會還做著 “65535 個字元足夠全世界用了”的美夢。Mysql 中的字串長度算的是字元數而非位元組數，對於 CHAR 資料型別來說，需要為字串保留足夠的長。當使用 utf8 字符集時，需要保留的長度就是 utf8 最長字元長度乘以字串長度，所以這裡理所當然的限制了 utf8 最大長度為 3，比如 CHAR(100) Mysql 會保留 300位元組長度。至於後續的版本為什麼不對 4 位元組長度的 UTF-8 字元提供支援，我想一個是為了向後相容性的考慮，還有就是基本多文種平面之外的字元確實很少用到。

要在 Mysql 中儲存 4 位元組長度的 UTF-8 字元，需要使用 utf8mb4 字符集，但只有 5.5.3 版本以後的才支援(檢視版本： select version();)。我覺得，為了獲取更好的相容性，應該總是使用 utf8mb4 而非 utf8. 對於 CHAR 型別資料，utf8mb4 會多消耗一些空間，根據 Mysql 官方建議，使用 VARCHAR 替代 CHAR。

修改資料庫預設配置

[client]
default-character-set = utf8mb4
[mysqld]
character-set-server=utf8mb4
collation-server=utf8mb4_unicode_ci
[mysql]
default-character-set = utf8mb4

mysql中utf8和utf8mb4區別
2017-12-18
MySql
MySQL中utf8和utf8mb4的區別
2020-11-13
MySql
mysql 字符集:utf8和utf8mb4區別
2015-10-20
MySql
在MySQL中，不要使用“utf8”。使用“utf8mb4”
2019-04-03
MySql
談談mysql和redis的區別
2020-09-24
MySqlRedis
談MySQL中char varchar區別
2012-07-20
MySql
utf8 和 UTF-8 在使用中的區別
2013-07-20
mysql中!=和is not的區別
2018-09-10
MySql
mysql中“ ‘ “和 “ ` “的區別
2020-11-28
MySql
MySQL中CHAR和VARCHAR區別
2020-12-09
MySql
Mysql 中 MyISAM 和 InnoDB 的區別
2020-11-16
MySql
mysql 中set和enum的區別
2012-04-10
MySql
utf8改成utf8mb4實戰教程
2020-12-24
utf-8 和 utf8的區別小記
2020-11-03
MySQL中is not null和!=null和<>null的區別
2017-02-22
MySqlNull
談談import和require的區別
2019-01-22
ImportUI
PHP中MySQL、MySQLi和PDO的用法和區別
2018-02-14
PHPMySql
MySQL中REPLACE INTO和INSERT INTO的區別分析
2021-09-09
MySql
Mysql中S 鎖和 X 鎖的區別
2022-04-03
MySql
Mysql中 int(10)和int(11)的區別
2016-07-23
MySql
MySQL中datetime和timestamp的區別
2024-07-10
MySql
utf-8、UTF-8、utf8在使用中的區別
2017-11-10
Mysql中myisam和innodb的區別，至少5點
2017-03-29
MySql
Mysql引擎中MyISAM和InnoDB的區別有哪些？
2017-09-22
MySql
MYSQL和SQL的區別
2020-06-11
MySql
MySQL和Oracle的區別
2018-04-13
MySqlOracle
Oracle和MySQL的區別
2024-05-21
OracleMySql
淺談HTTP中GET和POST請求方式的區別
2018-05-18
HTTP
淺談C#中重寫和隱藏的區別
2024-04-23
C#
淺談let和var的區別
2019-05-12
淺談SFTP和FTP的區別
2018-11-24
FTP
mysql中tinyint、smallint、int和bigint型別的用法區別
2013-09-05
MySql型別
【轉】mysql 和 redis的區別
2017-04-06
MySqlRedis
MS SQL Server和MySQL區別
2009-08-11
ServerMySql
MySQL 中 VARCHAR 最大長度及 CHAR 和 VARCHAR 的區別
2020-09-11
MySql
Mysql中tinyint(1)和tinyint(4)的區別詳析WIFR
2022-03-01
MySql
【Mysql】MySQL中interactive_timeout和wait_timeout的區別
2019-01-23
MySqlAI
MySQL語法中=與:=的區別
2017-01-29
MySql

談mysql中utf8和utf8mb4區別

相關文章