在平時的mysql運維操作中,經常會碰到插入中文欄位後出現亂碼的情況,產生中文亂碼的原因一般有:
1)mysql的編碼格式不對,是latin1編碼。強烈推薦將mysql下的編碼格式都改為utf8,因為它相容世界上所有字元!
2)mysql的表的語系設定問題(包含character與collation)
3)客戶端程式(例如php)的連線語系設定問題
下面就對Mysql下處理資料表中中文欄位亂碼問題的操作做一記錄:
為了防止後續操作出現亂碼現象,最好在建立庫或資料表的時候就設定正確的編碼。
建立資料庫的時候,設定編碼格式
mysql> CREATE DATABASE hqsb -> CHARACTER SET utf8 -> COLLATE utf8_general_ci; Query OK, 1 row affected (0.01 sec)
建立表的時候,設定編碼格式
mysql> use hqsb; Database changed mysql> CREATE TABLE haha ( -> id int(10) PRIMARY KEY AUTO_INCREMENT, -> name varchar(64) NOT NULL -> ) ENGINE=InnoDB DEFAULT CHARSET=utf8; Query OK, 0 rows affected (0.02 sec)
這3個設定好了,基本就不會出問題了,即建庫和建表時都使用相同的編碼格式。
如果在建庫建表的時候沒有指明編碼格式導致中文亂碼,可以通過以下方式進行查詢。
1)檢視mysql系統預設的編碼格式(保證下面查詢結果中的所有編碼格式都是utf8,有不是的就手動修改!):
a)session範圍(臨時修改,當前視窗有效)
檢視資料庫編碼
mysql> show variables like "%char%"; +--------------------------+----------------------------------+ | Variable_name | Value | +--------------------------+----------------------------------+ | character_set_client | gbk | | character_set_connection | gbk | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | gbk | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/local/mysql/share/charsets/ | +--------------------------+----------------------------------+ 8 rows in set (0.01 sec)
手動修改字符集(如上,哪一項不是utf8,就修改哪一項):
mysql> SET character_set_filesystem='utf8'; Query OK, 0 rows affected (0.00 sec)
再次檢視是否已修改:
mysql> show variables like "%char%"; +--------------------------+----------------------------------+ | Variable_name | Value | +--------------------------+----------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | utf8 | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/local/mysql/share/charsets/ | +--------------------------+----------------------------------+ 8 rows in set (0.01 sec)
如上可以看到字符集已經修改成都是utf8了。但是這裡有一個問題,那就是重新開啟一個命令視窗然後檢視資料編碼就又出現上面非utf8的情況。這就需要設定global範圍:
b)global範圍(臨時修改,跨視窗有效)
mysql 設定變數的範圍預設是 session 範圍。如果設定多個會話的字符集那麼需要設定 global 範圍:Set [global|session] variables …
mysql> set global character_set_filesystem='utf8'; Query OK, 0 rows affected (0.00 sec) mysql> show variables like "%char%"; +--------------------------+----------------------------------+ | Variable_name | Value | +--------------------------+----------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | utf8 | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/local/mysql/share/charsets/ | +--------------------------+----------------------------------+ 8 rows in set (0.01 sec)
當跨會話檢視mysql字符集都會看到都是utf8。如果以為這樣就萬事大吉了的話,那麼就大錯特錯了。
c)設定資料全域性範圍(全域性修改,永久生效)
如上設定後,當資料庫重啟後,就會發現設定global範圍的值又變成latin1了!
修改 mysql 配置檔案 /etc/my.cnf
[mysqld] character-set-server=utf8 [client] default-character-set=utf8 [mysql] default-character-set=utf8
如上設定後,重啟 mysql 服務,就會發現它的字符集就完全變成 utf8了。
不過需要請注意上面這幾個引數配置的位置,不然可能會啟動不起來 mysql 服務!
這樣,後續建立資料庫或表的時候不需要指定字元編碼,它預設就是 utf8!
Mysql字符集修改的兩點總結:
- 直接在session級別設定mysql的字元編碼,這是治標不治本的方法;
- 要從源頭上解決這個問題。那就是修改 mysql 預設的配置檔案,把它的字符集修改成能夠使用中文字元的UTF8才行!
2)檢視資料庫(比如hqsb)的編碼格式:
mysql> show create database hqsb; +----------+---------------------------------------------------------------+ | Database | Create Database | +----------+---------------------------------------------------------------+ | hqsb | CREATE DATABASE `hqsb` /*!40100 DEFAULT CHARACTER SET utf8 */ | +----------+---------------------------------------------------------------+ 1 row in set (0.00 sec)
如果資料庫的編碼格式不正確,可以手動修改:
mysql> ALTER DATABASE hqsb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; Query OK, 1 row affected (0.01 sec)
3)檢視資料表(比如haha)的編碼格式:
mysql> show create table haha; +-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+ | Table | Create Table | +-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+ | haha | CREATE TABLE `haha` ( `id` int(10) NOT NULL AUTO_INCREMENT, `name` varchar(64) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 | +-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+ 1 row in set (0.00 sec)
如果資料表的編碼格式不正確,可以手動修改:
mysql> ALTER TABLE haha DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; Query OK, 0 rows affected (0.01 sec)
注意:
在客戶端(比如xshell)裡連線mysql插入資料,最好事先確保編碼格式為Utf-8。
關於網頁中亂碼問題的幾點解決辦法總結
1)將網站編碼設為utf-8。 2)如果網站已運作了好久,並有很多舊資料,不能再更改簡體中文的設定,那麼建議將頁面的編碼設為GBK。 GBK與GB2312的區別就在於:GBK能比GB2312顯示更多的字元,要顯示簡體碼的繁體字,就只能用GBK。 3)編輯/etc/my.cnf ,在[mysql]段加入default_character_set=utf8; 4)在編寫Connection URL時,加上?useUnicode=true&characterEncoding=utf-8引數; 5)在網頁程式碼中加上一個"set names utf8"或者"set names gbk"的指令,告訴MySQL連線內容都要使用utf8或者gbk;