mysql字符集和字元排序

熊抱發表於2018-07-21


mysql的字符集和字元序:
    字元序:字元序(Collation)是指在同一字符集內字元之間的比較規則
    一個字元序唯一對應一種字符集,但一個字符集可以對應多種字元序,其中有一個是預設字元序(Default Collation)

    mysql的字符集和字元序有四個級別的預設設定:伺服器級,資料庫級,資料表級,欄位級

    mysql中的字元序的命名按照規範,以字元序對應的字符集名稱開頭.以_ci(大小寫不敏感),_cs(大小寫敏感)或者_bin(按編碼值比較)
        例如:在字元序“utf8_general_ci”下,字元“a”和“A”是等價的

    mysql字符集設定:
        系統變數:
            – character_set_server:預設的內部操作字符集
            – character_set_client:客戶端來源資料使用的字符集
            – character_set_connection:連線層字符集
            – character_set_results:查詢結果字符集
            – character_set_database:當前選中資料庫的預設字符集
            – character_set_system:系統後設資料(欄位名等)字符集
            – 還有以collation_開頭的同上面對應的變數,用來描述字元序

        MySQL中的字符集轉換過程:
            1.MySQL Server收到請求時將請求資料從character_set_client轉換為character_set_connection
            2.進行內部操作前將請求資料從character_set_connection轉換為內部操作字符集,其確定方法如下
                   – 使用每個資料欄位的CHARACTER SET設定值
                   – 若上述值不存在,則使用對應資料表的DEFAULT CHARACTER SET設定值(MySQL擴充套件,非SQL標準)
                   – 若上述值不存在,則使用對應資料庫的DEFAULT CHARACTER SET設定值
                   – 若上述值不存在,則使用character_set_server設定值
            3.將操作結果從內部操作字符集轉換為character_set_results

        檢測字符集問題的命令;
                SHOW CHARACTER SET;
                SHOW COLLATION;
                SHOW VARIABLES LIKE ‘character%’;
                SHOW VARIABLES LIKE ‘collation%’;
                SQL函式HEX、LENGTH、CHAR_LENGTH
                SQL函式CHARSET、COLLATION

        注意事項:
            1.my.cnf中的default_character_set設定隻影響mysql命令連線伺服器時的連線字符集,不會對使用libmysqlclient庫
            的應用程式產生任何作用
            2.對欄位進行的SQL操作通常都是以內部操作字符集來進行的,不受連線字符集設定的影響

        總結:
            mysql的字符集可以細化到一個庫,一張表,一列.但是一般是使用預設的設定
                1.編譯mysql時,指定了一個預設的字符集,這個字符集是latin1
                2.安裝mysql時,可以在配置檔案中指定一個預設的字符集,如果沒有指定,這個值繼承編譯時的字符集
                3.啟動mysqld時,可以使用character_set_server來指定預設的字符集,如果沒有指定就繼承配置檔案中的配置
                4.安裝mysql時選擇多語言支援,在程式安裝時會自動將配置設定為UTF-8

            預設情況下的mysql預設字符集是latin1

        修改預設字符集:
            1.最簡單的修改方法:
                在mysql的配置檔案中加入default-character-set = utf8
                                    character_set_server = utf8
                    修改完後重啟伺服器
            2.線上修改字符集
                     mysql> SET character_set_client = utf8;
                     mysql> SET character_set_connection = utf8;
                     mysql> SET character_set_database = utf8;
                     mysql> SET character_set_results = utf8;
                     mysql> SET character_set_server = utf8;
                     mysql> SET collation_connection = utf8;
                     mysql> SET collation_database = utf8;
                     mysql> SET collation_server = utf8;

            設定了表的預設字符集為utf8並且通過UTF-8編碼傳送查詢,存入資料庫的仍然是亂碼.那connection連線層上可能出了問題
            解決方法是在傳送查詢前執行一下下面這句:SET NAMES `utf8`;它相當於下面的三句指令:
                SET character_set_client = utf8;
                SET character_set_results = utf8;
                SET character_set_connection = utf8;

自己週末放假沒事學習的心得,如有不對請指出.謝謝!

相關文章