【轉帖】locale的設定及其LANG、LC_ALL、LANGUAGE環境變數的區別
http://hi.baidu.com/edeed/blog/item/2e99a14440bd8884b2b7dcb1.html
例如zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白這些古里古怪的表達方式。這個外星表示式規定了什麼東西呢?這個問題稍後詳述,現在只需要知道,這是locale的表達方式就可以了。
locale這個單詞中文翻譯成地區或者地域,其實這個單詞包含的意義要寬泛很多。Locale是根據計算機使用者所使用的語言,所在國家或者地區,以及當地的文化傳統所定義的一個軟體執行時的語言環境。
[oracle@game ~]$ locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8
[oracle@game ~]$
locale把按照所涉及到的文化傳統的各個方面分成12個大類,這12個大類分別是:
1、語言符號及其分類(LC_CTYPE)
2、數字(LC_NUMERIC)
3、比較和排序習慣(LC_COLLATE)
4、時間顯示格式(LC_TIME)
5、貨幣單位(LC_MONETARY)
6、資訊主要是提示資訊,錯誤資訊,狀態資訊,標題,標籤,按鈕和選單等(LC_MESSAGES)
7、姓名書寫方式(LC_NAME)
8、地址書寫方式(LC_ADDRESS)
9、電話號碼書寫方式(LC_TELEPHONE)
10、度量衡表達方式 (LC_MEASUREMENT)
11、預設紙張尺寸大小(LC_PAPER)
12、對locale自身包含資訊的概述(LC_IDENTIFICATION)。
所以說,locale就是某一個地域內的人們的語言習慣和文化傳統和生活習慣。一個地區的locale就是根據這幾大類的習慣定義的,這些locale定 義檔案放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義檔案,這些檔案都是用文字格式書寫的,你可以用寫字板開啟,看看裡邊的內容,當然出了有限的註釋以外,大部分 東西可能你都看不懂,因為是用的Unicode的字元索引方式。
[oracle@game ~]$ cd /usr/share/i18n/locales
[oracle@game locales]$ ls
aa_DJ ar_YE el_GR es_ES fr_CH iso14651_t1 ne_NP so_ET translit_hangul
aa_ER az_AZ el_GR@euro es_ES@euro fr_FR it_CH nl_BE so_KE translit_narrow
aa_ER@saaho be_BY en_AU es_GT fr_FR@euro it_IT nl_BE@euro so_SO translit_neutral
aa_ET bg_BG en_BW es_HN fr_LU it_IT@euro nl_NL sq_AL translit_small
af_ZA bn_BD en_CA es_MX fr_LU@euro iw_IL nl_NL@euro sr_CS translit_wide
am_ET bn_IN en_DK es_NI ga_IE ja_JP nn_NO st_ZA tr_TR
an_ES br_FR en_GB es_PA ga_IE@euro ka_GE no_NO sv_FI tt_RU
ar_AE br_FR@euro en_HK es_PE gd_GB kk_KZ oc_FR sv_FI@euro uk_UA
ar_BH bs_BA en_IE es_PR gez_ER kl_GL om_ET sv_SE ur_PK
ar_DZ byn_ER en_IE@euro es_PY gez_ER@abegede kn_IN om_KE ta_IN uz_UZ
ar_EG ca_ES en_IN es_SV gez_ET ko_KR pa_IN te_IN uz_UZ@cyrillic
ar_IN ca_ES@euro en_NZ es_US gez_ET@abegede kw_GB pl_PL tg_TJ vi_VN
ar_IQ cs_CZ en_PH es_UY gl_ES lg_UG POSIX th_TH wa_BE
ar_JO cy_GB en_SG es_VE gl_ES@euro lo_LA pt_BR ti_ER wa_BE@euro
ar_KW da_DK en_US et_EE gu_IN lt_LT pt_PT ti_ET wal_ET
ar_LB de_AT en_ZA eu_ES gv_GB lv_LV pt_PT@euro tig_ER xh_ZA
ar_LY de_AT@euro en_ZW eu_ES@euro he_IL mi_NZ ro_RO tl_PH yi_US
ar_MA de_BE es_AR fa_IR hi_IN mk_MK ru_RU translit_circle zh_CN
ar_OM de_BE@euro es_BO fi_FI hr_HR ml_IN ru_UA translit_cjk_compat zh_HK
ar_QA de_CH es_CL fi_FI@euro hu_HU mn_MN se_NO translit_cjk_variants zh_SG
ar_SA de_DE es_CO fo_FO hy_AM mr_IN sid_ET translit_combining zh_TW
ar_SD de_DE@euro es_CR fr_BE i18n ms_MY sk_SK translit_compat zu_ZA
ar_SY de_LU es_DO fr_BE@euro id_ID mt_MT sl_SI translit_font
ar_TN de_LU@euro es_EC fr_CA is_IS nb_NO so_DJ translit_fraction
[oracle@game locales]$
對於de_DE@euro的一點說明,@後邊是修正項,也就是說你可以看到兩個德國的locale:/usr/share/i18n/locales /de_DE@euro和/usr/share/i18n/locales/de_DE。開啟這兩個locale定義,你就會知道它們的差別在於 de_DE@euro使用的是歐洲的排序、比較和縮排習慣,而de_DE用的是德國的標準習慣。
上面我們說到了zh_CN.GB18030的前半部分,後半部分是什麼呢?大部分Linux使用者都知道是系統採用的字符集。
zh_CN.GB2312到底是在說什麼? Locale是軟體在執行時的語言環境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。一個locale的書寫格式為: 語言[_地域[.字符集]]。所以說呢,locale總是和一定的字符集相聯絡的。下面舉幾個例子:
1、我說中文,身處中華人民共和國,使用國標2312字符集來表達字元。zh_CN.GB2312=中文_中華人民共和國+國標2312字符集。
2、我說中文,身處中華人民共和國,使用國標18030字符集來表達字元。zh_CN.GB18030=中文_中華人民共和國+國標18030字符集。
3、我說中文,身處中華人民共和國臺灣省,使用國標Big5字符集來表達字元。zh_TW.BIG5=中文_臺灣.大五碼字符集
4、我說英文,身處大不列顛,使用ISO-8859-1字符集來表達字元。 en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集
5、我說德語,身處德國,使用UTF-8字符集,習慣了歐洲風格。-8字符集@按照歐洲習慣加以修正,注意不是-8,所以完全的locale表達方式是 [語言[_地域][.字符集] [@修正值]。
其中,與中文輸入關係最密切的就是LC_CTYPE,LC_CTYPE規定了系統內有效的字元以及這些字元的分類, 諸如什麼是大寫字母,小寫字母,大小寫轉換,標點符號、可列印字元和其他的字元屬性等方面。而locale定 義zh_CN中最最重要的一項就是定義了漢字(Class“hanzi”)這一個大類,當然也是用Unicode描述的,這就讓中文字元在Linux系統 中成為合法的有效字元,而且不論它們是用什麼字符集編碼的。
怎樣設定locale呢?
設定locale就是設定12大類的locale分類屬性,即12個LC_*。除了這12個變數可以設定以外,為了簡便起見,還有兩個變數:LC_ALL和LANG。它們之間有一個優先順序的關係:LC_ALL > LC_* >LANG。可以這麼說,LC_ALL是最上級設定或者強制設定,而LANG是預設設定值。
1、如果你設定了LC_ALL=zh_CN.UTF-8,那麼不管LC_*和LANG設定成什麼值,它們都會被強制服從LC_ALL的設定,成為 zh_CN.UTF-8。
2、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,並且沒有設定LC_ALL的話,那麼系統的locale設定以LC_*=en_US.UTF-8。
3、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未設定的話,系統會將LC_*設定成預設值,也就是LANG的值zh_CN.UTF-8。
4、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設定的話, 那麼系統的locale設定將是:LC_CTYPE=en_US.UTF-8,其餘的 LC_COLLATE,LC_MESSAGES等等均會採用預設值,也就是 LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。
所以,locale是這樣設定的:
1、如果你需要一個純中文的系統的話,設定LC_ALL= zh_CN.XXXX,或者LANG=zh_CN.XXXX都可以,當然你可以兩個都設定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設定,不要作無用功。
2、如果你只想要一個可以輸入中文的環境,而保持選單、標題,系統資訊等等為英文介面,那麼只需要設定 LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。
3、假如你高興的話,可以把12個LC_*一一設定成你需要的值,打造一個古靈精怪的系統: LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內碼GBK字符集); LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數字系統) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德國的度量衡使用ISO-8859-15字符集) 羅馬的地址書寫方式,美國的紙張設定……。估計沒人這麼幹吧。
4、假如你什麼也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統將採用POSIX作為lcoale,也就是C locale。
另外LANG和LANGUAGE有什麼區別呢?
LANG - Specifies the default locale for all unset locale variables
LANGUAGE - Most programs use this for the language of its interface
LANGUAGE是設定應用程式的介面語言。而LANG是優先順序很低的一個變數,它指定所有與locale有關的變數的預設值,
refer:http://blog.chinaunix.net/u2/60913/showart_1161340.html[@more@]
例如zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白這些古里古怪的表達方式。這個外星表示式規定了什麼東西呢?這個問題稍後詳述,現在只需要知道,這是locale的表達方式就可以了。
locale這個單詞中文翻譯成地區或者地域,其實這個單詞包含的意義要寬泛很多。Locale是根據計算機使用者所使用的語言,所在國家或者地區,以及當地的文化傳統所定義的一個軟體執行時的語言環境。
[oracle@game ~]$ locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8
[oracle@game ~]$
locale把按照所涉及到的文化傳統的各個方面分成12個大類,這12個大類分別是:
1、語言符號及其分類(LC_CTYPE)
2、數字(LC_NUMERIC)
3、比較和排序習慣(LC_COLLATE)
4、時間顯示格式(LC_TIME)
5、貨幣單位(LC_MONETARY)
6、資訊主要是提示資訊,錯誤資訊,狀態資訊,標題,標籤,按鈕和選單等(LC_MESSAGES)
7、姓名書寫方式(LC_NAME)
8、地址書寫方式(LC_ADDRESS)
9、電話號碼書寫方式(LC_TELEPHONE)
10、度量衡表達方式 (LC_MEASUREMENT)
11、預設紙張尺寸大小(LC_PAPER)
12、對locale自身包含資訊的概述(LC_IDENTIFICATION)。
所以說,locale就是某一個地域內的人們的語言習慣和文化傳統和生活習慣。一個地區的locale就是根據這幾大類的習慣定義的,這些locale定 義檔案放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義檔案,這些檔案都是用文字格式書寫的,你可以用寫字板開啟,看看裡邊的內容,當然出了有限的註釋以外,大部分 東西可能你都看不懂,因為是用的Unicode的字元索引方式。
[oracle@game ~]$ cd /usr/share/i18n/locales
[oracle@game locales]$ ls
aa_DJ ar_YE el_GR es_ES fr_CH iso14651_t1 ne_NP so_ET translit_hangul
aa_ER az_AZ el_GR@euro es_ES@euro fr_FR it_CH nl_BE so_KE translit_narrow
aa_ER@saaho be_BY en_AU es_GT fr_FR@euro it_IT nl_BE@euro so_SO translit_neutral
aa_ET bg_BG en_BW es_HN fr_LU it_IT@euro nl_NL sq_AL translit_small
af_ZA bn_BD en_CA es_MX fr_LU@euro iw_IL nl_NL@euro sr_CS translit_wide
am_ET bn_IN en_DK es_NI ga_IE ja_JP nn_NO st_ZA tr_TR
an_ES br_FR en_GB es_PA ga_IE@euro ka_GE no_NO sv_FI tt_RU
ar_AE br_FR@euro en_HK es_PE gd_GB kk_KZ oc_FR sv_FI@euro uk_UA
ar_BH bs_BA en_IE es_PR gez_ER kl_GL om_ET sv_SE ur_PK
ar_DZ byn_ER en_IE@euro es_PY gez_ER@abegede kn_IN om_KE ta_IN uz_UZ
ar_EG ca_ES en_IN es_SV gez_ET ko_KR pa_IN te_IN uz_UZ@cyrillic
ar_IN ca_ES@euro en_NZ es_US gez_ET@abegede kw_GB pl_PL tg_TJ vi_VN
ar_IQ cs_CZ en_PH es_UY gl_ES lg_UG POSIX th_TH wa_BE
ar_JO cy_GB en_SG es_VE gl_ES@euro lo_LA pt_BR ti_ER wa_BE@euro
ar_KW da_DK en_US et_EE gu_IN lt_LT pt_PT ti_ET wal_ET
ar_LB de_AT en_ZA eu_ES gv_GB lv_LV pt_PT@euro tig_ER xh_ZA
ar_LY de_AT@euro en_ZW eu_ES@euro he_IL mi_NZ ro_RO tl_PH yi_US
ar_MA de_BE es_AR fa_IR hi_IN mk_MK ru_RU translit_circle zh_CN
ar_OM de_BE@euro es_BO fi_FI hr_HR ml_IN ru_UA translit_cjk_compat zh_HK
ar_QA de_CH es_CL fi_FI@euro hu_HU mn_MN se_NO translit_cjk_variants zh_SG
ar_SA de_DE es_CO fo_FO hy_AM mr_IN sid_ET translit_combining zh_TW
ar_SD de_DE@euro es_CR fr_BE i18n ms_MY sk_SK translit_compat zu_ZA
ar_SY de_LU es_DO fr_BE@euro id_ID mt_MT sl_SI translit_font
ar_TN de_LU@euro es_EC fr_CA is_IS nb_NO so_DJ translit_fraction
[oracle@game locales]$
對於de_DE@euro的一點說明,@後邊是修正項,也就是說你可以看到兩個德國的locale:/usr/share/i18n/locales /de_DE@euro和/usr/share/i18n/locales/de_DE。開啟這兩個locale定義,你就會知道它們的差別在於 de_DE@euro使用的是歐洲的排序、比較和縮排習慣,而de_DE用的是德國的標準習慣。
上面我們說到了zh_CN.GB18030的前半部分,後半部分是什麼呢?大部分Linux使用者都知道是系統採用的字符集。
zh_CN.GB2312到底是在說什麼? Locale是軟體在執行時的語言環境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。一個locale的書寫格式為: 語言[_地域[.字符集]]。所以說呢,locale總是和一定的字符集相聯絡的。下面舉幾個例子:
1、我說中文,身處中華人民共和國,使用國標2312字符集來表達字元。zh_CN.GB2312=中文_中華人民共和國+國標2312字符集。
2、我說中文,身處中華人民共和國,使用國標18030字符集來表達字元。zh_CN.GB18030=中文_中華人民共和國+國標18030字符集。
3、我說中文,身處中華人民共和國臺灣省,使用國標Big5字符集來表達字元。zh_TW.BIG5=中文_臺灣.大五碼字符集
4、我說英文,身處大不列顛,使用ISO-8859-1字符集來表達字元。 en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集
5、我說德語,身處德國,使用UTF-8字符集,習慣了歐洲風格。-8字符集@按照歐洲習慣加以修正,注意不是-8,所以完全的locale表達方式是 [語言[_地域][.字符集] [@修正值]。
其中,與中文輸入關係最密切的就是LC_CTYPE,LC_CTYPE規定了系統內有效的字元以及這些字元的分類, 諸如什麼是大寫字母,小寫字母,大小寫轉換,標點符號、可列印字元和其他的字元屬性等方面。而locale定 義zh_CN中最最重要的一項就是定義了漢字(Class“hanzi”)這一個大類,當然也是用Unicode描述的,這就讓中文字元在Linux系統 中成為合法的有效字元,而且不論它們是用什麼字符集編碼的。
怎樣設定locale呢?
設定locale就是設定12大類的locale分類屬性,即12個LC_*。除了這12個變數可以設定以外,為了簡便起見,還有兩個變數:LC_ALL和LANG。它們之間有一個優先順序的關係:LC_ALL > LC_* >LANG。可以這麼說,LC_ALL是最上級設定或者強制設定,而LANG是預設設定值。
1、如果你設定了LC_ALL=zh_CN.UTF-8,那麼不管LC_*和LANG設定成什麼值,它們都會被強制服從LC_ALL的設定,成為 zh_CN.UTF-8。
2、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,並且沒有設定LC_ALL的話,那麼系統的locale設定以LC_*=en_US.UTF-8。
3、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未設定的話,系統會將LC_*設定成預設值,也就是LANG的值zh_CN.UTF-8。
4、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設定的話, 那麼系統的locale設定將是:LC_CTYPE=en_US.UTF-8,其餘的 LC_COLLATE,LC_MESSAGES等等均會採用預設值,也就是 LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。
所以,locale是這樣設定的:
1、如果你需要一個純中文的系統的話,設定LC_ALL= zh_CN.XXXX,或者LANG=zh_CN.XXXX都可以,當然你可以兩個都設定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設定,不要作無用功。
2、如果你只想要一個可以輸入中文的環境,而保持選單、標題,系統資訊等等為英文介面,那麼只需要設定 LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。
3、假如你高興的話,可以把12個LC_*一一設定成你需要的值,打造一個古靈精怪的系統: LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內碼GBK字符集); LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數字系統) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德國的度量衡使用ISO-8859-15字符集) 羅馬的地址書寫方式,美國的紙張設定……。估計沒人這麼幹吧。
4、假如你什麼也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統將採用POSIX作為lcoale,也就是C locale。
另外LANG和LANGUAGE有什麼區別呢?
LANG - Specifies the default locale for all unset locale variables
LANGUAGE - Most programs use this for the language of its interface
LANGUAGE是設定應用程式的介面語言。而LANG是優先順序很低的一個變數,它指定所有與locale有關的變數的預設值,
refer:http://blog.chinaunix.net/u2/60913/showart_1161340.html[@more@]
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/161195/viewspace-1055560/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- locale的設定及其LANG、LC_ALL、LANGUAGE環境變數的區別(轉帖)變數
- LANG、LC_ALL、LANGUAGE等語言環境變數區別變數
- LANG,LC_ALL,locale詳解(轉)
- linux環境變數設定區別Linux變數
- 環境變數的設定方法(轉)~變數
- 設定環境變數(轉)變數
- java設定-JDK環境變數的設定(轉)JavaJDK變數
- RMAN環境變數的設定變數
- 禁止 SSH 傳遞 locale 環境變數變數
- 設定環境變數變數
- 【LC】locale設定查詢及相關環境變數含義及示例變數
- win10環境變數怎麼設定 win10設定環境變數的方法Win10變數
- export 設定環境變數Export變數
- oracle環境變數設定Oracle變數
- CentOS環境變數設定CentOS變數
- redhatas 設定環境變數Redhat變數
- rman 設定環境變數變數
- JAVA環境變數設定Java變數
- Mac 設定環境變數的位置、檢視和新增PATH環境變數Mac變數
- Oracle環境變數NLS_LANGOracle變數
- Linux設定環境變數Linux變數
- c#環境變數設定C#變數
- XMLBeans 環境變數設定XMLBean變數
- Linux 環境變數設定Linux變數
- java JDK環境變數設定JavaJDK變數
- java jdk 設定環境變數JavaJDK變數
- ansible 設定環境變數變數
- ansible設定環境變數變數
- SQL Server 2008更改環境設定的幾個方式及其區別SQLServer
- 【NLS_LANG】不同作業系統平臺NLS_LANG環境變數的檢視與設定方法作業系統變數
- 關於環境變數設定的問題變數
- linux下的java環境變數設定LinuxJava變數
- win10環境變數設定怎麼編輯 win10設定環境變數的位置在哪Win10變數
- Unix的環境變數(轉)變數
- Unix的環境變數 (轉)變數
- 什麼是環境變數?Python中如何設定環境變數?變數Python
- Linux下perldoc亂碼延伸至LANG,LC_ALL,locale探討Linux
- Golang環境變數設定詳解Golang變數