imp/exp 字符集轉換

guyuexue發表於2007-11-22
明白ORACLE的多國語言設定,ORACLE多國語言設定是為了支援世界範圍的語言與字符集,一般對語言提示,貨幣形式,排序方式和CHAR,VARCHAR2,CLOB,LONG欄位的資料的顯示等有效。ORACLE的多國語言設定最主要的兩個特性就是國家語言設定與字符集設定,國家語言設定決定了介面或提示使用的語言種類,字符集決定了資料庫儲存與字符集有關資料(如文字)時候的編碼規則。正如剛才上面的一個小例子,環境變數NLS_LANG的不同,導致EXP幫助發生變化,這就是多國語言設定的作用(NLS_LANG包含國家語言設定與字符集設定,這裡起作用的是國家語言設定,而不是字符集)。

ORACLE字符集設定,分為資料庫字符集和客戶端字符集環境設定。在資料庫端,字符集在建立資料庫的時候設定,並儲存在資料庫props$表中,對於8i以上產品,已經可以採用“Alter database character set 字符集”來修改資料庫的字符集,但也僅僅是從子集到超集,不要透過update props$來修改字符集,如果是不支援的轉換,可能會失去所有與字符集有關的資料,就是支援的轉換,也可能導致資料庫的不正常工作。字符集分為單位元組字符集與多位元組字符集,US7ASCII就是典型的單位元組字符集,在這種字符集中length=lengthb,而ZHS16GBK就是常用的雙位元組字符集,在這裡lengthb=2*length。

在客戶端的字符集環境比較簡單,主要就是環境變數或登錄檔項NLS_LANG,注意NLS_LANG的優先順序別為:引數檔案à登錄檔à環境變數àalter session。NLS_LANG的組成為“國家語言設定.字符集”,如nls_lang=simplified chinese_china.zhs16gbk。客戶端的字符集最好與資料庫端一樣(國家語言設定可以不一樣,如zhs16gbk的字符集,客戶端可以是nls_lang =simplified chinese_china.zhs16gbk或Ameircan_America.zhs16gbk,都不影響資料庫字元的正常顯示),如果字符集不一樣,而且字符集的轉換也不相容,那麼客戶端的資料顯示與匯出/匯入的與字符集有關的資料將都是亂碼。

使用一點點技巧,就可以使匯出/匯入在不同的字符集的資料庫上轉換資料。這裡需要一個2進位制檔案編輯工具即可,如uedit32。用編輯方式開啟匯出的dmp檔案,獲取2、3位元組的內容,如00 01,先把它轉換為10進位制數,為1,使用函式NLS_CHARSET_NAME即可獲得該字符集:

SQL> select nls_charset_name(1) from dual;

NLS_CHARSET_NAME(1)

-------------------

US7ASCII

可以知道該dmp檔案的字符集為US7ASCII,如果需要把該dmp檔案的字符集換成ZHS16GBK,則需要用NLS_CHARSET_ID獲取該字符集的編號:

SQL> select nls_charset_id('zhs16gbk') from dual;

NLS_CHARSET_ID('ZHS16GBK')

--------------------------

852

把852換成16進位制數,為354,把2、3位元組的00 01換成03 54,即完成了把該dmp檔案字符集從us7ascii到zhs16gbk的轉化,這樣,再把該dmp檔案匯入到zhs16gbk字符集的資料庫就可以了。(注意,十進位制數與十六進位制之間的轉換,想明白其中的道理)[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/503782/viewspace-983264/,如需轉載,請註明出處,否則將追究法律責任。