oracle imp字符集問題的解決

fanhongjie發表於2007-09-12
問題: 在imp一個dmp檔案的時候,提示不支援要求的字符集轉換(從型別850852).[@more@]

原理:ORACLE多國語言設定是為了支援世界範圍的語言與字符集,一般對語言提示,貨幣形式,排序方式和CHAR,VARCHAR2,CLOB,LONG欄位的資料的顯示等有效。ORACLE的多國語言設定最主要的兩個特性就是國家語言設定與字符集設定,國家語言設定決定了介面或提示使用的語言種類,字符集決定了資料庫儲存與字符集有關資料(如文字)時候的編碼規則。
ORACLE字符集設定,分為資料庫字符集和客戶端字符集環境設定。在資料庫端,字符集在建立資料庫的時候設定,並儲存在資料庫props$表中,對於8i以上產品,已經可以採用'Alter database character set 字符集'來修改資料庫的字符集,但也僅僅是從子集到超集,不要透過update props$來修改字符集,如果是不支援的轉換,可能會失去所有與字符集有關的資料,就是支援的轉換,也可能導致資料庫的不正常工作。字符集分為單位元組字符集與多位元組字符集,US7ASCII就是典型的單位元組字符集,在這種字符集中length=lengthb,而ZHS16GBK就是常用的雙位元組字符集,在這裡lengthb=2*length。
在客戶端的字符集環境比較簡單,主要就是環境變數或登錄檔項NLS_LANG,注意NLS_LANG的優先順序別為:引數檔案à登錄檔à環境變數àalter session。NLS_LANG的組成為“國家語言設定.字符集”,如nls_lang=simplified chinese_china.zhs16gbk。客戶端的字符集最好與資料庫端一樣(國家語言設定可以不一樣,如zhs16gbk的字符集,客戶端可以是nls_lang =simplified chinese_china.zhs16gbk或Ameircan_America.zhs16gbk,都不影響資料庫字元的正常顯示),如果字符集不一樣,而且字符集的轉換也不相容,那麼客戶端的資料顯示與匯出/匯入的與字符集有關的資料將都是亂碼。

方案:
使用2進位制檔案編輯工具,如uedit32。開啟匯出的dmp檔案,獲取2、3位元組的內容,如00 01,先把它轉換為10進位制數,為1,使用函式NLS_CHARSET_NAME即可獲得該字符集:
SQL> select nls_charset_name(1) from dual;
NLS_CHARSET_NAME(1)
-------------------
US7ASCII
可以知道該dmp檔案的字符集為US7ASCII,如果需要把該dmp檔案的字符集換成ZHS16GBK,則需要用NLS_CHARSET_ID獲取該字符集的編號:
SQL> select nls_charset_id('zhs16gbk') from dual;
NLS_CHARSET_ID('ZHS16GBK')
--------------------------
852
把852換成16進位制數,為354,把2、3位元組的00 01換成03 54,即完成了把該dmp檔案字符集從us7ascii到zhs16gbk的轉化,這樣,再把該dmp檔案匯入到zhs16gbk字符集的資料庫就可以了。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/73920/viewspace-969051/,如需轉載,請註明出處,否則將追究法律責任。

相關文章