solaris上開發J2EE應用中文問題的解決 (轉)

worldblog發表於2007-12-09
solaris上開發J2EE應用中文問題的解決 (轉)[@more@]

 

 關於和的中文問題和處理方法,網上已經有很多文章。一般在中文核心的操作(如中文NT,2000)上,該問題不是很突出,而在其他一些系統(如,)中就比較明顯了。近日在solaris上開發一個J2EE的應用系統,環境是solaris 2.7+minij2ee+my。系統在windows和linux下均沒有出現中文處理的問題,但部署到solaris上面後所有中文顯示為?。
 後來經過分析,發現原因出在系統編碼上。由於solaris時預設的系統編碼為ASCII,因此以預設的系統編碼處理字串時漢字高位資訊丟失。下面一段簡單的jsp說明了這個問題:

String str=request.getParameter("i");
//byte[] b=str.getBytes("iso-8859-1");
byte[] b=str.getBytes();
out.println(new String(b,"gb2312"));
%>
在中輸入foo.jsp?i=中文,結果顯示為??。如果將byte[] b=str.getBytes();換成上面註釋掉的byte[] b=str.getBytes("iso-8859-1");,則正常顯示出“中文”二字。查閱了 JC的程式,問題相同。
考慮解決的方法有兩個,一個是修改驅動程式,另一個是將漢字編碼成7位,從實現方便的角度選擇了後者。不過後者的缺點是字串長度增加,並且無法直接透過sql工具來修改了。網上有一種漢字編碼的方法,是將漢字高位去1,英文則補一個0表示。這種方法有缺陷,因為特定的漢字編碼後會出現“'”等SQL語句中有歧義的字元,導致sql失敗。我摘取了minij2ee中uniString的編碼方法,該方法將位元組表示為其16進位制編碼,下面是:
public String encode()
{
 try
 {
 StringBuffer sb=new StringBuffer();
 byte[] bytes=m_enc.compareTo("")==0?m_str.getBytes():m_str.getBytes(m_enc);

 for(int i =0;i {
 char ch;
 ch=Character.forDigit((bytes[i]>>4)&0xF,16);
 sb.append(ch);
 ch=Character.forDigit(bytes[i]&0xF,16);
 sb.append(ch);
 }
 
 return sb.toString();
 }
 catch(.io.UnsupportedEncodingException e)
 {
 throw new RuntimeException("Unsupported encoding type.");
 }
}

public void decode(String encodestr)
{
 StringBuffer sb=new StringBuffer();
 int i=0;
 
 while(i!=encodestr.length())
 {
 sb.append((char)Integer.parseInt(encodestr.substring(i,i+2),16));
 i+=2;
 }
 
 m_str=new uniString(sb.toString(),"iso-8859-1").cvt(m_enc);
}
使用編碼後,問題解決。
 另外提一下,minij2ee最新版本中提供一個uniString類,解決了在所有上的中文問題。使用uniString,無需關心字串本身編碼,使用時只要來獲得需要的編碼即可,如在jsp裡呼叫uniString.gb()即可以以gb2312輸出字串,在資料庫時呼叫uniString.sys()即可以以系統預設編碼輸出字串,無論在中文核心還是英文核心的作業系統上均通用。

黃凱


更多的技術文件,盡在minij2ee技術文件中心,請訪問 http://www.minij2ee.com/document/


 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-990228/,如需轉載,請註明出處,否則將追究法律責任。

相關文章