solaris上開發J2EE應用中文問題的解決 (轉)[@more@]

關於和的中文問題和處理方法，網上已經有很多文章。一般在中文核心的操作（如中文NT，2000）上，該問題不是很突出，而在其他一些系統（如,）中就比較明顯了。近日在solaris上開發一個J2EE的應用系統，環境是solaris 2.7+minij2ee+my。系統在windows和linux下均沒有出現中文處理的問題，但部署到solaris上面後所有中文顯示為?。
後來經過分析，發現原因出在系統編碼上。由於solaris時預設的系統編碼為ASCII，因此以預設的系統編碼處理字串時漢字高位資訊丟失。下面一段簡單的jsp說明了這個問題：

String str=request.getParameter("i");
//byte[] b=str.getBytes("iso-8859-1");
byte[] b=str.getBytes();
out.println(new String(b,"gb2312"));
%>
在中輸入foo.jsp?i=中文，結果顯示為??。如果將byte[] b=str.getBytes();換成上面註釋掉的byte[] b=str.getBytes("iso-8859-1");，則正常顯示出“中文”二字。查閱了 JC的程式，問題相同。
考慮解決的方法有兩個，一個是修改驅動程式，另一個是將漢字編碼成7位，從實現方便的角度選擇了後者。不過後者的缺點是字串長度增加，並且無法直接透過sql工具來修改了。網上有一種漢字編碼的方法，是將漢字高位去1，英文則補一個0表示。這種方法有缺陷，因為特定的漢字編碼後會出現“'”等SQL語句中有歧義的字元，導致sql失敗。我摘取了minij2ee中uniString的編碼方法，該方法將位元組表示為其16進位制編碼，下面是：
public String encode()
{
try
{
StringBuffer sb=new StringBuffer();
byte[] bytes=m_enc.compareTo("")==0?m_str.getBytes():m_str.getBytes(m_enc);

for(int i =0;i {
char ch;
ch=Character.forDigit((bytes[i]>>4)&0xF,16);
sb.append(ch);
ch=Character.forDigit(bytes[i]&0xF,16);
sb.append(ch);
}

return sb.toString();
}
catch(.io.UnsupportedEncodingException e)
{
throw new RuntimeException("Unsupported encoding type.");
}
}

public void decode(String encodestr)
{
StringBuffer sb=new StringBuffer();
int i=0;

while(i!=encodestr.length())
{
sb.append((char)Integer.parseInt(encodestr.substring(i,i+2),16));
i+=2;
}

m_str=new uniString(sb.toString(),"iso-8859-1").cvt(m_enc);
}
使用編碼後，問題解決。
另外提一下，minij2ee最新版本中提供一個uniString類，解決了在所有上的中文問題。使用uniString，無需關心字串本身編碼，使用時只要來獲得需要的編碼即可，如在jsp裡呼叫uniString.gb()即可以以gb2312輸出字串，在資料庫時呼叫uniString.sys()即可以以系統預設編碼輸出字串，無論在中文核心還是英文核心的作業系統上均通用。

黃凱

更多的技術文件，盡在minij2ee技術文件中心，請訪問 http://www.minij2ee.com/document/ 。

solaris上開發J2EE應用中文問題的解決 (轉)

相關文章