解讀GBK編碼格式下的" "(類似於空格)的字元

iteye_3698發表於2011-10-10

     今天同事在解析使用者上傳的excel表格時,發現有的資料後面帶了" "這個字元,以為是空格,無論怎麼trim都搞不掉,晚上抽了點時間研究了下這個特殊的字元。

       具體程式碼如下:

     

 String str = " "; //把特殊字元單獨拿出來定義成String型別

 char[] c = str.toCharArray();//轉化成f字元陣列
 for(int i=0;i<c.length;i++) 
 {  System.out.println(c[i]+" : " +Integer.toHexString((int)c[i])); //列印每個字元對應的unicode碼制(這裡就一個字元),輸出為3000

 } 
	  
     //檢視unicode碼值表,3000對應的為CJK(中日韓)標誌和符號,已經得知它在GBK編碼下表現為空格樣式,換用日文編碼解析一下
	  
	  str  = new String(str.getBytes("Shift_JIS"));
      System.out.println(str);  //列印出來為"丂",日文下讀作"kao  第四聲",意思為彎曲的釘子

  

相關文章