Android 中的編碼與解碼

趙彥軍發表於2015-05-06

前言:今天遇到一個問題,一個使用者在登入的時候,出現登入失敗。但是其他使用者登入都是正常的,經過除錯發現登入失敗的使用者的密碼中有兩個特殊字元: * 、#  。

        特殊符號在提交表單的時候,出現了編碼不一樣的問題。那麼編碼是什麼鬼??

 

1、什麼是application/x-www-form-urlencoded字串?

    它是一種編碼型別。

    當URL地址裡包含非西歐字元的字串時,系統會將這些字元轉換成application/x-www-form-urlencoded字串。

    表單提交時也是如此,當包含非西歐字元的字串時,系統也會將這些字元轉換成application/x-www-form-urlencoded字串。

   

package com.app;
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;

public class AA {
    public static void main(String[] args) {
        /**
         * 將application/x-www-form-urlencoded字串 轉換成普通字串
         */
        String keyWord = "";
        try {
            keyWord = URLDecoder.decode("%E6%96%87%E6%A1%A3", "UTF-8");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }

        System.out.println(keyWord);

        /**
         * 將普通字串轉換成application/x-www-form-urlencoded字串
         * 必須強調的是編碼方式必須正確,如baidu的是gb2312,而google的是UTF-8
         */
        String urlStr = "" ;
        try {
            urlStr = URLEncoder.encode("文件", "Utf-8");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        System.out.println(urlStr);

    }
}

 

執行結果是:

  文件
 %E6%96%87%E6%A1%A3

 

2、URLEncoder  和  URLDecoder

    在java1.3和早期版本中,返回一個新的被編碼後的string,encode( ) 使用了平臺的預設編碼形式

   編碼:   public static String encode(String s)

   解碼:   public static String decode(String s)  

   在java1.4中及以後,要求使用者自己指定編碼形式,比如 "UTF-8" 、 "gb2312" 。

   編碼: public static String encode(String s, String encoding) throws UnsupportedEncodingException

   解碼: public static String decode(String s, String encoding) throws UnsupportedEncodingException

 

   注意:如果你拿不定主意用哪種編碼方式,那就選擇UTF-8吧。它比其他任何的編碼形式更有可能得到正確的結果。

 

3、為什麼要編碼?

    答案:處理不同作業系統間的差異性

  web設計者面臨的眾多難題之一便是怎樣處理不同作業系統間的差異性。這些差異效能引起URL方面的問題:例如,一些作業系統允許檔名中含有空格符,有些又不允許。

  大多數作業系統不會認為檔名中含有符號“#”會有什麼特殊含義;但是在一個URL中,符號“#”表示該檔名已經結束,後面會緊跟一個fragment(部分)識別符號。其他的特殊字元,  非字母數字字符集,它們在URL或另一個作業系統上都有其特殊的含義,表述著相似的問題。為了解決這些問題

我們在URL中使用的字元就必須是一個ASCII字符集的固定字集中的元素,具體如下:

   1.大寫字母A-Z
   2.小寫字母a-z
   3.數字 0-9
   4.標點符 - _ . ! ~ * ' (和 ,)

  如果向伺服器提交資料中含有  / & ? @ # ; $ + = %,這些字元和所有其他字元就應該被編碼。

  編碼過程非常簡單,任何字元只要不是ASCII碼數字,字母,或者前面提到的標點符,它們都將被轉換成位元組形式,每個位元組都寫成這種形式:一個“%”後面跟著兩位16進位制的數值。

  空格是一個特殊情況,因為它們太平常了。它除了被編碼成“%20”以外,還能編碼為一個“+”。加號(+)本身被編碼為%2B。

  當/ # = & 和?作為名字的一部分來使用時,而不是作為URL部分之間的分隔符來使用時,它們都應該被編碼。

 

4、如何編碼?

   類URL並不自動執行編碼或解碼工作。幸運的是,java提供了一個類URLEncoder把string編碼成這種形式。

   Java1.2增加了一個類URLDecoder它能以這種形式解碼string。

 

5、網頁中的表單使用POST方法提交時,資料內容的型別是 application/x-www-form-urlencoded,這種型別會:

    1.字元"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不會被編碼;
    2.將空格轉換為加號 (+) ;
    3.將非文字內容轉換成"%xy"的形式,xy是兩位16進位制的數值;
    4.在每個 name=value 對之間放置 & 符號

 

相關文章