從此不再懼怕URI編碼:JavaScript及C# URI編碼詳解

benbenxiongyuan發表於2013-08-30

混亂的URI編碼

  JavaScript中編碼有三種方法:escape、encodeURI、encodeURIComponent

  C#中編碼主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString

  JavaScript中的還好,只提供了三個,C#中主要用的就有這麼多,還沒有列出其他編碼(HTML),一多就弄不明白,弄不明白就心生恐懼,心生恐懼就變得苦逼,本文就向大家詳細解釋在JavaScript及C#中如何對URI進行編碼的方法(注:本文不涉及到其他編碼)。

escape:不推薦使用

  原因:eacape是BOM中的方法,只能對ASCII符號正確編碼,而encodeURI、encodeURIComponent可以對所有的Unicode符號編碼。ECMAScript v3 反對使用該方法,應用使用 decodeURI() 和 decodeURIComponent() 替代它。

  escape不編碼字元有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI:用於對網址編碼(不包含引數)

  encodeURI不編碼字元有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

  encodeURI就是為這個而設計的。encodeURI不對URI中的特殊字元進行編碼,如冒號(:)、斜槓(/)。下面看個示例:

encodeURI("http://www.cnblogs.com/a file with spaces.html")
// outputs http://www.cnblogs.com/a%20file%20with%20spaces.html

  可以看到僅僅把空格替換成了20%,所以此方法可用於對網址進行編碼。

  由於encodeURI不對冒號(:)、斜槓(/)進行編碼,所以如果引數(如把網址作為引數)中包含冒號(:)、斜槓(/),就會解析出錯,所以此方法不能對引數進行編碼。

encodeURIComponent:用於對網址引數進行編碼

  encodeURIComponent不編碼字元有71個:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z

  可以看到此方法對:/都進行了編碼,所以不能用它來對網址進行編碼。由於此方法對中文,空格,井號(#),斜線(/),冒號(:)都進行了編碼,所以適合對URI中的引數進行編碼。看下面的示例:

var param="部落格園";
var url="http://www.cnblogs.com/?key="+encodeURIComponent(param)+"&page=1";
console.log(url);//outputs http://www.cnblogs.com/?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1

  可以看到,這正是我們想要的結果(這裡只對需要編碼的引數(page=1不需要編碼)進行了編碼)。

Server.UrlEncode && HttpUtility.UrlEncode:不推薦

  把這兩個放到一起說是因為這兩個方法在絕大多數情況下是一樣的。它們的區別是HttpUtility.UrlEncode預設使用UTF8格式編碼,而Server.UrlEncode是使用系統預設格式編碼,Server.UrlEncode使用系統預設編碼做為引數呼叫HttpUtility.UrlEncode編碼,所以如果系統全域性都用UTF8格式編碼,這兩個方法就是一樣的。

  這兩個方法是怎麼編碼的呢,我們來看個示例:

string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc";
Response.Write(HttpUtility.UrlEncode(url1) );

//output
http%3a%2f%2fwww.cnblogs.com%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc

  由上面的例子我們可以看出,HttpUtility.UrlEncode對冒號(:)和斜槓(/)進行了編碼,所以不能用來對網址進行編碼。

  那麼能不能對引數進行編碼呢,答案也是否定的。因為在引數中空格應該被編碼為%20而不是被HttpUtility.UrlEncode編碼為加號(+),所以不推薦用這兩個方法對URI進行編碼。

Uri.EscapeUriString:用於對網址編碼(不包含引數)

  我們還是用例子說話:

string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc";
Response.Write( Uri.EscapeUriString(url1));
//outputs:
http://www.cnblogs.com/a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc

  可以看出,Uri.EscapeUriString對空格進行了編碼,也對中文進行了編碼,但對冒號(:)、斜槓(/)和井號(#)未編碼,所以此方法可以用於網址進行編碼,但不能對引數進行編碼,作用類似JavaScript中的encodeURI方法。

Uri.EscapeDataString:用於對網址引數進行編碼

  仍然用例子說話:

string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc";
Response.Write(Uri.EscapeDataString(url1));
//outputs:
http%3A%2F%2Fwww.cnblogs.com%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc

  可以看出,Uri.EscapeDataString對冒號(:)、斜槓(/)、空格、中文、井號(#)都進行了編碼,所以此方法不可以用於網址進行編碼,但可以用於對引數進行編碼,作用類似JavaScript中的encodeURIComponent方法。

小結

  在JavaScript中推薦的做法是用encodeURI對URI的網址部分編碼,用encodeURIComponent對URI中傳遞的引數進行編碼。

  在C#中推薦的做法是用Uri.EscapeUriString對URI的網址部分編碼,用Uri.EscapeDataString對URI中傳遞的引數進行編碼。

  解碼部分就不說了,與編碼方法相對應。

 

http://www.cnblogs.com/artwl/archive/2012/03/07/2382848.html

相關文章