從此不再懼怕URI編碼:JavaScript及C# URI編碼詳解
混亂的URI編碼
JavaScript中編碼有三種方法:escape、encodeURI、encodeURIComponent
C#中編碼主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString
JavaScript中的還好,只提供了三個,C#中主要用的就有這麼多,還沒有列出其他編碼(HTML),一多就弄不明白,弄不明白就心生恐懼,心生恐懼就變得苦逼,本文就向大家詳細解釋在JavaScript及C#中如何對URI進行編碼的方法(注:本文不涉及到其他編碼)。
escape:不推薦使用
原因:eacape是BOM中的方法,只能對ASCII符號正確編碼,而encodeURI、encodeURIComponent可以對所有的Unicode符號編碼。ECMAScript v3 反對使用該方法,應用使用 decodeURI() 和 decodeURIComponent() 替代它。
escape不編碼字元有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z
encodeURI:用於對網址編碼(不包含引數)
encodeURI不編碼字元有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURI就是為這個而設計的。encodeURI不對URI中的特殊字元進行編碼,如冒號(:)、斜槓(/)。下面看個示例:
encodeURI("http://www.cnblogs.com/a file with spaces.html") // outputs http://www.cnblogs.com/a%20file%20with%20spaces.html
可以看到僅僅把空格替換成了20%,所以此方法可用於對網址進行編碼。
由於encodeURI不對冒號(:)、斜槓(/)進行編碼,所以如果引數(如把網址作為引數)中包含冒號(:)、斜槓(/),就會解析出錯,所以此方法不能對引數進行編碼。
encodeURIComponent:用於對網址引數進行編碼
encodeURIComponent不編碼字元有71個:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z
可以看到此方法對:/都進行了編碼,所以不能用它來對網址進行編碼。由於此方法對中文,空格,井號(#),斜線(/),冒號(:)都進行了編碼,所以適合對URI中的引數進行編碼。看下面的示例:
var param="部落格園"; var url="http://www.cnblogs.com/?key="+encodeURIComponent(param)+"&page=1"; console.log(url);//outputs http://www.cnblogs.com/?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1
可以看到,這正是我們想要的結果(這裡只對需要編碼的引數(page=1不需要編碼)進行了編碼)。
Server.UrlEncode && HttpUtility.UrlEncode:不推薦
把這兩個放到一起說是因為這兩個方法在絕大多數情況下是一樣的。它們的區別是HttpUtility.UrlEncode預設使用UTF8格式編碼,而Server.UrlEncode是使用系統預設格式編碼,Server.UrlEncode使用系統預設編碼做為引數呼叫HttpUtility.UrlEncode編碼,所以如果系統全域性都用UTF8格式編碼,這兩個方法就是一樣的。
這兩個方法是怎麼編碼的呢,我們來看個示例:
string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc"; Response.Write(HttpUtility.UrlEncode(url1) ); //output http%3a%2f%2fwww.cnblogs.com%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
由上面的例子我們可以看出,HttpUtility.UrlEncode對冒號(:)和斜槓(/)進行了編碼,所以不能用來對網址進行編碼。
那麼能不能對引數進行編碼呢,答案也是否定的。因為在引數中空格應該被編碼為%20而不是被HttpUtility.UrlEncode編碼為加號(+),所以不推薦用這兩個方法對URI進行編碼。
Uri.EscapeUriString:用於對網址編碼(不包含引數)
我們還是用例子說話:
string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc"; Response.Write( Uri.EscapeUriString(url1)); //outputs: http://www.cnblogs.com/a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc
可以看出,Uri.EscapeUriString對空格進行了編碼,也對中文進行了編碼,但對冒號(:)、斜槓(/)和井號(#)未編碼,所以此方法可以用於網址進行編碼,但不能對引數進行編碼,作用類似JavaScript中的encodeURI方法。
Uri.EscapeDataString:用於對網址引數進行編碼
仍然用例子說話:
string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc"; Response.Write(Uri.EscapeDataString(url1)); //outputs: http%3A%2F%2Fwww.cnblogs.com%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc
可以看出,Uri.EscapeDataString對冒號(:)、斜槓(/)、空格、中文、井號(#)都進行了編碼,所以此方法不可以用於網址進行編碼,但可以用於對引數進行編碼,作用類似JavaScript中的encodeURIComponent方法。
小結
在JavaScript中推薦的做法是用encodeURI對URI的網址部分編碼,用encodeURIComponent對URI中傳遞的引數進行編碼。
在C#中推薦的做法是用Uri.EscapeUriString對URI的網址部分編碼,用Uri.EscapeDataString對URI中傳遞的引數進行編碼。
解碼部分就不說了,與編碼方法相對應。
http://www.cnblogs.com/artwl/archive/2012/03/07/2382848.html
相關文章
- servlet request getQueryString 漢字的URI編碼如何轉碼Servlet
- 字元編碼前世今生詳解,從此與“亂碼”說再見!字元
- 筆記八:URI Search 詳解筆記
- JavaScript this 從此不再疑惑JavaScript
- ES 筆記八:URI Search 詳解筆記
- Javascript編碼解碼URLJavaScript
- 各種字元編碼方式詳解及由來字元
- 【字元編碼】Java字元編碼詳細解答及問題探討字元Java
- JPEG檔案編/解碼詳解 .
- URL與URL編碼詳解
- Python字元編碼詳解Python字元
- JavaScript編碼指南JavaScript
- JavaScript 編碼指南JavaScript
- Nginx 重寫URINginx
- webclient類_操作uriWebclient
- 關於URL編碼/javascript/jsurl編碼JavaScriptJS
- jetty,tomcat URI傳中文引數亂碼的解決辦法JettyTomcat
- C#實現Base64編碼與解碼
- C# Unicode編碼C#Unicode
- C#編碼習慣C#
- C# 編碼規範C#
- Javascript編碼規範JavaScript
- JavaScript基本編碼模式JavaScript模式
- 從原理上搞定編碼-- Base64編碼
- C# 基礎知識:字元編碼、編碼轉換C#字元
- URI設計原則
- url和uri區別
- Android URI簡介Android
- Base64編碼知識詳解
- nginx原始碼編譯安裝(詳解)Nginx原始碼編譯
- 詳解LAMP原始碼編譯安裝LAMP原始碼編譯
- 字符集和字元編碼詳解字元
- 字符集編碼知識詳解
- Unicode編碼解碼Unicode
- C#支援的編碼格式C#
- 近日.NET C#編碼感悟C#
- 不再怕面試被考字串---詳解Java中的字串面試字串Java
- JavaScript編碼風格指南JavaScript