從此不再懼怕URI編碼:JavaScript及C# URI編碼詳解
混亂的URI編碼
JavaScript中編碼有三種方法:escape、encodeURI、encodeURIComponent
C#中編碼主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString
JavaScript中的還好,只提供了三個,C#中主要用的就有這麼多,還沒有列出其他編碼(HTML),一多就弄不明白,弄不明白就心生恐懼,心生恐懼就變得苦逼,本文就向大家詳細解釋在JavaScript及C#中如何對URI進行編碼的方法(注:本文不涉及到其他編碼)。
escape:不推薦使用
原因:eacape是BOM中的方法,只能對ASCII符號正確編碼,而encodeURI、encodeURIComponent可以對所有的Unicode符號編碼。ECMAScript v3 反對使用該方法,應用使用 decodeURI() 和 decodeURIComponent() 替代它。
escape不編碼字元有69個:*,+,-,.,/,@,_,0-9,a-z,A-Z
encodeURI:用於對網址編碼(不包含引數)
encodeURI不編碼字元有82個:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURI就是為這個而設計的。encodeURI不對URI中的特殊字元進行編碼,如冒號(:)、斜槓(/)。下面看個示例:
encodeURI("http://www.cnblogs.com/a file with spaces.html") // outputs http://www.cnblogs.com/a%20file%20with%20spaces.html
可以看到僅僅把空格替換成了20%,所以此方法可用於對網址進行編碼。
由於encodeURI不對冒號(:)、斜槓(/)進行編碼,所以如果引數(如把網址作為引數)中包含冒號(:)、斜槓(/),就會解析出錯,所以此方法不能對引數進行編碼。
encodeURIComponent:用於對網址引數進行編碼
encodeURIComponent不編碼字元有71個:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z
可以看到此方法對:/都進行了編碼,所以不能用它來對網址進行編碼。由於此方法對中文,空格,井號(#),斜線(/),冒號(:)都進行了編碼,所以適合對URI中的引數進行編碼。看下面的示例:
var param="部落格園"; var url="http://www.cnblogs.com/?key="+encodeURIComponent(param)+"&page=1"; console.log(url);//outputs http://www.cnblogs.com/?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1
可以看到,這正是我們想要的結果(這裡只對需要編碼的引數(page=1不需要編碼)進行了編碼)。
Server.UrlEncode && HttpUtility.UrlEncode:不推薦
把這兩個放到一起說是因為這兩個方法在絕大多數情況下是一樣的。它們的區別是HttpUtility.UrlEncode預設使用UTF8格式編碼,而Server.UrlEncode是使用系統預設格式編碼,Server.UrlEncode使用系統預設編碼做為引數呼叫HttpUtility.UrlEncode編碼,所以如果系統全域性都用UTF8格式編碼,這兩個方法就是一樣的。
這兩個方法是怎麼編碼的呢,我們來看個示例:
string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc"; Response.Write(HttpUtility.UrlEncode(url1) ); //output http%3a%2f%2fwww.cnblogs.com%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc
由上面的例子我們可以看出,HttpUtility.UrlEncode對冒號(:)和斜槓(/)進行了編碼,所以不能用來對網址進行編碼。
那麼能不能對引數進行編碼呢,答案也是否定的。因為在引數中空格應該被編碼為%20而不是被HttpUtility.UrlEncode編碼為加號(+),所以不推薦用這兩個方法對URI進行編碼。
Uri.EscapeUriString:用於對網址編碼(不包含引數)
我們還是用例子說話:
string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc"; Response.Write( Uri.EscapeUriString(url1)); //outputs: http://www.cnblogs.com/a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc
可以看出,Uri.EscapeUriString對空格進行了編碼,也對中文進行了編碼,但對冒號(:)、斜槓(/)和井號(#)未編碼,所以此方法可以用於網址進行編碼,但不能對引數進行編碼,作用類似JavaScript中的encodeURI方法。
Uri.EscapeDataString:用於對網址引數進行編碼
仍然用例子說話:
string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=部落格園#abc"; Response.Write(Uri.EscapeDataString(url1)); //outputs: http%3A%2F%2Fwww.cnblogs.com%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc
可以看出,Uri.EscapeDataString對冒號(:)、斜槓(/)、空格、中文、井號(#)都進行了編碼,所以此方法不可以用於網址進行編碼,但可以用於對引數進行編碼,作用類似JavaScript中的encodeURIComponent方法。
小結
在JavaScript中推薦的做法是用encodeURI對URI的網址部分編碼,用encodeURIComponent對URI中傳遞的引數進行編碼。
在C#中推薦的做法是用Uri.EscapeUriString對URI的網址部分編碼,用Uri.EscapeDataString對URI中傳遞的引數進行編碼。
解碼部分就不說了,與編碼方法相對應。
http://www.cnblogs.com/artwl/archive/2012/03/07/2382848.html
相關文章
- 筆記八:URI Search 詳解筆記
- ES 筆記八:URI Search 詳解筆記
- JavaScript this 從此不再疑惑JavaScript
- Javascript編碼解碼URLJavaScript
- data URI
- JS、C#中URL編碼解碼問題JSC#
- JavaScript編碼指南JavaScript
- Javascript編碼規範JavaScript
- 音訊編碼基礎詳解音訊
- Unicode編碼解碼Unicode
- URI 上傳中文符
- URI設計原則
- url和uri區別
- Python基礎之七:編碼詳解Python
- nginx原始碼編譯安裝(詳解)Nginx原始碼編譯
- Base64編碼知識詳解
- JavaScript編碼風格指南JavaScript
- JavaScript 編碼風格指南JavaScript
- JavaScript對url地址編碼JavaScript
- 用 JavaScript 編寫 MPEG1 解碼器JavaScript
- 詳解低延時高音質:編解碼篇
- 音視訊編解碼 -- 編碼引數 CRFCRF
- uri和url的區別
- URL、URI與URN 區別
- WPF image via web url or uriWeb
- url和uri的區別
- H.265/HEVC 幀內編碼詳解
- 可能是最詳細的字元編碼詳解字元
- 談談JavaScript編碼風格JavaScript
- Go JSON編碼與解碼?GoJSON
- URL編碼與解碼原理
- OpenLR 的編碼與解碼
- python中的編碼&解碼Python
- 程式碼線上編譯器(上)- 編輯及編譯編譯
- 【Netty】編解碼器Netty
- 不再怕面試被考字串---詳解Java中的字串面試字串Java
- 如何使用`open-uri`模組
- 一次搞懂 URI、URL、URN
- 深入 JavaScript 原型繼承原理——babel 編譯碼解讀JavaScript原型繼承Babel編譯