Python urlencode 編碼和url拼接

pythontab發表於2014-05-13

urlencode 呼叫方法

urlencode的引數必須是Dictionary

import urllib
d = {'name1':'www.pythontab.com','name2':'bbs.pythontab.com'}
print urllib.urlencode(d)

輸出:

name2=bbs.pythontab.com&name1=www.pythontab.com

相當於拼接兩個url引數,這個用法類似於PHP中的http_build_query(),這裡就不多數PHP中怎麼用了,有興趣的自己去查一下。

urlencode 編碼

函式urlencode不會改變傳入引數的原始編碼,也就是說需要在呼叫之前將post或get引數的編碼調整好。

問題:現在模擬請求Google和baidu,由於baidu使用的是gb2312編碼,google使用的是utf8編碼,兩個站點提交到URL中的中文引數的urlencode值是不一樣,下面以”PythonTab中文網”為例:

# coding: UTF-8
str = u'PythonTab中文網'
str = str.encode('gb2312')
d = {'name':str}
q = urllib.urlencode(d)
print q

結果:

name=PythonTab%D6%D0%CE%C4%CD%F8

注意:urlencode的引數必須是Dictionary

其他用法

django中urlencode類似,方法如下:

from django.utils.http import urlquote
a = urlquote('PythonTab中文網')
print a

得到漢字的GBK編碼

urllib 轉換字串

其實可以用urllib的quote函式對URL中的中文進行轉換,將中文轉換成GBK的編碼,得到的編碼是符合URI標準的URL。

>>> import urllib
>>> a = "PythonTab中文網"
>>> a
'PythonTab\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x91'
>>> urllib.quote(a)
'PythonTab%E4%B8%AD%E6%96%87%E7%BD%91'
>>>


相關文章