Python 中的POST/GET包構建以及隨機字串的生成

pythontab發表於2013-04-23

現在,我們來用Python,建立GET包和POST包。

至於有什麼用處,大家慢慢體會。

Python 中包含了大量的庫,作為一門新興的語言,Python 對HTTP有足夠強大的支援。

現在,我們引入新的庫 httplib 以及 urllib

這兩個庫根據名稱,我們可以知道他們是對於HTTP以及URL的操作。

首先我們先要與伺服器建立連線。(我們以某微博作為例子實現下文的各種功能)

conn = httplib.HTTPConnection("ti50*****com");

只要沒有提示錯誤,我們就可以認為連線已成功,下面就可以進行資料包傳送了。

在上文中我們說過了GET包的結構,只有HEARDER 部分。而在httplib中,heaer 是透過一個字典來儲存的。下面我們來定義它:

headers = {"Content-Type": "application/x-www-form-urlencoded",

  "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",

  "Referer": "http://ti50.*****com/g/s?sid=*********************",

  "Accept-Encoding": "",

  "Accept-Language": "zh-CN,zh;q=0.8",

  "Accept-Charset": "GBK,utf-8;q=0.7,*;q=0.3",

  "Cookie": Cookie  }

Accept-Encoding 我們刪除了其內容,這對於伺服器來說我們客戶端不能接受任何壓縮的格式,資料包將用原始資料傳送回來,這樣我們就可以省去解壓縮的過程直接分析網頁了,但是這樣做的後果是流量大,網路實時性差。關於解壓縮自然有別的庫來專門處理。

然後我們可以直接傳送了。

conn.request(method="GET",url='''http://ti50****com/g/s?*********_TK9EH&r=''' + go_num + '''&aid=amsg&bid=******=true&ifh=1&ngpd=false''',headers=headers);

method 欄位說明是傳送何種型別的資料包。

url 欄位以字串的形式定義地址

header 欄位定義包頭。

一般來說,一個資料包傳送至伺服器,伺服器會相應的返回一個應答包。而且這個應答包對於我們往往是有用的,我們用下面的命令獲取應答包。

response = conn.getresponse();

對於上面這條語句中的括號,其表示讀取應答包的前多少個字元。

POST包與GET包的建立過程基本相同。

只是我們需要新定義BODY,這個部分可以用字串的方式進行定義。

params = 'msg=***************************'

我們仍然需要先於伺服器進行連線。

conn = httplib.HTTPConnection("ti50*****com");

傳送

conn.request(method="POST",url='''/g/s?sid=******************&ngpd=false''',body=params,headers=headers);

可以發現上面的這個公式和傳送GET包的格式略有差距。

method 改變了。

url 裡面沒有寫域名。

多了一個body 欄位。

其中第二條可以想到,如果沒定義域名,則系統將最近一次與伺服器的連線用的域名進行替換。

獲取應答包的方式與GET包相同。

亂七八糟的小應用。

(一) 隨機字串的生成。

當我們用POST做一些很有趣的事情時,常常會遇到伺服器驗證神馬的,有時候我們可以用隨機字串來處理這樣的情況。

python 中給了隨機數的庫…… random。

對於簡單的應用非常方便。例如我們產生a與b 之間的一個隨機整數。

random.randint(a,b)

>>> random.randint(10,20)

>>> 15

知道了這步,我們可以很簡單的編寫一個隨機字串的程式了,

from random import Random 
def random_str(randomlength): 
    str = '' 
    chars = 'AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz0123456789'
    length = len(chars) - 1
    random = Random() 
    for i in range(randomlength): 
        str+=chars[random.randint(0, length)] 
    return str


顯然當呼叫此函式時應該給出隨機字串長度。

當然,我們也可以透過修改chars中的字元來定義隨機字串中的字元。

(二) 程式執行時間

我們現在給出一個非常不精確的程式時間計算方法,

from time import clock as now
start = now()
finish = now()
run_time = finish - start
print run_time


相關文章