看到struct這麼英文單詞,大家應該並不陌生,因為c/c++中就有struct,在那裡struct叫做結構體。在Python中也使用struct,這充分說明了這個struct應該和c/c++中的struct有很深的淵源。Python正是使用struct模組執行Python值和C結構體之間的轉換,從而形成Python位元組物件。它使用格式字串作為底層C結構體的緊湊描述,進而根據這個格式字串轉換成Python值。
我們知道python只定義了6種資料型別,字串,整數,浮點數,列表,元組,字典。但是C語言中有些位元組型的變數,在python中該如何實現呢?這點頗為重要,特別是要在網路上進行資料傳輸的話。
python提供了一個struct模組來提供轉換。下面就介紹這個模組中的幾個方法。
pack(fmt, v1, v2, ...) ------ 根據所給的fmt描述的格式將值v1,v2,...轉換為一個字串。
unpack(fmt, bytes) ------ 根據所給的fmt描述的格式將bytes反向解析出來,返回一個元組。
calcsize(fmt) ------ 根據所給的fmt描述的格式返回該結構的大小。
struct.pack():
struct.pack用於將Python的值根據格式符,轉換為字串(因為Python中沒有位元組(Byte)型別,可以把這裡的字串理解為位元組流,或位元組陣列)。其函式原型為:struct.pack(fmt, v1, v2, ...),引數fmt是格式字串,關於格式字串的相關資訊下面有所介紹。v1, v2, ...表示要轉換的python值。下面的例子將兩個整數轉換為字串(位元組流):
>>> import struct
>>> a=20
>>> b=400
>>> str=struct.pack('ii',a,b) #轉換成位元組流,雖然還是字串,但是可以在網路上傳輸
>>> print len(str) #ii 表示兩個int
8 #可以看到長度為8個位元組,正好是兩個int型資料的長度
>>> print str
#二進位制是亂碼
>>> print repr(str)
'\x14\x00\x00\x00\x90\x01\x00\x00' #其中十六進位制的 0x00000014, 0x00001009分別表示20和400
>>>
由此我們就可以任意的進行組包了,比如下面一個打包的例子,只介紹其中的pack
format = "!HH%ds" % len(data)
buffer = struct.pack(format,opcode,blocknumber,data)
我們要對一個資料進行打包,加上一些個包頭,我們根據下面的格式符資訊,知道H是unsigned short是2個位元組,而s是char型。所以這個buffer就是2個位元組的opcode,2個位元組的blocknumber,和len長的char。
Python模組——struct(位元組流,組包拆包實現)
struct.unpack():
我們接著上面的例子執行:
>>> a1,a2=struct.unpack('ii',str)
>>> print 'a1',a1
a1 20
>>> print 'a2=',a2
a2= 400
可以看到 “ii”以四個位元組為分界,把8個位元組的str分成了兩個int型的整數。
struct.calcsize():用來計算特定格式的輸出的大小,是幾個位元組,比如:
>>> struct.calcsize('HH4s')
8
>>> struct.calcsize('ii')
8
>>>
>>> format='!HH%ds' % len('hello python')
>>> struct.calcsize(format)
16
>>>