Python struct(位元組流,組包拆包實現)模組詳解

pythontab發表於2014-06-10

看到struct這麼英文單詞,大家應該並不陌生,因為c/c++中就有struct,在那裡struct叫做結構體。在Python中也使用struct,這充分說明了這個struct應該和c/c++中的struct有很深的淵源。Python正是使用struct模組執行Python值和C結構體之間的轉換,從而形成Python位元組物件。它使用格式字串作為底層C結構體的緊湊描述,進而根據這個格式字串轉換成Python值。

我們知道python只定義了6種資料型別,字串,整數,浮點數,列表,元組,字典。但是C語言中有些位元組型的變數,在python中該如何實現呢?這點頗為重要,特別是要在網路上進行資料傳輸的話。

python提供了一個struct模組來提供轉換。下面就介紹這個模組中的幾個方法。

pack(fmt, v1, v2, ...)  ------ 根據所給的fmt描述的格式將值v1,v2,...轉換為一個字串。

unpack(fmt, bytes)    ------ 根據所給的fmt描述的格式將bytes反向解析出來,返回一個元組。

calcsize(fmt)             ------ 根據所給的fmt描述的格式返回該結構的大小。

struct.pack():

struct.pack用於將Python的值根據格式符,轉換為字串(因為Python中沒有位元組(Byte)型別,可以把這裡的字串理解為位元組流,或位元組陣列)。其函式原型為:struct.pack(fmt, v1, v2, ...),引數fmt是格式字串,關於格式字串的相關資訊下面有所介紹。v1, v2, ...表示要轉換的python值。下面的例子將兩個整數轉換為字串(位元組流):

>>> import struct

>>> a=20

>>> b=400

>>> str=struct.pack('ii',a,b)    #轉換成位元組流,雖然還是字串,但是可以在網路上傳輸

>>> print len(str)               #ii 表示兩個int

8                                #可以看到長度為8個位元組,正好是兩個int型資料的長度

>>> print str

                               #二進位制是亂碼

>>> print repr(str)

'\x14\x00\x00\x00\x90\x01\x00\x00'   #其中十六進位制的 0x00000014, 0x00001009分別表示20和400

>>>

   由此我們就可以任意的進行組包了,比如下面一個打包的例子,只介紹其中的pack

 

format = "!HH%ds" % len(data)

buffer = struct.pack(format,opcode,blocknumber,data)

  我們要對一個資料進行打包,加上一些個包頭,我們根據下面的格式符資訊,知道H是unsigned short是2個位元組,而s是char型。所以這個buffer就是2個位元組的opcode,2個位元組的blocknumber,和len長的char。

 

Python模組——struct(位元組流,組包拆包實現)

   struct.unpack():

   我們接著上面的例子執行:

>>> a1,a2=struct.unpack('ii',str)

>>> print 'a1',a1

a1 20

>>> print 'a2=',a2

a2= 400

可以看到 “ii”以四個位元組為分界,把8個位元組的str分成了兩個int型的整數。

 struct.calcsize():用來計算特定格式的輸出的大小,是幾個位元組,比如:

>>> struct.calcsize('HH4s')

8

>>> struct.calcsize('ii')

8

>>>

>>> format='!HH%ds' % len('hello python')

>>> struct.calcsize(format)

16

>>>


相關文章