python資料格式化之pprint

pythontab發表於2014-10-21

pprint – 美觀列印

作用:美觀列印資料結構

pprint 包含一個“美觀印表機”,用於生成資料結構的一個美觀檢視。格式化工具會生成資料結構的一些表示,不僅可以由直譯器正確地解析,而且便於人類閱讀。輸出儘可能放在一行上,分解為多行時則需要縮排。

以下例項用用到的data包含一下資料

data = [(1,{'a':'A','b':'B','c':'C','d':'D'}),

        (2,{'e':'E','f':'F','g':'G','h':'H',

            'i':'I','j':'J','k':'K','l':'L'

            }),

        ]

1、  列印

要使用這個模組,最簡單的方法就是利用pprint()函式 

from pprint import pprint
print 'PRINT:'
print data
print 
print 'PPRINT:'
pprint(data)

執行結果:

PRINT:
[(1, {'a': 'A', 'c': 'C', 'b': 'B', 'd': 'D'}), (2, {'e': 'E', 'g': 'G', 'f': 'F', 'i': 'I', 'h': 'H', 'k': 'K', 'j': 'J', 'l': 'L'})]
PPRINT:
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]

pprint()格式化一個物件,並把它寫至一個資料流,這個資料流作為引數傳入(或者是預設的sys.stdout)

注意為什麼第二個字典中會顯示一豎列,因為pprint列印支援8個物件以上的豎列列印

 

2、  格式化

格式化一個資料結構而不把它直接寫至一個流(例如用於日誌記錄),可以使用pformat()來構造一個字串表示。 

import logging
from pprint import pformat
logging.basicConfig(level = logging.DEBUG,
                    format = '%(levelname)-8s %(message)s',
                    )
logging.debug('Logging pformatted data')
formatted = pformat(data)
for line in formatted.splitlines():
    logging.debug(line.rstrip())

執行結果:

DEBUG    Logging pformatted data
DEBUG    [(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
DEBUG     (2,
DEBUG      {'e': 'E',
DEBUG       'f': 'F',
DEBUG       'g': 'G',
DEBUG       'h': 'H',
DEBUG       'i': 'I',
DEBUG       'j': 'J',
DEBUG       'k': 'K',
DEBUG       'l': 'L'})]

然後可以單獨低列印格式化的字串或者計入日誌

splitlines() 按行分割()

rstrip()去除右邊的空格 lstrip()去除左邊的空格 strip()去除兩邊空格。預設為去除空格,也可以傳入需要從兩邊或者其中一邊去除的字元,如strip(‘a’)就是去除字串兩邊的字元’a’

3、  任意類

如果定製類定義了一個__repr__()方法,pprint()使用的PrettyPrinter類還可以處理這些定製類。

from pprint import pprint 
class node(object):
    def __init__(self,name,contents =[]):
        self.name = name
        self.contents = contents[:]
    def __repr__(self):
        return ('node(' + repr(self.name) + ',' +
                repr(self.contents) + ')'
                )
trees = [node('node-1'),
         node('node-2',[node('node-2-1')]),
         node('node-3',[node('node-3-1')]),         
         ]
pprint(trees)

執行結果:

[node('node-1',[]),
 node('node-2',[node('node-2-1',[])]),
 node('node-3',[node('node-3-1',[])])]

由PrettyPrinter組合巢狀物件的表示,從而返回完整字串表示。

 4、  遞迴

遞迴資料結構有指向原資料來源的引用來表示,形式為<Recursion on typename with id=number>。 

from pprint import pprint 
local_data = ['a','b',1,2]
local_data.append(local_data)
print 'id(local_data) =>',id(local_data)
pprint(local_data)
print local_data

執行結果:

id(local_data) => 47458332363520
['a', 'b', 1, 2, <Recursion on list with id=47458332363520>]
['a', 'b', 1, 2, [...]]

在這個例子中,列表local_data增加到了其自身,這會建立一個遞迴引用

內建函式id()作用是獲得物件的id值,理論上講每個物件都有一個id值,如果是整數和字串((相對較小的時候)),那麼相同的值會有相同的id值,但是如果是類,及時相同也會有不同的id值。測試如下: 

#int or float or lon 都一樣(比較小的時候)
a = 65464131311513l
b = 65464131311513l
c = 65464131311513l
print id(a)
print id(b)
print id(c)
print
a = '12312312'
b = '12312312'
c = '12312312'
print id(a)
print id(b)
print id(c)
print 
a = 65464131311513l*11
b = 65464131311513l*11
c = 65464131311513l*11
print id(a)
print id(b)
print id(c)
print
a = '12312312'*11
b = '12312312'*11
c = '12312312'*11
print id(a)
print id(b)
print id(c)
print 
class Test(object):
    def __init__(self):
        pass
a = Test()
b = Test()
c = Test()
print id(a)
print id(b)
print id(c)
print

測試結果:

47010342174992

47010342174992

47010342174992


47010343272096

47010343272096

47010343272096


47010343261568

47010343261648

47010343261688


47010343200944

47010343199152

47010343202352


47010343252304

47010343252944

47010343253008

5、  限制巢狀輸出

對於非常深的資料結構,可能不要求輸出包含所有細節。有可能資料沒有是當地格式化,也可能格式化文字過大而無法管理,或者默寫資料時多餘的。 

from pprint import pprint 
print 'depth 1 :'
pprint(data,depth=1)
print 
print 'depth 2 :'
pprint(data,depth=2)
print 
print 'depth 3 :'
pprint(data,depth=3)

執行結果:

depth 1 :
[(...), (...)]
depth 2 :
[(1, {...}), (2, {...})]
depth 3 :
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]

使用depth引數可以控制美觀印表機遞迴處理巢狀資料結構的深度。輸出中未包含的層次由一個省略號表示 

6、  控制輸出寬度

格式化文字的預設輸出寬度為80列。要調整這個寬度,可以再pprint()中使用引數width。 

from pprint import pprint
for width in [80,5]:
    print 'WIDTH = ', width
    pprint(data,width = width)
    print

執行結果:

WIDTH =  80
[(1, {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]
WIDTH =  5
[(1,
  {'a': 'A',
   'b': 'B',
   'c': 'C',
   'd': 'D'}),
 (2,
  {'e': 'E',
   'f': 'F',
   'g': 'G',
   'h': 'H',
   'i': 'I',
   'j': 'J',
   'k': 'K',
   'l': 'L'})]

寬度大小不能適應格式化資料結構時,如果斬斷或轉行會引入非法的語法,就不會進行截斷或轉行。


相關文章