Python中的內建型別是我們開發中最常見的,很多人都能熟練的使用它們。
然而有一些內建型別確實不那麼常見的,或者說往往會被我們忽略,所以這次的主題就是帶領大家重新認識這些“不同尋常”的內建型別。
(注意:本文基於python3,不會包含任何python2相關內容)
本文索引:
frozenset
不可變集合(frozenset)與普通的set一樣,只不過它的元素是不可變的,因此諸如add
,remove
,update
等可以新增/刪除/改變集合內元素的方法是不存在的,換句話說一旦frozenset建立後你將不再可能更改集合內的元素。其他的方法與set一致:
>>> frozen = frozenset([1, 1, 2, 3, 4, 5, 6, 6])
frozenset({1, 2, 3, 4, 5, 6})
>>> frozen | {1, 2, 3, 7, 8}
frozenset({1, 2, 3, 4, 5, 6, 7, 8})
>>> frozen ^ {1, 2, 3, 7, 8}
frozenset({4, 5, 6, 7, 8})
range
range
事實上相當得常見,所以你也許會奇怪我為什麼把它列出來。
其實原因很簡單,因為大部分人熟悉range
的使用,但並不清楚range到底是什麼。返回迭代器?返回一個可迭代物件?range
本身又是什麼呢?
答案揭曉:
>>> range
<class `range`>
是的,range
是個class!所以當我們使用for i in range(1, 10)
這樣的程式碼時,實際上我們遍歷了一個range
物件,而range
也實現了可迭代物件需要的__iter__
魔法方法,所以它自身是可迭代物件:
>>> range.__iter__
<slot wrapper `__iter__` of `range` objects>
因此,range
既不返回迭代器,也不返回其他可迭代物件,而是返回的自己。
bytearray
bytearray
一般情況下並不常見,它主要為了可以實現原地修改bytes物件而出現,因為bytes和str一樣是不可變物件,例如這樣是非法的:
>>> b = `測試用例a`.encode(`utf8`)
>>> b[-1] = 98 # change `a` -> `b`
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: `bytes` object does not support item assignment
而當我們把bytes的內容複製給bytearray
時就可以進行原地修改了:
>>> array = bytearray(b)
>>> array[-1] = 98
>>> array.decode(`utf8`)
測試用例b
bytearray
物件沒有字面常量,因此只能通過建構函式建立,它有著和bytes一樣的方法,只是可變以及多了一些序列物件的特性。如果要建立一個bytearray
可以有如下的幾種方法:
bytearray()
返回一個空的bytearray
物件bytearray(10)
建立一個長度為10且內容被0填充的bytearray
bytearray(iterable)
會將可迭代物件的內容轉換成bytes然後存入物件中bytearray(b`Hi!`)
將已有的二進位制資料複製進物件
另外bytearray
還提供了fromhex
和hex
方便將資料以16進位制的形式輸入輸出:
>>> array.hex()
`e6b58be8af95e794a8e4be8b62`
>>> bytearray().fromhex(`e6b58be8af95e794a8e4be8b62`).decode(`utf8`)
`測試用例b`
memoryview
memoryview
提供了直接訪問物件記憶體的機制,只要目標物件支援buffer protocol,例如bytes
和bytearray
。
memoryview
有個稱為“元素”的概念,也就是物件規定的最小的記憶體單元,比如bytes
和bytearray
的最小記憶體單元就是一個byte,具體取決於物件的實現。
len(view)
通常等於len(view.tolist())
,也就是等於view的“元素”數量。如果view.ndim == 0
,那麼整個view的記憶體會被視作一個整體,len會返回1,如果view.ndim == 1
那麼就正常返回“元素”的個數。view.itemsize
會返回單個“元素”的大小。單位是byte。
view.readonly
表示當前的memoryview
是否是隻讀的,例如bytes
物件的view就是隻讀的,view.readonly
的值為True
。是否只讀取決於被引用的物件是否可變以及對buffer protocol的實現。
對於使用完畢的memoryview
應該儘快呼叫其release()
方法釋放資源,而且部分物件在被view引用時會自動進行一些限制,比如bytearray
會禁止調整大小,及時釋放view是資源可以解除這些限制。
結合示例可以更清晰地瞭解這些特性:
>>> data = bytearray(b`abcefg`)
>>> v = memoryview(data)
>>> v.readonly
False
>>> v[0] = ord(b`z`)
>>> data
bytearray(b`zbcefg`)
>>> v[1:4] = b`123`
>>> data
bytearray(b`z123fg`)
>>> v[2:3] = b`spam`
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: memoryview assignment: lvalue and rvalue have different structures
>>> v[2:6] = b`spam`
>>> data
bytearray(b`z1spam`)
dict-views
準確的說,這不是一種型別,而是一種概念。然而typing裡仍然將其視為一種型別,所以也就羅列在此了。
概念:返回自dict.keys()
,dict.values
()和dict.items()
的物件被稱作dict-views
。
對於views物件,可以使用len,成員檢測,它本身也是可迭代物件:
>>> dishes = {`eggs`: 2, `sausage`: 1, `bacon`: 1, `spam`: 500}
>>> keys = dishes.keys()
>>> values = dishes.values()
>>> # iteration
>>> n = 0
>>> for val in values:
... n += val
>>> print(n)
504
>>> # keys and values are iterated over in the same order (insertion order)
>>> list(keys)
[`eggs`, `sausage`, `bacon`, `spam`]
>>> list(values)
[2, 1, 1, 500]
>>> # view objects are dynamic and reflect dict changes
>>> del dishes[`eggs`]
>>> del dishes[`sausage`]
>>> list(keys)
[`bacon`, `spam`]
>>> # set operations
>>> keys & {`eggs`, `bacon`, `salad`}
{`bacon`}
>>> keys ^ {`sausage`, `juice`}
{`juice`, `sausage`, `bacon`, `spam`}
從例子中可以看出,views保持著元素的插入順序(插入順序的保證從python3.6開始)以及views動態反應了key/value的插入和刪除以及修改,因此在某些場景下views物件是相當有用的。
The Ellipsis Object (…)
...
不是一個型別,不過算是一個內建物件。
它沒什麼特殊的含義,僅表示省略,通常被用在type hints中:
>>> ...
Ellipsis
>>> from typing import Callable
>>> func: Callable[..., None] = lambda x,y:print(x*y)
func是一個沒有返回值的函式,引數列表沒有做任何限制。
你也可以寫成Ellipsis
,兩者是等價的,不過顯然是...
這種形式更簡單明瞭。
以上就是這些容易被忽略和遺忘的內建型別,如有錯誤和疏漏歡迎指出。