1. range
range
是python內建的一個類,該型別表示一個不可改變(immutable)的數字序列,常常用於在for
迴圈中迭代一組特殊的數,它的原型可以近似表示如下:
class range(stop)
class range(start, stop, step=1)
(注意,Python是不允許定義兩個類初始化函式的,其實其CPython實現更像是傳入不定長引數*args
,然後根據len(args)
來進行不同的拆分,但我們這裡遵循Python文件風格寫法)
如果只傳入stop
引數,那麼我們就預設在[0, stop
)區間以步長1進行迭代。如果傳入2或3個引數,則我們會將在[start
, stop
)區間以step
步長(可選,預設為1)迭代 。注意,三個引數必須全部為整數值。
它的常見使用樣例如下:
print(list(range(10)))
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
print(list(range(0, 30, 5)))
# [0, 5, 10, 15, 20, 25]
當stop
<=start
時,而直接採用預設的step=1
時,元素會為空:
print(list(range(0)))
# []
print(list(range(1, 0)))
# []
此時的迭代我們需要將迭代步長設定為負:
print(list(range(0, -10, -1)))
# [0, -1, -2, -3, -4, -5, -6, -7, -8, -9]
如果非法地傳入非整數的引數,如:
print(list(range(10, 0.3)))
則會報以下的TypeError:
'float' object cannot be interpreted as an integer
最後提一下,我們常常會寫下如下程式碼:
for i in range(10):
print(i)
此時Python直譯器實質上會將range
物件隱式轉化為迭代器,等價於如下程式碼:
list_iterator = iter(range(10))
try:
while True:
x = next(list_iterator)
print(x)
except StopIteration:
pass
2. numpy.arange
numpy.arange
是NumPy
包的一個函式,它的功能與Python內建的range
類似,它的原型可以近似表示為:
numpy.arange(stop, dtype=None, like=None)
numpy.arange(start, stop, step=1, dtype=None, like=None)
(還是如前面所說,Python是不允許定義兩個類初始化函式的,其實其CPython實現更像是傳入不定長引數*args
,然後根據len(args)
來進行不同的拆分,但我們這裡遵循Python文件風格寫法)
其中start
、step
、step
的使用與range
類似,此處不再贅述,唯一的區別就是這3個引數都可以是小數。dtype為返回array
的型別,如果沒有給定則會從輸入輸入引數中推斷。like
為一個array-like的型別,它允許建立非NumPy arrays的arrays型別。
總結一下,該類與Python內建的range
區別有兩點:一是支援小數引數,二是返回ndarray
型別而非像range
那樣常常做為(隱式轉換為)list
型別使用。
以下是其常見用例:
print(np.arange(3))
# [0 1 2]
print(np.arange(3.0))
# [0. 1. 2.]
print(np.arange(3,7))
# [3 4 5 6]
print(np.arange(3,7,2))
# [3 5]
print(np.arange(0, 5, 0.5))
#[0. 0.5 1. 1.5 2. 2.5 3. 3.5 4. 4.5]
注意,在numpy.arange
的使用過程中可能存在浮點穩定性的問題,從而導致下面這樣的意想不到的結果:
print(np.arange(0, 5, 0.5, dtype=int))
# [0 0 0 0 0 0 0 0 0 0]
print(np.arange(-3, 3, 0.5, dtype=int))
# [-3 -2 -1 0 1 2 3 4 5 6 7 8]
這是因為在np.arange
的內部實現中,實際上的step值是按照公式dtype(start+step)-dtype(start)
來計算的,而非直接採用step
。當進行強制型別轉換(上面例子中轉為int
,即朝0方向取整)或start
遠遠比step
大時,會出現精度的損失。在這種情況下,建議使用下面提到的np.linspace
:
3. numpy.linspace
numpy.linspace
也是Numpy
內建的一個函式,它和numpy.arange
類似,但是它不再是簡單的[start, stop)
左閉右開,也沒有使用步長step
,而是使用樣本個數num
。其函式原型如下:
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)
其中當endpoint
採用預設的True
時,start
和stop
表示序列的開始和初始值(閉區間[start, stop]
),num
為區間[start, stop]
按照均勻(evenly)劃分取樣的樣本數(包括邊界start
和stop
在內)。不過需要注意的是,endpoint
為True
時stop
才能做為最後一個樣本,為False
時區間內便不包括stop
,此時會在區間[start,end]
內按照總個數為num + 1
個樣本取樣並去掉尾部樣本(即stop
點)組成。retstep
位置為True
則會返回(samples, step)
元組,其中samples
為生成的樣本,step
為樣本之間的間隔步長。
注意,它的start、stop引數都可以為小數,但是當dtype設定為int時則就不能為小數。
numpy.linspace
的常見使用樣例如下:
print(np.linspace(2.0, 3.0, num=5))
# array([2. , 2.25, 2.5 , 2.75, 3. ])
如果設定endpoint
為True
,則按照num+1
個樣本數量來取樣,並去掉最後一個樣本。
print(np.linspace(2.0, 3.0, num=5, endpoint=False))
# [2. 2.2 2.4 2.6 2.8]
如果retstep
設定為True
,則除了返回生成的樣本,還會返回樣本之間的間隔步長。
print(np.linspace(2.0, 3.0, num=5, retstep=True))
# (array([2. , 2.25, 2.5 , 2.75, 3. ]), 0.25)
下面我們用圖形形象化地描述endpoint
取True
和取False
的區別:
import matplotlib.pyplot as plt
N = 8
y = np.zeros(N)
x1 = np.linspace(0, 10, N, endpoint=True)
x2 = np.linspace(0, 10, N, endpoint=False)
plt.plot(x1, y, 'o', color='orange')
plt.plot(x2, y + 0.5, 'o', color='blue')
plt.ylim([1, -0.5])
plt.show()
影像顯示如下:
可以看出橘色的點為np.linspace(0, 10, N, endpoint=True)
,按照總共8個點在[0, 10]
取樣,幷包括stop
邊界10。藍色的點為np.linspace(0, 10, N, endpoint=False)
,先按照總共9個點在[0, 10]
取樣最後再去掉最後一個點(即stop
點10),最終得到間隙更密的8個點。
參考
- [1] https://docs.python.org/3/library/stdtypes.html?highlight=range#range
- [2] https://stackoverflow.com/questions/43999181/range-non-default-parameter-follows-default-one
- [3] https://numpy.org/doc/stable/reference/generated/numpy.arange.html?highlight=arange#numpy.arange
- [4] https://numpy.org/doc/stable/reference/generated/numpy.linspace.html#numpy.linspace