python numpy基礎陣列和向量計算

在python 中有時候我們用陣列運算元據可以極大的提升資料的處理效率，

類似於R的向量化操作，使得資料的操作趨於簡單化，在python 中是使用numpy模組可以進行陣列和向量計算。

下面來看下簡單的例子

import numpy as np 

data=np.array([2,5,6,8,3]) #構造一個簡單的陣列

print(data)

1

2

3

4

5

import numpy as np

data=np.array([2,5,6,8,3]) #構造一個簡單的陣列

print(data)

結果：

[2 5 6 8 3]

data1=np.array([[2,5,6,8,3],np.arange(5)])  #構建一個二維陣列

print(data1)

1

2

3

data1=np.array([[2,5,6,8,3],np.arange(5)]) #構建一個二維陣列

print(data1)

結果：

[[2 5 6 8 3]
[0 1 2 3 4]]

我們也可以通過shape和dtype方法檢視陣列的維度和資料格式

print(data.shape)
print(data.dtype)
print(data1.shape)
print(data1.dtype)

1

2

3

4

print(data.shape)

print(data.dtype)

print(data1.shape)

print(data1.dtype)

結果：

(5,)
int32

(2, 5)
int32

可以看出data是一維陣列，每組元素為5個，資料型別為32位int 型別

data1 為二維陣列，每個組有5個元素，資料型別為32位int型別

有一個較好的區分方法是看列印結果中，中括號的層數和位置，就可以看出陣列的維度，一層中括號代表一個維度。

其他的陣列屬性方法還有：

array.ndim 陣列的維數，一維陣列結果為1，二維陣列列印結果為2

array.size 陣列的元素個數

array.itemsiz 陣列每個元素的位元組大小

接下來我們瞭解下陣列中的資料型別：

NumPy中的基本資料型別
名稱	描述
bool	用一個位元組儲存的布林型別（True或False）
inti	由所在平臺決定其大小的整數（一般為int32或int64）
int8	一個位元組大小，-128 至 127
int16	整數，-32768 至 32767
int32	整數，-2 31 至 2 32 -1
int64	整數，-2 63 至 2 63 – 1
uint8	無符號整數，0 至 255
uint16	無符號整數，0 至 65535
uint32	無符號整數，0 至 2 ** 32 – 1
uint64	無符號整數，0 至 2 ** 64 – 1
float16	半精度浮點數：16位，正負號1位，指數5位，精度10位
float32	單精度浮點數：32位，正負號1位，指數8位，精度23位
float64或float	雙精度浮點數：64位，正負號1位，指數11位，精度52位
complex64	複數，分別用兩個32位浮點數表示實部和虛部
complex128或complex	複數，分別用兩個64位浮點數表示實部和虛部

基礎的陣列運算

陣列也可以進行我們常用的加減乘除運算

arr=np.array(np.arange(10))
arr1=np.array(np.arange(1,11))
print(arr*2)

1

2

3

arr=np.array(np.arange(10))

arr1=np.array(np.arange(1,11))

print(arr*2)

結果：

[ 0 2 4 6 8 10 12 14 16 18]

 print(arr+arr1)

1	print(arr+arr1)

結果：

[ 1 3 5 7 9 11 13 15 17 19]

注意，相加兩個陣列長度要一樣

接下來我們看下陣列索引

arr=np.arange(10)

1	arr=np.arange(10)

用下標直接進行索引

print(arr[5])

1	print(arr[5])

結果為：

5

切片索引

print(arr[5:8])

1	print(arr[5:8])

結果為：

[5 6 7]

可以利用索引對資料進行更改操作

arr[5]=120
print(arr)

1 2	arr[5]=120 print(arr)

結果為：

[ 0 1 2 3 4 120 6 7 8 9]

可以看到下標為5的數已經變成120了。

此外，陣列還可以進行布林操作

arr=np.arange(5)
name=np.array(['a','b','b','c','a'])
print(name=='a')

1

2

3

arr=np.arange(5)

name=np.array(['a','b','b','c','a'])

print(name=='a')

結果為：

[ True False False False True]

即滿足條件的資料全部以True的結果輸出。

接下來我們可以利用name陣列設定條件後的布林值對arr陣列進行相關操作

print(arr[name=='a'])

1	print(arr[name=='a'])

結果為：

[0 4]

即把arr中對應於name中a相對應位置的元素列印出來。

多條件操作

result=(name='a')|(name='c')
print(result)
print(name[result])

1

2

3

result=(name='a')|(name='c')

print(result)

print(name[result])

結果為：

[ True False False True True]
[‘a’ ‘c’ ‘a’]

接下來，我們瞭解下ufunc方法

用於操作單個陣列的函式有如下：

用於操作兩個或多個陣列的方法

相關的函式方法使用

np.meshgrid 用於生成多維矩陣

a,b=np.meshgrid(np.arange(1,5),np.arange(2,4))
print(a)
print(b)

1

2

3

a,b=np.meshgrid(np.arange(1,5),np.arange(2,4))

print(a)

print(b)

結果為：

[[1 2 3 4]
[1 2 3 4]]
[[2 2 2 2]
[3 3 3 3]]

按照資料最少的陣列形成陣列

np.where 是三元表示式 x if condition else y的向量化版本

arr1=np.arange(5)
arr2=np.arange(20,25)
condition=np.array([1,0,1,0,0]) 
result=np.where(condition,arr1,arr2)
print(arr1)
print(arr2)
print(result)

1

2

3

4

5

6

7

arr1=np.arange(5)

arr2=np.arange(20,25)

condition=np.array([1,0,1,0,0])

result=np.where(condition,arr1,arr2)

print(arr1)

print(arr2)

print(result)

結果為：

[0 1 2 3 4]
[20 21 22 23 24]
[ 0 21 2 23 24]

可以看出，result的結果中，條件為1的顯示陣列arr1的內容，條件為0的顯示arr2的內容

數學統計方法

在陣列中我們也可以使用數學統計方法進行計數，例如sum mean std 等

arr=np.random.randint(1,20,10)
print(arr)
print(np.mean(arr))
print(np.sum(arr))
print(np.std(arr))

1

2

3

4

5

arr=np.random.randint(1,20,10)

print(arr)

print(np.mean(arr))

print(np.sum(arr))

print(np.std(arr))

結果為：

[19 14 8 13 13 10 10 9 19 7]
12.2
122
4.01995024845

具體的方法內容如下圖所示：

布林型陣列的相關統計方法

arr=np.arange(-20,10)
result=(arr>5).sum()
print(arr)
print(result)

1

2

3

4

arr=np.arange(-20,10)

result=(arr>5).sum()

print(arr)

print(result)

結果為：

-20 -19 -18 -17 -16 -15 -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3
-2 -1 0 1 2 3 4 5 6 7 8 9]

4

可以對資料進行判斷後進行個數求和

其他的陣列方法還有

資料的讀取和儲存

線性函式的常用方法

arr=np.array([np.random.randint(1,10,5),np.random.randint(10,20,5)])
print(arr)
print(np.dot(arr,2))

1

2

3

arr=np.array([np.random.randint(1,10,5),np.random.randint(10,20,5)])

print(arr)

print(np.dot(arr,2))

結果為

[[ 4 6 5 1 6]
[14 16 11 10 18]]
[[ 8 12 10 2 12]
[28 32 22 20 36]]

dot方法可以進行矩陣相乘操作

其他方法如下圖

最後我們瞭解下numpy中的隨機數生成方法

上面的很多例子中我們已經用到了隨機數生成，

arr=np.random.random(10)
print(arr)

1 2	arr=np.random.random(10) print(arr)

結果為

[ 0.90051063 0.72818635 0.00411373 0.13154345 0.45513344 0.9700776
0.42150977 0.27728599 0.50888291 0.62288808]

其他形式的隨機數生成方法

瞭解以上numpy的操作方法，基本的資料操作問題應該不是很大了。

python numpy基礎 陣列和向量計算

相關文章

python numpy基礎陣列和向量計算