python之numpy庫[2]
python-numpy
csv檔案的寫入和存取
寫入csv檔案
CSV (Comma‐Separated Value, 逗號分隔值),是一種常見的檔案格式,用來儲存批量資料。
寫入csv檔案
np.savetxt(frame, array, fmt='%.18e', delimiter=None)
• frame : 檔案、字串或產生器,可以是.gz或.bz2的壓縮檔案
• array : 存入檔案的陣列
• fmt : 寫入檔案的格式,例如:%d %.2f %.18e
• delimiter : 分割字串,預設是任何空格
示例:
>>> a = np.arange(100).reshape(5,20)
>>> np.savetxt('a.csv',a,fmt='%d',delimiter=',')
得到的檔案是這樣的
0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19
20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39
40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59
60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79
80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99
改變引數,以浮點數寫入
>>> a = np.arange(100).reshape(5,20)
>>> np.savetxt('a.csv',a,fmt='%.1f',delimiter=',')
0.0,1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0,10.0,11.0,12.0,13.0,14.0,15.0,16.0,17.0,18.0,19.0
20.0,21.0,22.0,23.0,24.0,25.0,26.0,27.0,28.0,29.0,30.0,31.0,32.0,33.0,34.0,35.0,36.0,37.0,38.0,39.0
40.0,41.0,42.0,43.0,44.0,45.0,46.0,47.0,48.0,49.0,50.0,51.0,52.0,53.0,54.0,55.0,56.0,57.0,58.0,59.0
60.0,61.0,62.0,63.0,64.0,65.0,66.0,67.0,68.0,69.0,70.0,71.0,72.0,73.0,74.0,75.0,76.0,77.0,78.0,79.0
80.0,81.0,82.0,83.0,84.0,85.0,86.0,87.0,88.0,89.0,90.0,91.0,92.0,93.0,94.0,95.0,96.0,97.0,98.0,99.0
讀取csv檔案
讀取csv檔案
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
• frame : 檔案、字串或產生器,可以是.gz或.bz2的壓縮檔案
• dtype : 資料型別,可選
• delimiter : 分割字串,預設是任何空格
• unpack : 如果True,讀入屬性將分別寫入不同變數
示例:
>>> b = np.loadtxt('a.csv',delimiter=',')
>>> b
array([[ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.,
11., 12., 13., 14., 15., 16., 17., 18., 19.],
[ 20., 21., 22., 23., 24., 25., 26., 27., 28., 29., 30.,
31., 32., 33., 34., 35., 36., 37., 38., 39.],
[ 40., 41., 42., 43., 44., 45., 46., 47., 48., 49., 50.,
51., 52., 53., 54., 55., 56., 57., 58., 59.],
[ 60., 61., 62., 63., 64., 65., 66., 67., 68., 69., 70.,
71., 72., 73., 74., 75., 76., 77., 78., 79.],
[ 80., 81., 82., 83., 84., 85., 86., 87., 88., 89., 90.,
91., 92., 93., 94., 95., 96., 97., 98., 99.]])
>>> b = np.loadtxt('a.csv',dtype=np.int,delimiter=',')
>>> b
array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19],
[20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,
37, 38, 39],
[40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56,
57, 58, 59],
[60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76,
77, 78, 79],
[80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96,
97, 98, 99]])
CSV只能有效儲存一維和二維陣列
np.savetxt() np.loadtxt()只能有效存取一維和二維陣列
多維資料的存取
多維資料的寫入
a.tofile(frame, sep='', format='%s')
• frame : 檔案、字串
• sep : 資料分割字串,如果是空串,寫入檔案為二進位制
• format : 寫入資料的格式
示例;
>>> a = np.arange(100).reshape(5,10,2)
>>> a.tofile("a.dat",sep=',',format='%d')
a.dat的內容:
0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99
如果不指定分隔符,則產生二進位制檔案,無法用文字編輯器看懂。
多維資料的讀取
np.fromfile(frame, dtype=float, count=‐1, sep='')
• frame : 檔案、字串
• dtype : 讀取的資料型別
• count : 讀入元素個數,‐1表示讀入整個檔案
• sep : 資料分割字串,如果是空串,寫入檔案為二進位制
numpy的隨機數函式
NumPy的random子庫
np.random.*
函式 | 說明 |
---|---|
rand(d0,d1,…,dn) | 根據d0-dn建立隨機數陣列,浮點數,[0,1),均勻分佈 |
randn(d0,d1,…,dn) | 根據d0-dn建立隨機數陣列,標準正態分佈 |
randint(low[,high,shape]) | 根據shape建立隨機整數或整數陣列,範圍是[low,high) |
seed(s) | 隨機數種子,s是給定的種子值 |
shuffle(a) | 根據陣列a的第1軸進行隨排列,改變陣列a |
permutation(a) | 根據陣列a的第1軸產生一個新的亂序陣列,不改變陣列a |
choice(a[,size,replace,p]) | 從一維陣列a中以概率p抽取元素,形成size形狀新陣列replace表示是否可能重用元素,預設為False |
uniform(low,high,size) | 產生具有均勻分佈的陣列,low起始值,high結束值,size為形狀 |
normal(loc,scale,size) | 產生具有正態分佈的陣列,loc為均值,scale標準差,size為形狀 |
poisson(lam,size) | 產生具有泊松分佈的陣列,lam為隨機事件發生率,size為形狀 |
numpy的統計函式
NumPy直接提供的統計類函式
np.*
函式 | 說明 |
---|---|
sum(a,axis=None) | 根據給定axis計算陣列a相關元素之和,axis整數或元組 |
mean(a,axis=None) | 根據給定axis計算陣列a相關元素的期望,axis整數或元組 |
average(a,axis=None,weights=None) | 根據給定axis計算陣列a相關元素的加權平均值 |
std(a,axis=None) | 根據給定軸axis計算陣列a相關元素的標準差 |
var(a,axis = None) | 根據給定軸axis計算陣列a相關元素的方差 |
min(a) max(a) | 計算陣列a中元素的最小值,最大值 |
argmin(a) argmax(a) | 計算陣列a中元素的最小值,最大值的降一維後下標 |
unravel_index(index,shape) | 根據shape將一維下標index轉換成多維下標 |
ptp(a) | 計算陣列a中元素最大值和最小值的差 |
median(a) | 計算陣列a中元素的中位數(中值) |
axis=None 是統計函式的標配引數
numpy的梯度函式
函式 | 說明 |
---|---|
np.gradient(f) | 計算陣列f中元素的梯度,當f為多維時,返回每個維度梯度 |
梯度:連續值之間的變化率,即斜率
XY座標軸連續三個X座標對應的Y軸值:a, b, c,其中,b的梯度是: (c‐a)/2
>>> a = np.random.randint(0,20,5)
>>> np.gradient(a)
array([ 9. , -0.5, -2. , -3. , -12. ])
相關文章
- python之numpy庫[1]Python
- 【機器學習】--Python機器學習庫之Numpy機器學習Python
- Python常用庫NumpyPython
- Python之numpy學習Python
- Python之Numpy初識Python
- python 如何安裝numpy庫?Python
- Python的Numpy庫簡述Python
- Python資料分析之numpyPython
- Python庫安裝教程之NumpyPython
- 【Python資料科學】之NumpyPython資料科學
- 【轉】Python之Numpy詳細教程Python
- python---之numpy.pad()Python
- python-資料分析-Numpy-2Python
- Numpy學習(2)numpy向量化、numpy操作
- Python資料分析與展示之『Numpy』Python
- NumPy之:NumPy簡介教程
- (2)python_numpy: numpy.ma.masked_invalid 與 numpy.ma.compress_rowcols 函式用法Python函式
- Python資料分析(二): Numpy技巧 (2/4)Python
- Python資料分析工具庫-Numpy 陣列支援庫(一)Python陣列
- Python人工智慧常用庫Numpy使用入門Python人工智慧
- Python技術分享:numpy庫的安裝教程Python
- Python科學計算庫NumPy基礎操作Python
- numpy陣列(2)陣列
- python綜合學習四之Numpy和Pandas(下)Python
- Python學習之Pandas和Numpy的區別!Python
- Python資料分析--Numpy常用函式介紹(2)Python函式
- python實踐系列之(一)安裝 python/pip/numpy/matplotlibPython
- python之Numpy 排序搜尋計數及集合操作Python排序
- 重學python【numpy】Python
- Python3---numpyPython
- Python NumPy CookBook 前言Python
- python資料分析之Numpy資料庫第三期陣列的運算Python資料庫陣列
- NumPy之:理解廣播
- Python Numpy基礎教程Python
- Python資料分析 – numpyPython
- python_numPy學習Python
- Python資料分析 - NumpyPython
- python 無法使用numpyPython