在python自動化中,經常會遇到對資料檔案的操作,比如新增多名員工,但是直接將員工資料寫在python檔案中,不但工作量大,要是以後再次遇到類似批量資料操作還會寫在python檔案中嗎?
應對這一問題,可以將資料寫excel檔案,針對excel 檔案進行操作,完美解決。
本文僅介紹python對excel的操作
安裝xlrd 庫
xlrd庫 官方地址:https://pypi.org/project/xlrd/
pip install xlrd
筆者在安裝時使用了 pip3 install xlrd
原因:筆者同時安裝了python2 和 python3
如果pip的話會預設將庫安裝到python2中,python3中不能直接呼叫。
那麼到底是使用pip 還是pip3進行安裝呢?
如果系統中只安裝了Python2,那麼就只能使用pip。
如果系統中只安裝了Python3,那麼既可以使用pip也可以使用pip3,二者是等價的。
如果系統中同時安裝了Python2和Python3,則pip預設給Python2用,pip3指定給Python3用。
Xlrd 庫簡單的使用
以如下excel檔案為例進行操作
檔名為demo,有兩個sheet,名為工作表1和工作表2
工作表1中有如下資料
簡單的使用
# coding=utf-8 import xlrd # 開啟檔案 data = xlrd.open_workbook('file/demo.xlsx') # 檢視工作表 data.sheet_names() print("sheets:" + str(data.sheet_names())) # 通過檔名獲得工作表,獲取工作表1 table = data.sheet_by_name('工作表1') # 列印data.sheet_names()可發現,返回的值為一個列表,通過對列表索引操作獲得工作表1 # table = data.sheet_by_index(0) # 獲取行數和列數 # 行數:table.nrows # 列數:table.ncols print("總行數:" + str(table.nrows)) print("總列數:" + str(table.ncols)) # 獲取整行的值 和整列的值,返回的結果為陣列 # 整行值:table.row_values(start,end) # 整列值:table.col_values(start,end) # 引數 start 為從第幾個開始列印, # end為列印到那個位置結束,預設為none print("整行值:" + str(table.row_values(0))) print("整列值:" + str(table.col_values(1))) # 獲取某個單元格的值,例如獲取B3單元格值 cel_B3 = table.cell(3,2).value print("第三行第二列的值:" + cel_B3)
執行後結果
專案中使用
獲得所有的資料
1 # coding=utf-8 2 3 import xlrd 4 5 def read_xlrd(excelFile): 6 data = xlrd.open_workbook(excelFile) 7 table = data.sheet_by_index(0) 8 9 for rowNum in range(table.nrows): 10 rowVale = table.row_values(rowNum) 11 for colNum in range(table.ncols): 12 if rowNum > 0 and colNum == 0: 13 print(int(rowVale[0])) 14 else: 15 print(rowVale[colNum]) 16 print("---------------") 17 18 # if判斷是將 id 進行格式化 19 # print("未格式化Id的資料:") 20 # print(table.cell(1, 0)) 21 # 結果:number:1001.0 22 23 24 if __name__ == '__main__': 25 excelFile = 'file/demo.xlsx' 26 read_xlrd(excelFile=excelFile)
結果
如果在專案中使用則可將內容方法稍為做修改,獲得所有的資料後,將每一行資料作為陣列進行返回
1 # coding=utf-8 2 3 import xlrd 4 5 def read_xlrd(excelFile): 6 data = xlrd.open_workbook(excelFile) 7 table = data.sheet_by_index(0) 8 dataFile = [] 9 10 for rowNum in range(table.nrows): 11 # if 去掉表頭 12 if rowNum > 0: 13 dataFile.append(table.row_values(rowNum)) 14 15 return dataFile 16 17 18 if __name__ == '__main__': 19 excelFile = 'file/demo.xlsx' 20 print(read_xlrd(excelFile=excelFile))
結果