Python拆分列中文和 字元
需求描述:我們日常實際的工作中經常需要把一列資料按中文和 數字或者字母單獨拆分出來
匯入所需的庫:
import pandas as pd
定義函式
extract_characters
,該函式接受三個引數:
file_path
(Excel檔案路徑)、
sheet_name
(工作表名稱)和
column_name
(列名)。
def extract_characters(file_path, sheet_name, column_name):
讀取Excel檔案並將其儲存到DataFrame中:
df = pd.read_excel(file_path, sheet_name=sheet_name)
建立兩個新的列
'中文'
和
'其他字元'
,並將它們新增到DataFrame中:
df['中文'] = ''df['其他字元'] = ''
遍歷DataFrame的每一行資料:
for index, row in df.iterrows():
獲取指定列的值,並將其轉換為字串:
text = str(row[column_name])
初始化兩個空字串變數
chinese
和
other
,用於儲存中文字元和其他字元:
chinese = ''other = ''
遍歷每個字元:
for char in text:
判斷當前字元是否為中文字元(Unicode範圍為
\u4e00
到
\u9fff
):
if '\u4e00' <= char <= '\u9fff':
如果是中文字元,則將其新增到
chinese
字串中:
chinese += char
如果不是中文字元,則將其新增到
other
字串中:
other += char
將中文字符集合新增到新的
'中文'
列中:
df.at[index, '中文'] = chinese
將其他字符集合新增到新的
'其他字元'
列中:
df.at[index, '其他字元'] = other
返回處理後的DataFrame物件:
return df
定義測試示例的檔案路徑、工作表名稱和列名:
file_path = r'測試.xlsx'sheet_name = 'Sheet1'column_name = '店鋪銷售sku'
呼叫
extract_characters
函式,並將結果儲存在
result_df
中:
result_df = extract_characters(file_path, sheet_name, column_name)
將處理後的DataFrame儲存為Excel檔案:
result_df.to_excel('result.xlsx', index=False)
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70034822/viewspace-2991666/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python 列印中文字元Python字元
- Python元組和字典的拆包Python
- python的list要列印中文字元Python字元
- python字元對映表和字元替換Python字元
- c語言中文和ascii碼字元分離C語言ASCII字元
- python教程3.3:字元和編碼Python字元
- excel分列功能怎麼用 如何使用資料分列功能Excel
- Python列表數字元素加權和Python字元
- 中文字元轉為HTML字元實體字元HTML
- Python:列表也能拆包?Python
- 匹配字母、數字和中文字元正規表示式字元
- python字元畫Python字元
- 基於OpenCV和Python的車牌提取和字元分割OpenCVPython字元
- Python基礎之:struct和格式化字元PythonStruct字元
- LeetCode題解(1652):拆炸彈(Python)LeetCodePython
- 填一填python2.x 中文字元編碼的坑Python字元
- 分拆素數和 hd 2098
- 得到字串 位元組 長度 中文 兩個字元 英文一個字元字串字元
- python實現中文和unicode轉換PythonUnicode
- 正規表示式 字元和字元類字元
- 1.3.0 Python 字元編碼Python字元
- Python之字元型別Python字元型別
- Netty 中的粘包和拆包Netty
- webpack4之splitchunksPlugin拆拆拆--專案實踐WebPlugin
- Option-Shift-B 在 Mac 上輸入中文標點符號和特殊字元Mac符號字元
- 11.8 python之字元型別Python字元型別
- Java的自動裝箱和拆箱Java
- 談談JavaScript中裝箱和拆箱JavaScript
- Linux 中grep命令如何匹配中文字元Linux字元
- js用正規表示式將英文引號字元替換為中文引號字元JS字元
- 字串和字元的操作字串字元
- 什麼是裝箱(boxing)和拆箱 (unboxing)?
- Python語法的轉義字元Python字元
- python裡字元表示什麼意思Python字元
- Python字元與位元組新編Python字元
- Python字元編碼和二進位制不得不說的故事Python字元
- 關於【s】和[t]字元字元
- Python 中文編碼Python