Python 的內建字串方法(收藏專用)

發表於2016-05-20

字串處理是非常常用的技能,但 Python 內建字串方法太多,常常遺忘,為了便於快速參考,特地依據 Python 3.5.1 給每個內建方法寫了示例並進行了歸類,便於大家索引。
PS: 可以點選概覽內的綠色標題進入相應分類或者通過右側邊欄文章目錄快速索引相應方法。

概覽

字串大小寫轉換

  • str.capitalize()
  • str.lower()
  • str.casefold()
  • str.swapcase()
  • str.title()
  • str.upper()

字串格式輸出

  • str.center(width[, fillchar])
  • str.ljust(width[, fillchar]); str.rjust(width[, fillchar])
  • str.zfill(width)
  • str.expandtabs(tabsize=8)
  • str.format(^args, ^^kwargs)
  • str.format_map(mapping)

字串搜尋定位與替換

  • str.count(sub[, start[, end]])
  • str.find(sub[, start[, end]]); str.rfind(sub[, start[, end]])
  • str.index(sub[, start[, end]]); str.rindex(sub[, start[, end]])
  • str.replace(old, new[, count])
  • str.lstrip([chars]); str.rstrip([chars]); str.strip([chars])
  • static str.maketrans(x[, y[, z]]); str.translate(table)

字串的聯合與分割

  • str.join(iterable)
  • str.partition(sep); str.rpartition(sep)
  • str.split(sep=None, maxsplit=-1); str.rsplit(sep=None, maxsplit=-1)
  • str.splitlines([keepends])

字串條件判斷

  • str.endswith(suffix[, start[, end]]); str.startswith(prefix[, start[, end]])
  • str.isalnum()
  • str.isalpha()
  • str.isdecimal(); str.isdigit(); str.isnumeric()
  • str.isidentifier()
  • str.islower()
  • str.isprintable()
  • str.isspace()
  • str.istitle()
  • str.isupper()

字串編碼

  • str.encode(encoding=”utf-8″, errors=”strict”)

大小寫轉換

str.capitalize()

將首字母轉換成大寫,需要注意的是如果首字沒有大寫形式,則返回原字串。

str.lower()

將字串轉換成小寫,其僅對 ASCII 編碼的字母有效。

str.casefold()

將字串轉換成小寫,Unicode 編碼中凡是有對應的小寫形式的,都會轉換。

str.swapcase()

對字串字母的大小寫進行反轉。

但需要注意的是 s.swapcase().swapcase() == s 不一定為真:

這裡 'Μ'(是 mu 不是 M) 的小寫正好與 'μ' 的寫法一致。

str.title()

將字串中每個“單詞”首字母大寫。其判斷“單詞”的依據則是基於空格和標點,所以應對英文撇好所有格或一些英文大寫的簡寫時,會出錯。

str.upper()

將字串所有字母變為大寫,會自動忽略不可轉成大寫的字元。

需要注意的是 s.upper().isupper() 不一定為 True

字串格式輸出

str.center(width[, fillchar])

將字串按照給定的寬度居中顯示,可以給定特定的字元填充多餘的長度,如果指定的長度小於字串長度,則返回原字串。

str.ljust(width[, fillchar]); str.rjust(width[, fillchar])

返回指定長度的字串,字串內容居左(右)如果長度小於字串長度,則返回原始字串,預設填充為 ASCII 空格,可指定填充的字串。

str.zfill(width)

用 ‘0’ 填充字串,並返回指定寬度的字串。

str.expandtabs(tabsize=8)

用指定的空格替代橫向製表符,使得相鄰字串之間的間距保持在指定的空格數以內。

str.format(^args, ^^kwargs)

格式化字串的語法比較繁多,官方文件已經有比較詳細的 examples,這裡就不寫例子了,想了解的童鞋可以直接戳這裡 Format examples.

str.format_map(mapping)

類似 str.format(*args, **kwargs) ,不同的是 mapping 是一個字典物件。

字串搜尋定位與替換

str.count(sub[, start[, end]])

str.find(sub[, start[, end]]); str.rfind(sub[, start[, end]])

str.index(sub[, start[, end]]); str.rindex(sub[, start[, end]])

find() rfind() 類似,不同的是如果找不到,就會引發 ValueError

str.replace(old, new[, count])

str.lstrip([chars]); str.rstrip([chars]); str.strip([chars])

static str.maketrans(x[, y[, z]]); str.translate(table)

maktrans 是一個靜態方法,用於生成一個對照表,以供 translate 使用。
如果 maktrans 僅一個引數,則該引數必須是一個字典,字典的 key 要麼是一個 Unicode 編碼(一個整數),要麼是一個長度為 1 的字串,字典的 value 則可以是任意字串、None或者 Unicode 編碼。

如果 maktrans 有兩個引數,則兩個引數形成對映,且兩個字串必須是長度相等;如果有第三個引數,則第三個引數也必須是字串,該字串將自動對映到 None

字串的聯合與分割

str.join(iterable)

用指定的字串,連線元素為字串的可迭代物件。

str.partition(sep); str.rpartition(sep)

str.split(sep=None, maxsplit=-1); str.rsplit(sep=None, maxsplit=-1)

str.splitlines([keepends])

字串以行界符為分隔符拆分為列表;當 keependsTrue,拆分後保留行界符,能被識別的行界符見官方文件

字串條件判斷

str.endswith(suffix[, start[, end]]); str.startswith(prefix[, start[, end]])

str.isalnum()

字串和數字的任意組合,即為真,簡而言之:

只要 c.isalpha(), c.isdecimal(), c.isdigit(), c.isnumeric() 中任意一個為真,則 c.isalnum() 為真。

str.isalpha()

Unicode 字元資料庫中作為 “Letter”(這些字元一般具有 “Lm”, “Lt”, “Lu”, “Ll”, or “Lo” 等標識,不同於 Alphabetic) 的,均為真。

str.isdecimal(); str.isdigit(); str.isnumeric()

三個方法的區別在於對 Unicode 通用標識的真值判斷範圍不同:

isdecimal: Nd,
isdigit: No, Nd,
isnumeric: No, Nd, Nl

digitdecimal 的區別在於有些數值字串,是 digit 卻非 decimal ,具體戳 這裡

str.isidentifier()

判斷字串是否可為合法的識別符號。

str.islower()

str.isprintable()

判斷字串的所有字元都是可列印字元或字串為空。Unicode 字符集中 “Other” “Separator” 類別的字元為不可列印的字元(但不包括 ASCII 的空格(0x20))。

str.isspace()

判斷字串中是否至少有一個字元,並且所有字元都是空白字元。

str.istitle()

判斷字串中的字元是否是首字母大寫,其會忽視非字母字元。

str.isupper()

字串編碼

str.encode(encoding=”utf-8″, errors=”strict”)

參考資料

Python 內建型別字串方法

相關文章