詳解Python拼接字串的七種方式

Python猫發表於2018-11-01

原文網址 : https://www.jiqizhixin.com/articles/2018-11-01-3

忘了在哪看到一位程式設計大牛調侃，他說程式設計師每天就做兩件事，其中之一就是處理字串。相信不少同學會有同感。

幾乎任何一種程式語言，都把字串列為最基礎和不可或缺的資料型別。而拼接字串是必備的一種技能。今天，我跟大家一起來學習Python拼接字串的七種方式。

1、來自C語言的%方式

print('%s %s' % ('Hello', 'world'))
>>> Hello world

%號格式化字串的方式繼承自古老的C語言，這在很多程式語言都有類似的實現。上例的%s是一個佔位符，它僅代表一段字串，並不是拼接的實際內容。實際的拼接內容在一個單獨的%號後面，放在一個元組裡。

類似的佔位符還有：%d（代表一個整數）、%f（代表一個浮點數）、%x（代表一個16進位制數），等等。%佔位符既是這種拼接方式的特點，同時也是其限制，因為每種佔位符都有特定意義，實際使用起來太麻煩了。

2、format()拼接方式

# 簡潔版
s1 = 'Hello {}! My name is {}.'.format('World', 'Python貓')
print(s1)
>>>Hello World! My name is Python貓.

# 對號入座版
s2 = 'Hello {0}! My name is {1}.'.format('World', 'Python貓')
s3 = 'Hello {name1}! My name is {name2}.'.format(name1='World', name2='Python貓')
print(s2)
>>>Hello World! My name is Python貓.
print(s3)
>>>Hello World! My name is Python貓.

這種方式使用花括號{}做佔位符，在format方法中再轉入實際的拼接值。容易看出，它實際上是對%號拼接方式的改進。這種方式在Python2.6中開始引入。

上例中，簡潔版的花括號中無內容，缺點是容易弄錯次序。對號入座版主要有兩種，一種傳入序列號，一種則使用key-value的方式。實戰中，我們更推薦後一種，既不會數錯次序，又更直觀可讀。

3、() 類似元組方式

s_tuple = ('Hello', ' ', 'world')
s_like_tuple = ('Hello' ' ' 'world')

print(s_tuple) 
>>>('Hello', ' ', 'world')
print(s_like_tuple) 
>>>Hello world

type(s_like_tuple) >>>str

注意，上例中s_like_tuple並不是一個元組，因為元素間沒有逗號分隔符，這些元素間可以用空格間隔，也可以不要空格。使用type()檢視，發現它就是一個str型別。我沒查到這是啥原因，猜測或許()括號中的內容是被Python最佳化處理了。

這種方式看起來很快捷，但是，括號()內要求元素是真實字串，不能混用變數，所以不夠靈活。

# 多元素時，不支援有變數
str_1 = 'Hello'
str_2 = (str_1 'world')
>>> SyntaxError: invalid syntax
str_3 = (str_1 str_1)
>>> SyntaxError: invalid syntax
# 但是下面寫法不會報錯
str_4 = (str_1)

4、物件導向模板拼接

from string import Template
s = Template('${s1} ${s2}!') 
print(s.safe_substitute(s1='Hello',s2='world')) 
>>> Hello world!

說實話，我不喜歡這種實現方式。濃濃的一股被物件導向思想毒害的臭味。

就不多說了。

5、常用的+號方式

str_1 = 'Hello world！ ' 
str_2 = 'My name is Python貓.'
print(str_1 + str_2)
>>>Hello world！ My name is Python貓.
print(str_1)
>>>Hello world！

這種方式最常用、直觀、易懂，是入門級的實現方式。但是，它也存在兩處讓人容易犯錯的地方。

首先，新入門程式設計的同學容易犯錯，他們不知道字串是不可變型別，新的字串會獨佔一塊新的記憶體，而原來的字串保持不變。上例中，拼接前有兩段字串，拼接後實際有三段字串。

其次，一些有經驗的老程式設計師也容易犯錯，他們以為當拼接次數不超過3時，使用+號連線符就會比其它方式快（ps：不少Python教程都是如此建議），但這沒有任何合理根據。

事實上，在拼接短的字面值時，由於CPython中的 常數摺疊 （constant folding）功能，這些字面值會被轉換成更短的形式，例如'a'+'b'+'c' 被轉換成'abc'，'hello'+'world'也會被轉換成'hello world'。這種轉換是在編譯期完成的，而到了執行期時就不會再發生任何拼接操作，因此會加快整體計算的速度。

常數摺疊最佳化有一個限度，它要求拼接結果的長度不超過20。所以，當拼接的最終字串長度不超過20時，+號運算子的方式，會比後面提到的join等方式快得多，這與+號的使用次數無關。

題外話：你是否覺得20這個數字很熟悉呢？沒錯，我們之前在《Python中的“特權種族”是什麼？》中提到過，字串類的特權種族也是以20為限。當時也有一個例子，展示了編譯期和執行期的區別，建議你去回看。

6、join()拼接方式

str_list = ['Hello', 'world']
str_join1 = ' '.join(str_list)
str_join2 = '-'.join(str_list)
print(str_join1) >>>Hello world
print(str_join2) >>>Hello-world

str物件自帶的join()方法，接受一個序列引數，可以實現拼接。拼接時，元素若不是字串，需要先轉換一下。可以看出，這種方法比較適用於連線序列物件中（例如列表）的元素，並設定統一的間隔符。

當拼接長度超過20時，這種方式基本上是首選。不過，它的缺點就是，不適合進行零散片段的、不處於序列集合的元素拼接。

7、f-string方式

name = 'world'
myname = 'python_cat'
words = f'Hello {name}. My name is {myname}.'
print(words)
>>> Hello world. My name is python_cat.

f-string方式出自PEP 498（Literal String Interpolation，字面字串插值），從Python3.6版本引入。其特點是在字串前加 f 標識，字串中間則用花括號{}包裹其它字串變數。

這種方式在可讀性上秒殺format()方式，處理長字串的拼接時，速度與join()方法相當。

儘管如此，這種方式與其它某些程式語言相比，還是欠優雅，因為它引入了一個 f 標識。而其它某些程式語言可以更簡練，比如shell：

name="world"
myname="python_cat"
words="Hello ${name}. My name is ${myname}."
echo $words
>>>Hello world. My name is python_cat.

總結一下，我們前面說的“字串拼接”，其實是從結果上理解。若從實現原理上劃分的話，我們可以將這些方法劃分出三種型別：

格式化類：%、format()、template
拼接類：+、()、join()
插值類：f-string

當要處理字串列表等序列結構時，採用join()方式；拼接長度不超過20時，選用+號運算子方式；長度超過20的情況，高版本選用f-string，低版本時看情況使用format()或join()方式。

One more thing：

你以為這就要結束了？

圖樣！這不是我的風格！

我的風格是發散思考、系統思考、以及追求程式設計哲學的思考。

最近，我在讀《駭客與畫家》，保羅•格雷厄姆在書中提出了這個問題：

從語義上看，字串或多或少可以理解成列表的一個子集，其中的每一個元素都是字元。那麼，為什麼還需要把字串單列為一種資料結構呢？

作者認為“程式語言設定字串似乎就是一個過早最佳化的例子”，這個觀點令我大為震撼！前文提到的七種拼接字串的方法瞬間變成紙，薄得似乎一觸就破。

但是，作者認為這還不夠，他還有更驚人想法：

還有比這更驚人的預言。在邏輯上其實不需要對整數設定單獨的表示法，因為可以把它們也看作列表，整數n可以用一個n元素的列表表示。… 程式語言會發展到放棄基本資料型別之一的整數這一步嗎？

不知道你讀完這段話，有何感想。我在閱讀時，雖然有上下文語境的鋪墊，還是驚歎不已。

在此，先行預告一下：下期薦書系列的書目是《駭客與畫家》，到時候，還會有幸運抽獎，送出一本《駭客與畫家》，敬請留意。

附幾個相關PEP連結：

https://www.python.org/dev/peps/pep-0215/

https://www.python.org/dev/peps/pep-0292/

https://www.python.org/dev/peps/pep-3101/

https://www.python.org/dev/peps/pep-0498/

----------------

本文原創並首發於微信公眾號【Python貓】，後臺回覆“愛學習”，免費獲得20+本精選電子書。

公眾號：Python貓

公眾號@Python貓，一隻偽喵星來客，一個有趣又有用的學習分享平臺，專注python技術、資料科學和深度學習，兼具極客思維與人文情懷，歡迎你關注！

12月27日雲棲精選夜讀|Python拼接字串的七種方式
2018-12-27
Python字串
Java中常見字串拼接九種方式
2024-03-20
Java字串
Python 中字串拼接的 N 種方法
2018-09-03
Python字串
Javascript之字串拼接詳解
2018-05-25
JavaScript字串
python3 拼接字串的7種方法
2018-07-30
Python字串
5種常見的Python拼接字串方法！
2023-10-16
Python字串
python中7種方法實現字串的拼接
2024-05-09
Python字串
Java String 字串拼接的三種方式與效率對比分析
2020-10-26
Java字串
Python合併字典的七種方式！
2021-04-26
Python
python怎麼拼接字串
2021-09-11
Python字串
Python小技巧：一種字串的排序方式
2024-05-27
Python字串排序
Java 中拼接 String 的 N 種方式
2022-02-21
Java
python列表的若干種拼接
2020-11-24
Python
Java程式碼中字串拼接方式分析
2022-02-14
Java字串
[轉]Python格式化字串的4種方式
2024-03-20
Python字串
Python中的字串切割和拼接方法都有哪些?
2023-10-27
Python字串
Vue的七種傳值方式
2021-02-08
Vue
JavaScript 字串拼接
2019-01-17
JavaScript字串
python selenium的三種等待方式解讀
2018-12-18
Python
如何更高效的拼接字串？
2018-12-08
字串
SpringDI四種依賴注入方式詳解
2020-07-18
Spring依賴注入
python字串遍歷方式
2020-12-08
Python字串
Python基礎之七：編碼詳解
2020-10-23
Python
python實現兩字串對映詳解
2023-04-20
Python字串
字串拼接+和concat的區別
2018-05-02
字串
可能是最全面的 python 字串拼接總結
2019-02-16
Python字串
可能是最全面的python字串拼接總結
2018-07-04
Python字串
程式間的五種通訊方式介紹-詳解
2020-05-13
String/StringBuilder字串拼接操作
2019-04-16
UI字串
C語言 - 字串拼接
2024-04-23
C語言字串
Python中的56個內建函式詳解（七）
2021-09-11
Python函式
（Python基礎教程之七）Python字串操作
2021-09-09
Python字串
Python中對字串格式化的方法:%、format()、以及f+字串詳解
2020-11-13
Python字串格式化ORM
@Resource,@Autowired,@Inject3種注入方式詳解
2018-05-04
Redis詳解 - SpringBoot整合Redis，RedisTemplate和註解兩種方式的使用
2018-11-16
RedisSpring Boot
前端常用6種資料加密方式的使用(最詳解)
2024-10-17
前端加密
PHP FFI詳解 - 一種全新的PHP擴充套件方式
2021-03-03
PHP套件
js拼接帶冒號:的字串的方法
2021-09-09
JS字串