Python中冷門但非常好用的內建函式

Tsissan發表於2021-12-17

Python中有許多內建函式,不像print、len那麼廣為人知,但它們的功能卻異常強大,用好了可以大大提高程式碼效率,同時提升程式碼的簡潔度,增強可閱讀性

Counter

collections在python官方文件中的解釋是High-performance container datatypes,直接的中文翻譯解釋高效能容量資料型別。這個模組實現了特定目標的容器,以提供Python標準內建容器 dict , list , set , 和 tuple 的替代選擇。在python3.10.1中它總共包含以下幾種資料型別:

容器名 簡介
namedtuple() 建立命名元組子類的工廠函式
deque 類似列表(list)的容器,實現了在兩端快速新增(append)和彈出(pop)
ChainMap 類似字典(dict)的容器類,將多個對映集合到一個檢視裡面
Counter 字典的子類,提供了可雜湊物件的計數功能
OrderedDict 字典的子類,儲存了他們被新增的順序
defaultdict 字典的子類,提供了一個工廠函式,為字典查詢提供一個預設值
UserDict 封裝了字典物件,簡化了字典子類化
UserList 封裝了列表物件,簡化了列表子類化
UserString 封裝了字串物件,簡化了字串子類化

其中Counter中文意思是計數器,也就是我們常用於統計的一種資料型別,在使用Counter之後可以讓我們的程式碼更加簡單易讀。Counter類繼承dict類,所以它能使用dict類裡面的方法

舉例

#統計詞頻
fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']
result = {}
for fruit in fruits:
    if not result.get(fruit):
        result[fruit] = 1
    else:
        result[fruit] += 1
print(result)
#{'apple': 2, 'peach': 3, 'lemon': 1}

下面我們看用Counter怎麼實現:

from collections import Counter
fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']
c = Counter(fruits)
print(dict(c))
#{'apple': 2, 'peach': 3, 'lemon': 1}

顯然程式碼更加簡單了,也更容易閱讀和維護了。

  • elements()
    返回一個迭代器,其中每個元素將重複出現計數值所指定次。元素會按首次出現的順序返回。如果一個元素的計數值小於1,elements()將會忽略它。
>>> c = Counter(a=4, b=2, c=0, d=-2)
>>> sorted(c.elements())
['a', 'a', 'a', 'a', 'b', 'b']
  • most_common([n])
    返回一個列表,其中包含n個最常見的元素及出現次數,按常見程度由高到低排序。如果n被省略或為None,most_common()將返回計數器中的所有元素。計數值相等的元素按首次出現的順序排序:
>>> Counter('abracadabra').most_common(3)
[('a', 5), ('b', 2), ('r', 2)]

這兩個方法是Counter中最常用的方法,其他方法可以參考python3.10.1官方文件

實戰

Leetcode 1002.查詢共用字元
給你一個字串陣列words,請你找出所有在words的每個字串中都出現的共用字元(包括重複字元),並以陣列形式返回。你可以按任意順序返回答案。

輸入:words = ["bella", "label", "roller"]
輸出:["e", "l", "l"]

輸入:words = ["cool", "lock", "cook"]
輸出:["c", "o"]

看到統計字元,典型的可以用Counter完美解決。這道題是找出字串列表裡面每個元素都包含的字元,首先可以用Counter計算出每個元素每個字元出現的次數,依次取交集最後得出所有元素共同存在的字元,然後利用elements輸出共用字元出現的次數

class Solution:
    def commonChars(self, words: List[str]) -> List[str]:
        from collections import Counter
        ans = Counter(words[0])
        for i in words[1:]:
            ans &= Counter(i)
        return list(ans.elements())

提交一下,發現83個測試用例耗時48ms,速度還是不錯的

sorted

在處理資料過程中,我們經常會用到排序操作,比如將列表、字典、元組裡面的元素正/倒排序。這時候就需要用到sorted(),它可以對任何可迭代物件進行排序,並返回列表

  • 對列表升序操作:
a = sorted([2, 4, 3, 7, 1, 9])
print(a)
# 輸出:[1, 2, 3, 4, 7, 9]
  • 對元組倒序操作:
sorted((4,1,9,6),reverse=True)
print(a)
# 輸出:[9, 6, 4, 1]
  • 使用引數:key,根據自定義規則,按字串長度來排序:
fruits = ['apple', 'watermelon', 'pear', 'banana']
a = sorted(fruits, key = lambda x : len(x))
print(a)
# 輸出:['pear', 'apple', 'banana', 'watermelon']

all

all() 函式用於判斷給定的可迭代引數iterable中的所有元素是否都為 TRUE,如果是返回 True,否則返回 False。元素除了是 0、空、None、False外都算True。注意:空元組、空列表返回值為True。

>>> all(['a', 'b', 'c', 'd'])  # 列表list,元素都不為空或0
True
>>> all(['a', 'b', '', 'd'])   # 列表list,存在一個為空的元素
False
>>> all([0, 1,2, 3])          # 列表list,存在一個為0的元素
False
>>> all(('a', 'b', 'c', 'd'))  # 元組tuple,元素都不為空或0
True
>>> all(('a', 'b', '', 'd'))   # 元組tuple,存在一個為空的元素
False
>>> all((0, 1, 2, 3))          # 元組tuple,存在一個為0的元素
False
>>> all([])             # 空列表
True
>>> all(())             # 空元組
True

any函式正好和all函式相反:判斷一個tuple或者list是否全為空,0,False。如果全為空,0,False,則返回False;如果不全為空,則返回True。

F-strings

在python3.6.2版本中,PEP 498提出一種新型字串格式化機制,被稱為 “字串插值” 或者更常見的一種稱呼是F-strings,F-strings提供了一種明確且方便的方式將python表示式嵌入到字串中來進行格式化:

s1='Hello'
s2='World'
print(f'{s1} {s2}!')
# Hello World!

在F-strings中我們也可以執行函式:

def power(x):
  return x*x
x=4
print(f'{x} * {x} = {power(x)}')
# 4 * 4 = 16

而且F-strings的執行速度很快,比傳統的%-string和str.format()這兩種格式化方法都快得多,書寫起來也更加簡單。

本文主要講解了python幾種冷門但好用的函式,更多內容以後會陸陸續續更新~

相關文章