程式設計大神進階之路:Python技巧小貼士

機器之心發表於2019-10-24

介紹 Python 炫酷功能(例如,變數解包,偏函式,列舉可迭代物件等)的文章層出不窮。但是還有很多 Python 的程式設計小技巧鮮被提及。因此,本文會試著介紹一些其它文章沒有提到的小技巧,這些小技巧也是我平時會用到的的。讓我們一探究竟吧!

程式設計大神進階之路:Python技巧小貼士

整理字串輸入

整理使用者輸入的問題在程式設計過程中極為常見。通常情況下,將字元轉換為小寫或大寫就夠了,有時你可以使用正規表示式模組「Regex」完成這項工作。但是如果問題很複雜,可能有更好的方法來解決:

user_input = "This\nstring has\tsome whitespaces...\r\n"

character_map = {
    ord('\n') : ' ',
    ord('\t') : ' ',
    ord('\r') : None
}
user_input.translate(character_map)  # This string has some whitespaces... 

在本例中,你可以看到空格符「\ n」和「\ t」都被替換成了單個空格,「\ r」都被刪掉了。這只是個很簡單的例子,我們可以更進一步,使用「unicodedata」程式包生成大型重對映表,並使用其中的「combining()」進行生成和對映,我們可以

迭代器切片(Slice)

如果對迭代器進行切片操作,會返回一個「TypeError」,提示生成器物件沒有下標,但是我們可以用一個簡單的方案來解決這個問題:

import itertools

s = itertools.islice(range(50), 10, 20)  # <itertools.islice object at 0x7f70fab88138>
for val in s:
    ...

我們可以使用「itertools.islice」建立一個「islice」物件,該物件是一個迭代器,可以產生我們想要的項。但需要注意的是,該操作要使用切片之前的所有生成器項,以及「islice」物件中的所有項。

跳過可迭代物件的開頭

有時你要處理一些以不需要的行(如註釋)開頭的檔案。「itertools」再次提供了一種簡單的解決方案:

string_from_file = """
// Author: ...
// License: ...
//
// Date: ...
Actual content...
"""

import itertools

for line in itertools.dropwhile(lambda line: line.startswith("//"), string_from_file.split("\n")):
    print(line)

這段程式碼只列印初始註釋部分之後的內容。如果我們只想捨棄可迭代物件的開頭部分(本示例中為開頭的註釋行),而又不知道要這部分有多長時,這種方法就很有用了。

只包含關鍵字引數的函式 (kwargs)

當我們使用下面的函式時,建立僅僅需要關鍵字引數作為輸入的函式來提供更清晰的函式定義,會很有幫助:

def test(*, a, b):
    pass

test("value for a", "value for b")  # TypeError: test() takes 0 positional arguments...
test(a="value", b="value 2")  # Works...

如你所見,在關鍵字引數之前加上一個「*」就可以解決這個問題。如果我們將某些引數放在「*」引數之前,它們顯然是位置引數

建立支援「with」語句的物件

舉例而言,我們都知道如何使用「with」語句開啟檔案或獲取鎖,但是我們可以實現自己上下文表示式嗎?是的,我們可以使用「__enter__」和「__exit__」來實現上下文管理協議:

class Connection:
    def __init__(self):
        ...

    def __enter__(self):
        # Initialize connection...

    def __exit__(self, type, value, traceback):
        # Close connection...

with Connection() as c:
    # __enter__() executes
    ...
    # conn.__exit__() executes

這是在 Python 中最常見的實現上下文管理的方法,但是還有更簡單的方法:

from contextlib import contextmanager

@contextmanager
def tag(name):
    print(f"<{name}>")
    yield
    print(f"</{name}>")

with tag("h1"):
    print("This is Title.")

上面這段程式碼使用 contextmanager 的 manager 裝飾器實現了內容管理協議。在進入 with 塊時 tag 函式的第一部分(在 yield 之前的部分)就已經執行了,然後 with 塊才被執行,最後執行 tag 函式的其餘部分。

用「__slots__」節省記憶體

如果你曾經編寫過一個建立了某種類的大量例項的程式,那麼你可能已經注意到,你的程式突然需要大量的記憶體。那是因為 Python 使用字典來表示類例項的屬性,這使其速度很快,但記憶體使用效率卻不是很高。通常情況下,這並不是一個嚴重的問題。但是,如果你的程式因此受到嚴重的影響,不妨試一下「__slots__」:

class Person:
    __slots__ = ["first_name", "last_name", "phone"]
    def __init__(self, first_name, last_name, phone):
        self.first_name = first_name
        self.last_name = last_name
        self.phone = phone

當我們定義了「__slots__」屬性時,Python 沒有使用字典來表示屬性,而是使用小的固定大小的陣列,這大大減少了每個例項所需的記憶體。使用「__slots__」也有一些缺點:我們不能宣告任何新的屬性,我們只能使用「__slots__」上現有的屬性。而且,帶有「__slots__」的類不能使用多重繼承。

限制「CPU」和記憶體使用量

如果不是想最佳化程式對記憶體或 CPU 的使用率,而是想直接將其限制為某個確定的數字,Python 也有一個對應的庫可以做到:

import signal
import resource
import os

# To Limit CPU time
def time_exceeded(signo, frame):
    print("CPU exceeded...")
    raise SystemExit(1)

def set_max_runtime(seconds):
    # Install the signal handler and set a resource limit
    soft, hard = resource.getrlimit(resource.RLIMIT_CPU)
    resource.setrlimit(resource.RLIMIT_CPU, (seconds, hard))
    signal.signal(signal.SIGXCPU, time_exceeded)

# To limit memory usage
def set_max_memory(size):
    soft, hard = resource.getrlimit(resource.RLIMIT_AS)
    resource.setrlimit(resource.RLIMIT_AS, (size, hard))

我們可以看到,在上面的程式碼片段中,同時包含設定最大 CPU 執行時間和最大記憶體使用限制的選項。在限制 CPU 的執行時間時,我們首先獲得該特定資源(RLIMIT_CPU)的軟限制和硬限制,然後使用透過引數指定的秒數和先前檢索到的硬限制來進行設定。最後,如果 CPU 的執行時間超過了限制,我們將發出系統退出的訊號。在記憶體使用方面,我們再次檢索軟限制和硬限制,並使用帶「size」引數的「setrlimit」和先前檢索到的硬限制來設定它。

控制可以/不可以匯入什麼

有些語言有非常明顯的機制來匯出成員(變數、方法、介面),例如在 Golang 中只有以大寫字母開頭的成員被匯出。然而,在 Python 中,所有成員都會被匯出(除非我們使用了「__all__」):

def foo():
    pass

def bar():
    pass

__all__ = ["bar"]

在上面這段程式碼中,我們知道只有「bar」函式被匯出了。同樣,我們可以讓「__all__」為空,這樣就不會匯出任何東西,當從這個模組匯入的時候,會造成「AttributeError」。

實現比較運算子的簡單方法

為一個類實現所有的比較運算子(如 __lt__ , __le__ , __gt__ , __ge__)是很繁瑣的。有更簡單的方法可以做到這一點嗎?這種時候,「functools.total_ordering」就是一個很好的幫手:

from functools import total_ordering

@total_ordering
class Number:
    def __init__(self, value):
        self.value = value

    def __lt__(self, other):
        return self.value < other.value

    def __eq__(self, other):
        return self.value == other.value

print(Number(20) > Number(3))
print(Number(1) < Number(5))
print(Number(15) >= Number(15))
print(Number(10) <= Number(2))

這裡的工作原理究竟是怎樣的呢?我們用「total_ordering」裝飾器簡化實現對類例項排序的過程。我們只需要定義「__lt__」和「__eq__」就可以了,它們是實現其餘操作所需要的最小的操作集合(這裡也體現了裝飾器的作用——為我們填補空白)。

結語

並非本文中所有提到的功能在日常的 Python 程式設計中都是必需或有用的,但是其中某些功能可能會不時派上用場,而且它們也可能簡化一些原本就很冗長且令人煩惱的任務。還需指出的是,所有這些功能都是 Python 標準庫的一部分。而在我看來,其中一些功能似乎並不像標準庫中包含的標準內容,所以當你使用 Python 實現本文提到的某些功能時,請先參閱 Python 的標準庫,如果你不能找到想要的功能,可能只是因為你還沒有盡力查詢(如果真的沒有,那它肯定也存在於一些第三方庫)。

原文連結:https://medium.com/m/global-identity?redirectUrl=https%3A%2F%2Ftowardsdatascience.com%2Fpython-tips-and-trick-you-havent-already-seen-37825547544f

相關文章