Python高效程式設計技巧

aqee發表於2012-12-25

  我已經使用Python程式設計有多年了,即使今天我仍然驚奇於這種語言所能讓程式碼表現出的整潔和對DRY程式設計原則的適用。這些年來的經歷讓我學到了很多的小技巧和知識,大多數是通過閱讀很流行的開源軟體,如Django, Flask, Requests中獲得的。

  下面我挑選出的這幾個技巧常常會被人們忽略,但它們在日常程式設計中能真正的給我們帶來不少幫助。

  1. 字典推導(Dictionary comprehensions)和集合推導(Set comprehensions)

  大多數的Python程式設計師都知道且使用過列表推導(list comprehensions)。如果你對list comprehensions概念不是很熟悉——一個list comprehension就是一個更簡短、簡潔的建立一個list的方法。

>>> some_list = [1, 2, 3, 4, 5]

>>> another_list = [ x + 1 for x in some_list ]

>>> another_list
[2, 3, 4, 5, 6]

  自從python 3.1 (甚至是Python 2.7)起,我們可以用同樣的語法來建立集合和字典表:

>>> # Set Comprehensions
>>> some_list = [1, 2, 3, 4, 5, 2, 5, 1, 4, 8]

>>> even_set = { x for x in some_list if x % 2 == 0 }

>>> even_set
set([8, 2, 4])

>>> # Dict Comprehensions

>>> d = { x: x % 2 == 0 for x in range(1, 11) }

>>> d
{1: False, 2: True, 3: False, 4: True, 5: False, 6: True, 7: False, 8: True, 9: False, 10: True}

  在第一個例子裡,我們以some_list為基礎,建立了一個具有不重複元素的集合,而且集合裡只包含偶數。而在字典表的例子裡,我們建立了一個key是不重複的1到10之間的整數,value是布林型,用來指示key是否是偶數。

  這裡另外一個值得注意的事情是集合的字面量表示法。我們可以簡單的用這種方法建立一個集合:

>>> my_set = {1, 2, 1, 2, 3, 4}

>>> my_set
set([1, 2, 3, 4])

  而不需要使用內建函式set()。

  2. 計數時使用Counter計數物件。

  這聽起來顯而易見,但經常被人忘記。對於大多數程式設計師來說,數一個東西是一項很常見的任務,而且在大多數情況下並不是很有挑戰性的事情——這裡有幾種方法能更簡單的完成這種任務。

  Python的collections類庫裡有個內建的dict類的子類,是專門來幹這種事情的:

>>> from collections import Counter
>>> c = Counter('hello world')

>>> c
Counter({'l': 3, 'o': 2, ' ': 1, 'e': 1, 'd': 1, 'h': 1, 'r': 1, 'w': 1})

>>> c.most_common(2)
[('l', 3), ('o', 2)]

  3. 漂亮的列印出JSON

  JSON是一種非常好的資料序列化的形式,被如今的各種API和web service大量的使用。使用python內建的json處理,可以使JSON串具有一定的可讀性,但當遇到大型資料時,它表現成一個很長的、連續的一行時,人的肉眼就很難觀看了。

  為了能讓JSON資料表現的更友好,我們可以使用indent引數來輸出漂亮的JSON。當在控制檯互動式程式設計或做日誌時,這尤其有用:

>>> import json

>>> print(json.dumps(data))  # No indention
{"status": "OK", "count": 2, "results": [{"age": 27, "name": "Oz", "lactose_intolerant": true}, {"age": 29, "name": "Joe", "lactose_intolerant": false}]}

>>> print(json.dumps(data, indent=2))  # With indention

{
  "status": "OK",
  "count": 2,
  "results": [

    {
      "age": 27,
      "name": "Oz",

      "lactose_intolerant": true
    },
    {
      "age": 29,

      "name": "Joe",
      "lactose_intolerant": false
    }
  ]

}

  同樣,使用內建的pprint模組,也可以讓其它任何東西列印輸出的更漂亮。

  4. 建立一次性的、快速的小型web服務

  有時候,我們需要在兩臺機器或服務之間做一些簡便的、很基礎的RPC之類的互動。我們希望用一種簡單的方式使用B程式呼叫A程式裡的一個方法——有時是在另一臺機器上。僅內部使用。

  我並不鼓勵將這裡介紹的方法用在非內部的、一次性的程式設計中。我們可以使用一種叫做XML-RPC的協議 (相對應的是這個Python庫),來做這種事情。

  下面是一個使用SimpleXMLRPCServer模組建立一個快速的小的檔案讀取伺服器的例子:

from SimpleXMLRPCServer import SimpleXMLRPCServer

def file_reader(file_name):

    with open(file_name, 'r') as f:
        return f.read()

server = SimpleXMLRPCServer(('localhost', 8000))
server.register_introspection_functions()

server.register_function(file_reader)

server.serve_forever()

  客戶端:

import xmlrpclib
proxy = xmlrpclib.ServerProxy('http://localhost:8000/')

proxy.file_reader('/tmp/secret.txt')

  我們這樣就得到了一個遠端檔案讀取工具,沒有外部的依賴,只有幾句程式碼(當然,沒有任何安全措施,所以只可以在家裡這樣做)。

  5. Python神奇的開源社群

  這裡我提到的幾個東西都是Python標準庫裡的,如果你安裝了Python,你就已經可以這樣使用了。而對於很多其它型別的任務,這裡有大量的社群維護的第三方庫可供你使用。

  下面這個清單是我認為的好用且健壯的開源庫的必備條件:

  好的開源庫必須…
  • 包含一個很清楚的許可宣告,能適用於你的使用場景。
  • 開發和維護工作很活躍(或,你能參與開發維護它。)
  • 能夠簡單的使用pip安裝或反覆部署。
  • 有測試套件,具有足夠的測試覆蓋率。

  如果你發現一個好的程式庫,符合你的要求,不要不好意思————大部分的開源專案都歡迎捐贈程式碼和歡迎提供幫助——即使你不是一個Python高手。

  原文連結:Improving Your Python Productivity

相關文章