讓 Python 更加充分的使用 Sqlite3

發表於2017-12-01

我最近在涉及大量資料處理的專案中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何資料庫，所有的資料都將儲存在記憶體中，包括字典查詢、迭代和條件等查詢。這很好，但可以放入記憶體的只有那麼多，並且將資料從磁碟重新生成或載入到記憶體是一個繁瑣又耗時的過程。

我決定試一試sqlite3。因為只需開啟與資料庫的連線，這樣可以增加可處理的資料量，並將應用程式的載入時間減少到零。此外，我可以通過 SQL 查詢替換很多Python邏輯語句。

我想分享一些關於這次經歷的心得和發現。

TL;DR

使用大量操作 (又名 executemany)。
你不需要使用游標 (大部分時間)。
游標可被迭代。
使用上下文管理器。
使用編譯指示 (當它有意義)。
推遲索引建立。
使用佔位符來插入 python 值。

1. 使用大量操作

如果你需要在資料庫中一次性插入很多行，那麼你真不應該使用 execute。sqlite3 模組提供了批量插入的方式：executemany。

而不是像這樣做：

for row in iter_data():
    connection.execute('INSERT INTO my_table VALUES (?)', row)

1 2	for row in iter_data(): connection.execute('INSERT INTO my_table VALUES (?)', row)

你可以利用這個事實，即 executemany 接受元組的生成器作為引數：

connection.executemany(
    'INSERT INTO my_table VALUE (?)',
    iter_data()
)

connection.executemany(

'INSERT INTO my_table VALUE (?)',

iter_data()

)

這不僅更簡潔，而且更高效。實際上，sqlite3 在幕後利用 executemany 實現 execute，但後者插入一行而不是多行。

我寫了一個小的基準測試，將一百萬行插入空表（資料庫在記憶體中）：

executemany: 1.6 秒
execute: 2.7 秒

2. 你不需要遊標

一開始我經常搞混的事情就是，游標管理。線上示例和文件中通常如下：

connection = sqlite3.connect(':memory:')
cursor = connection.cursor()
# Do something with cursor

connection = sqlite3.connect(':memory:')

cursor = connection.cursor()

# Do something with cursor

但大多數情況下，你根本不需要游標，你可以直接使用連線物件（本文末尾會提到）。
像execute和executemany類似的操作可以直接在連線上呼叫。以下是一個證明此事的示例：

import sqlite3

connection = sqlite3(':memory:')

# Create a table
connection.execute('CREATE TABLE events(ts, msg)')

# Insert values
connection.executemany(
    'INSERT INTO events VALUES (?,?)',
    [
        (1, 'foo'),
        (2, 'bar'),
        (3, 'baz')
    ]
)

# Print inserted rows
for row in connnection.execute('SELECT * FROM events'):
    print(row)

import sqlite3

connection = sqlite3(':memory:')

# Create a table

connection.execute('CREATE TABLE events(ts, msg)')

# Insert values

connection.executemany(

'INSERT INTO events VALUES (?,?)',

[

(1, 'foo'),

(2, 'bar'),

(3, 'baz')

]

)

# Print inserted rows

for row in connnection.execute('SELECT * FROM events'):

print(row)

3. 游標（Cursor）可被用於迭代

你可能經常會看到使用fetchone或fetchall來處理SELECT查詢結果的示例。但是我發現處理這些結果的最自然的方式是直接在游標上迭代：

for row in connection.execute('SELECT * FROM events'):
    print(row)

1 2	for row in connection.execute('SELECT * FROM events'): print(row)

這樣一來，只要你得到足夠的結果，你就可以終止查詢，並且不會引起資源浪費。當然，如果事先知道你需要多少結果，可以改用LIMIT SQL語句，但Python生成器是非常方便的，可以讓你將資料生成與資料消耗分離。

4. 使用Context Managers（上下文管理器）

即使在處理SQL事務的中間，也會發生討厭的事情。為了避免手動處理回滾或提交，你可以簡單地使用連線物件作為上下文管理器。在以下示例中，我們建立了一個表，並錯誤地插入了重複的值：

import sqlite3
connection = sqlite3.connect(':memory:')

with connection:
    connection.execute(
        'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))')

try:
    with connection:
        connection.executemany('INSERT INTO events VALUES (?, ?)', [
            (1, 'foo'),
            (2, 'bar'),
            (3, 'baz'),
            (1, 'foo'),
        ])
except (sqlite3.OperationalError, sqlite3.IntegrityError) as e:
    print('Could not complete operation:', e)
    
# No row was inserted because transaction failed
for row in connection.execute('SELECT * FROM events'):
    print(row)
    
connection.close()

import sqlite3

connection = sqlite3.connect(':memory:')

with connection:

connection.execute(

'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))')

try:

with connection:

connection.executemany('INSERT INTO events VALUES (?, ?)', [

(1, 'foo'),

(2, 'bar'),

(3, 'baz'),

(1, 'foo'),

])

except (sqlite3.OperationalError, sqlite3.IntegrityError) as e:

print('Could not complete operation:', e)

# No row was inserted because transaction failed

for row in connection.execute('SELECT * FROM events'):

print(row)

connection.close()

5. 使用Pragmas

…當它真的有用時

在你的程式中有幾個 pragma 可用於調整 sqlite3 的行為。特別地，其中一個可以改善效能的是synchronous：

connection.execute('PRAGMA synchronous = OFF')

1	connection.execute('PRAGMA synchronous = OFF')

你應該知道這可能是危險的。如果應用程式在事務中間意外崩潰，資料庫可能會處於不一致的狀態。所以請小心使用！但是如果你要更快地插入很多行，那麼這可能是一個選擇。

6. 推遲索引建立

假設你需要在資料庫上建立幾個索引，而你需要在插入很多行的同時建立索引。把索引的建立推遲到所有行的插入之後可以導致實質性的效能改善。

7. 使用佔位符插入 Python 值

使用 Python 字串操作將值包含到查詢中是很方便的。但是這樣做非常不安全，而 sqlite3 給你提供了更好的方法來做到這一點：

# Do not do this!
my_timestamp = 1
c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp)

# Do this instead
my_timestamp = (1,)
c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp)

# Do not do this!

my_timestamp = 1

c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp)

# Do this instead

my_timestamp = (1,)

c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp)

此外，使用Python％s（或格式或格式的字串常量）的字串插值對於executemany來說並不是總是可行。所以在此嘗試沒有什麼真正意義！

請記住，這些小技巧可能會（也可能不會）給你帶來好處，具體取決於特定的用例。你應該永遠自己去嘗試，決定是否值得這麼做。

使用防火牆讓你的 Linux 更加強大
2019-07-13
防火牆Linux
Python資料庫模組(sqlite3,SQLite3)
2024-03-26
Python資料庫SQLite
自律，不是讓你優秀的充分條件！
2018-08-03
Lombok - 使用註解讓你的JavaBean變得更加簡潔
2020-08-14
LombokJavaBean
如何讓自己的程式碼更加安全？
2020-04-07
充分理解 python -m mod
2019-02-16
Python
ubuntu上使用sqlite3
2018-12-01
UbuntuSQLite
強化 SSH 讓你更加安心
2023-11-28
情感計算：讓機器更加智慧
2019-10-10
讓遊戲世界更加真實可信
2021-06-29
遊戲
SmartRules讓MindManager的互動圖變得更加智慧
2019-03-03
async/await 是如何讓程式碼更加簡潔的？
2018-08-17
AI
DSL-讓你的 Ruby 程式碼更加優雅
2019-04-20
CodeRunner for Mac：讓程式設計更加簡單
2023-12-14
Mac程式設計
沉浸式互動讓遊戲更加迷人
2020-01-14
遊戲
雲端計算如何讓您的企業更加安全？
2018-10-31
這些 JavaScript函式讓你的工作更加 So Easy!
2021-11-09
JavaScript函式
想讓你的程式碼變得更加優雅嗎？
2021-01-17
為你的App增加WIFI認證檢測，讓使用者體驗更加絲滑
2018-07-20
APPWiFi
Python標準庫14 資料庫 (sqlite3)
2019-10-20
Python資料庫SQLite
讓 Java 程式設計師更加高效的開發工具
2018-03-09
Java程式設計師
讓你的Mac更加乾淨整潔——App Cleaner & Uninstaller Pro
2024-01-16
MacAPP
全面吃透JAVA Stream流操作，讓程式碼更加的優雅
2022-07-11
Java
僅需五步，讓你的個人資料更加安全！
2021-02-24
12 個概念，讓 JavaScript 開發更加簡單
2019-03-07
JavaScript
Go Ballast 讓記憶體控制更加絲滑
2021-11-17
GoAST記憶體
Python對於Excel的一些基本繪製圖示操作，讓你日常工作更加輕鬆
2018-12-15
PythonExcel
Path Finder for Mac：讓你的Mac檔案管理更加高效便捷！
2023-11-16
Mac
牛逼！Vue3.5的useTemplateRef讓ref操作DOM更加絲滑
2024-09-04
Vue
DeepL翻譯工具，讓你的跨語言交流更加順暢
2024-06-25
風變程式設計讓我的職場選擇更加自由
2021-11-08
程式設計
ERP系統的移動盤點，讓工作更加精準高效
2022-12-02
spring思維導圖，讓spring更加簡單易懂
2018-03-03
Spring
這個 bug 讓我更加理解 Spring 單例了
2020-12-22
Spring單例
[Python]_[初級]_[校驗查詢sqlite3資料庫]
2020-11-30
PythonSQLite資料庫
讓pip使用python3而不是python2
2019-03-11
Python
推薦5款讓你的電腦更加有趣的小工具
2023-04-04
Android Annotation-讓你的程式碼和設計更加優雅（一）
2018-10-15
Android
分享5款讓生活和工作變得更加高效的軟體
2023-05-04

讓 Python 更加充分的使用 Sqlite3

1. 使用大量操作

2. 你不需要遊標

3. 游標（Cursor）可被用於迭代

4. 使用Context Managers（上下文管理器）

5. 使用Pragmas

6. 推遲索引建立

7. 使用佔位符插入 Python 值

相關文章