最全總結 | 聊聊 Python 資料處理全家桶(Mysql 篇)

AirPython發表於2020-09-17

image

1. 前言

在爬蟲、自動化、資料分析、軟體測試、Web 等日常操作中,除 JSON、YAML、XML 外,還有一些資料經常會用到,比如:Mysql、Sqlite、Redis、MongoDB、Memchache 等

一般情況下,我們都會使用特定的客戶端或命令列工具去操作;但是如果涉及到工程專案,將這部分資料操作整合到程式碼中使用才是王道

接下來,我將分幾篇文章,和大家一起聊聊 Python 操作這些資料的 最優 方案

本篇從使用最為廣泛的關係型資料庫 - Mysql 開始講起

2. 準備

首先,我們通過 Mysql 客戶端或命令列建立一個資料庫 xh

然後,在這個資料庫下建一張簡單的表 people

為了便於演示,這裡只建立了三個欄位:id、name、age,其中 id 為主鍵

image

Python 操作 Mysql 主要包含下面 3 種方式:

  • Python-MySql

  • PyMysql

  • SQLAlchemy

其中,

Python-MySql 由 C 語法打造,介面精煉,效能最棒;但是由於環境依賴多,安裝複雜,已停止更新,僅支援 Python2

PyMysql 為替代 Python-Mysql 而生,純 Python 語言編寫的 Mysql 操作客戶端,安裝方便,支援 Python3

SQLAlchemy 是一個非常強大的 ORM 框架,不提供底層的資料庫操作,主要是通過定義模型對應資料表結構,在 Python Web 程式設計領域應用廣泛

由於 Python-MySql  不支援 Python3,所以本文只談後 2 種操作方式

3. PyMysql

首先,使用 pip 安裝依賴

# 安裝依賴
pip3 install pymysql

連線資料庫,獲取資料庫連線物件及遊標物件

使用 pymysql 中的 connect() 方法,傳入資料庫的 HOST 地址、埠號、使用者名稱、密碼、待運算元據庫的名稱,即可以獲取 資料庫的連線物件

然後,再通過資料庫連線物件,獲取執行資料庫具體操作的 遊標物件

import pymysql

# 資料庫連線
self.db = pymysql.connect(host='localhost',
                          port=3306,
                          user='root',
                          password='**',
                          database='xh')

# 獲取遊標
self.cursor = self.db.cursor()

接著,我們來實現增刪改查操作

1、新增

新增包含新增單條資料和多條資料

對於單條資料的插入,只需要編寫一條插入的 SQL 語句,然後作為引數執行上面遊標物件的 execute(sql) 方法,最後使用資料庫連線物件的 commit() 方法將資料提交到資料庫中

# 插入一條資料
SQL_INSERT_A_ITEM = "INSERT INTO PEOPLE(name,age) VALUES('xag',23);"

def insert_a_item(self):
    """
    插入一條資料
    :return:
    """
    try:
        self.cursor.execute(SQL_INSERT_A_ITEM)
        self.db.commit()
    except Exception as e:
        print('插入資料失敗')
        print(e)
        self.db.rollback()

使用執行遊標物件的 executemany() 方法,傳入插入的 SQL 語句及 位置變數列表,可以實現一次插入多條資料

# 插入多條資料SQL,name和age是變數,對應列表
SQL_INSERT_MANY_ITEMS = "INSERT INTO PEOPLE (name, age) VALUES(%s, %s)"

# 待插入的資料
self.datas = [("張三", 23), ("李四", 24), ("王五", 25)]

def insert_items(self):
    """
    插入多條記錄
    :return:
    """
    try:
        self.cursor.executemany(SQL_INSERT_MANY_ITEMS, self.datas)
        self.db.commit()
    except Exception as e:
        print("插入資料異常")
        self.db.rollback()

需要注意的是,PyMysql 會將 SQL 語句中的所有欄位當做字串進行處理,所以這裡的 age 欄位在 SQL 中被當做字串處理

2、查詢

查詢分為三步,分別是:

  • 通過遊標物件執行具體的 SQL 語句

  • 通過遊標物件,獲取到元組資料

  • 遍歷元組資料,檢視結果

比如:檢視資料表中所有的記錄

# 查詢所有記錄
SQL_QUERY_ALL = "SELECT * FROM PEOPLE;"

def query(self):
    """查詢資料"""
    # 查詢所有資料
    self.cursor.execute(SQL_QUERY_ALL)

    # 元組資料
    rows = self.cursor.fetchall()

    # 列印結果
    for row in rows:
        id = row[0]
        name = row[1]
        age = row[2]
        print('id:', id, ',name:', name, 'age:', age)

如果需要按條件查詢某一條記錄,只需要修改 SQL 語句即可實現

# 按id查詢
SQL_QUERY_WITH_CONDITION = "SELECT * FROM PEOPLE WHERE id={};"

# 查詢id為5的記錄
self.cursor.execute(SQL_QUERY_WITH_CONDITION.format(5))

3、更新

和 新增操作 類似,更新操作也是通過遊標物件去執行更新的 SQL 語句,最後利用資料庫連線物件將資料真實更新到資料庫中

# 更新(通過id去更新)
SQL_UPDATE = "UPDATE PEOPLE SET name='%s',age=%s WHERE id=%s"

def update(self):
    """
    更新資料
    :return:
    """
    sql_update = SQL_UPDATE % ("王五五", 30, 5)
    print(sql_update)

    try:
        self.cursor.execute(sql_update)
        self.db.commit()
    except Exception as e:
        self.db.rollback()
        print('更新資料異常')
        print(e)

4、刪除

刪除操作同查詢、新增操作類似,只需要變更 SQL 語句即可

# 刪除(通過id去刪除資料)
SQL_DELETE = "DELETE FROM PEOPLE WHERE id=%d"
​
def delete(self):
    """
    刪除記錄
    :return:
    """
    try:
        # 刪除的完整sql
        sql_del = SQL_DELETE % (5)
        self.cursor.execute(sql_del)
        self.db.commit()
    except Exception as e:
        # 發生錯誤時回滾
        self.db.rollback()
        print(e)

最後,我們需要將遊標物件和資料庫連線物件資源釋放掉

def teardown(self):
    # 釋放資源
    self.cursor.close()
    self.db.close()

4. SQLAlchemy

首先,使用 SQLAlchemy 操作 Mysql 資料庫同樣先需要安裝依賴庫

# 安裝依賴包
pip3 install sqlalchemy

通過 SQLAlchemy 的內建方法 declarative_base() 建立一個基礎類 Base

然後,自定義一個 Base 類的子類,內部定義靜態變數,和上面資料表 people 中的欄位一一對應

from sqlalchemy import Column, Integer, String, create_engine
from sqlalchemy.ext.declarative import declarative_base

# 基礎類
Base = declarative_base()


# 自定義的表
class People(Base):
    # 表名
    __tablename__ = 'people'

    # 定義欄位
    id = Column(Integer, primary_key=True)
    name = Column(String(255))
    age = Column(Integer)

    def __repr__(self):
        """
        便於列印結果
        :return:
        """
        return "<People(id:{},name:{},age:{})".format(self.id, self.name, self.age)

接著,通過資料庫名、使用者名稱、密碼及 Host 組裝一個資料庫連線地址,作為引數傳入到 SQLAlchemy 的 create_engine() 方法中,以建立一個資料庫引擎例項物件

# 建立資料庫的引擎例項物件
# 資料庫名稱:xh
engine = create_engine("mysql+pymysql://root:資料庫密碼@localhost:3306/xh",
                               encoding="utf-8",
                               echo=True)

最後,通過資料庫引擎在資料庫中建立表結構,並例項化一個 會話物件

需要注意的是,create_all() 方法中的 checkfirst 引數如果傳入 True,則會判斷資料表是否存在,如果表存在,則不會重新建立

# 建立表結構
# checkfirst:判斷表是否存在,如果存在,就不重複建立
Base.metadata.create_all(engine, checkfirst=True)

# 例項化會話
self.session = sessionmaker(bind=engine)()

這樣所有的準備工作已經完成,接下來可以進行增刪改查操作了

1、新增

新增操作同樣包含插入一條記錄和多條記錄,分別對應會話物件的 add()、add_all() 方法

對於一條記錄的新增操作,只需要例項化一個 People 物件,執行上面的會話物件的 add(instance) 和 commit() 兩個方法,即可以將資料插入到資料表中

def add_item(self):
    """
    新增
    :return:
    """
    # 例項化一個物件
    people = People(name='xag', age=23)
    self.session.add(people)

    # 提交資料才會生效
    self.session.comit()

如果需要一次插入多條資料,只需要呼叫 add_all(列表資料) 即可

def add_items(self):
    """
    新增多條記錄
    :return:
    """
    datas = [
        People(name='張三', age=20),
        People(name='李四', age=21),
        People(name='王五', age=22),
    ]
    self.session.add_all(datas)

    self.session.commit()

2、查詢

查詢資料表的操作對應會話物件的 query(可變引數)

方法中的引數指定要查詢的欄位值,還可以通過 all()、first() 級聯方法限制要查詢的資料

def query(self):
    """
    查詢
    :return:
    """
    # 查詢所有記錄
    # result = self.session.query(People).all()

    # 查詢name/age兩個欄位
    result = self.session.query(People.name, People.age).all()
    print(result)

當然,也可以利用 filter_by(條件),按條件進行過濾

# 條件查詢
resp = self.session.query(People).filter_by(name='xag').first()
print(resp)

3、更新

更新操作一般做法是:

  • query 查詢出待更新的物件

  • 直接更新物件中的資料

  • 使用會話物件提交修改,完成更新操作

​def update1(self, id):
    """
    更新資料1
    :return:
    """
    # 獲取資料
    temp_people = self.session.query(People).filter_by(id=id).first()

    # 更新資料
    temp_people.name = "星安果"
    temp_people.age = 18
    # 提交修改
    self.session.commit()

需要指出的是,這裡可以使用 update() 方法進行簡寫

​def update2(self, id):
    """
    更新資料2
    :param id:
    :return:
    """
    # 使用update()方法直接更新欄位值
    self.session.query(People).filter(People.id == id).update({People.name: "xag", People.age: 1})
    self.session.commit()

4、刪除

刪除操作對應 delete() 方法,同樣是先查詢,後刪除,最後提交會話完成刪除操作

以按照 id 刪除某一條記錄為例:

def del_by_id(self, id):
    """
    通過id刪除一條記錄
    :param id:
    :return:
    """
    del_count = self.session.query(People).filter(People.id == id).delete()
    print('刪除數目:', del_count)
    self.session.commit()

5.最後

本篇文章通過一張表的增刪改查,詳細講解了 Python 操作 Mysql 的兩種使用方式

在實際專案中,如果僅僅是簡單的爬蟲或者自動化,建議使用 PyMysql;否則建議直接上 SQLAlchemy,它更強大方便

我已經將文中全部原始碼上傳到後臺,關注公眾號「 AirPython 」後回覆「 dball 」即可獲得全部原始碼

如果你覺得文章還不錯,請大家 點贊、分享、留言下,因為這將是我持續輸出更多優質文章的最強動力!

推薦閱讀

帶你用 Python 實現自動化群控(入門篇)

Python 如何使用 HttpRunner 做介面自動化測試

Python 自動化,Helium 憑什麼取代 Selenium?

相關文章