引言
在日常業務開發中,熟練掌握SQL
語言是至關重要的。除了基礎的增刪改查操作外,瞭解和掌握一些進階的SQL用法能夠讓你更高效地處理各種複雜的資料操作。本文將介紹幾種SQL進階用法,讓你少走99%的彎路,提高資料處理效率。
自定義排序
在MySQ
L中,你可以透過使用自定義排序來指定特定欄位的排序順序。通常情況下,MySQL
的排序是按照預設的升序(ASC
)或降序(DESC
)進行的。但是,有時候你可能需要按照特定的順序進行排序,而不僅僅是升序或降序。這時就可以使用自定義排序。
下面我們來透過一個示例來講解自定義排序。
假設你有一個students
表,其中包含學生的姓名和成績。現在,你想按照自定義的順序對學生進行排序,而不是按照成績的大小。例如,你想按照"A"、"B"、"C"、"D"、"E"這樣的順序進行排序。
在MySql8.0
以前我們需要使用ORDER BY
結合CASE
語句來自定義一個排序規則去實現。例如:
SELECT *
FROM students
ORDER BY
CASE
WHEN grade = 'A' THEN 1
WHEN grade = 'B' THEN 2
WHEN grade = 'C' THEN 3
WHEN grade = 'D' THEN 4
WHEN grade = 'E' THEN 5
ELSE 6 -- 處理其他情況,例如如果有其他成績值
END;
執行結果如下:
而在MySql8.0
之後可以直接使用自定義排序規則透過FIELD()
函式來實現自定義排序。FIELD()
函式接受一個欄位和一個值列表作為引數,並返回該欄位在值列表中的位置。上述示例我們可以改造為:
SELECT *
FROM students
ORDER BY FIELD(grade,'A','B','C','D','E');
再例如我們在按照自定義的名稱的規則排序:
SELECT *
FROM students
ORDER BY FIELD(name, 'Eve','David','Charlie','Bob','Alice');
執行結果:
需要注意的是,FIELD()
函式會返回欄位在值列表中的位置,如果欄位的值不在值列表中,則返回0。所以如果你的欄位可能包含不在值列表中的值,可能需要在排序時進行適當的處理。
這種方法相對簡單,並且在某些情況下非常方便,但也有一些限制。特別是,當值列表很長時,這種方法可能不夠靈活,因為需要在ORDER BY
子句中硬編碼所有的值。
空值NULL排序
在MySQ
L中,當涉及到NULL
值排序時,通常,NULL
值在升序排序(ASC
)中被視為小於任何非NULL
值,而在降序排序(DESC
)中則被視為大於任何非NULL
值。
SELECT * FROM students ORDER BY age ASC;
執行結果:
SELECT * FROM students ORDER BY age DESC;
執行結果:
如果你希望NULL值出現在排序結果的末尾或開頭,可以使用COALESCE
或IFNULL
函式或者ORDER BY IF(ISNULL(欄位), 0, 1)
來替換NULL值,從而顯式控制其排序位置:
- 升序時將NULL值放在最後面:
SELECT * FROM students ORDER BY COALESCE(age, 999999) ASC;
或者
SELECT * FROM students ORDER BY IFNULL(age, 999999) ASC;
或者
SELECT * FROM students ORDER BY IF(ISNULL(age), 1, 0), age ASC;
執行結果如下:
- 降序時把NULL值放在最前面:
SELECT * FROM students ORDER BY COALESCE(age, 999999) DESC;
或者
SELECT * FROM students ORDER BY IFNULL(age, 999999) DESC;
或者
SELECT * FROM students ORDER BY IF(ISNULL(age), 0, 1), age DESC;
執行結果如下:
假如對需要排序的列的最大最小的邊界值可以確定,即邏輯上不會出現這麼大的值的時候上述三種方式都可以實現,否則建議使用ORDER BY IF(ISNULL(age), 0, 1)
的方式,當然也建議不管那種情況都要使用這種方式。
CASE表示式
CASE
表示式是一種條件表示式,類似於其他程式語言中的switch
語句。它允許根據條件的不同返回不同的值。
CASE
表示式的基本語法如下:
CASE
WHEN condition1 THEN result1
WHEN condition2 THEN result2
...
ELSE resultN
END
condition1
、condition2
等是條件,可以是任何邏輯表示式。result1
、result2
等是對應條件為真時要返回的結果。ELSE
子句是可選的,用於處理所有條件都不滿足的情況,如果省略了ELSE
子句且所有條件都不滿足,則返回NULL。
SELECT
name,
score,
CASE
WHEN score >= 90 THEN 'A'
WHEN score >= 80 THEN 'B'
WHEN score >= 70 THEN 'C'
ELSE 'D'
END AS grade_level
FROM
students;
執行結果如下:
CASE
表示式在SQL
查詢中用途廣泛,可用於SELECT
、UPDATE
的SET
等語句中,實現動態計算列值、根據條件更新值等功能。
分組連線函式:GROUP_CONCAT
GROUP_CONCAT
函式用於將每個組內的行連線成一個字串,並返回該字串。通常在對結果集進行分組後,需要將每個分組內的多個值合併成一個字串時使用。該函式在MySQL中非常有用,特別是在處理與分組相關的資料時。
GROUP_CONCAT
函式的語法:
GROUP_CONCAT([DISTINCT] expr [,expr ...]
[ORDER BY {unsigned_integer | col_name | expr}
[ASC | DESC] [,col_name ...]]
[SEPARATOR str_val])
DISTINCT
:可選項,用於去除重複的值。expr
:要連線的表示式。ORDER BY
:可選項,用於指定連線後的字串的排序方式。SEPARATOR
:可選項,用於指定連線後的字串的分隔符,預設為逗號,
。
SELECT
class,
GROUP_CONCAT( NAME ) AS students_list
FROM
students
GROUP BY
class;
查詢結果:
使用GROUP_CONCAT
函式時,還可以透過ORDER BY
子句可以指定連線後的字串的排序方式。
SELECT
class,
GROUP_CONCAT( NAME ORDER BY age DESC SEPARATOR ';') AS students_list
FROM
students
GROUP BY
class;
執行結果:
預設情況下
GROUP_CONCAT
函式的最大連線長度是1024個字元。如果你的連線超過了這個限制,可以使用SET SESSION group_concat_max_len = val;
語句來調整最大連線長度。
分組統計資料後在進行統計彙總:WITH ROLLUP
WITH ROLLUP
是MySQL中用於執行聚合查詢並生成總計行(rollup summary)的選項之一。它允許在GROUP BY
子句中建立一個額外的行,該行包含了對分組資料的彙總資訊。這在需要同時檢視詳細資料和總計資料時非常有用。
使用WITH ROLLUP
時,查詢結果會包含每個分組的詳細資料,以及一個總計行,該總計行彙總了所有分組的資料。
SELECT
class,
AVG( age )
FROM
students
WHERE
age IS NOT NULL
GROUP BY
class WITH ROLLUP;
查詢結果:
結果中包含了每個年級的平均年齡,並且返回所有的班級的學生平均年齡。
需要注意的是,總計行中分組鍵列的值為NULL
,表示彙總了所有分組的資料。這使得我們可以透過檢查分組鍵列是否為NULL
來確定行是否為總計行。
子查詢提取:WITH AS
在MySQL中,WITH AS
子句(也稱為子查詢提取函式)允許你在一個查詢中建立一個臨時的命名子查詢(也稱為公共表表示式),然後在該查詢的後續部分引用這個子查詢。這有助於提高查詢的可讀性和簡潔性,尤其是當查詢中需要多次引用相同的子查詢時。
WITH AS
子句的基本語法:
WITH cte_name AS (
SELECT columns
FROM table
WHERE conditions
)
SELECT columns
FROM cte_name
WHERE conditions;
假如我們查詢分數大於80的,並且評級為A的並且不是2班的學生資訊:
WITH s1 AS ( SELECT * FROM students WHERE score > 80 ),
s2 AS ( SELECT * FROM students WHERE class = 2 )
SELECT
*
FROM
s1
WHERE
s1.id NOT IN ( SELECT s2.id FROM s2 )
AND s1.grade = 'A';
結果如下:
WITH AS是從MySql 8.0.1開始提供
優雅處理資料插入、更新時主鍵或者唯一鍵衝突
在日常開發中,我們嚐嚐在插入資料時會遇到唯一鍵衝突導致插入失敗的問題。如下:
假如我們的唯一鍵為:
ALTER TABLE students ADD UNIQUE KEY `uk_class_name` (`name`,`class`) USING BTREE;
我們執行以下sql:
SELECT * FROM students WHERE class = 1 and name = 'Alice';
查詢結果:
此時我們在插入一條資料:
INSERT INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);
發現報錯:
我們通常的做法時先按照唯一鍵查詢一遍資料,如果存在則先刪除資料,在進行插入。這種做法略顯麻煩,並且可能會誤刪資料。此時我們就可以採取以下三種方法區優雅處理。
IGNORE
IGNORE
關鍵字用於在執行插入、更新或刪除操作時,忽略特定型別的錯誤,而不是中止整個操作。特別是在插入或更新資料時,如果存在唯一索引衝突或主鍵衝突,使用IGNORE
關鍵字可以使得操作繼續進行而不是因為錯誤而中斷。
語法如下:
INSERT IGNORE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);
UPDATE IGNORE table_name
SET column1 = value1, column2 = value2, ...
WHERE condition;
上述插入語句的示例中,我們使用IGNORE
關鍵字:
INSERT IGNORE INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);
執行成功。
查詢資料發現,資料沒有變化:
如果UPDATE
使用了IGNORE
關鍵字,在更新資料時忽略那些會導致錯誤的行,比如更新更新後會違反唯一約束。
UPDATE IGNORE students SET name = 'Alice' WHERE id = 3;
此時會執行成功:
IGNORE在使用時應該謹慎,它可能會掩蓋潛在的業務邏輯錯誤或資料一致性問題。並且在事務安全性和完整性要求較高的場景下可能並不適用。
REPLACE
REPLACE INTO
是MySQL中用於向表中插入或替換資料的一種特殊語法。它類似於INSERT INTO
語句,但是在插入資料時,如果發現表中已存在具有相同唯一索引或主鍵的記錄,則會刪除現有記錄,然後插入新記錄,而不是丟擲錯誤或導致插入操作失敗。即有則刪除在插入,沒有則插入。
語法如下:
REPLACE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);
你也可以使用REPLACE INTO
與SELECT
語句結合使用來替換表中的資料:
REPLACE INTO table_name (column1, column2, ...)
SELECT column1, column2, ...
FROM another_table
WHERE condition;
我們執行如下sql:
REPLACE INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);
執行成功,查詢這條記錄:
此時我們發現記錄的id重新生成了,並且資料頁是插入的最新的資料。
REPLACE INTO
會首先嚐試刪除表中具有相同唯一索引或主鍵的記錄,然後再插入新記錄。因此,在使用REPLACE INTO
時應當謹慎,以確保不會意外刪除需要保留的資料。
ON DUPLICATE KEY UPDATE
在MySQL中,ON DUPLICATE KEY UPDATE
是用於在執行INSERT
語句時,如果發生唯一鍵衝突(即違反了唯一索引或主鍵約束),則執行後面的更新操作。
當你想要向表中插入一行資料,但是如果這一行資料已經存在(即主鍵或唯一索引已經存在),則更新該行資料而不是插入新的行,即有則更新,沒有則插入。
語法如下:
INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...)
ON DUPLICATE KEY UPDATE column1 = value1, column2 = value2, ...;
我們執行以下sql:
INSERT IGNORE INTO students ( NAME, grade, age, score, class )
VALUES
( 'Alice', 'A', 18, 98, 1 )
ON DUPLICATE KEY UPDATE score = 100,
grade = 'B';
執行成功,重新看一下這條資料:
資料已執行了更新操作。
這種方式適用於需要維護唯一記錄(如使用者名稱、郵箱等)的情況下,無需預先檢查是否存在重複,就能保證資料的一致性和完整性。同時,它也減少了對資料庫的請求次數,提高了處理效率。
總結
掌握以上這幾種SQL進階用法,能夠讓你在日常的資料處理工作中更加得心應手,少走很多彎路。透過最佳化查詢邏輯、處理異常情況以及執行插入或更新操作,你可以更高效地管理和運算元據庫,提升工作效率,從而更好地應對各種複雜的資料處理需求。
本文已收錄於我的個人部落格:碼農Academy的部落格,專注分享Java技術乾貨,包括Java基礎、Spring Boot、Spring Cloud、Mysql、Redis、Elasticsearch、中介軟體、架構設計、面試題、程式設計師攻略等