學會這7種SQL進階用法,讓你少走99%的彎路!

码农Academy發表於2024-03-08

引言

在日常業務開發中,熟練掌握SQL語言是至關重要的。除了基礎的增刪改查操作外,瞭解和掌握一些進階的SQL用法能夠讓你更高效地處理各種複雜的資料操作。本文將介紹幾種SQL進階用法,讓你少走99%的彎路,提高資料處理效率。

自定義排序

MySQL中,你可以透過使用自定義排序來指定特定欄位的排序順序。通常情況下,MySQL的排序是按照預設的升序(ASC)或降序(DESC)進行的。但是,有時候你可能需要按照特定的順序進行排序,而不僅僅是升序或降序。這時就可以使用自定義排序。

下面我們來透過一個示例來講解自定義排序。

假設你有一個students表,其中包含學生的姓名和成績。現在,你想按照自定義的順序對學生進行排序,而不是按照成績的大小。例如,你想按照"A"、"B"、"C"、"D"、"E"這樣的順序進行排序。

MySql8.0以前我們需要使用ORDER BY結合CASE語句來自定義一個排序規則去實現。例如:

SELECT * 
FROM students 
ORDER BY 
  CASE 
    WHEN grade = 'A' THEN 1 
    WHEN grade = 'B' THEN 2 
    WHEN grade = 'C' THEN 3 
    WHEN grade = 'D' THEN 4 
    WHEN grade = 'E' THEN 5 
    ELSE 6 -- 處理其他情況,例如如果有其他成績值
  END;

執行結果如下:
image.png

而在MySql8.0之後可以直接使用自定義排序規則透過FIELD()函式來實現自定義排序。FIELD()函式接受一個欄位和一個值列表作為引數,並返回該欄位在值列表中的位置。上述示例我們可以改造為:

SELECT * 
FROM students 
ORDER BY  FIELD(grade,'A','B','C','D','E');

image.png

再例如我們在按照自定義的名稱的規則排序:

SELECT *
FROM students 
ORDER BY  FIELD(name, 'Eve','David','Charlie','Bob','Alice');

執行結果:

image.png
需要注意的是,FIELD()函式會返回欄位在值列表中的位置,如果欄位的值不在值列表中,則返回0。所以如果你的欄位可能包含不在值列表中的值,可能需要在排序時進行適當的處理。

這種方法相對簡單,並且在某些情況下非常方便,但也有一些限制。特別是,當值列表很長時,這種方法可能不夠靈活,因為需要在ORDER BY子句中硬編碼所有的值。

空值NULL排序

MySQL中,當涉及到NULL值排序時,通常,NULL值在升序排序(ASC)中被視為小於任何非NULL值,而在降序排序(DESC)中則被視為大於任何非NULL值。

SELECT * FROM students ORDER BY age ASC;

執行結果:

image.png

SELECT * FROM students ORDER BY age DESC;

執行結果:
image.png
如果你希望NULL值出現在排序結果的末尾或開頭,可以使用COALESCEIFNULL函式或者ORDER BY IF(ISNULL(欄位), 0, 1)來替換NULL值,從而顯式控制其排序位置:

  1. 升序時將NULL值放在最後面:
SELECT * FROM students ORDER BY COALESCE(age, 999999) ASC;

或者

SELECT * FROM students ORDER BY IFNULL(age, 999999) ASC;

或者

SELECT * FROM students ORDER BY IF(ISNULL(age), 1, 0), age ASC;

執行結果如下:

image.png

  1. 降序時把NULL值放在最前面:
SELECT * FROM students ORDER BY COALESCE(age, 999999) DESC;

或者

SELECT * FROM students ORDER BY IFNULL(age, 999999) DESC;

或者

SELECT * FROM students ORDER BY IF(ISNULL(age), 0, 1), age DESC;

執行結果如下:
image.png

假如對需要排序的列的最大最小的邊界值可以確定,即邏輯上不會出現這麼大的值的時候上述三種方式都可以實現,否則建議使用ORDER BY IF(ISNULL(age), 0, 1)的方式,當然也建議不管那種情況都要使用這種方式。

CASE表示式

CASE表示式是一種條件表示式,類似於其他程式語言中的switch語句。它允許根據條件的不同返回不同的值。

CASE表示式的基本語法如下:

CASE
    WHEN condition1 THEN result1
    WHEN condition2 THEN result2
    ...
    ELSE resultN
END
  • condition1condition2等是條件,可以是任何邏輯表示式。
  • result1result2等是對應條件為真時要返回的結果。
  • ELSE子句是可選的,用於處理所有條件都不滿足的情況,如果省略了ELSE子句且所有條件都不滿足,則返回NULL。
SELECT 
    name,
    score,
    CASE
        WHEN score >= 90 THEN 'A'
        WHEN score >= 80 THEN 'B'
        WHEN score >= 70 THEN 'C'
        ELSE 'D'
    END AS grade_level
FROM
    students;

執行結果如下:
image.png
CASE表示式在SQL查詢中用途廣泛,可用於SELECTUPDATESET等語句中,實現動態計算列值、根據條件更新值等功能。

分組連線函式:GROUP_CONCAT

GROUP_CONCAT函式用於將每個組內的行連線成一個字串,並返回該字串。通常在對結果集進行分組後,需要將每個分組內的多個值合併成一個字串時使用。該函式在MySQL中非常有用,特別是在處理與分組相關的資料時。

GROUP_CONCAT函式的語法:

GROUP_CONCAT([DISTINCT] expr [,expr ...]
             [ORDER BY {unsigned_integer | col_name | expr}
                 [ASC | DESC] [,col_name ...]]
             [SEPARATOR str_val])

  • DISTINCT:可選項,用於去除重複的值。
  • expr:要連線的表示式。
  • ORDER BY:可選項,用於指定連線後的字串的排序方式。
  • SEPARATOR:可選項,用於指定連線後的字串的分隔符,預設為逗號,
SELECT
	class,
	GROUP_CONCAT( NAME ) AS students_list 
FROM
	students 
GROUP BY
	class;

查詢結果:
image.png

使用GROUP_CONCAT函式時,還可以透過ORDER BY子句可以指定連線後的字串的排序方式。

SELECT
	class,
	GROUP_CONCAT( NAME ORDER BY age DESC SEPARATOR ';') AS students_list 
FROM
	students 
GROUP BY
	class;

執行結果:
image.png

預設情況下GROUP_CONCAT函式的最大連線長度是1024個字元。如果你的連線超過了這個限制,可以使用SET SESSION group_concat_max_len = val;語句來調整最大連線長度。

分組統計資料後在進行統計彙總:WITH ROLLUP

WITH ROLLUP是MySQL中用於執行聚合查詢並生成總計行(rollup summary)的選項之一。它允許在GROUP BY子句中建立一個額外的行,該行包含了對分組資料的彙總資訊。這在需要同時檢視詳細資料和總計資料時非常有用。

使用WITH ROLLUP時,查詢結果會包含每個分組的詳細資料,以及一個總計行,該總計行彙總了所有分組的資料。

SELECT
	class,
	AVG( age ) 
FROM
	students 
WHERE
	age IS NOT NULL 
GROUP BY
	class WITH ROLLUP;

查詢結果:
image.png
結果中包含了每個年級的平均年齡,並且返回所有的班級的學生平均年齡。

需要注意的是,總計行中分組鍵列的值為NULL,表示彙總了所有分組的資料。這使得我們可以透過檢查分組鍵列是否為NULL來確定行是否為總計行。

子查詢提取:WITH AS

在MySQL中,WITH AS子句(也稱為子查詢提取函式)允許你在一個查詢中建立一個臨時的命名子查詢(也稱為公共表表示式),然後在該查詢的後續部分引用這個子查詢。這有助於提高查詢的可讀性和簡潔性,尤其是當查詢中需要多次引用相同的子查詢時。

WITH AS子句的基本語法:

WITH cte_name AS (
    SELECT columns
    FROM table
    WHERE conditions
)
SELECT columns
FROM cte_name
WHERE conditions;

假如我們查詢分數大於80的,並且評級為A的並且不是2班的學生資訊:

WITH s1 AS ( SELECT * FROM students WHERE score > 80 ),
s2 AS ( SELECT * FROM students WHERE class = 2 ) 
SELECT
	* 
FROM
	s1 
WHERE
	s1.id NOT IN ( SELECT s2.id FROM s2 ) 
	AND s1.grade = 'A';

結果如下:

image.png

WITH AS是從MySql 8.0.1開始提供

優雅處理資料插入、更新時主鍵或者唯一鍵衝突

在日常開發中,我們嚐嚐在插入資料時會遇到唯一鍵衝突導致插入失敗的問題。如下:

假如我們的唯一鍵為:

ALTER TABLE students ADD UNIQUE KEY `uk_class_name` (`name`,`class`) USING BTREE;

我們執行以下sql:

SELECT * FROM students WHERE class = 1 and name = 'Alice';

查詢結果:

image.png

此時我們在插入一條資料:

INSERT INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);

發現報錯:

image.png

我們通常的做法時先按照唯一鍵查詢一遍資料,如果存在則先刪除資料,在進行插入。這種做法略顯麻煩,並且可能會誤刪資料。此時我們就可以採取以下三種方法區優雅處理。

IGNORE

IGNORE關鍵字用於在執行插入、更新或刪除操作時,忽略特定型別的錯誤,而不是中止整個操作。特別是在插入或更新資料時,如果存在唯一索引衝突或主鍵衝突,使用IGNORE關鍵字可以使得操作繼續進行而不是因為錯誤而中斷。

語法如下:

INSERT IGNORE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

UPDATE IGNORE table_name
SET column1 = value1, column2 = value2, ...
WHERE condition;

上述插入語句的示例中,我們使用IGNORE關鍵字:

INSERT IGNORE INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);

執行成功。
image.png

查詢資料發現,資料沒有變化:
image.png

如果UPDATE使用了IGNORE關鍵字,在更新資料時忽略那些會導致錯誤的行,比如更新更新後會違反唯一約束。

UPDATE IGNORE students SET name = 'Alice' WHERE id = 3;

此時會執行成功:
image.png

IGNORE在使用時應該謹慎,它可能會掩蓋潛在的業務邏輯錯誤或資料一致性問題。並且在事務安全性和完整性要求較高的場景下可能並不適用。

REPLACE

REPLACE INTO是MySQL中用於向表中插入或替換資料的一種特殊語法。它類似於INSERT INTO語句,但是在插入資料時,如果發現表中已存在具有相同唯一索引或主鍵的記錄,則會刪除現有記錄,然後插入新記錄,而不是丟擲錯誤或導致插入操作失敗。即有則刪除在插入,沒有則插入。

語法如下:

REPLACE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

你也可以使用REPLACE INTOSELECT語句結合使用來替換表中的資料:

REPLACE INTO table_name (column1, column2, ...)
SELECT column1, column2, ...
FROM another_table
WHERE condition;

我們執行如下sql:

REPLACE INTO students (name, grade, age, score, class) VALUES ('Alice', 'A', 18, 98, 1);

執行成功,查詢這條記錄:
image.png
此時我們發現記錄的id重新生成了,並且資料頁是插入的最新的資料。

REPLACE INTO會首先嚐試刪除表中具有相同唯一索引或主鍵的記錄,然後再插入新記錄。因此,在使用REPLACE INTO時應當謹慎,以確保不會意外刪除需要保留的資料。

ON DUPLICATE KEY UPDATE

在MySQL中,ON DUPLICATE KEY UPDATE是用於在執行INSERT語句時,如果發生唯一鍵衝突(即違反了唯一索引或主鍵約束),則執行後面的更新操作。

當你想要向表中插入一行資料,但是如果這一行資料已經存在(即主鍵或唯一索引已經存在),則更新該行資料而不是插入新的行,即有則更新,沒有則插入。

語法如下:

INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...)
ON DUPLICATE KEY UPDATE column1 = value1, column2 = value2, ...;

我們執行以下sql:

INSERT IGNORE INTO students ( NAME, grade, age, score, class )
VALUES
	( 'Alice', 'A', 18, 98, 1 ) 
	ON DUPLICATE KEY UPDATE score = 100,
	grade = 'B';

執行成功,重新看一下這條資料:
image.png

資料已執行了更新操作。

這種方式適用於需要維護唯一記錄(如使用者名稱、郵箱等)的情況下,無需預先檢查是否存在重複,就能保證資料的一致性和完整性。同時,它也減少了對資料庫的請求次數,提高了處理效率。

總結

掌握以上這幾種SQL進階用法,能夠讓你在日常的資料處理工作中更加得心應手,少走很多彎路。透過最佳化查詢邏輯、處理異常情況以及執行插入或更新操作,你可以更高效地管理和運算元據庫,提升工作效率,從而更好地應對各種複雜的資料處理需求。

本文已收錄於我的個人部落格:碼農Academy的部落格,專注分享Java技術乾貨,包括Java基礎、Spring Boot、Spring Cloud、Mysql、Redis、Elasticsearch、中介軟體、架構設計、面試題、程式設計師攻略等

相關文章