資料庫-SQL 語法
二十餘年如一夢,此身雖在堪驚。
簡介:資料庫-SQL 語法
一、基礎
模式定義了資料如何儲存、儲存什麼樣的資料以及資料如何分解等資訊,資料庫和表都有模式。
主鍵的值不允許修改,也不允許複用(不能將已經刪除的主鍵值賦給新資料行的主鍵)。
SQL(Structured Query Language),標準 SQL 由 ANSI 標準委員會管理,從而稱為 ANSI SQL。各個 DBMS 都有自己的實現,如 PL/SQL、Transact-SQL 等。
SQL 語句不區分大小寫,但是資料庫表名、列名和值是否區分依賴於具體的 DBMS 以及配置。
SQL 支援以下三種註釋:
1 ## 註釋
2 SELECT *
3 FROM mytable; -- 註釋
4 /* 註釋1
5 註釋2 */
資料庫建立與使用:
1 CREATE DATABASE test;
2 USE test;
二、建立表
1 CREATE TABLE mytable (
2 # int 型別,不為空,自增
3 id INT NOT NULL AUTO_INCREMENT,
4 # int 型別,不可為空,預設值為 1,不為空
5 col1 INT NOT NULL DEFAULT 1,
6 # 變長字串型別,最長為 45 個字元,可以為空
7 col2 VARCHAR(45) NULL,
8 # 日期型別,可為空
9 col3 DATE NULL,
10 # 設定主鍵為 id
11 PRIMARY KEY (`id`));
三、修改表
新增列
1 ALTER TABLE mytable
2 ADD col CHAR(20);
刪除列
1 ALTER TABLE mytable
2 DROP COLUMN col;
刪除表
DROP TABLE mytable;
四、插入
普通插入
1 INSERT INTO mytable(col1, col2)
2 VALUES(val1, val2);
插入檢索出來的資料
1 INSERT INTO mytable1(col1, col2)
2 SELECT col1, col2
3 FROM mytable2;
將一個表的內容插入到一個新表
1 CREATE TABLE newtable AS
2 SELECT * FROM mytable;
五、更新
1 UPDATE mytable
2 SET col = val
3 WHERE id = 1;
六、刪除
1 DELETE FROM mytable
2 WHERE id = 1;
TRUNCATE TABLE 可以清空表,也就是刪除所有行。
TRUNCATE TABLE mytable;
使用更新和刪除操作時一定要用 WHERE 子句,不然會把整張表的資料都破壞。可以先用 SELECT 語句進行測試,防止錯誤刪除。
七、查詢
DISTINCT
相同值只會出現一次。它作用於所有列,也就是說所有列的值都相同才算相同。
1 SELECT DISTINCT col1, col2
2 FROM mytable;
LIMIT
限制返回的行數。可以有兩個引數,第一個引數為起始行,從 0 開始;第二個引數為返回的總行數。
返回前 5 行:
1 SELECT *
2 FROM mytable
3 LIMIT 5;
1 SELECT *
2 FROM mytable
3 LIMIT 0, 5;
返回第 3 ~ 4 行:
1 SELECT *
2 FROM mytable
3 LIMIT 2, 3;
八、排序
- ASC :升序(預設)
- DESC :降序
可以按多個列進行排序,並且為每個列指定不同的排序方式:
1 SELECT *
2 FROM mytable
3 ORDER BY col1 DESC, col2 ASC;
九、過濾
不進行過濾的資料非常大,導致通過網路傳輸了多餘的資料,從而浪費了網路頻寬。因此儘量使用 SQL 語句來過濾不必要的資料,而不是傳輸所有的資料到客戶端中然後由客戶端進行過濾。
1 SELECT *
2 FROM mytable
3 WHERE col IS NULL;
下表顯示了 WHERE 子句可用的操作符
操作符 | 說明 |
---|---|
= | 等於 |
< | 小於 |
> | 大於 |
<> != | 不等於 |
<= !> | 小於等於 |
>= !< | 大於等於 |
BETWEEN | 在兩個值之間 |
IS NULL | 為 NULL 值 |
應該注意到,NULL 與 0、空字串都不同。
AND 和 OR 用於連線多個過濾條件。優先處理 AND,當一個過濾表示式涉及到多個 AND 和 OR 時,可以使用 () 來決定優先順序,使得優先順序關係更清晰。
IN 操作符用於匹配一組值,其後也可以接一個 SELECT 子句,從而匹配子查詢得到的一組值。
NOT 操作符用於否定一個條件。
十、萬用字元
萬用字元也是用在過濾語句中,但它只能用於文字欄位。
-
% 匹配 >=0 個任意字元;
-
_ 匹配 ==1 個任意字元;
-
[ ] 可以匹配集合內的字元,例如 [ab] 將匹配字元 a 或者 b。用脫字元 ^ 可以對其進行否定,也就是不匹配集合內的字元。
使用 Like 來進行萬用字元匹配。
1 SELECT *
2 FROM mytable
3 WHERE col LIKE '[^AB]%'; -- 不以 A 和 B 開頭的任意文字
不要濫用萬用字元,萬用字元位於開頭處匹配會非常慢。
十一、計算欄位
在資料庫伺服器上完成資料的轉換和格式化的工作往往比客戶端上快得多,並且轉換和格式化後的資料量更少的話可以減少網路通訊量。
計算欄位通常需要使用 AS 來取別名,否則輸出的時候欄位名為計算表示式。
1 SELECT col1 * col2 AS alias
2 FROM mytable;
CONCAT() 用於連線兩個欄位。許多資料庫會使用空格把一個值填充為列寬,因此連線的結果會出現一些不必要的空格,使用 TRIM() 可以去除首尾空格。
1 SELECT CONCAT(TRIM(col1), '(', TRIM(col2), ')') AS concat_col
2 FROM mytable;
十二、函式
各個 DBMS 的函式都是不相同的,因此不可移植,以下主要是 MySQL 的函式。
彙總
函 數 | 說 明 |
---|---|
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行數 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
AVG() 會忽略 NULL 行。
使用 DISTINCT 可以彙總不同的值。
1 SELECT AVG(DISTINCT col1) AS avg_col
2 FROM mytable;
文字處理
函式 | 說明 |
---|---|
LEFT() | 左邊的字元 |
RIGHT() | 右邊的字元 |
LOWER() | 轉換為小寫字元 |
UPPER() | 轉換為大寫字元 |
LTRIM() | 去除左邊的空格 |
RTRIM() | 去除右邊的空格 |
LENGTH() | 長度 |
SOUNDEX() | 轉換為語音值 |
其中, SOUNDEX() 可以將一個字串轉換為描述其語音表示的字母數字模式。
1 SELECT *
2 FROM mytable
3 WHERE SOUNDEX(col1) = SOUNDEX('apple')
日期和時間處理
- 日期格式:YYYY-MM-DD
- 時間格式:HH:<zero-width space>MM:SS
函 數 | 說 明 |
---|---|
ADDDATE() | 增加一個日期(天、周等) |
ADDTIME() | 增加一個時間(時、分等) |
CURDATE() | 返回當前日期 |
CURTIME() | 返回當前時間 |
DATE() | 返回日期時間的日期部分 |
DATEDIFF() | 計算兩個日期之差 |
DATE_ADD() | 高度靈活的日期運算函式 |
DATE_FORMAT() | 返回一個格式化的日期或時間串 |
DAY() | 返回一個日期的天數部分 |
DAYOFWEEK() | 對於一個日期,返回對應的星期幾 |
HOUR() | 返回一個時間的小時部分 |
MINUTE() | 返回一個時間的分鐘部分 |
MONTH() | 返回一個日期的月份部分 |
NOW() | 返回當前日期和時間 |
SECOND() | 返回一個時間的秒部分 |
TIME() | 返回一個日期時間的時間部分 |
YEAR() | 返回一個日期的年份部分 |
mysql> SELECT NOW();
2021-7-26 21:15:41
數值處理
函式 | 說明 |
---|---|
SIN() | 正弦 |
COS() | 餘弦 |
TAN() | 正切 |
ABS() | 絕對值 |
SQRT() | 平方根 |
MOD() | 餘數 |
EXP() | 指數 |
PI() | 圓周率 |
RAND() | 隨機數 |
十三、分組
把具有相同的資料值的行放在同一組中。
可以對同一分組資料使用匯總函式進行處理,例如求分組資料的平均值等。
指定的分組欄位除了能按該欄位進行分組,也會自動按該欄位進行排序。
1 SELECT col, COUNT(*) AS num
2 FROM mytable
3 GROUP BY col;
GROUP BY 自動按分組欄位進行排序,ORDER BY 也可以按彙總欄位來進行排序。
1 SELECT col, COUNT(*) AS num
2 FROM mytable
3 GROUP BY col
4 ORDER BY num;
WHERE 過濾行,HAVING 過濾分組,行過濾應當先於分組過濾。
1 SELECT col, COUNT(*) AS num
2 FROM mytable
3 WHERE col > 2
4 GROUP BY col
5 HAVING num >= 2;
分組規定:
- GROUP BY 子句出現在 WHERE 子句之後,ORDER BY 子句之前;
- 除了彙總欄位外,SELECT 語句中的每一欄位都必須在 GROUP BY 子句中給出;
- NULL 的行會單獨分為一組;
- 大多數 SQL 實現不支援 GROUP BY 列具有可變長度的資料型別。
十四、子查詢
子查詢中只能返回一個欄位的資料。
可以將子查詢的結果作為 WHRER 語句的過濾條件:
1 SELECT *
2 FROM mytable1
3 WHERE col1 IN (SELECT col2
4 FROM mytable2);
下面的語句可以檢索出客戶的訂單數量,子查詢語句會對第一個查詢檢索出的每個客戶執行一次:
1 SELECT cust_name, (SELECT COUNT(*)
2 FROM Orders
3 WHERE Orders.cust_id = Customers.cust_id)
4 AS orders_num
5 FROM Customers
6 ORDER BY cust_name;
十五、連線
連線用於連線多個表,使用 JOIN 關鍵字,並且條件語句使用 ON 而不是 WHERE。
連線可以替換子查詢,並且比子查詢的效率一般會更快。
可以用 AS 給列名、計算欄位和表名取別名,給表名取別名是為了簡化 SQL 語句以及連線相同表。
內連線
內連線又稱等值連線,使用 INNER JOIN 關鍵字。
1 SELECT A.value, B.value
2 FROM tablea AS A INNER JOIN tableb AS B
3 ON A.key = B.key;
可以不明確使用 INNER JOIN,而使用普通查詢並在 WHERE 中將兩個表中要連線的列用等值方法連線起來。
1 SELECT A.value, B.value
2 FROM tablea AS A, tableb AS B
3 WHERE A.key = B.key;
自連線
自連線可以看成內連線的一種,只是連線的表是自身而已。
一張員工表,包含員工姓名和員工所屬部門,要找出與 Jim 處在同一部門的所有員工姓名。
子查詢版本
1 SELECT name
2 FROM employee
3 WHERE department = (
4 SELECT department
5 FROM employee
6 WHERE name = "Jim");
自連線版本
1 SELECT e1.name
2 FROM employee AS e1 INNER JOIN employee AS e2
3 ON e1.department = e2.department
4 AND e2.name = "Jim";
自然連線
自然連線是把同名列通過等值測試連線起來的,同名列可以有多個。
內連線和自然連線的區別:內連線提供連線的列,而自然連線自動連線所有同名列。
1 SELECT A.value, B.value
2 FROM tablea AS A NATURAL JOIN tableb AS B;
外連線
外連線保留了沒有關聯的那些行。分為左外連線,右外連線以及全外連線,左外連線就是保留左表沒有關聯的行。
檢索所有顧客的訂單資訊,包括還沒有訂單資訊的顧客。
1 SELECT Customers.cust_id, Customer.cust_name, Orders.order_id
2 FROM Customers LEFT OUTER JOIN Orders
3 ON Customers.cust_id = Orders.cust_id;
customers 表:
cust_id | cust_name |
---|---|
1 | a |
2 | b |
3 | c |
orders 表:
order_id | cust_id |
---|---|
1 | 1 |
2 | 1 |
3 | 3 |
4 | 3 |
結果:
cust_id | cust_name | order_id |
---|---|---|
1 | a | 1 |
1 | a | 2 |
3 | c | 3 |
3 | c | 4 |
2 | b | Null |
十六、組合查詢
使用 UNION 來組合兩個查詢,如果第一個查詢返回 M 行,第二個查詢返回 N 行,那麼組合查詢的結果一般為 M+N 行。
每個查詢必須包含相同的列、表示式和聚集函式。
預設會去除相同行,如果需要保留相同行,使用 UNION ALL。
只能包含一個 ORDER BY 子句,並且必須位於語句的最後。
1 SELECT col
2 FROM mytable
3 WHERE col = 1
4 UNION
5 SELECT col
6 FROM mytable
7 WHERE col =2;
十七、檢視
檢視是虛擬的表,本身不包含資料,也就不能對其進行索引操作。
對檢視的操作和對普通表的操作一樣。
檢視具有如下好處:
- 簡化複雜的 SQL 操作,比如複雜的連線;
- 只使用實際表的一部分資料;
- 通過只給使用者訪問檢視的許可權,保證資料的安全性;
- 更改資料格式和表示。
1 CREATE VIEW myview AS
2 SELECT Concat(col1, col2) AS concat_col, col3*col4 AS compute_col
3 FROM mytable
4 WHERE col5 = val;
十八、儲存過程
儲存過程可以看成是對一系列 SQL 操作的批處理。
使用儲存過程的好處:
- 程式碼封裝,保證了一定的安全性;
- 程式碼複用;
- 由於是預先編譯,因此具有很高的效能。
命令列中建立儲存過程需要自定義分隔符,因為命令列是以 ; 為結束符,而儲存過程中也包含了分號,因此會錯誤把這部分分號當成是結束符,造成語法錯誤。
包含 in、out 和 inout 三種引數。
給變數賦值都需要用 select into 語句。
每次只能給一個變數賦值,不支援集合的操作。
1 delimiter //
2
3 create procedure myprocedure( out ret int )
4 begin
5 declare y int;
6 select sum(col1)
7 from mytable
8 into y;
9 select y*y into ret;
10 end //
11
12 delimiter ;
1 call myprocedure(@ret);
2 select @ret;
十九、遊標
在儲存過程中使用遊標可以對一個結果集進行移動遍歷。
遊標主要用於互動式應用,其中使用者需要對資料集中的任意行進行瀏覽和修改。
使用遊標的四個步驟:
- 宣告遊標,這個過程沒有實際檢索出資料;
- 開啟遊標;
- 取出資料;
- 關閉遊標;
1 delimiter //
2 create procedure myprocedure(out ret int)
3 begin
4 declare done boolean default 0;
5
6 declare mycursor cursor for
7 select col1 from mytable;
8 # 定義了一個 continue handler,當 sqlstate '02000' 這個條件出現時,會執行 set done = 1
9 declare continue handler for sqlstate '02000' set done = 1;
10
11 open mycursor;
12
13 repeat
14 fetch mycursor into ret;
15 select ret;
16 until done end repeat;
17
18 close mycursor;
19 end //
20 delimiter ;
二十、觸發器
觸發器會在某個表執行以下語句時而自動執行:DELETE、INSERT、UPDATE。
觸發器必須指定在語句執行之前還是之後自動執行,之前執行使用 BEFORE 關鍵字,之後執行使用 AFTER 關鍵字。BEFORE 用於資料驗證和淨化,AFTER 用於審計跟蹤,將修改記錄到另外一張表中。
INSERT 觸發器包含一個名為 NEW 的虛擬表。
1 CREATE TRIGGER mytrigger AFTER INSERT ON mytable
2 FOR EACH ROW SELECT NEW.col into @result;
3
4 SELECT @result; -- 獲取結果
DELETE 觸發器包含一個名為 OLD 的虛擬表,並且是隻讀的。
UPDATE 觸發器包含一個名為 NEW 和一個名為 OLD 的虛擬表,其中 NEW 是可以被修改的,而 OLD 是隻讀的。
MySQL 不允許在觸發器中使用 CALL 語句,也就是不能呼叫儲存過程。
二十一、事務管理
基本術語:
- 事務(transaction)指一組 SQL 語句;
- 回退(rollback)指撤銷指定 SQL 語句的過程;
- 提交(commit)指將未儲存的 SQL 語句結果寫入資料庫表;
- 保留點(savepoint)指事務處理中設定的臨時佔位符(placeholder),你可以對它釋出回退(與回退整個事務處理不同)。
不能回退 SELECT 語句,回退 SELECT 語句也沒意義;也不能回退 CREATE 和 DROP 語句。
MySQL 的事務提交預設是隱式提交,每執行一條語句就把這條語句當成一個事務然後進行提交。當出現 START TRANSACTION 語句時,會關閉隱式提交;當 COMMIT 或 ROLLBACK 語句執行後,事務會自動關閉,重新恢復隱式提交。
設定 autocommit 為 0 可以取消自動提交;autocommit 標記是針對每個連線而不是針對伺服器的。
如果沒有設定保留點,ROLLBACK 會回退到 START TRANSACTION 語句處;如果設定了保留點,並且在 ROLLBACK 中指定該保留點,則會回退到該保留點。
1 START TRANSACTION
2 // ...
3 SAVEPOINT delete1
4 // ...
5 ROLLBACK TO delete1
6 // ...
7 COMMIT
二十二、字符集
基本術語:
- 字符集為字母和符號的集合;
- 編碼為某個字符集成員的內部表示;
- 校對字元指定如何比較,主要用於排序和分組。
除了給表指定字符集和校對外,也可以給列指定:
1 CREATE TABLE mytable
2 (col VARCHAR(10) CHARACTER SET latin COLLATE latin1_general_ci )
3 DEFAULT CHARACTER SET hebrew COLLATE hebrew_general_ci;
可以在排序、分組時指定校對:
1 SELECT *
2 FROM mytable
3 ORDER BY col COLLATE latin1_general_ci;
二十三、許可權管理
MySQL 的賬戶資訊儲存在 mysql 這個資料庫中。
1 USE mysql;
2 SELECT user FROM user;
建立賬戶
新建立的賬戶沒有任何許可權。
CREATE USER myuser IDENTIFIED BY 'mypassword';
修改賬戶名
RENAME USER myuser TO newuser;
刪除賬戶
DROP USER myuser;
檢視許可權
SHOW GRANTS FOR myuser;
授予許可權
賬戶用 username@host 的形式定義,username@% 使用的是預設主機名。
GRANT SELECT, INSERT ON mydatabase.* TO myuser;
刪除許可權
GRANT 和 REVOKE 可在幾個層次上控制訪問許可權:
- 整個伺服器,使用 GRANT ALL 和 REVOKE ALL;
- 整個資料庫,使用 ON database.*;
- 特定的表,使用 ON database.table;
- 特定的列;
- 特定的儲存過程。
REVOKE SELECT, INSERT ON mydatabase.* FROM myuser;
更改密碼
必須使用 Password() 函式進行加密。
SET PASSWROD FOR myuser = Password('new_password');
二十餘年如一夢
此身雖在堪驚