資料庫設計：儲存過程主體

woodytu發表於2016-07-05

對於設計和建立資料庫完全是個新手？沒關係，Joe Celko，世界上讀者數量最多的SQL作者之一，會告訴你這些基礎。和往常一樣，即使是最專業的資料庫老手，也會給他們帶來驚喜。Joe是DMBS雜誌是多年來最受讀者喜愛的作者。他在美國、英國，北歐，南美及非洲傳授SQL知識。他在ANSI / ISO SQL標準委員會工作了10年，為SQL-89和SQL-92標準做出了傑出貢獻。

在上一篇文章裡已經介紹了SQL Server裡的儲存過程標題，Joe會繼續談下儲存過程內容的話題。在這篇文章裡，他會概況談下作為過程化語言的T-SQL的侷限性，當決定如何使用它們時要記住那些。

在第一篇到第四篇，我們建立了表，架構的基礎和可視化。但我們還沒結束，因為架構不止這些。在一個真正的資料庫裡，有更多的結構需要考慮。在這些其它架構層級外的東西是：遊標，觸發器和儲存過程。還有其它像核對，翻譯，特權（collations, translations, privileges）和像這樣的東西。我只談這三個東西——遊標，觸發器和儲存過程——我只用最常規的方式命名。5-SQL和其它產品可以有更高的專利，不管ANSI/ISO標準。理由很簡單：這些東西是建立在早期SQL產品使用的現有檔案系統之上。這些過程化的結構是用來彌補早期產品宣告式程式碼的缺陷。供應商有鎖在“程式碼博物館”裡的使用者，不會放棄他們的客戶基礎。

在第5篇，對於儲存過程，我們討論儲存過程標題有什麼和它是如何工作的，就像一個黑盒子。在第6篇，我們到黑盒子裡面看看。

過程化SQL

SQL允許儲存過程程式碼模組在架構裡儲存。同時在標準SQL裡有SQL/PSM語言，你會使用像T-SQL的專門語言。這些語言通常是Algol家族的成員；那就是說他它們有IF-THEN-ELSE，WHILE迴圈和有BEGIN-END作用域的程式碼塊。

這些專用語言的大多數從未想用做程式開發。對於T- SQL的首要規則（The rules of thumb）是不寫超過50行的的過程，且不使用PRINT。但事實上，你可以避免所有的程式導向，每個表像檔案和程式碼一樣對待，好像資料庫是個過程化的檔案系統。如果你喜歡疼痛，大可敲個釘子到你身體，所以不用糾結。

T-SQL是個一次通過的編譯器。這是你必須前置本地變數，使用@（@標誌，“蝸牛（snail）”或“小蝸牛（petite escargot）”）的引數，@@是系統級的變數，#（井號）和##是臨時表。多通道編譯器建立符號表，然後用每個通道探索程式物件的東西。當它第一次找到它時，一次通過編譯器需要用新的符號來告知做什麼。一旦它們傳過來，因此@表示“為我分配本地儲存”，@@表示“在程式外找我，對它我是全域性的”，# 表示“對於當前會話在tempdb裡建立我”，##表示“在臨時表裡建立並保持我”。其它的一起是假定在DDL裡定義。

SQL不計算

你不能期望T-SQL來做過程化程式碼的優化。那需要多通道。例如，大部分FORTRAN編譯器使用代數學寫入來進行計算上的優化。來自IBM的F和G系列可以給學生完整錯誤資訊的快速編譯器，慢但可以為產成品優化效能。

1960年期間一個經典的IT故事是，IBM的國防部（DoD (Department of Defense) ）測試和通用計算機的FORTRAN編譯器。IBM編譯器執行了很長時間，生成一個壓縮的可執行模組，當執行的時候，很快得出正確答案。通用編譯器執行了很長時間，生成了很小的可執行模組，包含一個WRITE語句，立即列印出正確的答案。啥問題？問題是涉及函式和它們的取消退出逆轉。關鍵是浮點取整錯誤。通用FORTRAN編譯器成功配對函式和它們的逆向，完成代數並並以常量生成答案。

在T-SQL裡避免浮點數和實數。在T-SQL裡有同樣的資料型別，但在標準SQL裡沒有。問題是浮點數需要特定來處理避免取整錯誤和比較。有個它們需要呼叫近似數字資料型別的特定原因。這個特定處理需要要麼是軟體內建的，要麼是硬體的一部分，這就說你需要浮點處理器。同樣，你的老闆不會為你的桌面安裝遊戲顯示卡。商業應用伺服器通常不需要這些昂貴的功能，不管你在工作的時候花多少時間在玩Halo或Doom遊戲上。

即使晶片便宜，你也不能合理期望期望T-SQL來做數學上優化的事。SQL是個資料檢索和管理語言，不是用來計算的。你想要的是寫出傳給統計軟體包來獲得資料的好查詢，一個報表或其他特定工具。

如果需要十進位制的地方，那麼就使用DECIMAL資料型別。它們可以很好處理。竅門就是給你自己足夠的十進位制控制元件來獲得正確的整數。那意味著你需要知道你行業的標準。尤其是，如果你用歐元，你需要知道“歐元三角（euro triangulation）”，貨幣轉換和記賬規則。

最好親自做下代數，讓演算法儘可能簡單。這樣建議也適用於字元和時間資料。

T-SQL有基於C的函式庫。這是為什麼可以使用%來代替標準mod函式的原因。

SQL不用來顯示

再次強調，SQL是資料檢索和管理語言，不是用來做前端顯示的。在SQL資料型別裡一起拿到資料，把它們“FQ（over the wall）”傳給前端程式，例如報表編輯器和圖形包，這樣看起來會更好。

但是因為過程語言是焊接到它們的檔案，程式設計師寫單片程式成長起來。COBOL只是字串和顯示模板。FORTRAN有它自己的格式化語句。BASIC版本有使用#和其它符號的圖片選項。即使像C的低階語言，在它的printf函式裡有精確的格式化選項！

長期的過程化語言程式設計後，對於很多程式設計師，分層的概念非常困難。事實上，在現在，你還是可以聽到抗議：“在資料庫我就可以完整這個並節約時間”。

有時候拿是對的。但大多時候，這不會節約。顯示格式化會從在基本列上使用索引阻止優化器。前端然後會拆回格式化列到它們的源資料或另一個格式。比起在它們的列裡有基本資料型別的簡單列，真正的損失是這更難維護。

讓我給你2個常見的例子。使用專門的 CONVERT()函式把時間資料轉為字元來顯示。讓程式為你做這個；它們有函式庫來做這個。你不用擔心國家設定或正確的取整（可以是通過程式設計決定的程式）。當你有DATEPART（）和CAST（）時，CONVERT（）的最壞使用是對字元處理。可以看下兩個日期轉為字串，然後比較字串。

第2個常見例子是從姓和名組合為姓名。這會阻止在姓列上的索引使用，會給前端帶來可用空間和規則的重格式化問題。你會看到翻轉名字順序（名，姓）的前端程式碼

基本宣告式程式設計啟發法（Basic Declarative Programming Heuristics）

結構化程式設計實際上有修正性的數學證據。你可以且應該看下Dijkstra, Wirth and Manna。這實際上是會幫你程式設計的理論。宣告式程式設計還沒到那個點。但可以給你寫啟發。當你看到一個特定情形時可以嘗試些事情；它們不是宇宙法則，就像精明投資者的押注。

關於這個話題有2個系列（看下下面參考文章）可以給你過程化的例子，半過程化和宣告式程式設計風格。但現在，讓我給你有幫助的“高水平提示”的快速清單。

傾向一句頂多句

在一個沒有使用T-SQL流程控制的一個SQL語句裡，你可以做的更多工作，程式碼越好，工作越順。因此，如果你的儲存過程主體有兩個或更多引用到同個表，你大可以組合它們並一次訪問那個表。

你可以使用CASE表示式來避免很多的IF- THEN-ELSE控制邏輯。在CASE表示式前，是應用邏輯到SQL的表示式。經典的例子是多年來Sybase/SQL伺服器類一部分的UPDATE語句。你有個書店，想修改書的價格。超過25美元的書上漲10%（這個會做廣告），低於25美元打85折（這個不會做廣告）。

經典的在虛擬碼裡，結構化程式設計的答案如下：

BEGIN
OPEN FILE (Bookstore);
READ (price) FROM Bookstore;
WHILE NOT EOF (bookstore)
DO BEGIN
   IF price < 25.00
   THEN UPDATE Books SET price = price * 1.10
   ELSE UPDATE Books SET price = price * 0.85;
   FETCH NEXT Bookstore;
   END IF;
END WHILE;
CLOSE FILE (Bookstore);
END:

BEGIN

OPEN FILE (Bookstore);

READ (price) FROM Bookstore;

WHILE NOT EOF (bookstore)

DO BEGIN

IF price < 25.00

THEN UPDATE Books SET price = price * 1.10

ELSE UPDATE Books SET price = price * 0.85;

FETCH NEXT Bookstore;

END IF;

END WHILE;

CLOSE FILE (Bookstore);

END:

很容易把虛擬碼準換為遊標。純粹的SQL語句會如下:

BEGIN
UPDATE Books
   SET price = price * 1.10
 WHERE price < 25.00;
UPDATE Books
   SET price = price * 0.85
 WHERE price >= 25.00;
END;

BEGIN

UPDATE Books

SET price = price * 1.10

WHERE price < 25.00;

UPDATE Books

SET price = price * 0.85

WHERE price >= 25.00;

END;

但這不對！如果一本書現在售價是24.95美元。當第一個UPDATE語句執行後，會是27.45美元。但當我們執行第2個UPDATE時，最後的價格會是23.33美元。這不是我們想要的。交換下UPDATE語句也沒用；在頂部的書會更新2次。

這是對遊標的經典異議。在那些日子裡，對於這類問題，我們有各類可怕的多個表掃描儲存過程。現在，我們有了CASE表示式，它是宣告式，做一次表掃描。

UPDATE Books
   SET price
       = CASE
         WHEN price < 25.00
         THEN price * 1.10
         ELSE price * 0.85
         END;

UPDATE Books

SET price

= CASE

WHEN price < 25.00

THEN price * 1.10

ELSE price * 0.85

END;

這個啟發式有個部分：

在多個語句裡查詢出現的同樣表；它們是可以組合一起的。
如果用IF-THEN-ELSE控制語句的話，可以在單個語句裡用CASE表示式替換分支。

同樣的啟發式適用於INSERT INTO語句。這個的一個格式是插入初始的一些行，隨後是選擇的一些行。結構如下：

INSERT INTO Foobar (..) VALUES(..);
INSERT INTO Foobar SELECT .. FROM.. WHERE..;

1 2	INSERT INTO Foobar (..) VALUES(..); INSERT INTO Foobar SELECT .. FROM.. WHERE..;

也可以寫成這樣：

INSERT INTO Foobar (..)
(SELECT X.* FROM (VALUES (..)) AS X)
UNION ALL
SELECT .. FROM.. WHERE..;

INSERT INTO Foobar (..)

(SELECT X.* FROM (VALUES (..)) AS X)

UNION ALL

SELECT .. FROM.. WHERE..;

當然CASE表示式也可以用在SELECT語句裡。

或許這個啟發式的最佳例子是MERGE語句，可以讓你把INSERT和UPDATE組合為一個語句。這裡我不會討論它，但強烈建議你看下它。

避免本地變數

T-SQL必須分配本地本地變數，它們經常是不需要的。一個常見的模式：

CREATE FUNCTION Foobar (..)
RETURNS <data type>
AS
BEGIN
DECLARE @local_return_holder <data type>;
SET @local_return_holder
    = <scalar query>:
END;

CREATE FUNCTION Foobar (..)

RETURNS <data type>

BEGIN

DECLARE @local_return_holder <data type>;

SET @local_return_holder

= <scalar query>:

END;

可以更簡單：

CREATE FUNCTION Foobar (..)
RETURNS <data type>
AS
BEGIN
RETURN (<scalar query>);
END;

CREATE FUNCTION Foobar (..)

RETURNS <data type>

BEGIN

RETURN (<scalar query>);

END;

本地變數的其他缺點它們會從優化器隱藏表示式。

BEGIN
SET @local_x = (<scalar query>); -- has to load local variable
..
<statement using @local_x>;
END;

BEGIN

SET @local_x = (<scalar query>); -- has to load local variable

<statement using @local_x>;

END;

可以是：

BEGIN
..
<statement using (<scalar query>)>; --optimizes whole expression
END;

BEGIN

<statement using (<scalar query>)>; --optimizes whole expression

END;

你也可以巢狀呼叫函式，不用在本地變數裡的直接值逐步處理。這個的最好例子是REPLACE（）的如下系列呼叫：

SET <a href="http://www.jobbole.com/members/chenj0726">@x</a> = REPLACE (@x, 'a', 'A');
SET <a href="http://www.jobbole.com/members/chenj0726">@x</a> = REPLACE (@x, 'B', 'b');
ETC

SET <a href="http://www.jobbole.com/members/chenj0726">@x</a> = REPLACE (@x, 'a', 'A');

SET <a href="http://www.jobbole.com/members/chenj0726">@x</a> = REPLACE (@x, 'B', 'b');

ETC

使用REPLACE (REPLACE..(REPLACE (@x, ‘z’, ‘Z’) ..))最多你可以32層。

對此概念有問題，你可以和LISP程式設計師談下。這個語言只有巢狀函式呼叫。

傾向JOIN非Loop

有很多其他技巧可以避免逐行處理。例如，不用說太多，for迴圈通常可以用join到系列表（Series table）來代替。系列表（Series table）是來一個到上限的一系列整數。

尋找應該在DDL裡的東西

在儲存過程裡IF-THEN邏輯的使用在執行時清理資料，這是你真的在DDL裡需要CHECK（），在第一時間就阻止出錯。例如：

SET T.x = COALESCE (T.x, 0);
IF (x > 12)..;

1 2	SET T.x = COALESCE (T.x, 0); IF (x > 12)..;

這是你需要你在一些列上有預設值和約束的標誌。在表裡修改“x INTEGER”如下：

 CREATE TABLE T
(..
  x INTEGER DEFAULT 0 NOT NULL
     CHECK (x BETWEEN 0 AND 12),
..);

CREATE TABLE T

(..

x INTEGER DEFAULT 0 NOT NULL

CHECK (x BETWEEN 0 AND 12),

..);

避免CLR和XML混用

保持外部語言在架構之外。不新增其他語言來混合的 SQL已經很難維護。當你在語句裡找到一個CLR模組你不知道，你會怎麼辦？它們不會遵循例如MOD（），SUBSTRING（）和算術取整等同樣的定義。最好的例子是C#和VB之間的區別，2個微軟專屬語言在布林值表達上卻是一致的。

參考文章：

https://www.simple-talk.com/sql/t-sql-programming/procedural,-semi-procedural-and-declarative-programming-in-sql/

https://www.simple-talk.com/sql/t-sql-programming/procedural,-semi-procedural-and-declarative-programing-part-ii/

英文連結：

http://www.sqlservercentral.com/articles/Stairway+Series/70950/

資料庫設計：儲存過程
2016-07-05
資料庫儲存過程
資料庫儲存過程
2024-08-16
資料庫儲存過程
【資料庫】資料庫儲存過程(一)
2019-09-05
資料庫儲存過程
MySql資料庫——儲存過程
2021-09-09
MySql資料庫儲存過程
儲存過程呼叫不同資料庫的資料
2012-12-07
儲存過程資料庫
資料庫許可權-儲存過程
2015-11-27
資料庫儲存過程
淺談資料庫中的儲存過程
2017-04-08
資料庫儲存過程
Mysql 資料庫水平分表儲存過程
2017-12-14
MySql資料庫儲存過程
資料庫開發---常用物件-儲存過程
2015-01-12
資料庫物件儲存過程
使用儲存過程(PL/SQL)向資料庫中儲存BLOB物件
2019-07-08
儲存過程SQL資料庫物件
sqlserver資料庫還原儲存過程指令碼
2022-02-07
SQLServer資料庫儲存過程指令碼
頭歌資料庫實驗六：儲存過程
2024-05-29
資料庫儲存過程
儲存過程返回資料集
2014-03-27
儲存過程
儲存過程在主從庫上的測試
2015-03-23
儲存過程
資料庫表設計之儲存引擎
2021-06-28
資料庫儲存引擎
批量插入資料的儲存過程
2012-06-18
儲存過程
【SqlServer】清除過期資料的儲存過程
2019-01-24
SQLServer儲存過程
把自編儲存過程設定為系統儲存過程
2009-05-19
儲存過程
【故障公告】1個儲存過程拖垮整個資料庫
2022-02-21
儲存過程資料庫
通過EFCore呼叫GBase8s資料庫儲存過程
2021-11-26
資料庫儲存過程
好程式設計師大資料培訓分享之hive儲存過程
2020-05-26
程式設計師大資料Hive儲存過程
MySQL的寫入資料儲存過程
2022-06-10
MySql儲存過程
SQL Server 資料備份儲存過程
2010-11-30
SQLServer儲存過程
儲存過程_造使用者資料
2024-11-28
儲存過程
資料儲存--面向列的儲存設計
2018-01-22
MySQL儲存過程詳解 mysql 儲存過程
2016-07-26
MySql儲存過程
恢復MySQL資料庫建立儲存過程是遇到錯誤
2021-09-09
MySql資料庫儲存過程
金倉資料庫KingbaseES儲存過程 RETURN語句
2023-03-31
資料庫儲存過程
通用的SQL Server資料庫查詢分頁儲存過程
2008-11-26
SQLServer資料庫儲存過程
殺死所有的指定資料庫的程式的儲存過程
2006-12-11
資料庫儲存過程
SQL Server資料庫遠端更新目標表資料的儲存過程
2018-12-27
SQLServer資料庫儲存過程
儲存過程
2014-09-02
儲存過程
Mysql使用儲存過程快速新增百萬資料
2021-09-08
MySql儲存過程
使用JavaScript和Python實現Oracle資料庫的儲存過程？
2018-12-21
JavaScriptPythonOracle資料庫儲存過程
查詢當前資料庫存在某個字串的儲存過程
2018-06-21
資料庫字串儲存過程
淺談mysql資料庫技術，輕鬆玩轉儲存過程
2018-04-02
MySql資料庫儲存過程
MySQL---資料庫從入門走向大神系列(五)-儲存過程
2016-08-08
MySql資料庫儲存過程
Sql Server判斷資料庫、表、儲存過程、函式是否存在
2010-02-01
SQLServer資料庫儲存過程函式

資料庫設計：儲存過程主體

過程化SQL

SQL不計算

SQL不用來顯示

基本宣告式程式設計啟發法（Basic Declarative Programming Heuristics）

傾向一句頂多句

避免本地變數

傾向JOIN非Loop

尋找應該在DDL裡的東西

避免CLR和XML混用

相關文章