大牛們是如何寫出那些高質量、高效能的SQL查詢語句的?

博為峰網校發表於2018-12-18

想要寫出高質量、高效能的SQL查詢語句:

一、首先要搞明白什麼叫執行計劃?

執行計劃是資料庫根據SQL語句和相關表的統計資訊作出的一個查詢方案,這個方案是由查詢最佳化器自動分析產生的,比如一條SQL語句如果用來從一個 10萬條記錄的表中查1條記錄,那查詢最佳化器會選擇“索引查詢”方式,如果該表進行了歸檔,當前只剩下5000條記錄了,那查詢最佳化器就會改變方案,採用“全表掃描”方式。

可見,執行計劃並不是固定的,它是“個性化的”。產生一個正確的“執行計劃”有兩點很重要:

(1)SQL語句是否清晰地告訴查詢最佳化器它想幹什麼?

(2)查詢最佳化器得到的資料庫統計資訊是否是最新的、正確的?

大牛們是如何寫出那些高質量、高效能的SQL查詢語句的?

二、統一SQL語句的寫法

對於以下兩句SQL語句,程式設計師認為是相同的,資料庫查詢最佳化器認為是不同的。

select*from dual

select*From dual

其實就是大小寫不同,查詢分析器就認為是兩句不同的SQL語句,必須進行兩次解析。生成2個執行計劃。所以作為程式設計師,應該保證相同的查詢語句在任何地方都一致,多一個空格都不行!

三、SQL語句編寫注意問題

下面就某些SQL語句編寫注意問題做一下詳細的介紹。在這些where子句中,即使某些列存在索引,但是由於編寫了劣質的SQL,系統在執行該SQL語句時也不能使用該索引,而同樣使用全表掃描,這就造成了響應速度的極大降低。

1.IS NULL 與 IS NOT NULL

不能用null作索引,任何包含null值的列都將不會被包含在索引中。即使索引有多列這樣的情況下,只要這些列中有一列含有null,該列就會從索引中排除。也就是說如果某列存在空值,即使對該列建索引也不會提高效能。

任何在where子句中使用is null或is not null的語句最佳化器是不允許使用索引的。

2.避免使用不相容的資料型別。

不相容的資料型別代表著全表檢索資料的型別轉換,訪問將變為全表掃描

select * from employee where last_name = 100;注last_name為varchar型別

3.聯接列

對於有聯接的列,即使最後的聯接值為一個靜態值,最佳化器是不會使用索引的。我們一起來看一個例子,假定有一個職工表(employee),對於 一個職工的姓和名分成兩列存放(FIRST_NAME和LAST_NAME),現在要查詢一個叫比爾.克林頓(Bill Cliton)的職工。

下面是一個採用聯接查詢的SQL語句,

select * from employss where first_name||''||last_name ='Beill Cliton';

上面這條語句完全可以查詢出是否有Bill Cliton這個員工,但是這裡需要注意,系統最佳化器對基於last_name建立的索引沒有使用。

當採用下面這種SQL語句的編寫,Oracle系統就可以採用基於last_name建立的索引。

*** where first_name ='Beill' and last_name ='Cliton';

4. 萬用字元(%)開頭的like語句

目前的需求是這樣的,要求在職工表中查詢名字中包含cliton的人。可以採用如下的查詢SQL語句:

select * from employee where last_name like '%cliton%'這裡由於萬用字元(%)在搜尋詞首出現,所以Oracle系統不使用last_name的索引。然而當萬用字元出現在字串其他位置時,最佳化器就能利用索引。在下面的查詢中索引得到了使用:

select * from employee where last_name like 'c%'

5.索引欄位上進行運算會使索引失效。

儘量避免在WHERE子句中對欄位進行函式或表示式操作,這將導致引擎放棄使用索引而進行全表掃描。

eg:SELECT * FROM T1 WHERE F1/2=100 應改為: SELECT * FROM T1 WHERE F1=100*2

6. Order by語句

ORDER BY語句決定了Oracle如何將返回的查詢結果排序。Order by語句對要排序的列沒有什麼特別的限制,也可以將函式加入列中(象聯接或者附加等)。任何在Order by語句的非索引項或者有計算表示式都將降低查詢速度。

仔細檢查order by語句以找出非索引項或者表示式,它們會降低效能。解決這個問題的辦法就是重寫order by語句以使用索引,也可以為所使用的列建立另外一個索引,同時應絕對避免在order by子句中使用表示式。

7. NOT

我們在查詢時經常在where子句使用一些邏輯表示式,如大於、小於、等於以及不等於等等,也可以使用and(與)、or(或)以及not(非)。NOT可用來對任何邏輯運算子號取反。下面是一個NOT子句的例子:

... where not (status ='VALID')

如果要使用NOT,則應在取反的短語前面加上括號,並在短語前面加上NOT運算子。NOT運算子包含在另外一個邏輯運算子中,這就是不等於(<>)運算子。換句話說,即使不在查詢where子句中顯式地加入NOT詞,NOT仍在運算子中,見下例:

... where status <>'INVALID';

對這個查詢,可以改寫為不使用NOT:

select * from employee where salary<3000 or salary>3000;

雖然這兩種查詢的結果一樣,但是第二種查詢方案會比第一種查詢方案更快些。第二種查詢允許Oracle對salary列使用索引,而第一種查詢則不能使用索引。

8. IN和EXISTS

有時候會將一列和一系列值相比較。最簡單的辦法就是在where子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。

第一種格式是使用IN運算子:

... where column in(select * from ... where ...);

第二種格式是使用EXIST運算子:

... where exists (select 'X' from ...where ...);

我相信絕大多數人會使用第一種格式,因為它比較容易編寫,而實際上第二種格式要遠比第一種格式的效率高。在Oracle中可以幾乎將所有的IN運算子子查詢改寫為使用EXISTS的子查詢。

第二種格式中,子查詢以‘select 'X'開始。運用EXISTS子句不管子查詢從表中抽取什麼資料它只檢視where子句。這樣最佳化器就不必遍歷整個表而僅根據索引就可完成工作(這裡假定在where語句中使用的列存在索引)。相對於IN子句來說,EXISTS使用相連子查詢,構造起來要比IN子查詢困難一些。

透過使用EXIST,Oracle系統會首先檢查主查詢,然後執行子查詢直到它找到第一個匹配項,這就節省了時間。Oracle系統在執行IN子查詢時,首先執行子查詢,並將獲得的結果列表存放在一個加了索引的臨時表中。在執行子查詢之前,系統先將主查詢掛起,待子查詢執行完畢,存放在臨時表中以後再執行主查詢。這也就是使用EXISTS比使用IN通常查詢速度快的原因。

同時應儘可能使用NOT EXISTS來代替NOT IN,儘管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查詢效率更高。

9.應儘量避免在 where 子句中使用or來連線條件 ,否則將導致引擎放棄使用索引而進行全表掃描,

如:select id from employee where num=10 or num=20

可以這樣查詢:select id from employee where num=10 union all select id from employeewhere num=20

10.應儘量避免在 where 子句中對欄位進行表示式操作

這將導致引擎放棄使用索引而進行全表掃描。如:select id from t where num/2=100應改為:select id from t where num=100*2

11.應儘量避免在where子句中對欄位進行函式操作

這將導致引擎放棄使用索引而進行全表掃描。如:select id from t where substring(name,1,3)=’abc’ ,name以abc開頭的id應改為:

select id from t where name like ‘abc%’

12.不要在 where 子句中的“=”左邊進行函式、算術運算或其他表示式運算 ,否則系統將可能無法正確使用索引。

13.在使用索引欄位作為條件時 ,如果該索引是複合索引,那麼必須使用到該索引中的第一個欄位作為條件時才能保證系統使用該索引,否則該索引將不會被使用,並且應儘可能的讓欄位順序與索引順序相一致。

14. 索引並不是越多越好

索引固然可以提高相應的select的效率,但同時也降低了insert 及update的效率,因為 insert 或 update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數最好不要超過6個,若太多則應考慮一些不常使用到的列上建的索引是否有必要。

15.儘量使用數字型欄位 ,若只含數值資訊的欄位儘量不要設計為字元型,這會降低查詢和連線的效能,並會增加儲存開銷。這是因為引擎在處理查詢和連線時會逐個比較字串中每一個字元,而對於數字型而言只需要比較一次就夠了。

16.儘可能的使用 varchar/nvarchar 代替 char/nchar  ,因為首先變長欄位儲存空間小,可以節省儲存空間,其次對於查詢來說,在一個相對較小的欄位內搜尋效率顯然要高些。

17.任何地方都不要使用select * fromt ,用具體的欄位列表代替“*”,不要返回用不到的任何欄位。

四、總結:

透過這些查詢最佳化方法,我們設法將查詢從8秒降低到2秒,並且將查詢次數從4次減少到1次。需要說明的是,這些查詢時間是在我們開發環境執行時記錄的,生產環境速度會更快。

這對追蹤查詢緩慢及其修復等問題是一個有用的指南。最佳化查詢看起來可能像一個可怕的任務,但只要你嘗試一下,並取得一些初步的勝利,你就會開始找到錯誤,並希望做出進一步改善。

歡迎加入  51軟體測試大家庭,在這裡你將獲得【最新行業資訊】,【免費測試工具安裝包】,【軟體測試技術乾貨】,【面試求職技巧】... 51與你共同學習,一起成長!期待你的加入: QQ                     群:                    755431660


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31407649/viewspace-2285641/,如需轉載,請註明出處,否則將追究法律責任。

相關文章