為資料庫建立索引(轉)

gugu99發表於2007-08-13
為資料庫建立索引(轉)[@more@]

  就象許多的PHP開發者一樣,在剛開始建立動態網站的時候,我都是使用相對簡單的資料結構。PHP在連線資料庫方面的確實是十分方便(譯者注:有些人認為PHP在連線不同資料庫時沒有一個統一的介面,不太方便,其實這可以透過一些擴充套件庫來做到這一點),你無需看大量的設計文件就可以建立和使用資料庫,這也是PHP獲得成功的主要原因之一。

  前些時候,一位頗高階的程式設計師居然問我什麼叫做索引,令我感到十分的驚奇,我想這絕不會是滄海一粟,因為有成千上萬的開發者(可能大部分是使用MySQL的)都沒有受過有關資料庫的正規培訓,儘管他們都為客戶做過一些開發,但卻對如何為資料庫建立適當的索引所知較少,因此我起了寫一篇相關文章的念頭。

  最普通的情況,是為出現在where子句的欄位建一個索引。為方便講述,我們先建立一個如下的表。

    CREATE TABLE mytable (     

  以上是postgres的資料,可以看到該資料庫在查詢的時候使用了一個索引(一個好開始),而且它使用的是我建立的第二個索引。看到我上面命名的好處了吧,你馬上知道它使用適當的索引了。

  接著,來個稍微複雜一點的,如果有個ORDER BY字句呢?不管你信不信,大多數的資料庫在使用order by的時候,都將會從索引中受益。

  SELECT * FROM mytable

  WHERE category_id=1 AND user_id=2

  ORDER BY adddate DESC;

  有點迷惑了吧?很簡單,就象為where字句中的欄位建立一個索引一樣,也為ORDER BY的字句中的欄位建立一個索引:

  CREATE INDEX mytable_categoryid_userid_adddate

  ON mytable (category_id,user_id,adddate);

  注意: "mytable_categoryid_userid_adddate" 將會被截短為

     "mytable_categoryid_userid_addda"   

  現在使用我們料想的索引了,而且它還挺聰明,知道可以從索引後面開始讀,從而避免了任何的排序。

  以上說得細了一點,不過如果你的資料庫非常巨大,並且每日的頁面請求達上百萬算,我想你會獲益良多的。不過,如果你要做更為複雜的查詢呢,例如將多張表結合起來查詢,特別是where限制字句中的欄位是來自不止一個表格時,應該怎樣處理呢?我通常都儘量避免這種做法,因為這樣資料庫要將各個表中的東西都結合起來,然後再排除那些不合適的行,搞不好開銷會很大。

  如果不能避免,你應該檢視每張要結合起來的表,並且使用以上的策略來建立索引,然後再用EXPLAIN命令驗證一下是否使用了你料想中的索引。如果是的話,就OK。不是的話,你可能要建立臨時的表來將他們結合在一起,並且使用適當的索引。

  要注意的是,建立太多的索引將會影響更新和插入的速度,因為它需要同樣更新每個索引檔案。對於一個經常需要更新和插入的表格,就沒有必要為一個很少使用的where字句單獨建立索引了,對於比較小的表,排序的開銷不會很大,也沒有必要建立另外的索引。

  以上介紹的只是一些十分基本的東西,其實裡面的學問也不少,單憑EXPLAIN我們是不能判定該方法是否就是最最佳化的,每個資料庫都有自己的一些最佳化器,雖然可能還不太完善,但是它們都會在查詢時對比過哪種方式較快,在某些情況下,建立索引的話也未必會快,例如索引放在一個不連續的儲存空間時,這會增加讀磁碟的負擔,因此,哪個是最優,應該透過實際的使用環境來檢驗。

  在剛開始的時候,如果表不大,沒有必要作索引,我的意見是在需要的時候才作索引,也可用一些命令來最佳化表,例如MySQL可用"OPTIMIZE TABLE"。

  綜上所述,在如何為資料庫建立恰當的索引方面,你應該有一些基本的概念了。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10748419/viewspace-954232/,如需轉載,請註明出處,否則將追究法律責任。

相關文章