五個常見 PHP 資料庫問題
轉載於:http://dev.yesky.com/web/196/2610196.shtml
揭露 PHP 應用程式中出現的五個常見資料庫問題 —— 包括資料庫模式設計、資料庫訪問和使用資料庫的業務邏輯程式碼 —— 以及它們的解決方案。
如果只有一種 方式使用資料庫是正確的……
您可以用很多的方式建立資料庫設計、資料庫訪問和基於資料庫的 PHP 業務邏輯程式碼,但最終一般以錯誤告終。本文說明了資料庫設計和訪問資料庫的 PHP 程式碼中出現的五個常見問題,以及在遇到這些問題時如何修復它們。
一個常見問題是較老的 PHP 程式碼直接使用 mysql_ 函式來訪問資料庫。清單 1 展示瞭如何直接訪問資料庫。
清單 1. Access/get.php
<?php function get_user_id( $name ) { $db = mysql_connect( 'localhost', 'root', 'password' ); mysql_select_db( 'users' ); $res = mysql_query( "SELECT id FROM users WHERE login='".$name."'" ); while( $row = mysql_fetch_array( $res ) ) { $id = $row[0]; } return $id; } var_dump( get_user_id( 'jack' ) ); ?> |
注意使用了 mysql_connect 函式來訪問資料庫。還要注意查詢,其中使用字串連線來向查詢新增 $name 引數。
該技術有兩個很好的替代方案:PEAR DB 模組和 PHP Data Objects (PDO) 類。兩者都從特定資料庫選擇提供抽象。因此,您的程式碼無需太多調整就可以在 IBM? DB2?、MySQL、PostgreSQL 或者您想要連線到的任何其他資料庫上執行。
使用 PEAR DB 模組和 PDO 抽象層的另一個價值在於您可以在 SQL 語句中使用 ? 運算子。這樣做可使 SQL 更加易於維護,且可使您的應用程式免受 SQL 注入攻擊。
使用 PEAR DB 的替代程式碼如下所示。
清單 2. Access/get_good.php
<?php require_once("DB.php"); function get_user_id( $name ) { $dsn = 'mysql://root:password@localhost/users'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( 'SELECT id FROM users WHERE login=?',array( $name ) ); $id = null; while( $res->fetchInto( $row ) ) { $id = $row[0]; } return $id; } var_dump( get_user_id( 'jack' ) ); ?> |
注意,所有直接用到 MySQL 的地方都消除了,只有 $dsn 中的資料庫連線字串除外。此外,我們透過 ? 運算子在 SQL 中使用 $name 變數。然後,查詢的資料透過 query() 方法末尾的 array 被髮送進來。
問題 2:不使用自動增量功能
與大多數現代資料庫一樣,MySQL 能夠在每記錄的基礎上建立自動增量惟一識別符號。除此之外,我們仍然會看到這樣的程式碼,即首先執行一個 SELECT 語句來找到最大的 id,然後將該 id 增 1,並找到一個新記錄。清單 3 展示了一個示例壞模式。
清單 3. Badid.sql
DROP TABLE IF EXISTS users; CREATE TABLE users ( id MEDIUMINT, login TEXT, password TEXT ); INSERT INTO users VALUES ( 1, 'jack', 'pass' ); INSERT INTO users VALUES ( 2, 'joan', 'pass' ); INSERT INTO users VALUES ( 1, 'jane', 'pass' ); |
這裡的 id 欄位被簡單地指定為整數。所以,儘管它應該是惟一的,我們還是可以新增任何值,如 CREATE 語句後面的幾個 INSERT 語句中所示。清單 4 展示了將使用者新增到這種型別的模式的 PHP 程式碼。
清單 4. Add_user.php
<?php require_once("DB.php"); function add_user( $name, $pass ) { $rows = array(); $dsn = 'mysql://root:password@localhost/bad_badid'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT max(id) FROM users" ); $id = null; while( $res->fetchInto( $row ) ) { $id = $row[0]; } $id += 1; $sth = $db->prepare( "INSERT INTO users VALUES(?,?,?)" ); $db->execute( $sth, array( $id, $name, $pass ) ); return $id; } $id = add_user( 'jerry', 'pass' ); var_dump( $id ); ?> |
add_user.php 中的程式碼首先執行一個查詢以找到 id 的最大值。然後檔案以 id 值加 1 執行一個 INSERT 語句。該程式碼在負載很重的伺服器上會在競態條件中失敗。另外,它也效率低下。
那麼替代方案是什麼呢?使用 MySQL 中的自動增量特性來自動地為每個插入建立惟一的 ID。更新後的模式如下所示。
清單 5. Goodid.php
DROP TABLE IF EXISTS users; CREATE TABLE users ( id MEDIUMINT NOT NULL AUTO_INCREMENT, login TEXT NOT NULL, password TEXT NOT NULL, PRIMARY KEY( id ) ); INSERT INTO users VALUES ( null, 'jack', 'pass' ); INSERT INTO users VALUES ( null, 'joan', 'pass' ); INSERT INTO users VALUES ( null, 'jane', 'pass' ); |
我們新增了 NOT NULL 標誌來指示欄位必須不能為空。我們還新增了 AUTO_INCREMENT 標誌來指示欄位是自動增量的,新增 PRIMARY KEY 標誌來指示那個欄位是一個 id。這些更改加快了速度。清單 6 展示了更新後的 PHP 程式碼,即將使用者插入表中。
清單 6. Add_user_good.php
<?php require_once("DB.php"); function add_user( $name, $pass ) { $dsn = 'mysql://root:password@localhost/good_genid'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $sth = $db->prepare( "INSERT INTO users VALUES(null,?,?)" ); $db->execute( $sth, array( $name, $pass ) ); $res = $db->query( "SELECT last_insert_id()" ); $id = null; while( $res->fetchInto( $row ) ) { $id = $row[0]; } return $id; } $id = add_user( 'jerry', 'pass' ); var_dump( $id ); ?> |
現在我不是獲得最大的 id 值,而是直接使用 INSERT 語句來插入資料,然後使用 SELECT 語句來檢索最後插入的記錄的 id。該程式碼比最初的版本及其相關模式要簡單得多,且效率更高。
問題 3:使用多個資料庫
偶爾,我們會看到一個應用程式中,每個表都在一個單獨的資料庫中。在非常大的資料庫中這樣做是合理的,但是對於一般的應用程式,則不需要這種級別的分割。此外,不能跨資料庫執行關係查詢,這會影響使用關聯式資料庫的整體思想,更不用說跨多個資料庫管理表會更困難了。 那麼,多個資料庫應該是什麼樣的呢?首先,您需要一些資料。清單 7 展示了分成 4 個檔案的這樣的資料。
清單 7. 資料庫檔案
Files.sql: CREATE TABLE files ( id MEDIUMINT, user_id MEDIUMINT, name TEXT, path TEXT ); Load_files.sql: INSERT INTO files VALUES ( 1, 1, 'test1.jpg', 'files/test1.jpg' ); INSERT INTO files VALUES ( 2, 1, 'test2.jpg', 'files/test2.jpg' ); Users.sql: DROP TABLE IF EXISTS users; CREATE TABLE users ( id MEDIUMINT, login TEXT, password TEXT ); Load_users.sql: INSERT INTO users VALUES ( 1, 'jack', 'pass' ); INSERT INTO users VALUES ( 2, 'jon', 'pass' ); |
在這些檔案的多資料庫版本中,您應該將 SQL 語句載入到一個資料庫中,然後將 users SQL 語句載入到另一個資料庫中。用於在資料庫中查詢與某個特定使用者相關聯的檔案的 PHP 程式碼如下所示。
清單 8. Getfiles.php
<?php require_once("DB.php"); function get_user( $name ) { $dsn = 'mysql://root:password@localhost/bad_multi1'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT id FROM users WHERE login=?",array( $name ) ); $uid = null; while( $res->fetchInto( $row ) ) { $uid = $row[0]; } return $uid; } function get_files( $name ) { $uid = get_user( $name ); $rows = array(); $dsn = 'mysql://root:password@localhost/bad_multi2'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT * FROM files WHERE user_id=?",array( $uid ) ); while( $res->fetchInto( $row ) ) { $rows[] = $row; } return $rows; } $files = get_files( 'jack' ); var_dump( $files ); ?> |
get_user 函式連線到包含使用者表的資料庫並檢索給定使用者的 ID。get_files 函式連線到檔案表並檢索與給定使用者相關聯的檔案行。
做所有這些事情的一個更好辦法是將資料載入到一個資料庫中,然後執行查詢,比如下面的查詢。
清單 9. Getfiles_good.php
<?php require_once("DB.php"); function get_files( $name ) { $rows = array(); $dsn = 'mysql://root:password@localhost/good_multi'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query("SELECT files.* FROM users, files WHERE users.login=? AND users.id=files.user_id", array( $name ) ); while( $res->fetchInto( $row ) ) { $rows[] = $row; } return $rows; } $files = get_files( 'jack' ); var_dump( $files ); ?> |
該程式碼不僅更短,而且也更容易理解和高效。我們不是執行兩個查詢,而是執行一個查詢。
儘管該問題聽起來有些牽強,但是在實踐中我們通常總結出所有的表應該在同一個資料庫中,除非有非常迫不得已的理由。
問題 4:不使用關係
關聯式資料庫不同於程式語言,它們不具有陣列型別。相反,它們使用表之間的關係來建立物件之間的一到多結構,這與陣列具有相同的效果。我在應用程式中看到的一個問題是,工程師試圖將資料庫當作程式語言來使用,即透過使用具有逗號分隔的識別符號的文字字串來建立陣列。請看下面的模式。
清單 10. Bad.sql
DROP TABLE IF EXISTS files; CREATE TABLE files ( id MEDIUMINT, name TEXT, path TEXT ); DROP TABLE IF EXISTS users; CREATE TABLE users ( id MEDIUMINT, login TEXT, password TEXT, files TEXT ); INSERT INTO files VALUES ( 1, 'test1.jpg', 'media/test1.jpg' ); INSERT INTO files VALUES ( 2, 'test1.jpg', 'media/test1.jpg' ); INSERT INTO users VALUES ( 1, 'jack', 'pass', '1,2' ); |
系統中的一個使用者可以具有多個檔案。在程式語言中,應該使用陣列來表示與一個使用者相關聯的檔案。在本例中,程式設計師選擇建立一個 files 欄位,其中包含一個由逗號分隔的檔案 id 列表。要得到一個特定使用者的所有檔案的列表,程式設計師必須首先從使用者表中讀取行,然後解析檔案的文字,併為每個檔案執行一個單獨的 SELECT 語句。該程式碼如下所示。
清單 11. Get.php
<?php require_once("DB.php"); function get_files( $name ) { $dsn = 'mysql://root:password@localhost/bad_norel'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT files FROM users WHERE login=?",array( $name ) ); $files = null; while( $res->fetchInto( $row ) ) { $files = $row[0]; } $rows = array(); foreach( split( ',',$files ) as $file ) { $res = $db->query( "SELECT * FROM files WHERE id=?", array( $file ) ); while( $res->fetchInto( $row ) ) { $rows[] = $row; } } return $rows; } $files = get_files( 'jack' ); var_dump( $files ); ?> |
該技術很慢,難以維護,且沒有很好地利用資料庫。惟一的解決方案是重新架構模式,以將其轉換回到傳統的關係形式,如下所示。
清單 12. Good.sql
DROP TABLE IF EXISTS files; CREATE TABLE files ( id MEDIUMINT, user_id MEDIUMINT, name TEXT, path TEXT ); DROP TABLE IF EXISTS users; CREATE TABLE users ( id MEDIUMINT, login TEXT, password TEXT ); INSERT INTO users VALUES ( 1, 'jack', 'pass' ); INSERT INTO files VALUES ( 1, 1, 'test1.jpg', 'media/test1.jpg' ); INSERT INTO files VALUES ( 2, 1, 'test1.jpg', 'media/test1.jpg' ); |
這裡,每個檔案都透過 user_id 函式與檔案表中的使用者相關。這可能與任何將多個檔案看成陣列的人的思想相反。當然,陣列不引用其包含的物件 —— 事實上,反之亦然。但是在關聯式資料庫中,工作原理就是這樣的,並且查詢也因此要快速且簡單得多。清單 13 展示了相應的 PHP 程式碼。
清單 13. Get_good.php
<?php require_once("DB.php"); function get_files( $name ) { $dsn = 'mysql://root:password@localhost/good_rel'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } $rows = array(); $res = $db->query("SELECT files.* FROM users,files WHERE users.login=? AND users.id=files.user_id",array( $name ) ); while( $res->fetchInto( $row ) ) { $rows[] = $row; } return $rows; } $files = get_files( 'jack' ); var_dump( $files ); ?> |
這裡,我們對資料庫進行一次查詢,以獲得所有的行。程式碼不復雜,並且它將資料庫作為其原有的用途使用。
問題 5:n+1 模式
我真不知有多少次看到過這樣的大型應用程式,其中的程式碼首先檢索一些實體(比如說客戶),然後來回地一個一個地檢索它們,以得到每個實體的詳細資訊。我們將其稱為 n+1 模式,因為查詢要執行這麼多次 —— 一次查詢檢索所有實體的列表,然後對於 n 個實體中的每一個執行一次查詢。當 n=10 時這還不成其為問題,但是當 n=100 或 n=1000 時呢?然後肯定會出現低效率問題。清單 14 展示了這種模式的一個例子。
清單 14. Schema.sql
DROP TABLE IF EXISTS authors; CREATE TABLE authors ( id MEDIUMINT NOT NULL AUTO_INCREMENT, name TEXT NOT NULL, PRIMARY KEY ( id ) ); DROP TABLE IF EXISTS books; CREATE TABLE books ( id MEDIUMINT NOT NULL AUTO_INCREMENT, author_id MEDIUMINT NOT NULL, name TEXT NOT NULL, PRIMARY KEY ( id ) ); INSERT INTO authors VALUES ( null, 'Jack Herrington' ); INSERT INTO authors VALUES ( null, 'Dave Thomas' ); INSERT INTO books VALUES ( null, 1, 'Code Generation in Action' ); INSERT INTO books VALUES ( null, 1, 'Podcasting Hacks' ); INSERT INTO books VALUES ( null, 1, 'PHP Hacks' ); INSERT INTO books VALUES ( null, 2, 'Pragmatic Programmer' ); INSERT INTO books VALUES ( null, 2, 'Ruby on Rails' ); INSERT INTO books VALUES ( null, 2, 'Programming Ruby' ); |
該模式是可靠的,其中沒有任何錯誤。問題在於訪問資料庫以找到一個給定作者的所有書籍的程式碼中,如下所示。
清單 15. Get.php
<?php require_once('DB.php'); $dsn = 'mysql://root:password@localhost/good_books'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } function get_author_id( $name ) { global $db; $res = $db->query( "SELECT id FROM authors WHERE name=?",array( $name ) ); $id = null; while( $res->fetchInto( $row ) ) { $id = $row[0]; } return $id; } function get_books( $id ) { global $db; $res = $db->query( "SELECT id FROM books WHERE author_id=?",array( $id ) ); $ids = array(); while( $res->fetchInto( $row ) ) { $ids []= $row[0]; } return $ids; } function get_book( $id ) { global $db; $res = $db->query( "SELECT * FROM books WHERE id=?", array( $id ) ); while( $res->fetchInto( $row ) ) { return $row; } return null; } $author_id = get_author_id( 'Jack Herrington' ); $books = get_books( $author_id ); foreach( $books as $book_id ) { $book = get_book( $book_id ); var_dump( $book ); } ?> |
如果您看看下面的程式碼,您可能會想,“嘿,這才是真正的清楚明瞭。” 首先,得到作者 id,然後得到書籍列表,然後得到有關每本書的資訊。的確,它很清楚明瞭,但是其高效嗎?回答是否定的。看看只是檢索 Jack Herrington 的書籍時要執行多少次查詢。一次獲得 id,另一次獲得書籍列表,然後每本書執行一次查詢。三本書要執行五次查詢!
解決方案是用一個函式來執行大量的查詢,如下所示。
清單 16. Get_good.php
<?php require_once('DB.php'); $dsn = 'mysql://root:password@localhost/good_books'; $db =& DB::Connect( $dsn, array() ); if (PEAR::isError($db)) { die($db->getMessage()); } function get_books( $name ) { global $db; $res = $db->query("SELECT books.* FROM authors,books WHERE books.author_id=authors.id AND authors.name=?", array( $name ) ); $rows = array(); while( $res->fetchInto( $row ) ) { $rows []= $row; } return $rows; } $books = get_books( 'Jack Herrington' ); var_dump( $books ); ?> |
現在檢索列表需要一個快速、單個的查詢。這意味著我將很可能必須具有幾個這些型別的具有不同引數的方法,但是實在是沒有選擇。如果您想要具有一個擴充套件的 PHP 應用程式,那麼必須有效地使用資料庫,這意味著更智慧的查詢。
本例的問題是它有點太清晰了。通常來說,這些型別的 n+1 或 n*n 問題要微妙得多。並且它們只有在資料庫管理員在系統具有效能問題時在系統上執行查詢剖析器時才會出現。
結束語
資料庫是強大的工具,就跟所有強大的工具一樣,如果您不知道如何正確地使用就會濫用它們。識別和解決這些問題的訣竅是更好地理解底層技術。長期以來,我老聽到業務邏輯編寫人員抱怨,他們不想要必須理解資料庫或 SQL 程式碼。他們把資料庫當成物件使用,並疑惑效能為什麼如此之差。
他們沒有認識到,理解 SQL 對於將資料庫從一個困難的必需品轉換成強大的聯盟是多麼重要。如果您每天使用資料庫,但是不熟悉 SQL,那麼請閱讀 The Art of SQL,這本書寫得很好,實踐性也很強,可以指導您基本瞭解資料庫。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/786540/viewspace-926973/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料庫常見問題資料庫
- 10個常見的資料庫安全問題資料庫
- 資料庫面試時常見的26個問題資料庫面試
- PHP 常見問題PHP
- SQL Server資料庫恢復常見問題SQLServer資料庫
- Oracle資料庫備份、災備的23個常見問題Oracle資料庫
- 大資料常見問題大資料
- 20個資料庫常見面試題講解資料庫面試題
- 常見資料庫資料庫
- PHP 安全問題入門:10 個常見安全問題 + 例項講解PHP
- 資料庫常見面試題總結資料庫面試題
- MySQL資料庫開發常見問題及幾點優化!MySql資料庫優化
- 前端開發常見問題精選(五)前端
- grub常見的幾個問題
- mybatis常見庫及問題彙總MyBatis
- 資料庫安全問題?這裡有10個最常見的資料庫
- 微信小程式開發常見問題(五)微信小程式
- 常見問題
- 騰訊雲資料庫 TencentDB for Memcached一些常見問題的解答資料庫
- Windows共享資料夾常見問題解決方法Windows
- 談談大資料採集和常見問題大資料
- 入行 AI 的幾個常見問題AI
- Laravel 個人開發常見問題Laravel
- 常見的6個Python資料視覺化庫!Python視覺化
- 遊戲開發者談遊戲行業融資時常見的五個問題遊戲開發行業
- InnoDB儲存引擎鎖機制(五、 常見問題)儲存引擎
- db2資料庫的操作以及一些常見問題解決DB2資料庫
- js常見問題JS
- Homestead 常見問題
- Apache 常見問題Apache
- Linux 常見問題Linux
- Git 常見問題Git
- swiper常見問題
- Composer 常見問題
- HTML常見問題HTML
- Git常見問題Git
- 前端常見問題前端
- 【Nginx】常見問題Nginx
- ndk 常見問題