Linux下php擴充套件tidy的安裝_參考

cnbird發表於2009-12-17

tidy 是一個非常幫忙的網頁程式碼分析和糾錯的工具,能夠支援多種頁面編碼,並且支援xhtml輸出。如果我們偷懶,甚至可以將整個頁面快取,最後採用tidy處理,最後輸出完美的xhtml程式碼。

linux下安裝過程如下:

首先安裝tidy ,下載tidy原始碼:

cvs -d:pserver: anonymous@tidy.cvs.sourceforge.net 為防備電子郵件地址收集器,這個 E-mail 地址被隱藏,你的瀏覽器必須支援 Javascript 才可看到這個郵件地址 :/cvsroot/tidy login
cvs -z3 -d:pserver: anonymous@tidy.cvs.sourceforge.net 為防備電子郵件地址收集器,這個 E-mail 地址被隱藏,你的瀏覽器必須支援 Javascript 才可看到這個郵件地址 :/cvsroot/tidy co tidy

然後編譯:

cd tidy/build/gmake/
make
make install

tidy 編譯完成了,接下來我們安裝php擴充套件,php文件中都說 pecl中tidy-1.x支援php 4.3以後,而 tidy-2.x支援php5 ,但是我就沒找到tidy 2.x ,但是tidy-1.2在我的php下執行也正常。

wget http://pecl.php.net/get/tidy-1.2.tgz
tar -xvzf tidy-1.2.tgz
cd tidy-1.2
/usr/local/php/bin/phpize
./configure –with-php-config=/usr/local/php/bin/php-config
make;make install

接下來修改php.ini

加上 extension=”tidy.so”

重啟apache 就可以了。

比如當對兩個html進行比較時, 如何能夠正確地向使用者提供 友好的比較結果。舉一個很簡單的例子。
<span>123</span> 和<div>123</div> 在html source 層面是完全不同的字串,但是對於使用者體驗來說,這兩個字串是一致的。 再比如
<ul><li>First</li><li>Second</li></ul> 和 <li>First</li><li>Second</li> 在顯示的時候是完全一致,但是html 確差了很多。 我們可以從技術上向使用者解釋說, 他們本來就是不一樣的,但是這樣會嚇跑我們的使用者。

我想了很多辦法來解決這個問題,解決方案就是建立一個可配置的配置表, 通過反射建立起一套規則,當出現比較結果和human 體驗不一致的時候,就利用這套邏輯進行修正,但是這樣的問題就是 頭疼醫疼 腳疼醫腳 ,總是滯後於使用者發現問題,就和IE 的補丁一樣,雖然可以解決問題,但是永遠都是再發現問題以後才去解決。

終於有一點,痛下決心,在根子上解決這個問題。 解決這個問題的關鍵,就是在相同的使用者體驗的前提下,儘量的將資料來源修正為同等比較, 這樣的唯一解決方案就是XHTML 了,下一步的問題是,如何進行修正,這個可不是一個小問題。 直道有一天一個很偶然的機會,發現了W3C組織提供的Open Source 的專案Html Tidy,

這個Html Tidy 可以幫助我們 對html 字串進行修正,並做標準化的處理。詳細的關於Html Tidy 的資訊,大家可以去這個站點, 我也會在後續的Post 中做詳細的介紹。

 

source : http://hi.baidu.com/gengshenspirit/blog/item/9f6b3538f896b8fab311c771.html


相關文章