Apache學習筆記

wangjun_pfc發表於2007-10-13

內容摘要:

Apache是一個歷史悠久並且功能十分強大的WEB伺服器,但其豐富的功能對於一個新手來說往往不知道從何下手。我個人感覺Apache的設計充分體現了模組化設計的優勢,通過在動態模組載入(DSO)模式下的安裝,任何子應用模組都可以通過配置檔案的簡單修改進行積木式的靈活配置。安裝的過程可以從簡單的靜態html服務開始,一個模組一個模組的學習使用。從單純的HTML靜態服務(core),到複雜的動態頁面服務(core + php, core + resin, core + php + mod_gzip, core + resin + mod_expire)

本文主要從簡化安裝==>效能調優==>維護方便的角度,介紹了WEB服務的規劃、HTTPD安裝/應用模組配置、升級/維護等過程。讓ApachePHPResin等應用模組的獨立升級,完全互不影響。

  1. WEB應用容量規劃:根據硬體配置和WEB應用的特點進行WEB服務的規劃及一些簡單的估算公式;

  2. Apache安裝過程apache的通用的簡化安裝選項,方便以後的應用的模組化配置;
    修改 HARD_SERVER_LIMIT
    vi /path/to/apache_src/src/include/httpd.h
    #define HARD_SERVER_LIMIT 2560 <===
    將原來的 HARD_SERVER_LIMIT 256 後面加個“0”
    apache
    編譯:

    ./configure --prefix=/home/apache --enable-shared=max --enable-module=most

  3. 可選應用模組/工具的安裝php resin mod_gzip mod_expire及各個模組之間的配合;
    mod_php
    安裝:./configure --with-apxs=/home/apache/bin/apxs --enable-track-vars --with-mysql
    mod_resin
    安裝:
    ./configure --with-apxs=/home/apache/bin/apxs
    mod_gzip
    安裝:修改Makefile中的 apxs路徑:然後
    make make install
    工具:日誌輪循工具cronolog安裝:http://www.cronolog.org

  4. 升級/維護:看看通用和模組化的安裝過程如何簡化了日常的升級/維護工作;
    按照以上的方法:系統管理員和應用管理員的職責可以清楚的分開,互相獨立。
    系統安裝:系統管理員的職責就是安裝好一臺DSO模式的Apache,然後COLON即可,
    應用安裝:由應用管理員負責具體應用所需要的模組,比如PHP Resin等,並設定httpd.conf中相關的配置。
    系統升級:系統管理員:升級作業系統/升級Apache
    應用升級:應用管理員:升級應用模組,PHP Resin等。

WEB應用的容量規劃

Apache主要是一個記憶體消耗型的服務應用,我個人總結的經驗公式:
apache_max_process_with_good_perfermance < (total_hardware_memory / apache_memory_per_process ) * 2
apache_max_process = apache_max_process_with_good_perfermance * 1.5

為什麼會有一個apache_max_process_with_good_perfermanceapache_max_process呢?原因是在低負載下系統可以使用更多的記憶體用於檔案系統的快取,從而進一步提高單個請求的響應速度。在高負載下,系統的單個請求響應速度會慢不少,而超過 apache_max_process,系統會因為開始使用硬碟做虛擬記憶體交換空間而導致系統效率急劇下降。此外,同樣的服務:2G記憶體的機器的 apache_max_process一般只設定到1G記憶體的1.7倍,因為Apache本身會因為程式過多導致效能下降。

例子1
一個apache + mod_php的伺服器:一個apache程式一般需要4M記憶體
因此在一個1G記憶體的機器上:apache_max_process_with_good_perfermance < (1g / 4m) * 2 = 500
apache_max_process
500 * 1.5 = 750
所以規劃你的應用讓服務儘量跑在500個程式以下以保持比較高的效率,並設定Apache的軟上限在800個。

例子2
一個apache + mod_resin的伺服器: 一個apache程式一般需要2M記憶體
在一個2G記憶體的機器上:
apache_max_process_with_good_perfermance < (2g / 2m ) * 2 = 2000
apache_max_process
2000 * 1.5 = 3000

以上估算都是按小檔案服務估算的(一個請求一般大小在20k以下)。對於檔案下載型別站點,可能還會受其他因素:比如頻寬等的影響。

Apache安裝過程

伺服器個數的硬上限HARD_SERVER_LIMIT的修改:
Apache的原始碼中預設的最大程式數是256個,需要修改apache_1.3.xx/src/include/httpd.h
#ifndef HARD_SERVER_LIMIT
#ifdef WIN32
#define HARD_SERVER_LIMIT 1024
#elif defined(NETWARE)
#define HARD_SERVER_LIMIT 2048
#else
#define HARD_SERVER_LIMIT 2560 <===
將原來的HARD_SERVER_LIMIT 256 後面加個
“0”
#endif
#endif

解釋:
Apache
預設的最大使用者數是256個:這個配置對於伺服器記憶體還是256M左右的時代是一個非常好的預設設定,但隨著記憶體成本的急劇下降,現在大型站點的伺服器記憶體配置一般比當時要高一個數量級不止。所以256個程式的硬限制對於一臺1G記憶體的機器來說是太浪費了,而且Apache的軟上限 max_client是受限於HARD_SERVER_LIMIT的,因此如果WEB伺服器記憶體大於256M,都應該調高Apache HARD_SERVER_LIMIT。根據個人的經驗:2560已經可以滿足大部分小於2G記憶體的伺服器的容量規劃了(Apache的軟上限的規劃請看後面)。

Apache的編譯:以下通用的編譯選項能滿足以後任意模組的安裝
./configure --prefix=/another_driver/apache/ --enable-shared=max --enable-module=most
比如:
./configure --prefix=/home/apache/ --enable-shared=max --enable-module=most

解釋:
--prefix=/another_driver/apache/
:建議將apache服務安裝在另外一個驅動裝置上的目的在於硬碟往往是一個系統使用壽命最低的裝置,因此:將服務資料和系統完全分開,不僅能提高了資料的訪問速度,更重要的,大大方便系統升級,應用備份和恢復過程。

--shared-module=max:使用動態載入方式載入子模組會帶來5%的效能下降,但和帶來的配置方便相比更本不算什麼:比如模組升級方便,系統升級風險降低,安裝過程標準化等

--enable-module=most:用most可以將一些不常用的module編譯進來,比如後面講到的mod_expire是就不在 apache的預設常用模組中

如果不想build so, 也可以這樣:
./configure /
"--with-layout=Apache" /
"--prefix=/path/to/apache" /
"--disable-module=access" /
"--disable-module=actions" /
"--disable-module=autoindex" /
"--disable-module=env" /
"--disable-module=imap" /
"--disable-module=negotiation" /
"--disable-module=setenvif" /
"--disable-module=status" /
"--disable-module=userdir" /
"--disable-module=cgi" /
"--disable-module=include" /
"--disable-module=auth" /
"--disable-module=asis"

但結果會發現,這樣編譯對服務效能只能有微小的提高(5%左右),但卻失去了以後系統升級和模組升級的靈活性,無論是模組還是Apache本身升級都必須把ApachePHPSOURCE加在一起重新編譯。

apache的預設配置檔案一般比較大:可以使用去掉註釋的方法精簡一下:然後再進入具體的培植過程能讓你更快的定製出你所需要的。
grep -v "#" httpd.conf.default >httpd.conf

需要修改的通用專案有以下幾個:

#服務埠,預設是8080,建議將整個Apache配置調整好後再將服務埠改到正式服務的埠
Port 8080 => 80

#伺服器名:預設沒有
ServerName name.example.com

#
最大服務程式數:根據服務容量預測設定
MaxClients 256 => 800

#預設啟動服務後的服務程式數:等服務比較平穩後,按平均負載下的httpd個數設定就可以
StartServers 5 => 200

不要修改:
以前有建議說修改:
MinSpareServers 5 => 100
MaxSpareServers 10 => 200

但從我的經驗看來:預設值已經是非常優化的了,而且讓Apache自己調整子共享程式個數還是比較好的。

特別修改:
solaris或一些比較容易出現記憶體洩露的應用上:
MaxRequestsPerChild 0 =>3000

應用模組和工具的安裝配置:

由於使用模組動態載入的模式,所以可以方便的通過簡單的配置調整來把Apache定製成你需要的:最好把不常用模組全部清除(無論處於安全還是效率)。
比如:對於靜態頁面伺服器:就什麼其他子模組都不載入,對於PHP應用就加上PHP模組,對於JAVA應用就把Resin模組載入上。而且各種模組的插拔非常簡單,這樣除錯過程中就可以簡單的通過註釋掉不需要的模組,而不用重新編譯。

一般說來,可以不需要的模組包括:
#LoadModule env_module libexec/mod_env.so
#LoadModule negotiation_module libexec/mod_negotiation.so
#LoadModule status_module libexec/mod_status.so
#server side include
已經過時了
#LoadModule includes_module libexec/mod_include.so
#
不需要將沒有預設index檔案的目錄下所有檔案列出
#LoadModule autoindex_module libexec/mod_autoindex.so
#
儘量不使用CGI:一直是Apache安全問題最多的地方
#LoadModule cgi_module libexec/mod_cgi.so
#LoadModule asis_module libexec/mod_asis.so
#LoadModule imap_module libexec/mod_imap.so
#LoadModule action_module libexec/mod_actions.so
#
不使用安全認證可以大大提高訪問速度
#LoadModule access_module libexec/mod_access.so
#LoadModule auth_module libexec/mod_auth.so
#LoadModule setenvif_module libexec/mod_setenvif.so

最好保留的有:
#
用於定製log格式
LoadModule config_log_module libexec/mod_log_config.so
#
用於增加檔案應用的關聯
LoadModule mime_module libexec/mod_mime.so
#
用於預設index檔案:index.php
LoadModule dir_module libexec/mod_dir.so

可用可不用的有:
#
比如:需要在~/username/下除錯php可以將
LoadModule userdir_module libexec/mod_userdir.so
#
比如:需要將以前的URL進行轉向或者需要使用CGI script-alias
LoadModule alias_module libexec/mod_alias.so

常用的模組:
最常用的可能就是phpJAVA應用伺服器的前端,此外,從效能上講利用mod_gzip可以減少40%左右的流量,減少機器用於傳輸的負載,而 mod_expires可以減少10%左右的重複請求,讓重複的使用者對指定的頁面請求結果都CACHE在本地,根本不向伺服器發出請求。

建議將所有MODULE的配置都放到相應模組的配置內部:<IfModule some_module.c>some_module config </IfModule>

PHP的安裝:
/path/to/php_src/configure --with-apxs=/path/to/apache/bin/apxs --with-other-modules-you-need
需要修改的配置:
AddType application/x-httpd-php .php .php3 .any_file_in_php

resin的安裝設定:
/path/to/resin/src/configure --with-apxs=/path/to/apache/bin/apxs

具體的resin設定放在另外一個檔案中:比如/home/resin/conf/resin.conf
<IfModule mod_caucho.c>
CauchoConfigFile /path/to/apache/conf/resin.conf
</IfModule>

mod_expires的安裝配置:
<IfModule mod_expires.c>
    ExpiresActive on
    ExpiresByType image/gif "access plus 1 month"
    ExpiresByType text/css "now plus 1 month"
    ExpiresDefault "now plus 1 day"
</IfModule>

註釋:
所有的.gif檔案1個月以後過期
所有的檔案預設1天以後過期

mod_gzip的安裝
http://www.chedong.com/tech/compress.html

日誌的輪循:cronolog的安裝和設定

cronolog可以非常整齊的將日誌按天輪循儲存
預設編譯安裝到/usr/local/bin/下,只需要將配置改成:

CustomLog "|/usr/local/sbin/cronolog /home/apache/logs/%w/access_log" combined

日誌將按天截斷並存放在以星期為目錄名的目錄下:比如:log/1是週一,log/5是週五, log/0是週日

gzip壓縮每天的日誌:
30 4 * * * /usr/bin/gzip -f /home/apache/logs/`date -d yesterday +%w`/access_log

日誌的定期刪除:
30 5 * * */usr/bin/find /home/apache/logs/ -name access_log.gz -mtime +3 |xargs -r /bin/rm -f

升級維護

由於使用動態模組載入方式(DSO模式)安裝ApacheApacheHTTPD核心服務和應用模組以及應用模組之間都變的非常靈活,建議將所有獨立模組的配置都放在
<IfModule mod_name>
CONFIGURATIONS..
</IfModule>
裡,這樣配置非常容易通過遮蔽某個模組來進行功能調整:比如:
#AddModule mod_gzip.c
就遮蔽了mod_gzip,而其他模組不首任何影響。

安裝和維護過程:

  • 系統安裝:系統管理員的職責就是安裝系統和一個按照DSO模式安裝的Apache,然後COLON

  • 應用安裝:由應用管理員負責具體應用所需要的模組並設定HTTPD

  • 系統升級:系統管理員:升級系統/升級Apache

  • 應用升級:應用管理員:升級應用模組:PHP CAUCHO

  • 系統備份/恢復:如果Apache不在預設的系統盤上,只需要將Apache目錄備份就可以了,遇到系統分割槽的硬體問題直接使用預先準備好的系統COLON,再直接將Apache所在物理盤恢復就行了。

系統管理員:Apache的最簡化安裝

OS + Apache (httpd core only)

應用管理員:應用模組定製

純靜態頁面服務
core

PHP動態頁面
core+so
+php

JAVA應用
core+so
+caucho
+ssl

應用例子:

www.example.com
image.example.com

bbs.example.com

mall.example.com

 

例子:ApachePHP模組的獨立升級。

如果Apache是按照以下方式安裝:
./configure --prefix=/home/apache --enable-shared=max --enable-module=most
PHP
是按照以下方式安裝:
./configure --with-apxs=/home/apache/bin/apxs --enable-track-vars --with-mysql

以後單獨升級Apache的時候,仍然是:
./configure --prefix=/home/apache --enable-shared=max --enable-module=most
make
su
#/home/apache/bin/apachectl stop
#make install

單獨升級php時,仍然是:
./configure --with-apxs=/home/apache/bin/apxs --enable-track-vars --with-mysql
make
su
#/home/apache/bin/apachectl stop
#make install
#/home/apache/bin/apachectl start

基於反相代理的WEB加速:
squid
mod_proxy都可以實現反相代理加速。而基於快取的代理加速比起原有WEB服務,速度會有數量級的提升。

小提示:

Apache安裝後,預設根目錄下沒有但很有用的2個檔案:

  • favicon.ico: favicon.ico是一個16x16的站點圖示檔案,如果瀏覽器發現有這個檔案,在位址列中會用這個圖示替換調瀏覽器的網頁圖示。IE6 MOZILLA等主流瀏覽器都支援這個功能。
    例如: http://www.chedong.com/favicon.ico

  • robots.txt: 用於告訴搜尋引擎的爬蟲程式(spider)網站那些頁面可以被索引,那些不可以。
    具體說明請參考:http://www.robotstxt.org/wc/robots.html

參考文件:

Apache專案
http://httpd.apache.org/

PHP
http://www.php.net/

Resin
http://www.caucho.com/

mod_gzip
http://sourceforge.net/projects/mod-gzip/

Cronolog
http://www.cronolog.org/

mod_expires
http://httpd.apache.org/docs/mod/mod_expires.html

面向搜尋引擎的CMS設計:
http://www.chedong.com/tech/cms.html

 

 

相關文章