Squid最佳化完全手冊(轉)

ba發表於2007-08-12
Squid最佳化完全手冊(轉)[@more@]一、 概述

squid是一款優秀的open source的代理伺服器軟體,可以執行於多種系統平臺上,但是同其他商業化的產品相比,其缺點也是很明顯的,那就是它的命中率和效率相對低下。

本文主要討論在不改變硬體條件之下,透過以下手段對squid進行效能最佳化:

1. 編譯一個高效的、精簡的新核心;
2. 對Cache分割槽採用reiserfs日誌檔案系統;
3. 重新編譯squid;
4. 最佳化squid配置;

對於最佳化的效果,我使用大名鼎鼎的cacheflow公司的測試工具——cfmc進行測試比較:

首先用cfmc自帶的一個指令碼,從squid.conf的access.log中抽出RUL,然後以這些RUL為依據進行測試。

伺服器配置:
型號:HP LH3
CPU:PII450
記憶體:256MB 100MHz ECC SDRAM DIMM
硬碟:9.1GB Hot-Swap Ultra2 Hard Disk
網路卡:Ethernet Express PRO 100 10/100M X 2
作業系統:RedHat 7.1

最佳化前測試結果:
Iteration 0: Cumulative statistics; 933 seconds elapsed
Total objects: 72599, total object size: 513211102 bytes
Average object size: 7069 bytes
Average object response time: 2707 milliseconds
Objects per second: 77.81
Bytes per second: 550065, min: 550065, max: 879873
URLs discarded due to socket or connection failures: 6955
Redirections: 1017, Cookied objects: 1036
Pragma no-cache objects: 1656, Non-200 HTTP response codes: 2505

最佳化後測試結果:
Iteration 0: Cumulative statistics; 688 seconds elapsed
Total objects: 72599, total object size: 403833100 bytes
Average object size: 5562 bytes
Average object response time: 1890 milliseconds
Objects per second: 105.52
Bytes per second: 586966, min: 586966, max: 995582
URLs discarded due to socket or connection failures: 16372
Redirections: 1658, Cookied objects: 1000
Pragma no-cache objects: 1454, Non-200 HTTP response codes: 3132

透過對以上測試結果的比較,我們可以看出:
最佳化後的Objects per second增加了35.6%,Average object response time減少了43.2%,對整體效能的提升還是比較明顯的。

二、 編譯新核心

我們採取這樣的方式來編譯核心:取消核心的模組支援,將伺服器所有的硬體驅動編譯到核心中,此外還要注意將對reiserfs檔案系統的支援也編譯到核心中,從而在提供系統效能的同時增加系統安全性。在2.4.10以上的版本中,已經內建了對reiserfs檔案系統的支援。

首先從下載linux-2.4.12.tar.gz,這是當前最新的核心。
然後解開核心檔案:
tar xvzf linux-2.4.12.tar.gz
進入新生成的目錄並執行:
cd linux
make mrproper
make config

根據我的伺服器的配置,我選擇這樣編譯核心:

* Code maturity level options
Prompt for development and/or incomplete code/drivers (CONFIG_EXPERIMENTAL) [Y/n/?]
* Loadable module support
Enable loadable module support (CONFIG_MODULES) [N/y/?]
* Processor type and features
Processor family (386, 486, 586/K5/5x86/6x86/6x86MX, Pentium-Classic, Pentium-MM
X, Pentium-Pro/Celeron/Pentium-II, Pentium-III/Celeron(Coppermine), Pentium-4, K
6/K6-II/K6-III, Athlon/Duron/K7, Crusoe, Winchip-C6, Winchip-2, Winchip-2A/Winch
ip-3, CyrixIII/C3) [Pentium-Pro/Celeron/Pentium-II]
* General setup
Networking support (CONFIG_NET) [Y/n/?]
PCI support (CONFIG_PCI) [Y/n/?]
PCI access mode (BIOS, Direct, Any) [Any]
defined CONFIG_PCI_GOANY
PCI device name database (CONFIG_PCI_NAMES) [Y/n/?]
System V IPC (CONFIG_SYSVIPC) [Y/n/?]
Sysctl support (CONFIG_SYSCTL) [Y/n/?]
Kernel core (/proc/kcore) format (ELF, A.OUT) [ELF]
defined CONFIG_KCORE_ELF
* Plug and Play configuration
Plug and Play support (CONFIG_PNP) [Y/n/?]
* Block devices
Normal PC floppy disk support (CONFIG_BLK_DEV_FD) [Y/n/?]
* Networking options
Kernel/User netlink socket (CONFIG_NETLINK) [Y/n/?]
Routing messages (CONFIG_RTNETLINK) [Y/n/?]
Network packet filtering (replaces ipchains) (CONFIG_NETFILTER) [Y/n/?]
Unix domain sockets (CONFIG_UNIX) [Y/n/?]
TCP/IP networking (CONFIG_INET) [Y/n/?]
IP: advanced router (CONFIG_IP_ADVANCED_ROUTER) [Y/n/?]
IP: policy routing (CONFIG_IP_MULTIPLE_TABLES) [Y/n/?]
IP: use netfilter MARK value as routing key (CONFIG_IP_ROUTE_FWMARK) [Y/n/?]
IP: fast network address translation (CONFIG_IP_ROUTE_NAT) [Y/n/?]
IP: equal cost multipath (CONFIG_IP_ROUTE_MULTIPATH) [Y/n/?]
* IP: Netfilter Configuration
Connection tracking (required for masq/NAT) (CONFIG_IP_NF_CONNTRACK) [Y/n/?]
FTP protocol support (CONFIG_IP_NF_FTP) [Y/n/?]
IP tables support (required for filtering/masq/NAT) (CONFIG_IP_NF_IPTABLES) [Y/n/?]
limit match support (CONFIG_IP_NF_MATCH_LIMIT) [Y/n/?]
Multiple port match support (CONFIG_IP_NF_MATCH_MULTIPORT) [Y/n/?]
Connection state match support (CONFIG_IP_NF_MATCH_STATE) [Y/n/?]
Packet filtering (CONFIG_IP_NF_FILTER) [Y/n/?]
Full NAT (CONFIG_IP_NF_NAT) [Y/n/?]
REDIRECT target support (CONFIG_IP_NF_TARGET_REDIRECT) [Y/n/?]
LOG target support (CONFIG_IP_NF_TARGET_LOG) [Y/n/?]
ATA/IDE/MFM/RLL support (CONFIG_IDE) [Y/n/?]
* IDE, ATA and ATAPI Block devices
Enhanced IDE/MFM/RLL disk/cdrom/tape/floppy support (CONFIG_BLK_DEV_IDE) [Y/n/?]
Include IDE/ATA-2 DISK support (CONFIG_BLK_DEV_IDEDISK) [Y/n/?]
Use multi-mode by default (CONFIG_IDEDISK_MULTI_MODE) [Y/n/?]
Include IDE/ATAPI CDROM support (CONFIG_BLK_DEV_IDECD) [Y/n/?]
* SCSI support
SCSI support (CONFIG_SCSI) [Y/n/?]
* SCSI support type (disk, tape, CD-ROM)
SCSI disk support (CONFIG_BLK_DEV_SD) [Y/n/?]
Maximum number of SCSI disks that can be loaded as modules (CONFIG_SD_EXTRA_DEVS) [8]
* Some SCSI devices (e.g. CD jukebox) support multiple LUNs
Enable extra checks in new queueing code (CONFIG_SCSI_DEBUG_QUEUES) [Y/n/?]
* SCSI low-level drivers
AMI MegaRAID support (CONFIG_SCSI_MEGARAID) [Y/n/?]
SYM53C8XX SCSI support (CONFIG_SCSI_SYM53C8XX) [Y/n/?]
default tagged command queue depth (CONFIG_SCSI_NCR53C8XX_DEFAULT_TAGS) [4]
maximum number of queued commands (CONFIG_SCSI_NCR53C8XX_MAX_TAGS) [32]
synchronous transfers frequency in MHz (CONFIG_SCSI_NCR53C8XX_SYNC) [80]
* Network device support
Network device support (CONFIG_NETDEVICES) [Y/n/?]
* Ethernet (10 or 100Mbit)
Ethernet (10 or 100Mbit) (CONFIG_NET_ETHERNET) [Y/n/?]
EISA, VLB, PCI and on board controllers (CONFIG_NET_PCI) [Y/n/?]
EtherExpressPro/100 support (CONFIG_EEPRO100) [Y/n/?]
* Input core support
Input core support (CONFIG_INPUT) [Y/n/?]
Keyboard support (CONFIG_INPUT_KEYBDEV) [Y/n/?]
* Character devices
Virtual terminal (CONFIG_VT) [Y/n/?]
Support for console on virtual terminal (CONFIG_VT_CONSOLE) [Y/n/?]
Standard/generic (8250/16550 and compatible UARTs) serial support (CONFIG_SERIAL) [Y/n/?]
Unix98 PTY support (CONFIG_UNIX98_PTYS) [Y/n/?]
Maximum number of Unix98 PTYs in use (0-2048) (CONFIG_UNIX98_PTY_COUNT) [8]
* File systems
Reiserfs support (CONFIG_REISERFS_FS) [Y/n/?]
ISO 9660 CDROM file system support (CONFIG_ISO9660_FS) [Y/n/?]
/proc file system support (CONFIG_PROC_FS) [Y/n/?]
/dev/pts file system for Unix98 PTYs (CONFIG_DEVPTS_FS) [Y/n/?]
* Console drivers
VGA text console (CONFIG_VGA_CONSOLE) [Y/n/?]

這裡需要說明的是:如果要使用透明代理模式,要仔細選擇Netfilter,因為我們還得用iptables來重定向tcp包,以滿足透明代理的要求。
假如您的伺服器配置與我的不同,只需要更改相應的硬體配置引數即可,比如CPU型別、網路卡、SCSI硬碟等。

接著:
make bzImage

完成後,將 arch/i386/boot/目錄下的新核心bzImage複製到/boot/目錄下,並更名為opt:
cp arch/i386/boot/bzImage /boot/
mv /boot/bzImage /boot/opt

然後編輯lilo.conf如下所示:
boot=/dev/sda
map=/boot/map
install=/boot/boot.b
prompt
timeout=50
message=/boot/message
default=opt

image=/boot/vmlinuz-2.4.2-2
label=linux
initrd=/boot/initrd-2.4.2-2.img
read-only
root=/dev/sda1

image=/boot/opt
label=opt
read-only
root=/dev/sda1

最後執行:
# lilo
Added linux
Added opt *

好了,這樣我們就可以用新核心啟動了,您可以發現,這樣自己編譯的核心要小的多,也快得多。

三、 使用reiserfs檔案系統

有人做過測試,在相同條件下,如果cache分割槽使用reiserfs檔案系統,效能要比使用ext2的高出20%,所以我們將在cache分割槽中採用reiserfs檔案系統。在上一步中,我們已經在核心中提供了對reiserfs的支援,下面我們要做的,就是將原來的cache分割槽重新格式化成reiserfs檔案系統。

首先從下載reiserfs檔案系統相關工具reiserfsprogs,然後解開該檔案:
tar xvzf reiserfsprogs-3.x.0j.tar.gz

進入新生成目錄,執行:
./configure
make
make install
這將生成mkreiserfs、reiserfsck、debugreiserfs、resize_reiserfs四個reiserfs的工具。

完成後我們將reiserfs工具安裝成功了。這時,假設原來的cache分割槽為/dev/sda7,所裝載的目錄為/cache,在對其格式化之前,我們要先umount 原來的分割槽:
umount /cahce

對分割槽格式化,我們執行:
mkreiserfs –h r5 /de/sda7

完成後我們修改/etc/fstab,將/cache一行改為:
/dev/sda7 /cache reiserfs notail,noatime 0 0
然後重啟動。

四、 重新編譯squid

經過大量的測試表明:squid-2.2.STABLE5+hno補丁的組合要比2.3或者是其他版本的squid都要穩定的多、效率也要高的多,如果您不相信可以自己化幾天時間做一下測試。所以我們將採用這個版本的squid。
首先從下載squid-2.2.STABLE5-src.tar.gz, 從下載squid-2.2.STABLE5-hno.20000202.snapshot.gz補丁,然後分別解開這兩個包:
tar xvzf squid-2.2.STABLE5-src.tar.gz
gunzip –d squid-2.2.STABLE5-hno.20000202.snapshot.gz

然後打補丁:
cd squid-2.2.STABLE5
patch –p1 < ../ squid-2.2.STABLE5-hno.20000202.snapshot

接下來,就可以開始編譯squid了,在採用非同步io(多執行緒模式)之外,我們本著這樣一個原則:那就是去掉一切不需要的功能,如下所示:
./configure --prefix=/usr --exec_prefix=/usr --bindir=/usr/sbin --libexecdir=/usr/lib/squid --localstatedir=/var --sysconfdir=/etc/squid --mandir=/usr/share/man --enable-async-io=20 --disable-icmp --disable-delay-pools --disable-mem-gen-trace --disable-useragent-log --enable-kill-parent-hack --disable-arp-acl --enable-poll --disable-ident-lookups

make
make install

其中,--enable-async-io=20說明我們採用非同步io,並採用18個執行緒。
編譯透過後,我們就可以開始配置squid了。

五、 最佳化squid配置

以下是我的squid.conf及相關解釋:

#取消對代理陣列的支援
icp_port 0

#對日誌檔案和pid檔案位置進行設定
cache_store_log none
cache_access_log /var/log/squid/access.log
cache_log /var/log/squid/cache.log
emulate_httpd_log on
pid_filename /var/run/squid.pid

#設定執行時的使用者和組許可權
cache_effective_user squid
cache_effective_group squid

#設定管理資訊
visible_hostname proxy.yxtc.edu.cn
cache_mgr

#設定監聽地址和埠
http_port 3128
tcp_incoming_address x.x.x.x
udp_incoming_address x.x.x.x

#見下面補充說明
cache_mem 32 MB
cache_dir /cache 6000 14 256

#設定cache物件超時時間
reference_age 3 months

#訪問控制設定
acl mynet src 192.168.1.0/255.255.255.0
acl all src 0.0.0.0/0.0.0.0
http_access allow mynet
http_access deny all

#透明代理設定
httpd_accel_host virtual
httpd_accel_port 80
httpd_accel_with_proxy on
httpd_accel_uses_host_header on

#swap 效能微調
half_closed_clients off
cache_swap_high 100%
cache_swap_low 80%
maximum_object_size 1024 KB

#見補充說明
refresh_pattern -i .html 1440 90% 129600 reload-into-ims
refresh_pattern -i .shtml 1440 90% 129600 reload-into-ims
refresh_pattern -i .hml 1440 90% 129600 reload-into-ims
refresh_pattern -i .gif 1440 90% 129600 reload-into-ims
refresh_pattern -i .swf 1440 90% 129600 reload-into-ims
refresh_pattern -i .jpg 1440 90% 129600 reload-into-ims
refresh_pattern -i .png 1440 90% 129600 reload-into-ims
refresh_pattern -i .bmp 1440 90% 129600 reload-into-ims
refresh_pattern -i .js 1440 90% 129600 reload-into-ims

補充說明:

1.cache_mem 32 MB
注意:cache_mem並不是squid所能使用記憶體的大小,而是squid使用者hot object的實體記憶體的大小,所以這個值可以小一些。

2.cache_dir /cache 6000 14 256
對於第一級子目錄和第二級子目錄的計算方法,可以參考筆者以前的文章《用LINUX架設代理伺服器(上)(中)(下)》;

3.refresh_pattern -i .html 1440 90% 129600 reload-into-ims等
這幾句其實是強行控制物件的超時時間,這違反了http協議的精神,但是在頻寬較窄的場合,可以提高明顯系統相應時間。

4.注意/cache目錄及日誌檔案的許可權,其所有使用者和所有組必須為squid;

5.可以採用rpm包的指令碼/etc/rc.d/init.d/squid控制squid,也可以採用squid命令控制,具體可以參考squid –h

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10617731/viewspace-952548/,如需轉載,請註明出處,否則將追究法律責任。

相關文章