Nginx502錯誤原因和解決方法總結
一、NGINX 502錯誤排查
NGINX 502 Bad Gateway錯誤是FastCGI有問題,造成NGINX 502錯誤的可能性比較多。將網上找到的一些和502 Bad Gateway錯誤有關的問題和排查方法列一下,先從FastCGI配置入手:
1.FastCGI程式是否已經啟動
2.FastCGI worker程式數是否不夠
執行 netstat -anpo | grep “php-cgi” | wc -l 判斷是否接近FastCGI程式,接近配置檔案中設定的數值,表明worker程式數設定太少
3.FastCGI執行時間過長
根據實際情況調高以下引數值
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
4.FastCGI Buffer不夠
nginx和apache一樣,有前端緩衝限制,可以調整緩衝引數
fastcgi_buffer_size 32k;
fastcgi_buffers 8 32k;
5.Proxy Buffer不夠
如果你用了Proxying,調整
proxy_buffer_size 16k;
proxy_buffers 4 16k;
參見:http://www.server110.com
6.https轉發配置錯誤
正確的配置方法
server_name www.mydomain.com;
location /myproj/repos {
set $fixed_destination $http_destination;
if ( $http_destination ~* ^https(.*)$ )
{
set $fixed_destination http$1;
}
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header Destination $fixed_destination;
proxy_pass http://subversion_hosts;
}
當然,還要看你後端用的是哪種型別的FastCGI,我用過的有php-fpm,流量約為單臺機器40萬PV(動態頁面), 現在基本上沒有碰到502。
7.php指令碼執行時間過長
將php-fpm.conf的<value name=”request_terminate_timeout”>0s</value>的0s改成一個時間
二、Nginx 413錯誤的排查:修改上傳檔案大小限制
在上傳時nginx返回了413錯誤,檢視log檔案,顯示的錯誤資訊是:”413 Request Entity Too Large”, 於是在網上找了下“nginx 413錯誤”發現需要做以下設定:
在nginx.conf增加 client_max_body_size的相關設定, 這個值預設是1m,可以增加到8m以增加提高檔案大小限制;
如果執行的是php,那麼還要檢查php.ini,這個大小client_max_body_size要和php.ini中的如下值的最大值一致或者稍大,這樣就不會因為提交資料大小不一致出現的錯誤。
post_max_size = 8M
upload_max_filesize = 2M
三、Nginx 400錯誤排查:HTTP頭/Cookie過大
今天有人彙報nginx的HTTP400錯誤,而且這個HTTP400錯誤並不是每次都會出現的,查了一下發現nginx400錯誤是由於request header過大,通常是由於cookie中寫入了較長的字串所引起的。
解決方法是不要在cookie裡記錄過多資料,如果實在需要的話可以考慮調整在nginx.conf中的client_header_buffer_size(預設1k)
若cookie太大,可能還需要調整large_client_header_buffers(預設4k),該引數說明如下:
請求行如果超過buffer,就會報HTTP 414錯誤(URI Too Long)
nginx接受最長的HTTP頭部大小必須比其中一個buffer大,否則就會報400的HTTP錯誤(Bad Request)。
/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
Nginx 502 Bad Gateway的含義是請求的PHP-CGI已經執行,但是由於某種原因(一般是讀取資源的問題)沒有執行完畢而導致PHP-CGI程式終止。
Nginx 504 Gateway Time-out的含義是所請求的閘道器沒有請求到,簡單來說就是沒有請求到可以執行的PHP-CGI。
解決這兩個問題其實是需要綜合思考的,一般來說Nginx 502 Bad Gateway和php-fpm.conf的設定有關,而Nginx 504 Gateway Time-out則是與nginx.conf的設定有關。
而正確的設定需要考慮伺服器自身的效能和訪客的數量等多重因素。
以我目前的伺服器為例子CPU是奔四1.5G的,記憶體1GB,CENTOS的系統,訪客大概是50人左右同時線上。
但是線上的人大都需要請求PHP-CGI進行大量的資訊處理,因此我將nginx.conf設定為:
fastcgi_connect_timeout 300s;
fastcgi_send_timeout 300s;
fastcgi_read_timeout 300s;
fastcgi_buffer_size 128k;
fastcgi_buffers 8 128k;#8 128
fastcgi_busy_buffers_size 256k;
fastcgi_temp_file_write_size 256k;
fastcgi_intercept_errors on;
這裡最主要的設定是前三條,即
fastcgi_connect_timeout 300s;
fastcgi_send_timeout 300s;
fastcgi_read_timeout 300s;
這裡規定了PHP-CGI的連線、傳送和讀取的時間,300秒足夠用了,因此我的伺服器很少出現504 Gateway Time-out這個錯誤。最關鍵的是php-fpm.conf的設定,這個會直接導致502 Bad Gateway和504 Gateway Time-out。
下面我們來仔細分析一下php-fpm.conf幾個重要的引數:
php-fpm.conf有兩個至關重要的引數,一個是”max_children”,另一個是”request_terminate_timeout”
我的兩個設定的值一個是”40″,一個是”900″,但是這個值不是通用的,而是需要自己計算的。
計算的方式如下:
如果你的伺服器效能足夠好,且寬頻資源足夠充足,PHP指令碼沒有系迴圈或BUG的話你可以直接將”request_terminate_timeout”設定成0s。0s的含義是讓PHP-CGI一直執行下去而沒有時間限制。而如果你做不到這一點,也就是說你的PHP-CGI可能出現某個BUG,或者你的寬頻不夠充足或者其他的原因導致你的PHP-CGI能夠假死那麼就建議你給”request_terminate_timeout”賦一個值,這個值可以根據你伺服器的效能進行設定。一般來說效能越好你可以設定越高,20分鐘-30分鐘都可以。由於我的伺服器PHP指令碼需要長時間執行,有的可能會超過10分鐘因此我設定了900秒,這樣不會導致PHP-CGI死掉而出現502 Bad gateway這個錯誤。
而”max_children”這個值又是怎麼計算出來的呢?這個值原則上是越大越好,php-cgi的程式多了就會處理的很快,排隊的請求就會很少。設定”max_children”也需要根據伺服器的效能進行設定,一般來說一臺伺服器正常情況下每一個php-cgi所耗費的記憶體在20M左右,因此我的”max_children”我設定成40個,20M*40=800M也就是說在峰值的時候所有PHP-CGI所耗記憶體在800M以內,低於我的有效記憶體1Gb。而如果我的”max_children”設定的較小,比如5-10個,那麼php-cgi就會“很累”,處理速度也很慢,等待的時間也較長。如果長時間沒有得到處理的請求就會出現504 Gateway Time-out這個錯誤,而正在處理的很累的那幾個php-cgi如果遇到了問題就會出現502 Bad gateway這個錯誤。
////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
nginx中配置php fastcgi組解決莫名其妙的502 Bad Gateway錯誤
一般nginx搭配php都採用這樣的方式:
location ~ .php$ {
proxy_pass http://localhost:9000;
fastcgi_param SCRIPT_FILENAME /data/_hongdou$fastcgi_script_name;
include fastcgi_params;
}
這個方式只能連線到一組spawn-fcgi開啟的fastcgi,在伺服器負載稍高時常常出現502 bad gateway錯誤。
起先懷疑這是php-cgi的程式開得太少,增加後仍然有反映時常有錯,偶然間發現php-cgi會報出這樣的錯誤:
zend_mm_heap corrupted
看來是php-cgi在執行某些程式碼時有問題,以致於該執行緒中止。
在伺服器上可能還會看到php-cgi程式在不斷變少,估計是出現錯誤的php-cgi的程式自動退出了。
php的問題總是不太容易能解決,所以在nginx方面想想辦法,nginx的好處是它總是能爆出一些稀奇古怪的做法出來。
在nginx的proxy中,規避莫名其妙錯誤的辦法無非是proxy到一個upstream的伺服器組中,然後配置 proxy_next_upstream,讓nginx遇到某種錯誤碼時,自動跳到下一個後端上。這樣,應用伺服器即使不穩定,但是在nginx後面就變成了穩定服務。想到nginx的fastcgi和proxy是一路東西,所以proxy能用的經驗,移植到fastcgi也能跑得起來。
照著這個思路,用spawn-fcgi多開同樣一組php程式,所不同的僅僅是埠:
spawn-fcgi -a 127.0.0.1 -p 9000 -u nobody -f php-cgi -C 100
spawn-fcgi -a 127.0.0.1 -p 9001 -u nobody -f php-cgi -C 100
然後把fastcgi的這段配置改成用upstream的方式:
upstream backend {
server 127.0.0.1:9000;
server 127.0.0.1:9001;
}
location ~ .php$ {
fastcgi_pass backend;
fastcgi_param SCRIPT_FILENAME /data/_hongdou$fastcgi_script_name;
include fastcgi_params;
}
檢查配置結果正確,能跑起來;同時在伺服器上netstat -n|grep 9000和grep 9001都有記錄,證明連線無誤;在前臺查閱頁面,一切執行正常。
這個配置是最簡單的配置,既然能連線上upstream,那麼很顯然upstream的一些東西都可以拿來用,比如ip_hash、weight、max_fails等。
這樣的配置在單機下不知能不能共享session,沒有測試,如果有問題,可以加上ip_hash,或者配置php把session存進memcached中。
然後就是fastcgi_next_upstream的配置,nginx wiki中沒有介紹到這個配置,查了一下,在nginx的CHANGES中有提到,而且出生年月是和proxy_next_upstream一樣的。既然如此,那就照proxy_next_upstream一樣配吧。一般按預設的值error timeout就可以工作,因為php出現502錯誤的異常是返回的500錯誤,所以我把fastcgi_next_upstream定為:
fastcgi_next_upstream error timeout invalid_header http_500;
通過這個配置,就可以基本杜絕任何時常性的500錯誤,出問題的機率會變小很多,如果客戶反映仍然激烈,那麼就多增加幾組fastcgi程式。
以上配置能夠杜絕由於php所引起的“莫名其妙”的時常性的502錯誤,同時可使nginx搭配php比從前方式更為強悍。假如nginx還是返回502錯誤,那這次就一定是出現伺服器掛掉或其它嚴重問題的了。
本文轉自 陳小龍哈 51CTO部落格,原文連結:http://blog.51cto.com/chenxiaolong/1898253
相關文章
- ora-371錯誤的原因和解決方法
- 華納雲內部伺服器500錯誤原因和解決方法伺服器
- PRKC-1002錯誤問題原因和解決方法
- Win10系統寬頻連線錯誤676的原因和解決方法Win10
- 【FAQ】華為帳號服務報錯 907135701的常見原因總結和解決方法
- 伺服器出現500錯誤的原因和解決辦法伺服器
- Win10電腦打不開檔案提示“錯誤2755”的原因和解決方法Win10
- BlueHost SSH連線常見錯誤和解決方法
- mysql錯誤解決總結MySql
- 造成跨域的原因和解決方法跨域
- 引起索引失效的原因和解決方法索引
- 粘包問題原因和解決方法
- MySQL常見錯誤分析與解決方法總結MySql
- Win7電腦開機提示致命錯誤C0000034的原因和解決方法Win7
- ORA-01502錯誤成因和解決方法
- 雲伺服器出現502錯誤的原因分析和解決方案伺服器
- 路由不定時丟包原因和解決方法路由
- 報錯No bean named ' is defined的原因和解決方案Bean
- ORA-01502 state unusable錯誤成因和解決方法
- ORA-04031錯誤分析和解決
- 資料庫連線錯誤的原因及解決方法資料庫
- c++連結錯誤原因整理C++
- CentOS 7 "線纜被拔出"的原因和解決方法CentOS
- 【MySQL】Got fatal error 1236原因和解決方法MySqlGoError
- LoadRunner在執行時常見的提示錯誤和解決方法
- ORA-01502 index state unusable錯誤成因和解決方法Index
- Win10系統寬頻連線651錯誤程式碼的原因和解決方案Win10
- npm錯誤總結NPM
- ORA-00214 錯誤產生原因與解決方法
- VNI—2015:驗證錯誤 的解決方法總結 (轉)
- 寬頻連線錯誤解決方法總彙
- Linux環境下段錯誤的產生原因及除錯方法小結Linux除錯
- Oracle 錯誤總結及問題解決 ORAOracle
- php7 使用 phpunit 部分錯誤和解決方案PHP
- Java web錯誤總結~JavaWeb
- TimesTen錯誤總結
- IE不能上網瀏覽的常見原因和解決方法
- Nginx常見錯誤程式碼總結和分析方法Nginx