Nginx502錯誤原因和解決方法總結

技術小牛人發表於2017-11-22

一、NGINX 502錯誤排查

NGINX 502 Bad Gateway錯誤是FastCGI有問題，造成NGINX 502錯誤的可能性比較多。將網上找到的一些和502 Bad Gateway錯誤有關的問題和排查方法列一下，先從FastCGI配置入手：
1.FastCGI程式是否已經啟動
2.FastCGI worker程式數是否不夠

執行 netstat -anpo | grep “php-cgi” | wc -l 判斷是否接近FastCGI程式，接近配置檔案中設定的數值，表明worker程式數設定太少
3.FastCGI執行時間過長

根據實際情況調高以下引數值

fastcgi_connect_timeout 300;

fastcgi_send_timeout 300;

fastcgi_read_timeout 300;
4.FastCGI Buffer不夠

nginx和apache一樣，有前端緩衝限制，可以調整緩衝引數

fastcgi_buffer_size 32k;

fastcgi_buffers 8 32k;
5.Proxy Buffer不夠

如果你用了Proxying，調整

proxy_buffer_size 16k;

proxy_buffers 4 16k;

參見：http://www.server110.com
6.https轉發配置錯誤

正確的配置方法

server_name www.mydomain.com;

location /myproj/repos {

set $fixed_destination $http_destination;

if ( $http_destination ~* ^https(.*)$ )

{

set $fixed_destination http$1;

}

proxy_set_header Host $host;

proxy_set_header X-Real-IP $remote_addr;

proxy_set_header Destination $fixed_destination;

proxy_pass http://subversion_hosts;

}

當然，還要看你後端用的是哪種型別的FastCGI，我用過的有php-fpm，流量約為單臺機器40萬PV(動態頁面), 現在基本上沒有碰到502。

7.php指令碼執行時間過長

將php-fpm.conf的<value name=”request_terminate_timeout”>0s</value>的0s改成一個時間

二、Nginx 413錯誤的排查:修改上傳檔案大小限制

在上傳時nginx返回了413錯誤，檢視log檔案，顯示的錯誤資訊是:”413 Request Entity Too Large”, 於是在網上找了下“nginx 413錯誤”發現需要做以下設定：

在nginx.conf增加 client_max_body_size的相關設定, 這個值預設是1m，可以增加到8m以增加提高檔案大小限制；

如果執行的是php，那麼還要檢查php.ini，這個大小client_max_body_size要和php.ini中的如下值的最大值一致或者稍大，這樣就不會因為提交資料大小不一致出現的錯誤。

post_max_size = 8M

upload_max_filesize = 2M

三、Nginx 400錯誤排查：HTTP頭/Cookie過大

今天有人彙報nginx的HTTP400錯誤，而且這個HTTP400錯誤並不是每次都會出現的，查了一下發現nginx400錯誤是由於request header過大，通常是由於cookie中寫入了較長的字串所引起的。

解決方法是不要在cookie裡記錄過多資料，如果實在需要的話可以考慮調整在nginx.conf中的client_header_buffer_size(預設1k)

若cookie太大，可能還需要調整large_client_header_buffers(預設4k)，該引數說明如下：

請求行如果超過buffer，就會報HTTP 414錯誤(URI Too Long)

nginx接受最長的HTTP頭部大小必須比其中一個buffer大，否則就會報400的HTTP錯誤(Bad Request)。

/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

Nginx 502 Bad Gateway的含義是請求的PHP-CGI已經執行，但是由於某種原因（一般是讀取資源的問題）沒有執行完畢而導致PHP-CGI程式終止。

Nginx 504 Gateway Time-out的含義是所請求的閘道器沒有請求到，簡單來說就是沒有請求到可以執行的PHP-CGI。

解決這兩個問題其實是需要綜合思考的，一般來說Nginx 502 Bad Gateway和php-fpm.conf的設定有關，而Nginx 504 Gateway Time-out則是與nginx.conf的設定有關。

而正確的設定需要考慮伺服器自身的效能和訪客的數量等多重因素。

以我目前的伺服器為例子CPU是奔四1.5G的，記憶體1GB，CENTOS的系統，訪客大概是50人左右同時線上。

但是線上的人大都需要請求PHP-CGI進行大量的資訊處理，因此我將nginx.conf設定為：

fastcgi_connect_timeout 300s;

fastcgi_send_timeout 300s;

fastcgi_read_timeout 300s;

fastcgi_buffer_size 128k;

fastcgi_buffers 8 128k;#8 128

fastcgi_busy_buffers_size 256k;

fastcgi_temp_file_write_size 256k;

fastcgi_intercept_errors on;

這裡最主要的設定是前三條，即

fastcgi_connect_timeout 300s;

fastcgi_send_timeout 300s;

fastcgi_read_timeout 300s;

這裡規定了PHP-CGI的連線、傳送和讀取的時間，300秒足夠用了，因此我的伺服器很少出現504 Gateway Time-out這個錯誤。最關鍵的是php-fpm.conf的設定，這個會直接導致502 Bad Gateway和504 Gateway Time-out。

下面我們來仔細分析一下php-fpm.conf幾個重要的引數：

php-fpm.conf有兩個至關重要的引數，一個是”max_children”,另一個是”request_terminate_timeout”

我的兩個設定的值一個是”40″，一個是”900″，但是這個值不是通用的，而是需要自己計算的。

計算的方式如下：

如果你的伺服器效能足夠好，且寬頻資源足夠充足，PHP指令碼沒有系迴圈或BUG的話你可以直接將”request_terminate_timeout”設定成0s。0s的含義是讓PHP-CGI一直執行下去而沒有時間限制。而如果你做不到這一點，也就是說你的PHP-CGI可能出現某個BUG，或者你的寬頻不夠充足或者其他的原因導致你的PHP-CGI能夠假死那麼就建議你給”request_terminate_timeout”賦一個值，這個值可以根據你伺服器的效能進行設定。一般來說效能越好你可以設定越高，20分鐘-30分鐘都可以。由於我的伺服器PHP指令碼需要長時間執行，有的可能會超過10分鐘因此我設定了900秒，這樣不會導致PHP-CGI死掉而出現502 Bad gateway這個錯誤。

而”max_children”這個值又是怎麼計算出來的呢？這個值原則上是越大越好，php-cgi的程式多了就會處理的很快，排隊的請求就會很少。設定”max_children”也需要根據伺服器的效能進行設定，一般來說一臺伺服器正常情況下每一個php-cgi所耗費的記憶體在20M左右，因此我的”max_children”我設定成40個，20M*40=800M也就是說在峰值的時候所有PHP-CGI所耗記憶體在800M以內，低於我的有效記憶體1Gb。而如果我的”max_children”設定的較小，比如5-10個，那麼php-cgi就會“很累”，處理速度也很慢，等待的時間也較長。如果長時間沒有得到處理的請求就會出現504 Gateway Time-out這個錯誤，而正在處理的很累的那幾個php-cgi如果遇到了問題就會出現502 Bad gateway這個錯誤。

////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

nginx中配置php fastcgi組解決莫名其妙的502 Bad Gateway錯誤

一般nginx搭配php都採用這樣的方式：

location ~ .php$ {

proxy_pass        http://localhost:9000;

fastcgi_param   SCRIPT_FILENAME   /data/_hongdou$fastcgi_script_name;

include        fastcgi_params;

}

這個方式只能連線到一組spawn-fcgi開啟的fastcgi，在伺服器負載稍高時常常出現502 bad gateway錯誤。

起先懷疑這是php-cgi的程式開得太少，增加後仍然有反映時常有錯，偶然間發現php-cgi會報出這樣的錯誤：

zend_mm_heap corrupted

看來是php-cgi在執行某些程式碼時有問題，以致於該執行緒中止。

在伺服器上可能還會看到php-cgi程式在不斷變少，估計是出現錯誤的php-cgi的程式自動退出了。

php的問題總是不太容易能解決，所以在nginx方面想想辦法，nginx的好處是它總是能爆出一些稀奇古怪的做法出來。

在nginx的proxy中，規避莫名其妙錯誤的辦法無非是proxy到一個upstream的伺服器組中，然後配置 proxy_next_upstream，讓nginx遇到某種錯誤碼時，自動跳到下一個後端上。這樣，應用伺服器即使不穩定，但是在nginx後面就變成了穩定服務。想到nginx的fastcgi和proxy是一路東西，所以proxy能用的經驗，移植到fastcgi也能跑得起來。

照著這個思路，用spawn-fcgi多開同樣一組php程式，所不同的僅僅是埠：

spawn-fcgi -a 127.0.0.1 -p 9000 -u nobody -f php-cgi -C 100

spawn-fcgi -a 127.0.0.1 -p 9001 -u nobody -f php-cgi -C 100

然後把fastcgi的這段配置改成用upstream的方式：

upstream backend {

server 127.0.0.1:9000;

server 127.0.0.1:9001;

}

location ~ .php$ {

fastcgi_pass        backend;

fastcgi_param   SCRIPT_FILENAME   /data/_hongdou$fastcgi_script_name;

include        fastcgi_params;

}

檢查配置結果正確，能跑起來；同時在伺服器上netstat -n|grep 9000和grep 9001都有記錄，證明連線無誤；在前臺查閱頁面，一切執行正常。

這個配置是最簡單的配置，既然能連線上upstream，那麼很顯然upstream的一些東西都可以拿來用，比如ip_hash、weight、max_fails等。

這樣的配置在單機下不知能不能共享session，沒有測試，如果有問題，可以加上ip_hash，或者配置php把session存進memcached中。

然後就是fastcgi_next_upstream的配置，nginx wiki中沒有介紹到這個配置，查了一下，在nginx的CHANGES中有提到，而且出生年月是和proxy_next_upstream一樣的。既然如此，那就照proxy_next_upstream一樣配吧。一般按預設的值error timeout就可以工作，因為php出現502錯誤的異常是返回的500錯誤，所以我把fastcgi_next_upstream定為：

fastcgi_next_upstream error timeout invalid_header http_500;

通過這個配置，就可以基本杜絕任何時常性的500錯誤，出問題的機率會變小很多，如果客戶反映仍然激烈，那麼就多增加幾組fastcgi程式。

以上配置能夠杜絕由於php所引起的“莫名其妙”的時常性的502錯誤，同時可使nginx搭配php比從前方式更為強悍。假如nginx還是返回502錯誤，那這次就一定是出現伺服器掛掉或其它嚴重問題的了。

本文轉自陳小龍哈 51CTO部落格，原文連結:http://blog.51cto.com/chenxiaolong/1898253

ora-371錯誤的原因和解決方法
2011-11-13
華納雲內部伺服器500錯誤原因和解決方法
2023-10-23
伺服器
PRKC-1002錯誤問題原因和解決方法
2013-12-13
Win10系統寬頻連線錯誤676的原因和解決方法
2015-11-26
Win10
【FAQ】華為帳號服務報錯 907135701的常見原因總結和解決方法
2022-07-04
伺服器出現500錯誤的原因和解決辦法
2023-01-28
伺服器
Win10電腦打不開檔案提示“錯誤2755”的原因和解決方法
2020-06-19
Win10
BlueHost SSH連線常見錯誤和解決方法
2020-08-27
mysql錯誤解決總結
2016-03-10
MySql
造成跨域的原因和解決方法
2017-01-13
跨域
引起索引失效的原因和解決方法
2011-08-25
索引
粘包問題原因和解決方法
2024-11-04
MySQL常見錯誤分析與解決方法總結
2015-06-25
MySql
Win7電腦開機提示致命錯誤C0000034的原因和解決方法
2019-03-18
Win7
ORA-01502錯誤成因和解決方法
2017-10-24
雲伺服器出現502錯誤的原因分析和解決方案
2019-09-23
伺服器
路由不定時丟包原因和解決方法
2016-09-28
路由
報錯No bean named ' is defined的原因和解決方案
2018-02-08
Bean
ORA-01502 state unusable錯誤成因和解決方法
2013-04-09
ORA-04031錯誤分析和解決
2008-04-22
資料庫連線錯誤的原因及解決方法
2024-10-08
資料庫
c++連結錯誤原因整理
2018-06-21
C++
CentOS 7 "線纜被拔出"的原因和解決方法
2019-05-11
CentOS
【MySQL】Got fatal error 1236原因和解決方法
2015-06-27
MySqlGoError
LoadRunner在執行時常見的提示錯誤和解決方法
2014-03-05
ORA-01502 index state unusable錯誤成因和解決方法
2012-05-30
Index
Win10系統寬頻連線651錯誤程式碼的原因和解決方案
2016-02-25
Win10
npm錯誤總結
2016-05-12
NPM
ORA-00214 錯誤產生原因與解決方法
2010-06-05
VNI—2015：驗證錯誤的解決方法總結 (轉)
2007-08-15
寬頻連線錯誤解決方法總彙
2016-08-30
Linux環境下段錯誤的產生原因及除錯方法小結
2018-03-09
Linux除錯
Oracle 錯誤總結及問題解決 ORA
2018-08-21
Oracle
php7 使用 phpunit 部分錯誤和解決方案
2019-02-16
PHP
Java web錯誤總結~
2016-11-16
JavaWeb
TimesTen錯誤總結
2011-05-04
IE不能上網瀏覽的常見原因和解決方法
2006-09-08
Nginx常見錯誤程式碼總結和分析方法
2017-03-23
Nginx

Nginx502錯誤原因和解決方法總結

相關文章