為什麼Nginx的效能要比Apache高很多？

oschina發表於2016-03-17

NginxApache

為什麼Nginx的效能要比Apache高很多？這得益於Nginx使用了最新的epoll（Linux 2.6核心）和kqueue（freebsd）網路I/O模型，而Apache則使用的是傳統的select模型。

目前Linux下能夠承受高併發訪問的Squid、Memcached都採用的是epoll網路I/O模型。

處理大量的連線的讀寫，Apache所採用的select網路I/O模型非常低效。

下面用一個比喻來解析Apache採用的select模型和Nginx採用的epoll模型進行之間的區別：

假設你在大學讀書，住的宿舍樓有很多間房間，你的朋友要來找你。

select版宿管大媽就會帶著你的朋友挨個房間去找，直到找到你為止。

而epoll版宿管大媽會先記下每位同學的房間號，

你的朋友來時，只需告訴你的朋友你住在哪個房間即可，不用親自帶著你的朋友滿大樓找人。

如果來了10000個人，都要找自己住這棟樓的同學時，select版和epoll版宿管大媽，誰的效率更高，不言自明。

同理，在高併發伺服器中，輪詢I/O是最耗時間的操作之一，select和epoll的效能誰的效能更高，同樣十分明瞭。

epoll - I/O event notification facility

在linux的網路程式設計中，很長的時間都在使用select來做事件觸發。

在linux新的核心中，有了一種替換它的機制，就是epoll。

相比於select，epoll最大的好處在於它不會隨著監聽fd數目的增長而降低效率。

因為在核心中的select實現中，它是採用輪詢來處理的，輪詢的fd數目越多，自然耗時越多。

並且，在linux/posix_types.h標頭檔案有這樣的宣告：

#define __FD_SETSIZE    1024

表示select最多同時監聽1024個fd，當然，可以通過修改標頭檔案再重編譯核心來擴大這個數目，但這似乎並不治本。

epoll的介面非常簡單，一共就三個函式：

1. int epoll_create(int size);

建立一個epoll的控制程式碼，size用來告訴核心這個監聽的數目一共有多大。

這個引數不同於select()中的第一個引數，給出最大監聽的fd+1的值。

需要注意的是，當建立好epoll控制程式碼後，它就是會佔用一個fd值，在linux下如果檢視/proc/程式id/fd/，

是能夠看到這個fd的，所以在使用完epoll後，必須呼叫close()關閉，否則可能導致fd被耗盡。

2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

epoll的事件註冊函式，它不同與select()是在監聽事件時告訴核心要監聽什麼型別的事件，

而是在這裡先註冊要監聽的事件型別。第一個引數是epoll_create()的返回值，

第二個參數列示動作，用三個巨集來表示：

EPOLL_CTL_ADD：註冊新的fd到epfd中；

EPOLL_CTL_MOD：修改已經註冊的fd的監聽事件；

EPOLL_CTL_DEL：從epfd中刪除一個fd；

第三個引數是需要監聽的fd，第四個引數是告訴核心需要監聽什麼事，struct epoll_event結構如下：

typedef union epoll_data {
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;
struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};

events可以是以下幾個巨集的集合：

EPOLLIN ：表示對應的檔案描述符可以讀（包括對端SOCKET正常關閉）；

EPOLLOUT：表示對應的檔案描述符可以寫；

EPOLLPRI：表示對應的檔案描述符有緊急的資料可讀（這裡應該表示有帶外資料到來）；

EPOLLERR：表示對應的檔案描述符發生錯誤；

EPOLLHUP：表示對應的檔案描述符被結束通話；

EPOLLET：將EPOLL設為邊緣觸發(Edge Triggered)模式，這是相對於水平觸發(Level Triggered)來說的。

EPOLLONESHOT：只監聽一次事件，當監聽完這次事件之後，

如果還需要繼續監聽這個socket的話，需要再次把這個socket加入到EPOLL佇列裡

3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

等待事件的產生，類似於select()呼叫。

引數events用來從核心得到事件的集合，maxevents告之核心這個events有多大，這個 maxevents的值不能大於建立epoll_create()時的size，引數timeout是超時時間（毫秒，0會立即返回，-1將不確定，也有說法說是永久阻塞）。

該函式返回需要處理的事件數目，如返回0表示已超時。

4、關於ET、LT兩種工作模式：

可以得出這樣的結論：

ET模式僅當狀態發生變化的時候才獲得通知,這裡所謂的狀態的變化並不包括緩衝區中還有未處理的資料，也就是說,如果要採用ET模式,需要一直read/write直到出錯為止，很多人反映為什麼採用ET模式只接收了一部分資料就再也得不到通知了，大多因為這樣；而LT模式是隻要有資料沒有處理就會一直通知下去的。

那麼究竟如何來使用epoll呢？其實非常簡單。

通過在包含一個標頭檔案#include <sys/epoll.h> 以及幾個簡單的API將可以大大的提高你的網路伺服器的支援人數。

首先通過create_epoll(int maxfds)來建立一個epoll的控制程式碼，其中maxfds為你epoll所支援的最大控制程式碼數。

這個函式會返回一個新的epoll控制程式碼，之後的所有操作將通過這個控制程式碼來進行操作。

在用完之後，記得用close()來關閉這個建立出來的epoll控制程式碼。

之後在你的網路主迴圈裡面，每一幀的呼叫epoll_wait(int epfd, epoll_event events, int max events, int timeout)來查詢所有的網路介面，看哪一個可以讀，哪一個可以寫了。基本的語法為：

nfds = epoll_wait(kdpfd, events, maxevents, -1);

其中kdpfd為用epoll_create建立之後的控制程式碼，events是一個epoll_event*的指標，當epoll_wait這個函式操作成功之後，epoll_events裡面將儲存所有的讀寫事件。

max_events是當前需要監聽的所有socket控制程式碼數。最後一個timeout是 epoll_wait的超時，為0的時候表示馬上返回，為-1的時候表示一直等下去，直到有事件範圍，為任意正整數的時候表示等這麼長的時間，如果一直沒有事件，則範圍。一般如果網路主迴圈是單獨的執行緒的話，可以用-1來等，這樣可以保證一些效率，如果是和主邏輯在同一個執行緒的話，則可以用0來保證主迴圈的效率。

epoll_wait範圍之後應該是一個迴圈，遍利所有的事件。

幾乎所有的epoll程式都使用下面的框架：

for( ; ; )
    {
        nfds = epoll_wait(epfd,events,20,500);
        for(i=0;i<nfds;++i)
        {
            if(events[i].data.fd==listenfd) //有新的連線
            {
                connfd = accept(listenfd,(sockaddr *)&clientaddr, &clilen); //accept這個連線
                ev.data.fd=connfd;
                ev.events=EPOLLIN|EPOLLET;
                epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev); //將新的fd新增到epoll的監聽佇列中
            }
            else if( events[i].events&EPOLLIN ) //接收到資料，讀socket
            {
                n = read(sockfd, line, MAXLINE)) < 0    //讀
                ev.data.ptr = md;     //md為自定義型別，新增資料
                ev.events=EPOLLOUT|EPOLLET;
                epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);//修改識別符號，等待下一個迴圈時傳送資料，非同步處理的精髓
            }
            else if(events[i].events&EPOLLOUT) //有資料待傳送，寫socket
            {
                struct myepoll_data* md = (myepoll_data*)events[i].data.ptr;    //取資料
                sockfd = md->fd;
                send( sockfd, md->ptr, strlen((char*)md->ptr), 0 );        //傳送資料
                ev.data.fd=sockfd;
                ev.events=EPOLLIN|EPOLLET;
                epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); //修改識別符號，等待下一個迴圈時接收資料
            }
            else
            {
                //其他的處理
            }
        }
    }

為什麼nginx效能比apache效能好
2021-05-15
NginxApache
從Nginx、Apache工作原理看為什麼Nginx比Apache高效
2018-04-11
NginxApache
為什麼處理排序的陣列要比非排序的快
2019-05-22
排序陣列
Redis為什麼是單執行緒？為什麼有如此高的效能？
2019-04-08
Redis執行緒
什麼是Nginx?Linux為什麼使用Nginx?
2021-07-12
NginxLinux
為什麼Python要比其他語言更受喜歡?
2020-01-02
Python
js中為什麼for迴圈比forEach效能高？
2024-03-10
JS
為什麼很多人不跑滴滴了？
2020-09-26
為什麼很多人喜歡 Python？
2018-11-19
Python
為什麼MacBook要比普通電腦貴？差別在哪裡呢?
2020-06-17
Mac
Nginx-01-為什麼使用 Nginx? nginx 的優缺點
2024-05-14
Nginx
Nginx 為什麼這麼快？
2022-12-08
Nginx
為什麼說很多IDC企業管理效率低下
2020-11-30
html標籤種類很多，為什麼不都用div？
2019-01-21
HTML
為什麼很多人排斥中國女生嫁去外國？
2020-08-24
為什麼很多人入門選擇Python爬蟲?
2020-04-02
Python爬蟲
IT≠程式猿！為什麼很多人都想進入IT行業？
2018-11-27
行業
為什麼很多公司都不招大齡程式設計師?
2018-07-14
程式設計師
阿里巴巴為什麼選擇Apache Flink？
2018-10-15
阿里Apache
Nginx 高階篇（二）什麼是負載均衡
2020-03-17
Nginx負載
為什麼很多公司都轉型go語言開發？Go語言能做什麼
2019-04-04
Go
PostgreSQL Collation 怎麼調整，為什麼很多專案都選擇 Ctype
2023-02-13
SQL
為什麼很多人都選擇註冊新加坡基金會？
2021-10-22
為什麼有很多名人讓人們警惕人工智慧？
2018-12-24
人工智慧
為什麼很多程式設計師工作時都戴耳機？
2018-07-14
程式設計師
Apache Mesos為什麼會失敗？（黑客新聞）
2021-04-15
Apache黑客
為什麼要選擇Apache Pulsar：IO隔離
2019-03-04
Apache
Nginx代理websocket為什麼要這樣做？
2022-05-10
NginxWeb
為什麼學習HTML開發的很多人都是沒有基礎的？
2021-05-26
HTML
switch和if else if哪個效率高？為什麼很多IT程式設計師都喜歡用switch判斷？
2021-08-06
程式設計師
恆訊科技分析：Nginx是什麼意思？Nginx作為反向代理伺服器有什麼作用？
2022-11-15
Nginx伺服器
為什麼選擇高防DNS？
2022-11-01
DNS
大齡碼農經驗那麼豐富，為什麼很多公司都不招？
2018-12-03
nginx和apache的區別
2020-10-27
NginxApache
為什麼 APISIX Ingress 是比 Ingress NGINX 更好的選擇？
2023-01-17
APINginx
什麼是 Apache Kafka？
2024-06-09
ApacheKafka
【IPP SWAP】為什麼熱度這麼高
2023-05-08
為什麼學習Python，python的薪資為什麼這麼高，進去看看就知道
2019-01-05
Python
為什麼很多人會選擇學網路安全？前景如何？
2021-11-08

為什麼Nginx的效能要比Apache高很多？

1. int epoll_create(int size);

2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

4、關於ET、LT兩種工作模式：

相關文章