為什麼Nginx的效能要比Apache高很多?
為什麼Nginx的效能要比Apache高很多? 這得益於Nginx使用了最新的epoll(Linux 2.6核心)和kqueue(freebsd)網路I/O模型,而Apache則使用的是傳統的select模型。
目前Linux下能夠承受高併發訪問的Squid、Memcached都採用的是epoll網路I/O模型。
處理大量的連線的讀寫,Apache所採用的select網路I/O模型非常低效。
下面用一個比喻來解析Apache採用的select模型和Nginx採用的epoll模型進行之間的區別:
假設你在大學讀書,住的宿舍樓有很多間房間,你的朋友要來找你。
select版宿管大媽就會帶著你的朋友挨個房間去找,直到找到你為止。
而epoll版宿管大媽會先記下每位同學的房間號,
你的朋友來時,只需告訴你的朋友你住在哪個房間即可,不用親自帶著你的朋友滿大樓找人。
如果來了10000個人,都要找自己住這棟樓的同學時,select版和epoll版宿管大媽,誰的效率更高,不言自明。
同理,在高併發伺服器中,輪詢I/O是最耗時間的操作之一,select和epoll的效能誰的效能更高,同樣十分明瞭。
epoll - I/O event notification facility
在linux的網路程式設計中,很長的時間都在使用select來做事件觸發。
在linux新的核心中,有了一種替換它的機制,就是epoll。
相比於select,epoll最大的好處在於它不會隨著監聽fd數目的增長而降低效率。
因為在核心中的select實現中,它是採用輪詢來處理的,輪詢的fd數目越多,自然耗時越多。
並且,在linux/posix_types.h標頭檔案有這樣的宣告:
#define __FD_SETSIZE 1024
表示select最多同時監聽1024個fd,當然,可以通過修改標頭檔案再重編譯核心來擴大這個數目,但這似乎並不治本。
epoll的介面非常簡單,一共就三個函式:
1. int epoll_create(int size);
建立一個epoll的控制程式碼,size用來告訴核心這個監聽的數目一共有多大。
這個引數不同於select()中的第一個引數,給出最大監聽的fd+1的值。
需要注意的是,當建立好epoll控制程式碼後,它就是會佔用一個fd值,在linux下如果檢視/proc/程式id/fd/,
是能夠看到這個fd的,所以在使用完epoll後,必須呼叫close()關閉,否則可能導致fd被耗盡。
2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件註冊函式,它不同與select()是在監聽事件時告訴核心要監聽什麼型別的事件,
而是在這裡先註冊要監聽的事件型別。第一個引數是epoll_create()的返回值,
第二個參數列示動作,用三個巨集來表示:
EPOLL_CTL_ADD:註冊新的fd到epfd中;
EPOLL_CTL_MOD:修改已經註冊的fd的監聽事件;
EPOLL_CTL_DEL:從epfd中刪除一個fd;
第三個引數是需要監聽的fd,第四個引數是告訴核心需要監聽什麼事,struct epoll_event結構如下:
typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64; } epoll_data_t; struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */ };
events可以是以下幾個巨集的集合:
EPOLLIN :表示對應的檔案描述符可以讀(包括對端SOCKET正常關閉);
EPOLLOUT:表示對應的檔案描述符可以寫;
EPOLLPRI:表示對應的檔案描述符有緊急的資料可讀(這裡應該表示有帶外資料到來);
EPOLLERR:表示對應的檔案描述符發生錯誤;
EPOLLHUP:表示對應的檔案描述符被結束通話;
EPOLLET: 將EPOLL設為邊緣觸發(Edge Triggered)模式,這是相對於水平觸發(Level Triggered)來說的。
EPOLLONESHOT:只監聽一次事件,當監聽完這次事件之後,
如果還需要繼續監聽這個socket的話,需要再次把這個socket加入到EPOLL佇列裡
3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的產生,類似於select()呼叫。
引數events用來從核心得到事件的集合,maxevents告之核心這個events有多大,這個 maxevents的值不能大於建立epoll_create()時的size,引數timeout是超時時間(毫秒,0會立即返回,-1將不確定,也有說法說是永久阻塞)。
該函式返回需要處理的事件數目,如返回0表示已超時。
4、關於ET、LT兩種工作模式:
可以得出這樣的結論:
ET模式僅當狀態發生變化的時候才獲得通知,這裡所謂的狀態的變化並不包括緩衝區中還有未處理的資料,也就是說,如果要採用ET模式,需要一直read/write直到出錯為止,很多人反映為什麼採用ET模式只接收了一部分資料就再也得不到通知了,大多因為這樣;而LT模式是隻要有資料沒有處理就會一直通知下去的。
那麼究竟如何來使用epoll呢?其實非常簡單。
通過在包含一個標頭檔案#include <sys/epoll.h> 以及幾個簡單的API將可以大大的提高你的網路伺服器的支援人數。
首先通過create_epoll(int maxfds)來建立一個epoll的控制程式碼,其中maxfds為你epoll所支援的最大控制程式碼數。
這個函式會返回一個新的epoll控制程式碼,之後的所有操作將通過這個控制程式碼來進行操作。
在用完之後,記得用close()來關閉這個建立出來的epoll控制程式碼。
之後在你的網路主迴圈裡面,每一幀的呼叫epoll_wait(int epfd, epoll_event events, int max events, int timeout)來查詢所有的網路介面,看哪一個可以讀,哪一個可以寫了。基本的語法為:
nfds = epoll_wait(kdpfd, events, maxevents, -1);
其中kdpfd為用epoll_create建立之後的控制程式碼,events是一個epoll_event*的指標,當epoll_wait這個函式操作成功之後,epoll_events裡面將儲存所有的讀寫事件。
max_events是當前需要監聽的所有socket控制程式碼數。最後一個timeout是 epoll_wait的超時,為0的時候表示馬上返回,為-1的時候表示一直等下去,直到有事件範圍,為任意正整數的時候表示等這麼長的時間,如果一直沒有事件,則範圍。一般如果網路主迴圈是單獨的執行緒的話,可以用-1來等,這樣可以保證一些效率,如果是和主邏輯在同一個執行緒的話,則可以用0來保證主迴圈的效率。
epoll_wait範圍之後應該是一個迴圈,遍利所有的事件。
幾乎所有的epoll程式都使用下面的框架:
for( ; ; ) { nfds = epoll_wait(epfd,events,20,500); for(i=0;i<nfds;++i) { if(events[i].data.fd==listenfd) //有新的連線 { connfd = accept(listenfd,(sockaddr *)&clientaddr, &clilen); //accept這個連線 ev.data.fd=connfd; ev.events=EPOLLIN|EPOLLET; epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev); //將新的fd新增到epoll的監聽佇列中 } else if( events[i].events&EPOLLIN ) //接收到資料,讀socket { n = read(sockfd, line, MAXLINE)) < 0 //讀 ev.data.ptr = md; //md為自定義型別,新增資料 ev.events=EPOLLOUT|EPOLLET; epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);//修改識別符號,等待下一個迴圈時傳送資料,非同步處理的精髓 } else if(events[i].events&EPOLLOUT) //有資料待傳送,寫socket { struct myepoll_data* md = (myepoll_data*)events[i].data.ptr; //取資料 sockfd = md->fd; send( sockfd, md->ptr, strlen((char*)md->ptr), 0 ); //傳送資料 ev.data.fd=sockfd; ev.events=EPOLLIN|EPOLLET; epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); //修改識別符號,等待下一個迴圈時接收資料 } else { //其他的處理 } } }
相關文章
- 為什麼nginx效能比apache效能好NginxApache
- 從Nginx、Apache工作原理看為什麼Nginx比Apache高效NginxApache
- 為什麼處理排序的陣列要比非排序的快排序陣列
- Redis為什麼是單執行緒?為什麼有如此高的效能?Redis執行緒
- 什麼是Nginx?Linux為什麼使用Nginx?NginxLinux
- 為什麼Python要比其他語言更受喜歡?Python
- js中為什麼for迴圈比forEach效能高?JS
- 為什麼很多人不跑滴滴了?
- 為什麼很多人喜歡 Python?Python
- 為什麼MacBook要比普通電腦貴?差別在哪裡呢?Mac
- Nginx-01-為什麼使用 Nginx? nginx 的優缺點Nginx
- Nginx 為什麼這麼快?Nginx
- 為什麼說很多IDC企業管理效率低下
- html標籤種類很多,為什麼不都用div?HTML
- 為什麼很多人排斥中國女生嫁去外國?
- 為什麼很多人入門選擇Python爬蟲?Python爬蟲
- IT≠程式猿!為什麼很多人都想進入IT行業?行業
- 為什麼很多公司都不招大齡程式設計師?程式設計師
- 阿里巴巴為什麼選擇Apache Flink?阿里Apache
- Nginx 高階篇(二)什麼是負載均衡Nginx負載
- 為什麼很多公司都轉型go語言開發?Go語言能做什麼Go
- PostgreSQL Collation 怎麼調整,為什麼很多專案都選擇 CtypeSQL
- 為什麼很多人都選擇註冊新加坡基金會?
- 為什麼有很多名人讓人們警惕人工智慧?人工智慧
- 為什麼很多程式設計師工作時都戴耳機?程式設計師
- Apache Mesos為什麼會失敗?(黑客新聞)Apache黑客
- 為什麼要選擇Apache Pulsar:IO隔離Apache
- Nginx代理websocket為什麼要這樣做?NginxWeb
- 為什麼學習HTML開發的很多人都是沒有基礎的?HTML
- switch和if else if哪個效率高?為什麼很多IT程式設計師都喜歡用switch判斷?程式設計師
- 恆訊科技分析:Nginx是什麼意思?Nginx作為反向代理伺服器有什麼作用?Nginx伺服器
- 為什麼選擇高防DNS?DNS
- 大齡碼農經驗那麼豐富,為什麼很多公司都不招?
- nginx和apache的區別NginxApache
- 為什麼 APISIX Ingress 是比 Ingress NGINX 更好的選擇?APINginx
- 什麼是 Apache Kafka?ApacheKafka
- 【IPP SWAP】為什麼熱度這麼高
- 為什麼學習Python,python的薪資為什麼這麼高,進去看看就知道Python
- 為什麼很多人會選擇學網路安全?前景如何?