Linux中select()函式分析
Select在Socket程式設計中還是比較重要的,可是對於初學Socket的人來說都不太愛用Select寫程式,他們只是習慣寫諸如connect、accept、recv或recvfrom這樣的阻塞程式(所謂阻塞方式block,顧名思義,就是程式或是執行緒執行到這些函式時必須等待某個事件的發生,如果事件沒有發生,程式或執行緒就被阻塞,函式不能立即返回)。可是使用Select就可以完成非阻塞(所謂非阻塞方式non-block,就是程式或執行緒執行此函式時不必非要等待事件的發生,一旦執行肯定返回,以返回值的不同來反映函式的執行情況,如果事件發生則與阻塞方式相同,若事件沒有發生則返回一個程式碼來告知事件未發生,而程式或執行緒繼續執行,所以效率較高)方式工作的程式,它能夠監視我們需要監視的檔案描述符的變化情況——讀寫或是異常。下面詳細介紹一下!
Select的函式格式(我所說的是Unix系統下的伯克利socket程式設計,和windows下的有區別,一會兒說明):
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
先說明兩個結構體:
第一,struct fd_set可以理解為一個集合,這個集合中存放的是檔案描述符(file descriptor),即檔案控制程式碼,這可以是我們所說的普通意義的檔案,當然Unix下任何裝置、管道、FIFO等都是檔案形式,全部包括在內,所以毫無疑問一個socket就是一個檔案,socket控制程式碼就是一個檔案描述符。fd_set集合可以通過一些巨集由人為來操作,比如清空集合FD_ZERO(fd_set *),將一個給定的檔案描述符加入集合之中FD_SET(int ,fd_set *),將一個給定的檔案描述符從集合中刪除FD_CLR(int
,fd_set*),檢查集合中指定的檔案描述符是否可以讀寫FD_ISSET(int ,fd_set* )。一會兒舉例說明。
第二,struct timeval是一個大家常用的結構,用來代表時間值,有兩個成員,一個是秒數,另一個是毫秒數。
具體解釋select的引數:
int maxfdp是一個整數值,是指集合中所有檔案描述符的範圍,即所有檔案描述符的最大值加1,不能錯!在Windows中這個引數的值無所謂,可以設定不正確。
fd_set *readfds是指向fd_set結構的指標,這個集合中應該包括檔案描述符,我們是要監視這些檔案描述符的讀變化的,即我們關心是否可以從這些檔案中讀取資料了,如果這個集合中有一個檔案可讀,select就會返回一個大於0的值,表示有檔案可讀,如果沒有可讀的檔案,則根據timeout引數再判斷是否超時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何檔案的讀變化。
fd_set *writefds是指向fd_set結構的指標,這個集合中應該包括檔案描述符,我們是要監視這些檔案描述符的寫變化的,即我們關心是否可以向這些檔案中寫入資料了,如果這個集合中有一個檔案可寫,select就會返回一個大於0的值,表示有檔案可寫,如果沒有可寫的檔案,則根據timeout引數再判斷是否超時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何檔案的寫變化。
fd_set *errorfds同上面兩個引數的意圖,用來監視檔案錯誤異常。
struct timeval* timeout是select的超時時間,這個引數至關重要,它可以使select處於三種狀態,第一,若將NULL以形參傳入,即不傳入時間結構,就是將select置於阻塞狀態,一定等到監視檔案描述符集合中某個檔案描述符發生變化為止;第二,若將時間值設為0秒0毫秒,就變成一個純粹的非阻塞函式,不管檔案描述符是否有變化,都立刻返回繼續執行,檔案無變化返回0,有變化返回一個正值;第三,timeout的值大於0,這就是等待的超時時間,即select在timeout時間內阻塞,超時時間之內有事件到來就返回了,否則在超時後不管怎樣一定返回,返回值同上述。
返回值:
負值:select錯誤 正值:某些檔案可讀寫或出錯 0:等待超時,沒有可讀寫或錯誤的檔案
在有了select後可以寫出像樣的網路程式來!舉個簡單的例子,就是從網路上接受資料寫入一個檔案中。
例子:
main()
{
int sock;
FILE *fp;
struct fd_set fds;
struct timeval timeout={3,0}; //select等待3秒,3秒輪詢,要非阻塞就置0
char buffer[256]={0}; //256位元組的接收緩衝區
/* 假定已經建立UDP連線,具體過程不寫,簡單,當然TCP也同理,主機ip和port都已經給定,要寫的檔案已經開啟
sock=socket(...);
bind(...);
fp=fopen(...); */
while(1)
{
FD_ZERO(&fds); //每次迴圈都要清空集合,否則不能檢測描述符變化
FD_SET(sock,&fds); //新增描述符
FD_SET(fp,&fds); //同上
maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加1
switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select使用
{
case -1: exit(-1);break; //select錯誤,退出程式
case 0:break; //再次輪詢
default:
if(FD_ISSET(sock,&fds)) //測試sock是否可讀,即是否網路上有資料
{
recvfrom(sock,buffer,256,.....);//接受網路資料
if(FD_ISSET(fp,&fds)) //測試檔案是否可寫
fwrite(fp,buffer...);//寫入檔案
buffer清空;
}// end if break;
}// end switch
}//end while
}//end main
參考資料:http://cuijinbird.blogchina.com/cuijinbird/1921117.html
Part 2:
每一個陣列元素都能與一開啟的檔案控制程式碼(不管是Socket控制程式碼,還是其他
檔案或命名管道或裝置控制程式碼)建立聯絡,建立聯絡的工作由程式設計師完成,
當呼叫select()時,由核心根據IO狀態修改fd_set的內容,由此來通知執
行了select()的程式哪一Socket或檔案可讀,下面具體解釋:
#include <sys/types.h>
#include <sys/times.h>
#include <sys/select.h>
int select(nfds, readfds, writefds, exceptfds, timeout)
int nfds;
fd_set *readfds, *writefds, *exceptfds;
struct timeval *timeout;
ndfs:select監視的檔案控制程式碼數,視程式中開啟的檔案數而定,一般設為呢要監視各檔案
中的最大檔案號加一。
readfds:select監視的可讀檔案控制程式碼集合。
writefds: select監視的可寫檔案控制程式碼集合。
exceptfds:select監視的異常檔案控制程式碼集合。
timeout:本次select()的超時結束時間。(見/usr/sys/select.h,
可精確至百萬分之一秒!)
當readfds或writefds中映象的檔案可讀或可寫或超時,本次select()
就結束返回。程式設計師利用一組系統提供的巨集在select()結束時便可判
斷哪一檔案可讀或可寫。對Socket程式設計特別有用的就是readfds。
幾隻相關的巨集解釋如下:
FD_ZERO(fd_set *fdset):清空fdset與所有檔案控制程式碼的聯絡。
FD_SET(int fd, fd_set *fdset):建立檔案控制程式碼fd與fdset的聯絡。
FD_CLR(int fd, fd_set *fdset):清除檔案控制程式碼fd與fdset的聯絡。
FD_ISSET(int fd, fdset *fdset):檢查fdset聯絡的檔案控制程式碼fd是否
可讀寫,>0表示可讀寫。
(關於fd_set及相關巨集的定義見/usr/include/sys/types.h)
這樣,你的socket只需在有東東讀的時候才讀入,大致如下:
...
int sockfd;
fd_set fdR;
struct timeval timeout = ..;
...
for(;;) {
FD_ZERO(&fdR);
FD_SET(sockfd, &fdR);
switch (select(sockfd + 1, &fdR, NULL, &timeout)) {
case -1:
error handled by u;
case 0:
timeout hanled by u;
default:
if (FD_ISSET(sockfd)) {
now u read or recv something;
/* if sockfd is father and
server socket, u can now
accept() */
}
}
}
所以一個FD_ISSET(sockfd)就相當通知了sockfd可讀。
至於struct timeval在此的功能,請man select。不同的timeval設定
使使select()表現出超時結束、無超時阻塞和輪詢三種特性。由於
timeval可精確至百萬分之一秒,所以Windows的SetTimer()根本不算
什麼。你可以用select()做一個超級時鐘。
FD_ACCEPT的實現?依然如上,因為客戶方socket請求連線時,會傳送
連線請求報文,此時select()當然會結束,FD_ISSET(sockfd)當然大
於零,因為有報文可讀嘛!至於這方面的應用,主要在於服務方的父
Socket,你若不喜歡主動accept(),可改為如上機制來accept()。
至於FD_CLOSE的實現及處理,頗費了一堆cpu處理時間,未完待續。
--
討論關於利用select()檢測對方Socket關閉的問題:
仍然是本地Socket有東東可讀,因為對方Socket關閉時,會發一個關閉連線
通知報文,會馬上被select()檢測到的。關於TCP的連線(三次握手)和關
閉(二次握手)機制,敬請參考有關TCP/IP的書籍。
不知是什麼原因,UNIX好象沒有提供通知程式關於Socket或Pipe對方關閉的
訊號,也可能是cpu所知有限。總之,當對方關閉,一執行recv()或read(),
馬上回返回-1,此時全域性變數errno的值是115,相應的sys_errlist[errno]
為"Connect refused"(請參考/usr/include/sys/errno.h)。所以,在上
篇的for(;;)...select()程式塊中,當有東西可讀時,一定要檢查recv()或
read()的返回值,返回-1時要作出關斷本地Socket的處理,否則select()會
一直認為有東西讀,其結果曾幾令cpu傷心欲斷針腳。不信你可以試試:不檢
查recv()返回結果,且將收到的東東(實際沒收到)寫至標準輸出...
在有名管道的程式設計中也有類似問題出現。具體處理詳見拙作:釋出一個有用
的Socket客戶方原碼。
至於主動寫Socket時對方突然關閉的處理則可以簡單地捕捉訊號SIGPIPE並作
出相應關斷本地Socket等等的處理。SIGPIPE的解釋是:寫入無讀者方的管道。
在此不作贅述,請詳man signal。
以上是cpu在作tcp/ip資料傳輸實驗積累的經驗,若有錯漏,請狂炮擊之。
唉,昨天在hacker區被一幫孫子轟得差點兒沒短路。ren cpu(奔騰的心) z80
補充關於select在非同步(非阻塞)connect中的應用,剛開始搞socket程式設計的時候
我一直都用阻塞式的connect,非阻塞connect的問題是由於當時搞proxy scan
而提出的呵呵
通過在網上與網友們的交流及查詢相關FAQ,總算知道了怎麼解決這一問題.同樣
用select可以很好地解決這一問題.大致過程是這樣的:
1.將開啟的socket設為非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完
成(有的系統用FNEDLAY也可).
2.發connect呼叫,這時返回-1,但是errno被設為EINPROGRESS,意即connect仍舊
在進行還沒有完成.
3.將開啟的socket設進被監視的可寫(注意不是可讀)檔案集合用select進行監視,
如果可寫,用
getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));
來得到error的值,如果為零,則connect成功.
在許多unix版本的proxyscan程式你都可以看到類似的過程,另外在solaris精華
區->程式設計技巧中有一個通用的帶超時引數的connect模組.
http://tb.blog.csdn.net/TrackBack.aspx?PostId=1684998
相關文章
- select監聽多個client -- linux函式clientLinux函式
- sql中select列有自定義函式 dblinkSQL函式
- select函式socket程式設計函式程式設計
- Linux select()Linux
- Linux Clone函式Linux函式
- Oracle分析函式與視窗函式Oracle函式
- python中id()函式、zip()函式、map()函式、lamda函式Python函式
- linux之__setup函式Linux函式
- SQLite中的SELECT子句使用表示式SQLite
- Hive之分析函式Hive函式
- ORALCE函式:LAG()和LEAD() 分析函式詳解函式
- 【多程式】Linux中fork()函式詳解|多程式Linux函式
- linux非阻塞式socket程式設計之select()用法Linux程式設計
- Linux中的sleep、usleep、nanosleep、poll和selectLinuxNaN
- 研究linux函式 之 fork()Linux函式
- Python資料分析--Numpy常用函式介紹(7)--Numpy中矩陣和通用函式Python函式矩陣
- Python資料分析--Numpy常用函式介紹(5)--Numpy中的相關性函式Python函式
- 函式‘select’標籤‘"data.frame"’找不到繼承方法函式繼承
- Oracle分析函式之開窗函式over()詳解Oracle函式
- MySQL分析函式實現MySql函式
- count 函式原始碼分析函式原始碼
- Sql 中的 left 函式、right 函式SQL函式
- Rust中的into函式和from函式Rust函式
- PHP 手冊中的匿名函式關聯用法分析PHP函式
- 分析WordPress中esc_sql函式引起的注入危害SQL函式
- 【Java】NIO中Selector的select方法原始碼分析Java原始碼
- (未完成)APC函式的執行,分析 KiDeliverApc 函式函式IDE
- JavaScript中的compose函式和pipe函式JavaScript函式
- Linux下getopt函式的使用Linux函式
- js中在一個函式中引用另一個函式中的函式,可以這麼做JS函式
- 在Linux中, 什麼是shell函式?如何使用它們?Linux函式
- ORACLE分析函式手冊(轉)Oracle函式
- openGauss 高階分析函式支援函式
- oracle資料庫常用分析函式與聚合函式的用法Oracle資料庫函式
- 如何使用函式指標呼叫類中的函式和普通函式函式指標
- C++中函式指標與函式物件C++函式指標物件
- 如何在 Linux Shell 程式設計中定義和使用函式Linux程式設計函式
- 解析Linux訊號集操作函式Linux函式