linux非阻塞式socket程式設計之select()用法

你的財神爺發表於2018-05-31
 Select在Socket程式設計中還是比較重要的,可是對於初學Socket的人來說都不太愛用Select寫程式,他們只是習慣寫諸如 connect、accept、recv或recvfrom這樣的阻塞程式(所謂阻塞方式block,顧名思義,就是程式或是執行緒執行到這些函式時必須等待某個事件的發生,如果事件沒有發生,程式或執行緒就被阻塞,函式不能立即返回)。可是使用Select就可以完成非阻塞(所謂非阻塞方式non- block,就是程式或執行緒執行此函式時不必非要等待事件的發生,一旦執行肯定返回,以返回值的不同來反映函式的執行情況,如果事件發生則與阻塞方式相同,若事件沒有發生則返回一個程式碼來告知事件未發生,而程式或執行緒繼續執行,所以效率較高)方式工作的程式,它能夠監視我們需要監視的檔案描述符的變化情況讀寫或是異常。下面詳細介紹一下! 

Select的函式格式(我所說的是Unix系統下的伯克利socket程式設計,和windows下的有區別,一會兒說明): 

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout); 

先說明兩個結構體: 

第一,struct fd_set可以理解為一個集合,這個集合中存放的是檔案描述符(file descriptor),即檔案控制程式碼,這可以是我們所說的普通意義的檔案,當然Unix下任何裝置、管道、FIFO等都是檔案形式,全部包括在內,所以毫無疑問一個socket就是一個檔案,socket控制程式碼就是一個檔案描述符。fd_set集合可以通過一些巨集由人為來操作,比如清空集合 FD_ZERO(fd_set *),將一個給定的檔案描述符加入集合之中FD_SET(int ,fd_set *),將一個給定的檔案描述符從集合中刪除FD_CLR(int ,fd_set*),檢查集合中指定的檔案描述符是否可以讀寫FD_ISSET(int ,fd_set* )。一會兒舉例說明。 

第二,struct timeval是一個大家常用的結構,用來代表時間值,有兩個成員,一個是秒數,另一個是毫秒數。 

具體解釋select的引數: 

int maxfdp是一個整數值,是指集合中所有檔案描述符的範圍,即所有檔案描述符的最大值加1,不能錯!在Windows中這個引數的值無所謂,可以設定不正確。 

fd_set *readfds是指向fd_set結構的指標,這個集合中應該包括檔案描述符,我們是要監視這些檔案描述符的讀變化的,即我們關心是否可以從這些檔案中讀取資料了,如果這個集合中有一個檔案可讀,select就會返回一個大於0的值,表示有檔案可讀,如果沒有可讀的檔案,則根據timeout引數再判斷是否超時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何檔案的讀變化。 

fd_set *writefds是指向fd_set結構的指標,這個集合中應該包括檔案描述符,我們是要監視這些檔案描述符的寫變化的,即我們關心是否可以向這些檔案中寫入資料了,如果這個集合中有一個檔案可寫,select就會返回一個大於0的值,表示有檔案可寫,如果沒有可寫的檔案,則根據timeout引數再判斷是否超時,若超出timeout的時間,select返回0,若發生錯誤返回負值。可以傳入NULL值,表示不關心任何檔案的寫變化。 

fd_set *errorfds同上面兩個引數的意圖,用來監視檔案錯誤異常。 

struct timeval* timeout是select的超時時間,這個引數至關重要,它可以使select處於三種狀態,第一,若將NULL以形參傳入,即不傳入時間結構,就是將select置於阻塞狀態,一定等到監視檔案描述符集合中某個檔案描述符發生變化為止;第二,若將時間值設為0秒0毫秒,就變成一個純粹的非阻塞函式,不管檔案描述符是否有變化,都立刻返回繼續執行,檔案無變化返回0,有變化返回一個正值;第三,timeout的值大於0,這就是等待的超時時間,即 select在timeout時間內阻塞,超時時間之內有事件到來就返回了,否則在超時後不管怎樣一定返回,返回值同上述。 

返回值: 

負值:select錯誤 正值:某些檔案可讀寫或出錯 0:等待超時,沒有可讀寫或錯誤的檔案 

在有了select後可以寫出像樣的網路程式來!舉個簡單的例子,就是從網路上接受資料寫入一個檔案中。 

例子: 

main() 



int sock; 

FILE *fp; 

struct fd_set fds; 

struct timeval timeout={3,0}; //select等待3秒,3秒輪詢,要非阻塞就置0 

char buffer[256]={0}; //256位元組的接收緩衝區 

/* 假定已經建立UDP連線,具體過程不寫,簡單,當然TCP也同理,主機ip和port都已經給定,要寫的檔案已經開啟 

sock=socket(...); 

bind(...); 

fp=fopen(...); */ 

while(1) 



FD_ZERO(&fds); //每次迴圈都要清空集合,否則不能檢測描述符變化 

FD_SET(sock,&fds); //新增描述符 

FD_SET(fp,&fds); //同上 

maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加1 

switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select使用 



case -1: exit(-1);break; //select錯誤,退出程式 

case 0:break; //再次輪詢 

default: 

if(FD_ISSET(sock,&fds)) //測試sock是否可讀,即是否網路上有資料 



recvfrom(sock,buffer,256,.....);//接受網路資料 

if(FD_ISSET(fp,&fds)) //測試檔案是否可寫 

fwrite(fp,buffer...);//寫入檔案 

buffer清空; 

}// end if break; 

}// end switch 

}//end while 

}//end main

----------------------------------------------------------
Linux select()詳解


Linux select()詳解       select系統呼叫是用來讓我們的程式監視多個檔案控制程式碼(file descriptor)的狀態變化的。程式會停在select這裡等待,直到被監視的檔案控制程式碼有某一個或多個發生了狀態改變。

    檔案在控制程式碼在Linux裡很多,如果你man某個函式,在函式返回值部分說到成功後有一個檔案控制程式碼被建立的都是的,如man socket可以看到“On success, a file descriptor for the new socket is returned.”而man 2 open可以看到“open() and creat() return the new file descriptor”,其實檔案控制程式碼就是一個整數,看socket函式的宣告就明白了:
    int socket(int domain, int type, int protocol);
當然,我們最熟悉的控制程式碼是0、1、2三個,0是標準輸入,1是標準輸出,2是標準錯誤輸出。0、1、2是整數表示的,對應的FILE *結構的表示就是stdin、stdout、stderr,0就是stdin,1就是stdout,2就是stderr。
比如下面這兩段程式碼都是從標準輸入讀入9個位元組字元:


#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char ** argv)
{
        char buf[10] = "";
        read(0, buf, 9); /* 從標準輸入 0 讀入字元 */
        fprintf(stdout, "%s\n", buf); /* 向標準輸出 stdout 寫字元 */
        return 0;
}
/* **上面和下面的程式碼都可以用來從標準輸入讀使用者輸入的9個字元** */
#include <stdio.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char ** argv)
{
        char buf[10] = "";
        fread(buf, 9, 1, stdin); /* 從標準輸入 stdin 讀入字元 */
        write(1, buf, strlen(buf));
        return 0;
}
   繼續上面說的select,就是用來監視某個或某些控制程式碼的狀態變化的。select函式原型如下:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
函式的最後一個引數timeout顯然是一個超時時間值,其型別是struct timeval *,即一個struct timeval結構的變數的指標,所以我們在程式裡要申明一個struct timeval tv;然後把變數tv的地址&tv傳遞給select函式。struct timeval結構如下:


struct timeval {
             long    tv_sec;         /* seconds */
             long    tv_usec;        /* microseconds */
         };
   第2、3、4三個引數是一樣的型別: fd_set *,即我們在程式裡要申明幾個fd_set型別的變數,比如rdfds, wtfds, exfds,然後把這個變數的地址&rdfds, &wtfds, &exfds 傳遞給select函式。這三個引數都是一個控制程式碼的集合,第一個rdfds是用來儲存這樣的控制程式碼的:當控制程式碼的狀態變成可讀的時系統就會告訴select函式返回,同理第二個wtfds是指有控制程式碼狀態變成可寫的時系統就會告訴select函式返回,同理第三個引數exfds是特殊情況,即控制程式碼上有特殊情況發生時系統會告訴select函式返回。特殊情況比如對方通過一個socket控制程式碼發來了緊急資料。如果我們程式裡只想檢測某個socket是否有資料可讀,我們可以這樣:

fd_set rdfds; /* 先申明一個 fd_set 集合來儲存我們要檢測的 socket控制程式碼 */
struct timeval tv; /* 申明一個時間變數來儲存時間 */
int ret; /* 儲存返回值 */
FD_ZERO(&rdfds); /* 用select函式之前先把集合清零 */
FD_SET(socket, &rdfds); /* 把要檢測的控制程式碼socket加入到集合裡 */
tv.tv_sec = 1;
tv.tv_usec = 500; /* 設定select等待的最大時間為1秒加500毫秒 */
ret = select(socket + 1, &rdfds, NULL, NULL, &tv); /* 檢測我們上面設定到集合rdfds裡的控制程式碼是否有可讀資訊 */
if(ret < 0) perror("select");/* 這說明select函式出錯 */
else if(ret == 0) printf("超時\n"); /* 說明在我們設定的時間值1秒加500毫秒的時間內,socket的狀態沒有發生變化 */
else { /* 說明等待時間還未到1秒加500毫秒,socket的狀態發生了變化 */
    printf("ret=%d\n", ret); /* ret這個返回值記錄了發生狀態變化的控制程式碼的數目,由於我們只監視了socket這一個控制程式碼,所以這裡一定ret=1,如果同時有多個控制程式碼發生變化返回的就是控制程式碼的總和了 */
    /* 這裡我們就應該從socket這個控制程式碼裡讀取資料了,因為select函式已經告訴我們這個控制程式碼裡有資料可讀 */
    if(FD_ISSET(socket, &rdfds)) { /* 先判斷一下socket這外被監視的控制程式碼是否真的變成可讀的了 */
        /* 讀取socket控制程式碼裡的資料 */
        recv(...);
    }
}
   注意select函式的第一個引數,是所有加入集合的控制程式碼值的最大那個值還要加1。比如我們建立了3個控制程式碼:
/************關於本文件********************************************
*filename: Linux網路程式設計一步一步學-select詳解
*purpose: 詳細說明select的用法
*wrote by: zhoulifa(zhoulifa@163.com) 周立發(http://zhoulifa.bokee.com)
Linux愛好者 Linux知識傳播者 SOHO族 開發者 最擅長C語言
*date time:2007-02-03 19:40
*Note: 任何人可以任意複製程式碼並運用這些文件,當然包括你的商業用途
* 但請遵循GPL
*Thanks to:Google
*Hope:希望越來越多的人貢獻自己的力量,為科學技術發展出力
* 科技站在巨人的肩膀上進步更快!感謝有開源前輩的貢獻!
*********************************************************************/

int sa, sb, sc;
sa = socket(...); /* 分別建立3個控制程式碼並連線到伺服器上 */
connect(sa,...);
sb = socket(...);
connect(sb,...);
sc = socket(...);
connect(sc,...);

FD_SET(sa, &rdfds);/* 分別把3個控制程式碼加入讀監視集合裡去 */
FD_SET(sb, &rdfds);
FD_SET(sc, &rdfds);
   在使用select函式之前,一定要找到3個控制程式碼中的最大值是哪個,我們一般定義一個變數來儲存最大值,取得最大socket值如下:

int maxfd = 0;
if(sa > maxfd) maxfd = sa;
if(sb > maxfd) maxfd = sb;
if(sc > maxfd) maxfd = sc;
   然後呼叫select函式:
ret = select(maxfd + 1, &rdfds, NULL, NULL, &tv); /* 注意是最大值還要加1 */
   同樣的道理,如果我們要檢測使用者是否按了鍵盤進行輸入,我們就應該把標準輸入0這個控制程式碼放到select裡來檢測,如下:

FD_ZERO(&rdfds);
FD_SET(0, &rdfds);
tv.tv_sec = 1;
tv.tv_usec = 0;
ret = select(1, &rdfds, NULL, NULL, &tv); /* 注意是最大值還要加1 */
if(ret < 0) perror("select");/* 出錯 */
else if(ret == 0) printf("超時\n"); /* 在我們設定的時間tv內,使用者沒有按鍵盤 */
else { /* 使用者有按鍵盤,要讀取使用者的輸入 */
    scanf("%s", buf);
}----------------------------------------------------------
Linux select學習筆記

select系統呼叫是用來讓我們的程式監視多個檔案描述符(file descrīptor)的狀態變化的。程式會停在select這裡等待,直到被監視的檔案描述符有某一個或多個發生了狀態改變。select()的機制中提供一fd_set的資料結構,實際上是一long型別的陣列, 每一個陣列元素都能與一開啟的檔案描述符(不管是Socket描述符,還是其他 檔案或命名管道或裝置描述符)建立聯絡,建立聯絡的工作由程式設計師完成, 當呼叫select()時,由核心根據IO狀態修改fd_set的內容,由此來通知執 行了select()的程式哪一Socket或檔案可讀,

select函式原型如下:
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

函式的最後一個引數timeout顯然是一個超時時間值,其型別是struct timeval *,即一個struct timeval結構的變數的指標,所以我們在程式裡要申明一個struct timeval tv;然後把變數tv的地址&tv傳遞給select函式。struct timeval結構如下:

struct timeval {
long   tv_sec;     /* seconds */
long   tv_usec;    /* microseconds */
};

第2、3、4三個引數的型別是一樣的: fd_set *,即我們在程式裡要申明幾個fd_set型別的變數,比如定義了rfds, wfds, efds。

另外關於fd_set型別的變數,還有一組標準的巨集定義來處理此類變數:

FD_ZERO(fd_set *fdset):清空fdset與所有檔案描述符的聯絡。

FD_SET(int fd, fd_set *fdset):建立檔案描述符fd與fdset的聯絡。

FD_CLR(int fd, fd_set *fdset):清除檔案描述符fd與fdset的聯絡。

FD_ISSET(int fd, fd_set *fdset):檢查fd_set聯絡的檔案描述符fd是否可讀寫,>0表示可讀寫。

(關於fd_set及相關巨集的定義見/usr/include/sys/types.h)定義的這三個引數都是描述符的集合,第一個rfds是用來儲存這樣的描述符的:當描述符的狀態變成可讀的時系統就會告訴select函式返回,第二個wfds是指有描述符狀態變成可寫的時系統就會告訴select函式返回,第三個引數efds是特殊情況,即描述符上有特殊情況發生時系統會告訴select函式返回。下面以一個輸入為例來說明:

int fd1, fd2;         /* 在定義兩個描述符*/

fd1 = socket(...);    /* 建立socket連線*/

fd2 = open(“/dev/tyS0”,O_RDWR); /* 開啟一個串列埠*/

FD_ZERO(&rfds);       /* 用select函式之前先把集合清零 */

FD_SET(fd1, &rfds);   /* 分別把2個描述符加入讀監視集合裡去 */

FD_SET(fd2, &rfds);

int maxfd = 0;

maxfd = (fd1>fd2)?(fd1+1):(fd2+1);           /* 注意是最大值還要加1 */

ret = select(maxfd, &rfds, NULL, NULL, &tv); /*然後呼叫select函式*/

這樣就可以使用一個開關語句(switch語句)來判斷到底是哪一個輸入源在輸入資料。具體判斷如下:

switch(ret){

case -1:perror("select");/* 這說明select函式出錯 */

case 0:printf("超時\n"); /* 說明在設定的時間內,socket的狀態沒有發生變化 */

default:

if(FD_ISSET(fd1, &rfds)) 處理函式1();/*socket有資料來*/

if(FD_ISSET(fd2, &rfds)) 處理函式2();/*ttyS0有資料來*/

}

 

以下來自網路搜尋:

Linux下select呼叫的過程:

1.使用者層應用程式呼叫select(),底層呼叫poll())

2.核心層呼叫sys_select() ------> do_select()

最終呼叫檔案描述符fd對應的struct file型別變數的struct file_operations *f_op的poll函式。

poll指向的函式返回當前可否讀寫的資訊。

1)如果當前可讀寫,返回讀寫資訊。

2)如果當前不可讀寫,則阻塞程式,並等待驅動程式喚醒,重新呼叫poll函式,或超時返回。

3.驅動需要實現poll函式。

當驅動發現有資料可以讀寫時,通知核心層,核心層重新呼叫poll指向的函式查詢資訊。

poll_wait(filp,&wait_q,wait) // 此處將當前程式加入到等待佇列中,但並不阻塞

在中斷中使用wake_up_interruptible(&wait_q)喚醒等待佇列



----------------------------------------------------------
Socket程式設計中select()的妙用
 
用過 WinSock API 網友們知道:WinSock 程式設計中有一很方便的地方便是其 
息驅動機制,不管是底層 API 的 WSAAsyncSelect() 還是 MFC 的非同步Socket類: 
CAsyncSocket,都提供了諸如 FD_ACCEPT、FD_READ、FD_CLOSE 之類的訊息 
供程式設計人員捕捉並處理。FD_ACCEPT 通知程式有客戶方Socket請求連線, 
FD_READ通知程式本地Socket有東東可讀,FD_CLOSE通知程式對方Socket已 
關閉。那麼,BSD Socket 是不是真的相形見拙呢? 
 
非也! 'cause cpu love unix so. 
 
BSD UNIX中有一系統呼叫芳名select()完全可以提供類似的訊息驅動機制。 
cpu鄭重宣佈:WinSock的WSAAsyncSeclet()不過是此select()的fork版! 
 
bill也是fork出來的嘛,xixi. 
 
select()的機制中提供一fd_set的資料結構,實際上是一long型別的陣列, 
每一個陣列元素都能與一開啟的檔案控制程式碼(不管是Socket控制程式碼,還是其他 
檔案或命名管道或裝置控制程式碼)建立聯絡,建立聯絡的工作由程式設計師完成, 
當呼叫select()時,由核心根據IO狀態修改fd_set的內容,由此來通知執 
行了select()的程式哪一Socket或檔案可讀,下面具體解釋: 
 
#include  <sys/types.h> 
#include  <sys/times.h> 
#include  <sys/select.h> 
 
int select(nfds, readfds, writefds, exceptfds, timeout) 
int nfds; 
fd_set *readfds, *writefds, *exceptfds; 
struct timeval *timeout; 
 
ndfs:select監視的檔案控制程式碼數,視程式中開啟的檔案數而定,一般設為呢要監視各檔案 
      中的最大檔案號加一。 
readfds:select監視的可讀檔案控制程式碼集合。 
writefds: select監視的可寫檔案控制程式碼集合。 
exceptfds:select監視的異常檔案控制程式碼集合。 
timeout:本次select()的超時結束時間。(見/usr/sys/select.h, 
        可精確至百萬分之一秒!) 
 
當readfds或writefds中映象的檔案可讀或可寫或超時,本次select() 
就結束返回。程式設計師利用一組系統提供的巨集在select()結束時便可判 
斷哪一檔案可讀或可寫。對Socket程式設計特別有用的就是readfds。 
幾隻相關的巨集解釋如下: 
 
FD_ZERO(fd_set *fdset):清空fdset與所有檔案控制程式碼的聯絡。 
FD_SET(int fd, fd_set *fdset):建立檔案控制程式碼fd與fdset的聯絡。 
FD_CLR(int fd, fd_set *fdset):清除檔案控制程式碼fd與fdset的聯絡。 
FD_ISSET(int fd, fdset *fdset):檢查fdset聯絡的檔案控制程式碼fd是否 
                                可讀寫,>0表示可讀寫。 
(關於fd_set及相關巨集的定義見/usr/include/sys/types.h) 
 
這樣,你的socket只需在有東東讀的時候才讀入,大致如下: 
 
... 
int     sockfd; 
fd_set  fdR; 
struct  timeval timeout = ..; 
... 
for(;;) { 
        FD_ZERO(&fdR); 
        FD_SET(sockfd, &fdR); 
        switch (select(sockfd + 1, &fdR, NULL, &timeout)) { 
                case -1: 
                        error handled by u; 
                case 0: 
                        timeout hanled by u; 
                default: 
                        if (FD_ISSET(sockfd)) { 
                                now u read or recv something; 
                                /* if sockfd is father and  
                                server socket, u can now 
                                accept() */ 
                        } 
        } 

 
所以一個FD_ISSET(sockfd)就相當通知了sockfd可讀。 
至於struct timeval在此的功能,請man select。不同的timeval設定 
使使select()表現出超時結束、無超時阻塞和輪詢三種特性。由於 
timeval可精確至百萬分之一秒,所以Windows的SetTimer()根本不算 
什麼。你可以用select()做一個超級時鐘。 
 
FD_ACCEPT的實現?依然如上,因為客戶方socket請求連線時,會傳送 
連線請求報文,此時select()當然會結束,FD_ISSET(sockfd)當然大 
於零,因為有報文可讀嘛!至於這方面的應用,主要在於服務方的父 
Socket,你若不喜歡主動accept(),可改為如上機制來accept()。 
 
至於FD_CLOSE的實現及處理,頗費了一堆cpu處理時間,未完待續。 
 
-- 
討論關於利用select()檢測對方Socket關閉的問題: 
 
仍然是本地Socket有東東可讀,因為對方Socket關閉時,會發一個關閉連線 
通知報文,會馬上被select()檢測到的。關於TCP的連線(三次握手)和關 
閉(二次握手)機制,敬請參考有關TCP/IP的書籍。 
 
不知是什麼原因,UNIX好象沒有提供通知程式關於Socket或Pipe對方關閉的 
訊號,也可能是cpu所知有限。總之,當對方關閉,一執行recv()或read(), 
馬上回返回-1,此時全域性變數errno的值是115,相應的sys_errlist[errno] 
為"Connect refused"(請參考/usr/include/sys/errno.h)。所以,在上 
篇的for(;;)...select()程式塊中,當有東西可讀時,一定要檢查recv()或 
read()的返回值,返回-1時要作出關斷本地Socket的處理,否則select()會 
一直認為有東西讀,其結果曾幾令cpu傷心欲斷針腳。不信你可以試試:不檢 
查recv()返回結果,且將收到的東東(實際沒收到)寫至標準輸出... 
在有名管道的程式設計中也有類似問題出現。具體處理詳見拙作:釋出一個有用 
的Socket客戶方原碼。 
 
至於主動寫Socket時對方突然關閉的處理則可以簡單地捕捉訊號SIGPIPE並作 
出相應關斷本地Socket等等的處理。SIGPIPE的解釋是:寫入無讀者方的管道。 
在此不作贅述,請詳man signal。 
 
以上是cpu在作tcp/ip資料傳輸實驗積累的經驗,若有錯漏,請狂炮擊之。 
 
唉,昨天在hacker區被一幫孫子轟得差點兒沒短路。ren cpu(奔騰的心) z80 
 
補充關於select在非同步(非阻塞)connect中的應用,剛開始搞socket程式設計的時候 
我一直都用阻塞式的connect,非阻塞connect的問題是由於當時搞proxy scan 
而提出的呵呵 
通過在網上與網友們的交流及查詢相關FAQ,總算知道了怎麼解決這一問題.同樣 
用select可以很好地解決這一問題.大致過程是這樣的: 
 
1.將開啟的socket設為非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完 
成(有的系統用FNEDLAY也可). 
 
2.發connect呼叫,這時返回-1,但是errno被設為EINPROGRESS,意即connect仍舊 
在進行還沒有完成. 
 
3.將開啟的socket設進被監視的可寫(注意不是可讀)檔案集合用select進行監視, 
如果可寫,用 
        getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int)); 
來得到error的值,如果為零,則connect成功. 
 
在許多unix版本的proxyscan程式你都可以看到類似的過程,另外在solaris精華 
區->程式設計技巧中有一個通用的帶超時引數的connect模組.  

相關文章