Linux環境下的網路程式設計

tolywang發表於2005-03-14
           本文介紹了在Linux環境下的socket程式設計常用函式用法及socket程式設計的一般規則和客戶/伺服器模型的程式設計應注意的事項和常遇問題的解決方法,並舉了具體代 碼例項。要理解本文所談的技術問題需要讀者具有一定C語言的程式設計經驗和TCP/IP方面的基本知識。要實習本文的示例,需要Linux下的gcc編譯平臺支援。
Socket定義
網路的Socket資料傳輸是一種特殊的I/O,Socket也是一種檔案描述符。Socket也具有一個類似於開啟檔案的函式呼叫—Socket(),該函式返回一個整型的Socket描述符,隨後的連線建立、資料傳輸等操作都是透過該Socket實現的。常用 的Socket型別有兩種:流式Socket—SOCK_STREAM和資料包式Socket—SOCK_DGRAM。流式是一種面向連線的Socket,針對於面向連線的TCP服務應用;資料包式Socket是一種無連線的Socket,對應於無連線的UDP服務應用。
Socket程式設計相關資料型別定義
計算機資料儲存有兩種位元組優先順序:高位位元組優先和低位位元組優先。Intenet上資料以高位位元組優先順序在網路上傳輸,所以對於在內部是以低位位元組優先方式儲存資料的機器,在Internet上傳輸資料時就需要進行轉換。
我們要討論的第一個結構型別是:struct sockaddr,該型別是用來儲存socket資訊的:
struct sockaddr {
unsigned short sa_family; /* 地址族, AF_xxx */
char sa_data[14]; /* 14 位元組的協議地址 */ };
sa_family一般為AF_INET;sa_data則包含該socket的IP地址和埠號。
另外還有一種結構型別:
struct sockaddr_in {
short int sin_family; /* 地址族 */
unsigned short int sin_port; /* 埠號 */
struct in_addr sin_addr; /* IP地址 */
unsigned char sin_zero[8]; /* 填充0 以保持與struct sockaddr同樣大小 */
};
這個結構使用更為方便。sin_zero(它用來將sockaddr_in結構填充到與struct sockaddr同樣的長度)應該用bzero()或memset()函式將其置為零。指向sockaddr_in 的指標和指向sockaddr的指標可以相互轉換,這意味著如果一個函式所需引數型別是sockaddr時,你可以在函式呼叫的時候將一個指向sockaddr_in的指標轉換為指向sockaddr的指標;或者相反。sin_family通常被賦AF_INET;in_port和sin_addr應該轉換成為網路位元組優先順序;而sin_addr則不需要轉換。
我們下面討論幾個位元組順序轉換函式:
htons()--"Host to Network Short" ; htonl()--"Host to Network long"
ntohs()--"Network to Host Short" ; ntohl()--"Network to Host Long"
在這裡, h表示"host" ,n表示"network",s 表示"short",l表示 "long"。
開啟socket 描述符、建立繫結並建立連線
socket函式原型為:
int socket(int domain, int type, int protocol);
domain引數指定socket的型別:SOCK_STREAM 或SOCK_DGRAM;protocol通常賦值“0”。Socket()呼叫返回一個整型socket描述符,你可以在後面的呼叫使用它。一旦透過socket呼叫返回一個socket描述符,你應該將該socket與你本機上的一個埠相關聯(往往當你在設計伺服器端程式時需要呼叫該函式。隨後你就可以在該埠監聽服務請求;而客戶端一般無須呼叫該函式)。 Bind函式原型為 :
int bind(int sockfd,struct sockaddr *my_addr, int addrlen);
Sockfd是一個socket描述符,my_addr是一個指向包含有本機IP地址及埠號等資訊的sockaddr型別的指標;addrlen常被設定為sizeof(struct sockaddr)。
最後,對於bind 函式要說明的一點是,你可以用下面的賦值實現自動獲得本機IP地址和隨機獲取一個沒有被佔用的埠號:
my_addr.sin_port = 0; /* 系統隨機選擇一個未被使用的埠號 */
my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本機IP地址 */
透過將my_addr.sin_port置為0,函式會自動為你選擇一個未佔用的埠來使用。同樣,透過將my_addr.sin_addr.s_addr置為INADDR_ANY,系統會自動填入本機IP地址。Bind()函式在成功被呼叫時返回0;遇到錯誤時返回“-1”並將errno置為相應的錯誤號。另外要注意的是,當呼叫函式時,一般不要將埠號置為小於1024的值,因為1~1024是保留埠號,你可以使用大於1024中任何一個沒有被佔用的埠號。
Connect()函式用來與遠端伺服器建立一個TCP連線,其函式原型為:
int connect(int sockfd, struct sockaddr *serv_addr, int addrlen);
Sockfd是目的伺服器的sockt描述符;serv_addr是包含目的機IP地址和埠號的指標。遇到錯誤時返回-1,並且errno中包含相應的錯誤碼。進行客戶端程式設計無須呼叫bind(),因為這種情況下只需知道目的機器的IP地址,而客戶透過哪個埠與伺服器建立連線並不需要關心,核心會自動選擇一個未被佔用的埠供客戶端來使用。
Listen()——監聽是否有服務請求
在伺服器端程式中,當socket與某一埠捆綁以後,就需要監聽該埠,以便對到達的服務請求加以處理。
int listen(int sockfd, int backlog);
Sockfd是Socket系統呼叫返回的socket 描述符;backlog指定在請求佇列中允許的最大請求數,進入的連線請求將在佇列中等待accept()它們(參考下文)。cklog對佇列中等待服務的請求的數目進行了限制,大多數系統預設值為20。
當listen遇到錯誤時返回-1,errno被置為相應的錯誤碼。
故伺服器端程式通常按下列順序進行函式呼叫:
socket(); bind(); listen(); /* accept() goes here */
accept()——連線埠的服務請求。
當某個客戶端試圖與伺服器監聽的埠連線時,該連線請求將排隊等待伺服器accept()它。透過呼叫accept()函式為其建立一個連線,accept()函式將返回一個新的socket描述符,來供這個新連線來使用。而伺服器可以繼續在以前的那個socket上監聽,同時可以在新的socket描述符上進行資料send()(傳送)和recv()(接收)操作:
int accept(int sockfd, void *addr, int *addrlen);
sockfd是被監聽的socket描述符,addr通常是一個指向sockaddr_in變數的指標,該變數用來存放提出連線請求服務的主機的資訊(某臺主機從某個埠發出該請求);addrten通常為一個指向值為sizeof(struct sockaddr_in)的整型指標變數。錯誤發生時返回一個-1並且設定相應的errno值。
Send()和recv()——資料傳輸
這兩個函式是用於面向連線的socket上進行資料傳輸。
Send()函式原型為:
int send(int sockfd, const void *msg, int len, int flags);
Sockfd是你想用來傳輸資料的socket描述符,msg是一個指向要傳送資料的指標。
Len是以位元組為單位的資料的長度。flags一般情況下置為0(關於該引數的用法可參照man手冊)。
char *msg = "Beej was here!"; int len, bytes_sent; ... ...
len = strlen(msg); bytes_sent = send(sockfd, msg,len,0); ... ...
Send()函式返回實際上傳送出的位元組數,可能會少於你希望傳送的資料。所以需要對send()的返回值進行測量。當send()返回值與len不匹配時,應該對這種情況進行處理。
recv()函式原型為:
int recv(int sockfd,void *buf,int len,unsigned int flags);
Sockfd是接受資料的socket描述符;buf 是存放接收資料的緩衝區;len是緩衝的長度。Flags也被置為0。Recv()返回實際上接收的位元組數,或當出現錯誤時,返回-1並置相應的errno值。
Sendto()和recvfrom()——利用資料包方式進行資料傳輸
在無連線的資料包socket方式下,由於本地socket並沒有與遠端機器建立連線,所以在傳送資料時應指明目的地址,sendto()函式原型為:
int sendto(int sockfd, const void *msg,int len,unsigned int flags, const struct sockaddr *to, int tolen);
該函式比send()函式多了兩個引數,to表示目地機的IP地址和埠號資訊,而tolen常常被賦值為sizeof (struct sockaddr)。Sendto 函式也返回實際傳送的資料位元組長度或在出現傳送錯誤時返回-1。
Recvfrom()函式原型為:
int recvfrom(int sockfd,void *buf,int len,unsigned int lags,struct sockaddr *from,int *fromlen);
from是一個struct sockaddr型別的變數,該變數儲存源機的IP地址及埠號。fromlen常置為sizeof (struct sockaddr)。當recvfrom()返回時,fromlen包含實際存入from中的資料位元組數。Recvfrom()函式返回接收到的位元組數或當出現錯誤時返回-1,並置相應的errno。
應注意的一點是,當你對於資料包socket呼叫了connect()函式時,你也可以利用send()和recv()進行資料傳輸,但該socket仍然是資料包socket,並且利用傳輸層的UDP服務。但在傳送或接收資料包時,核心會自動為之加上目地和源地址資訊。
Close()和shutdown()——結束資料傳輸
當所有的資料操作結束以後,你可以呼叫close()函式來釋放該socket,從而停止在該socket上的任何資料操作:close(sockfd);
你也可以呼叫shutdown()函式來關閉該socket。該函式允許你只停止在某個方向上的資料傳輸,而一個方向上的資料傳輸繼續進行。如你可以關閉某socket的寫操作而允許繼續在該socket上接受資料,直至讀入所有資料。
int shutdown(int sockfd,int how);
Sockfd的含義是顯而易見的,而引數 how可以設為下列值:
·0-------不允許繼續接收資料
·1-------不允許繼續傳送資料
·2-------不允許繼續傳送和接收資料,均為允許則呼叫close ()
shutdown在操作成功時返回0,在出現錯誤時返回-1(並置相應errno)。
DNS——域名服務相關函式
由於IP地址難以記憶和讀寫,所以為了讀寫記憶方便,人們常常用域名來表示主機,這就需要進行域名和IP地址的轉換。函式gethostbyname()就是完成這種轉換的,函式原型為:
struct hostent *gethostbyname(const char *name);
函式返回一種名為hosten的結構型別,它的定義如下:
struct hostent {
char *h_name; /* 主機的官方域名 */
char **h_aliases; /* 一個以NULL結尾的主機別名陣列 */
int h_addrtype; /* 返回的地址型別,在Internet環境下為AF-INET */
int h_length; /*地址的位元組長度 */
char **h_addr_list; /* 一個以0結尾的陣列,包含該主機的所有地址*/
};
#define h_addr h_addr_list[0] /*在h-addr-list中的第一個地址*/
當 gethostname()呼叫成功時,返回指向struct hosten的指標,當呼叫失敗時返回-1。當呼叫gethostbyname時,你不能使用perror()函式來輸出錯誤資訊,而應該使用herror()函式來輸出。
面向連線的客戶/伺服器程式碼例項
這個伺服器透過一個連線向客戶傳送字串"Hello,world!"。只要在伺服器上執行該伺服器軟體,在客戶端執行客戶軟體,客戶端就會收到該字串。
該伺服器軟體程式碼見程式1:
#include stdio.h
#include stdlib.h
#include errno.h
#include string.h
#include sys/types.h
#include netinet/in.h
#include sys/socket.h
#include sys/wait.h
#define MYPORT 3490 /*伺服器監聽埠號 */
#define BACKLOG 10 /* 最大同時連線請求數 */
main()
{
intsock fd,new_fd; /* 監聽socket: sock_fd,資料傳輸socket:new_fd*
/
struct sockaddr_in my_addr; /* 本機地址資訊 */
struct sockaddr_in their_addr; /* 客戶地址資訊 */
n_size;
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) { /*錯誤檢測
*/
perror("socket"); exit(1); }
my_addr.sin_family=AF_INET;
my_addr.sin_port=htons(MYPORT);
my_addr.sin_addr.s_addr = INADDR_ANY;
bzero(&(my_addr.sin_zero),8);
if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockad
dr))
== -1) {/*錯誤檢測*/
perror("bind"); exit(1); }
if (listen(sockfd, BACKLOG) == -1) {/*錯誤檢測*/
perror("listen"); exit(1); }
while(1) { /* main accept() loop */
sin_size = sizeof(struct sockaddr_in);
if ((new_fd = accept(sockfd, (struct sockaddr *)&their_addr,
&sin_size)) == -1) {
perror("accept"); continue; }
printf("server: got connection from %s
",
inet_ntoa(their_addr.sin_addr));
if (!fork()) { /* 子程式程式碼段 */
if (send(new_fd, "Hello, world!
", 14, 0) == -1)
perror("send"); close(new_fd); exit(0); }
close(new_fd); /* 父程式不再需要該socket */
waitpid(-1,NULL,WNOHANG) > 0 /*等待子程式結束,清除子程式所佔用資源
*/
}
}
(程式1)
伺服器首先建立一個Socket,然後將該Socket與本地地址/埠號捆綁,成功之後就在相應的socket上監聽,當accpet捕捉到一個連線服務請求時,就生成一個新的socket,並透過這個新的socket向客戶端傳送字串"Hello,world!",然後關閉該socket。
fork()函式生成一個子程式來處理資料傳輸部分,fork()語句對於子程式返回的值為0。所以包含fork函式的if語句是子程式程式碼部分,它與if語句後面的父程式程式碼部分是併發執行的。
客戶端軟體程式碼部分見程式2:
#includestdio.h
#include stdlib.h
#include errno.h
#include string.h
#include netdb.h
#include sys/types.h
#include netinet/in.h
#include sys/socket.h
#define PORT 3490
#define MAXDATASIZE 100 /*每次最大資料傳輸量 */
int main(int argc, char *argv[])
{
int sockfd, numbytes;
char buf[MAXDATASIZE];
struct hostent *he;
struct sockaddr_in their_addr;
if (argc != 2) {
fprintf(stderr,"usage: client hostname
"); exit(1); }
if((he=gethostbyname(argv[1]))==NULL) {
herror("gethostbyname"); exit(1); }
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
perror("socket"); exit(1); }
their_addr.sin_family=AF_INET;
their_addr.sin_port=htons(PORT);
their_addr.sin_addr = *((struct in_addr *)he->h_addr);
bzero(&(their_addr.sin_zero),8);
if (connect(sockfd, (struct sockaddr *)&their_addr,
sizeof(struct sockaddr)) == -1) {/*錯誤檢測*/
perror("connect"); exit(1); }
if ((numbytes=recv(sockfd, buf, MAXDATASIZE, 0)) == -1) {
perror("recv"); exit(1); }
buf[numbytes] = '';
printf("Received: %s",buf);
close(sockfd);
return 0;
}
(程式2)
客戶端程式碼相對來說要簡單一些,首先透過伺服器域名獲得其IP地址,然後建立一個socket,呼叫connect函式與伺服器建立連線,連線成功之後接收從伺服器傳送過來的資料,最後關閉socket,結束程式。
無連線的客戶/伺服器程式的在原理上和連線的客戶/伺服器是一樣的,兩者的區別在於無連線的客戶/伺服器中的客戶一般不需要建立連線,而且在傳送接收資料時,需要指定遠端機的地址。
關於阻塞(blocking)的概念和select()函式當伺服器執行到accept語句時,而沒有客戶連線服務請求到來,那麼會發生什麼情況?這時伺服器就會停止在accept語句上等待連線服務請求的到來;同樣,當程式執行到接收資料語句時,如果沒有資料可以讀取,則程式同樣會停止在接收語句上。這種情況稱為blocking。但如果你希望伺服器僅僅注意檢查是否有客戶在等待連線,有就接受連線;否則就繼續做其他事情,則可以透過將Socke設定為非阻塞方式來實現:非阻塞socket在沒有客戶在等待時就使accept呼叫立即返回。
#include unistd.h
#include fcntl.h
. . . . ; sockfd = socket(AF_INET,SOCK_STREAM,0);
fcntl(sockfd,F_SETFL,O_NONBLOCK); . . . . .
透過設定socket為非阻塞方式,可以實現“輪詢”若干Socket。當企圖從一個沒有資料等待處理的非阻塞Socket讀入資料時,函式將立即返回,並且返回值置為-1,並且errno置為EWOULDBLOCK。但是這種“輪詢”會使CPU處於忙等待方式,從而降低效能。考慮到這種情況,假設你希望伺服器監聽連線服務請求的同時從已經建立的連線讀取資料,你也許會想到用一個accept語句和多個recv()語句,但是由於accept及recv都是會阻塞的,所以這個想法顯然不會成功。
呼叫非阻塞的socket會大大地浪費系統資源。而呼叫select()會有效地解決這個問題,它允許你把程式本身掛起來,而同時使系統核心監聽所要求的一組檔案描述符的任何活動,只要確認在任何被監控的檔案描述符上出現活動,select()呼叫將返回指示該檔案描述符已準備好的資訊,從而實現了為程式選出隨機的變化,而不必由程式本身對輸入進行測試而浪費CPU開銷。Select函式原型為:
int select(int numfds,fd_set *readfds,fd_set *writefds,fd_set *exeptfds,struct timeval *timeout);
其中readfds、writefds、exceptfds分別是被select()監視的讀、寫和異常處理的檔案描述符集合。如果你希望確定是否可以從標準輸入和某個socket描述符讀取資料,你只需要將標準輸入的檔案描述符0和相應的sockdtfd加入到readfds集合中;numfds的值是需要檢查的號碼最高的檔案描述符加1,這個例子中numfds的值應為sockfd+1;當select返回時,readfds將被修改,指示某個檔案描述符已經準備被讀取,你可以透過FD_ISSSET()來測試。為了實現fd_set中對應的檔案描述符的設定、復位和測試,它提供了一組宏:
FD_ZERO(fd_set *set)----清除一個檔案描述符集;
FD_SET(int fd,fd_set *set)----將一個檔案描述符加入檔案描述符集中;
FD_CLR(int fd,fd_set *set)----將一個檔案描述符從檔案描述符集中清除
FD_ISSET(int fd,fd_set *set)----試判斷是否檔案描述符被置位。
Timeout引數是一個指向struct timeval型別的指標,它可以使select()在等待timeout長時間後沒有檔案描述符準備好即返回。struct timeval資料結構為:
struct timeval {
int tv_sec; /* seconds */
int tv_usec; /* microseconds */
};
我們透過程式3來說明:
#include sys/time.h
#include sys/types.h
#include unistd.h
#define STDIN 0 /*標準輸入檔案描述符*/
main()
{
struct timeval tv;
fd_set readfds;
tv.tv_sec = 2;
tv.tv_usec = 500000;
FD_ZERO(&readfds);
FD_SET(STDIN,&readfds);
/* 這裡不關心寫檔案和異常處理檔案描述符集合 */
select(STDIN+1, &readfds, NULL, NULL, &tv);
if (FD_ISSET(STDIN, &readfds)) printf("A key was pressed!
");
else printf("Timed out.
");
}
(程式3)
select()在被監視埠等待2.5秒鐘以後,就從select返回

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/35489/viewspace-84227/,如需轉載,請註明出處,否則將追究法律責任。

相關文章