Linux環境下的Socket程式設計

yangdelong發表於2009-10-09

http://www.yuanma.org/data/2006/0730/article_1262.htm

 

什麼是Socket
  Socket介面是TCP/IP網路的API,Socket介面定義了許多函式或例程,程式設計師可以用它們來開發TCP/IP網路上的應用程式。要學Internet上的TCP/IP網路程式設計,必須理解Socket介面。
   Socket介面設計者最先是將介面放在Unix作業系統裡面的。如果瞭解Unix系統的輸入和輸出的話,就很容易瞭解Socket了。網路的 Socket資料傳輸是一種特殊的I/O,Socket也是一種檔案描述符。Socket也具有一個類似於開啟檔案的函式呼叫Socket(),該函式返 回一個整型的Socket描述符,隨後的連線建立、資料傳輸等操作都是通過該Socket實現的。常用的Socket型別有兩種:流式Socket (SOCK_STREAM)和資料包式Socket(SOCK_DGRAM)。流式是一種面向連線的Socket,針對於面向連線的TCP服務應用;資料 報式Socket是一種無連線的Socket,對應於無連線的UDP服務應用。

Socket建立
  為了建立Socket,程式可以呼叫Socket函式,該函式返回一個類似於檔案描述符的控制程式碼。socket函式原型為:
  int socket(int domain, int type, int protocol);
   domain指明所使用的協議族,通常為PF_INET,表示網際網路協議族(TCP/IP協議族);type引數指定socket的型別: SOCK_STREAM 或SOCK_DGRAM,Socket介面還定義了原始Socket(SOCK_RAW),允許程式使用低層協議;protocol通常賦值"0"。 Socket()呼叫返回一個整型socket描述符,你可以在後面的呼叫使用它。
  Socket描述符是一個指向內部資料結構的指標,它指向描述符表入口。呼叫Socket函式時,socket執行體將建立一個Socket,實際上"建立一個Socket"意味著為一個Socket資料結構分配儲存空間。Socket執行體為你管理描述符表。
  兩個網路程式之間的一個網路連線包括五種資訊:通訊協議、本地協議地址、本地主機埠、遠端主機地址和遠端協議埠。Socket資料結構中包含這五種資訊。

Socket配置
   通過socket呼叫返回一個socket描述符後,在使用socket進行網路傳輸以前,必須配置該socket。面向連線的socket客戶端通過 呼叫Connect函式在socket資料結構中儲存本地和遠端資訊。無連線socket的客戶端和服務端以及面向連線socket的服務端通過呼叫 bind函式來配置本地資訊。
Bind函式將socket與本機上的一個埠相關聯,隨後你就可以在該埠監聽服務請求。Bind函式原型為:
  int bind(int sockfd,struct sockaddr *my_addr, int addrlen);
  Sockfd是呼叫socket函式返回的socket描述符,my_addr是一個指向包含有本機IP地址及埠號等資訊的sockaddr型別的指標;addrlen常被設定為sizeof(struct sockaddr)。
  struct sockaddr結構型別是用來儲存socket資訊的:
  struct sockaddr {
   unsigned short sa_family; /* 地址族, AF_xxx */
char sa_data[14]; /* 14 位元組的協議地址 */
};
  sa_family一般為AF_INET,代表Internet(TCP/IP)地址族;sa_data則包含該socket的IP地址和埠號。
  另外還有一種結構型別:
  struct sockaddr_in {
   short int sin_family; /* 地址族 */
   unsigned short int sin_port; /* 埠號 */
   struct in_addr sin_addr; /* IP地址 */
   unsigned char sin_zero[8]; /* 填充0 以保持與struct sockaddr同樣大小 */
  };
   這個結構更方便使用。sin_zero用來將sockaddr_in結構填充到與struct sockaddr同樣的長度,可以用bzero()或memset()函式將其置為零。指向sockaddr_in 的指標和指向sockaddr的指標可以相互轉換,這意味著如果一個函式所需引數型別是sockaddr時,你可以在函式呼叫的時候將一個指向 sockaddr_in的指標轉換為指向sockaddr的指標;或者相反。
  使用bind函式時,可以用下面的賦值實現自動獲得本機IP地址和隨機獲取一個沒有被佔用的埠號:
  my_addr.sin_port = 0; /* 系統隨機選擇一個未被使用的埠號 */
  my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本機IP地址 */
通過將my_addr.sin_port置為0,函式會自動為你選擇一個未佔用的埠來使用。同樣,通過將my_addr.sin_addr.s_addr置為INADDR_ANY,系統會自動填入本機IP地址。
注意在使用bind函式是需要將sin_port和sin_addr轉換成為網路位元組優先順序;而sin_addr則不需要轉換。
  計算機資料儲存有兩種位元組優先順序:高位位元組優先和低位位元組優先。Internet上資料以高位位元組優先順序在網路上傳輸,所以對於在內部是以低位位元組優先方式儲存資料的機器,在Internet上傳輸資料時就需要進行轉換,否則就會出現資料不一致。
  下面是幾個位元組順序轉換函式:
·htonl():把32位值從主機位元組序轉換成網路位元組序
·htons():把16位值從主機位元組序轉換成網路位元組序
·ntohl():把32位值從網路位元組序轉換成主機位元組序
·ntohs():把16位值從網路位元組序轉換成主機位元組序
  Bind()函式在成功被呼叫時返回0;出現錯誤時返回"-1"並將errno置為相應的錯誤號。需要注意的是,在呼叫bind函式時一般不要將埠號置為小於1024的值,因為1到1024是保留埠號,你可以選擇大於1024中的任何一個沒有被佔用的埠號。

連線建立
  面向連線的客戶程式使用Connect函式來配置socket並與遠端伺服器建立一個TCP連線,其函式原型為:
  int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);
Sockfd 是socket函式返回的socket描述符;serv_addr是包含遠端主機IP地址和埠號的指標;addrlen是遠端地質結構的長度。 Connect函式在出現錯誤時返回-1,並且設定errno為相應的錯誤碼。進行客戶端程式設計無須呼叫bind(),因為這種情況下只需知道目的機器 的IP地址,而客戶通過哪個埠與伺服器建立連線並不需要關心,socket執行體為你的程式自動選擇一個未被佔用的埠,並通知你的程式資料什麼時候到 打斷口。
  Connect函式啟動和遠端主機的直接連線。只有面向連線的客戶程式使用socket時才需要將此socket與遠端主機相連。無連線協議從不建立直接連線。面向連線的伺服器也從不啟動一個連線,它只是被動的在協議埠監聽客戶的請求。
  Listen函式使socket處於被動的監聽模式,併為該socket建立一個輸入資料佇列,將到達的服務請求儲存在此佇列中,直到程式處理它們。
  int listen(int sockfd, int backlog);
Sockfd 是Socket系統呼叫返回的socket 描述符;backlog指定在請求佇列中允許的最大請求數,進入的連線請求將在佇列中等待accept()它們(參考下文)。Backlog對佇列中等待 服務的請求的數目進行了限制,大多數系統預設值為20。如果一個服務請求到來時,輸入佇列已滿,該socket將拒絕連線請求,客戶將收到一個出錯資訊。
當出現錯誤時listen函式返回-1,並置相應的errno錯誤碼。
  accept()函式讓伺服器接收客戶的連線請求。在建立好輸入佇列後,伺服器就呼叫accept函式,然後睡眠並等待客戶的連線請求。
  int accept(int sockfd, void *addr, int *addrlen);
   sockfd是被監聽的socket描述符,addr通常是一個指向sockaddr_in變數的指標,該變數用來存放提出連線請求服務的主機的資訊 (某臺主機從某個埠發出該請求);addrten通常為一個指向值為sizeof(struct sockaddr_in)的整型指標變數。出現錯誤時accept函式返回-1並置相應的errno值。
  首先,當accept函式監視的 socket收到連線請求時,socket執行體將建立一個新的socket,執行體將這個新socket和請求連線程式的地址聯絡起來,收到服務請求的 初始socket仍可以繼續在以前的 socket上監聽,同時可以在新的socket描述符上進行資料傳輸操作。

資料傳輸
  Send()和recv()這兩個函式用於面向連線的socket上進行資料傳輸。
  Send()函式原型為:
  int send(int sockfd, const void *msg, int len, int flags);
Sockfd是你想用來傳輸資料的socket描述符;msg是一個指向要傳送資料的指標;Len是以位元組為單位的資料的長度;flags一般情況下置為0(關於該引數的用法可參照man手冊)。
  Send()函式返回實際上傳送出的位元組數,可能會少於你希望傳送的資料。在程式中應該將send()的返回值與欲傳送的位元組數進行比較。當send()返回值與len不匹配時,應該對這種情況進行處理。
char *msg = "Hello!";
int len, bytes_sent;
……
len = strlen(msg);
bytes_sent = send(sockfd, msg,len,0);
……
  recv()函式原型為:
  int recv(int sockfd,void *buf,int len,unsigned int flags);
  Sockfd是接受資料的socket描述符;buf 是存放接收資料的緩衝區;len是緩衝的長度。Flags也被置為0。Recv()返回實際上接收的位元組數,當出現錯誤時,返回-1並置相應的errno值。
Sendto()和recvfrom()用於在無連線的資料包socket方式下進行資料傳輸。由於本地socket並沒有與遠端機器建立連線,所以在傳送資料時應指明目的地址。
sendto()函式原型為:
  int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
  該函式比send()函式多了兩個引數,to表示目地機的IP地址和埠號資訊,而tolen常常被賦值為sizeof (struct sockaddr)。Sendto 函式也返回實際傳送的資料位元組長度或在出現傳送錯誤時返回-1。
  Recvfrom()函式原型為:
  int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
   from是一個struct sockaddr型別的變數,該變數儲存源機的IP地址及埠號。fromlen常置為sizeof (struct sockaddr)。當recvfrom()返回時,fromlen包含實際存入from中的資料位元組數。Recvfrom()函式返回接收到的位元組數或 當出現錯誤時返回-1,並置相應的errno。
如果你對資料包socket呼叫了connect()函式時,你也可以利用send()和recv()進行資料傳輸,但該socket仍然是資料包socket,並且利用傳輸層的UDP服務。但在傳送或接收資料包時,核心會自動為之加上目地和源地址資訊。

結束傳輸
  當所有的資料操作結束以後,你可以呼叫close()函式來釋放該socket,從而停止在該socket上的任何資料操作:
close(sockfd);
  你也可以呼叫shutdown()函式來關閉該socket。該函式允許你只停止在某個方向上的資料傳輸,而一個方向上的資料傳輸繼續進行。如你可以關閉某socket的寫操作而允許繼續在該socket上接受資料,直至讀入所有資料。
  int shutdown(int sockfd,int how);
  Sockfd是需要關閉的socket的描述符。引數 how允許為shutdown操作選擇以下幾種方式:
  ·0-------不允許繼續接收資料
  ·1-------不允許繼續傳送資料
·2-------不允許繼續傳送和接收資料,
·均為允許則呼叫close ()
  shutdown在操作成功時返回0,在出現錯誤時返回-1並置相應errno。
面向連線的Socket例項
  程式碼例項中的伺服器通過socket連線向客戶端傳送字串"Hello, you are connected!"。只要在伺服器上執行該伺服器軟體,在客戶端執行客戶軟體,客戶端就會收到該字串。
  該伺服器軟體程式碼如下:
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#include <sys/wait.h>
#define SERVPORT 3333 /*伺服器監聽埠號 */
#define BACKLOG 10 /* 最大同時連線請求數 */
main()
{
int sockfd,client_fd; /*sock_fd:監聽socket;client_fd:資料傳輸socket */
 struct sockaddr_in my_addr; /* 本機地址資訊 */
 struct sockaddr_in remote_addr; /* 客戶端地址資訊 */
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
  perror("socket建立出錯!"); exit(1);
}
my_addr.sin_family=AF_INET;
 my_addr.sin_port=htons(SERVPORT);
 my_addr.sin_addr.s_addr = INADDR_ANY;
bzero(&(my_addr.sin_zero),8);
 if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) /
   == -1) {
perror("bind出錯!");
exit(1);
}
 if (listen(sockfd, BACKLOG) == -1) {
perror("listen出錯!");
exit(1);
}
while(1) {
  sin_size = sizeof(struct sockaddr_in);
  if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr, /
  &sin_size)) == -1) {
perror("accept出錯");
continue;
}
  printf("received a connection from %s/n", inet_ntoa(remote_addr.sin_addr));
  if (!fork()) { /* 子程式程式碼段 */
   if (send(client_fd, "Hello, you are connected!/n", 26, 0) == -1)
   perror("send出錯!");
close(client_fd);
exit(0);
}
  close(client_fd);
  }
 }
}
   伺服器的工作流程是這樣的:首先呼叫socket函式建立一個Socket,然後呼叫bind函式將其與本機地址以及一個本地埠號繫結,然後呼叫 listen在相應的socket上監聽,當accpet接收到一個連線服務請求時,將生成一個新的socket。伺服器顯示該客戶機的IP地址,並通過 新的socket向客戶端傳送字串"Hello,you are connected!"。最後關閉該socket。
  程式碼例項中的fork()函式生成一個子程式來處理資料傳輸部分,fork()語句對於子程式返回的值為0。所以包含fork函式的if語句是子程式程式碼部分,它與if語句後面的父程式程式碼部分是併發執行的。

客戶端程式程式碼如下:
#include<stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <netdb.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#define SERVPORT 3333
#define MAXDATASIZE 100 /*每次最大資料傳輸量 */
main(int argc, char *argv[]){
 int sockfd, recvbytes;
 char buf[MAXDATASIZE];
 struct hostent *host;
 struct sockaddr_in serv_addr;
 if (argc < 2) {
fprintf(stderr,"Please enter the server's hostname!/n");
exit(1);
}
 if((host=gethostbyname(argv[1]))==NULL) {
herror("gethostbyname出錯!");
exit(1);
}
 if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
perror("socket建立出錯!");
exit(1);
}
 serv_addr.sin_family=AF_INET;
 serv_addr.sin_port=htons(SERVPORT);
 serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
 bzero(&(serv_addr.sin_zero),8);
 if (connect(sockfd, (struct sockaddr *)&serv_addr, /
   sizeof(struct sockaddr)) == -1) {
perror("connect出錯!");
exit(1);
}
 if ((recvbytes=recv(sockfd, buf, MAXDATASIZE, 0)) ==-1) {
perror("recv出錯!");
exit(1);
}
 buf[recvbytes] = '/0';
 printf("Received: %s",buf);
 close(sockfd);
}
  客戶端程式首先通過伺服器域名獲得伺服器的IP地址,然後建立一個socket,呼叫connect函式與伺服器建立連線,連線成功之後接收從伺服器傳送過來的資料,最後關閉socket。
  函式gethostbyname()是完成域名轉換的。由於IP地址難以記憶和讀寫,所以為了方便,人們常常用域名來表示主機,這就需要進行域名和IP地址的轉換。函式原型為:
  struct hostent *gethostbyname(const char *name);
  函式返回為hosten的結構型別,它的定義如下:
  struct hostent {
  char *h_name; /* 主機的官方域名 */
   char **h_aliases; /* 一個以NULL結尾的主機別名陣列 */
   int h_addrtype; /* 返回的地址型別,在Internet環境下為AF-INET */
  int h_length; /* 地址的位元組長度 */
   char **h_addr_list; /* 一個以0結尾的陣列,包含該主機的所有地址*/
  };
  #define h_addr h_addr_list[0] /*在h-addr-list中的第一個地址*/
  當 gethostname()呼叫成功時,返回指向struct hosten的指標,當呼叫失敗時返回-1。當呼叫gethostbyname時,你不能使用perror()函式來輸出錯誤資訊,而應該使用herror()函式來輸出。

  無連線的客戶/伺服器程式的在原理上和連線的客戶/伺服器是一樣的,兩者的區別在於無連線的客戶/伺服器中的客戶一般不需要建立連線,而且在傳送接收資料時,需要指定遠端機的地址。

阻塞和非阻塞
   阻塞函式在完成其指定的任務以前不允許程式呼叫另一個函式。例如,程式執行一個讀資料的函式呼叫時,在此函式完成讀操作以前將不會執行下一程式語句。當 伺服器執行到accept語句時,而沒有客戶連線服務請求到來,伺服器就會停止在accept語句上等待連線服務請求的到來。這種情況稱為阻塞 (blocking)。而非阻塞操作則可以立即完成。比如,如果你希望伺服器僅僅注意檢查是否有客戶在等待連線,有就接受連線,否則就繼續做其他事情,則 可以通過將Socket設定為非阻塞方式來實現。非阻塞socket在沒有客戶在等待時就使accept呼叫立即返回。
  #include <unistd.h>
  #include <fcntl.h>
  ……
sockfd = socket(AF_INET,SOCK_STREAM,0);
fcntl(sockfd,F_SETFL,O_NONBLOCK);
……
   通過設定socket為非阻塞方式,可以實現"輪詢"若干Socket。當企圖從一個沒有資料等待處理的非阻塞Socket讀入資料時,函式將立即返 回,返回值為-1,並置errno值為EWOULDBLOCK。但是這種"輪詢"會使CPU處於忙等待方式,從而降低效能,浪費系統資源。而呼叫 select()會有效地解決這個問題,它允許你把程式本身掛起來,而同時使系統核心監聽所要求的一組檔案描述符的任何活動,只要確認在任何被監控的檔案 描述符上出現活動,select()呼叫將返回指示該檔案描述符已準備好的資訊,從而實現了為程式選出隨機的變化,而不必由程式本身對輸入進行測試而浪費 CPU開銷。Select函式原型為:
int select(int numfds,fd_set *readfds,fd_set *writefds,
fd_set *exceptfds,struct timeval *timeout);
   其中readfds、writefds、exceptfds分別是被select()監視的讀、寫和異常處理的檔案描述符集合。如果你希望確定是否可以 從標準輸入和某個socket描述符讀取資料,你只需要將標準輸入的檔案描述符0和相應的sockdtfd加入到readfds集合中;numfds的值 是需要檢查的號碼最高的檔案描述符加1,這個例子中numfds的值應為sockfd+1;當select返回時,readfds將被修改,指示某個檔案 描述符已經準備被讀取,你可以通過FD_ISSSET()來測試。為了實現fd_set中對應的檔案描述符的設定、復位和測試,它提供了一組巨集:
  FD_ZERO(fd_set *set)----清除一個檔案描述符集;
  FD_SET(int fd,fd_set *set)----將一個檔案描述符加入檔案描述符集中;
  FD_CLR(int fd,fd_set *set)----將一個檔案描述符從檔案描述符集中清除;
  FD_ISSET(int fd,fd_set *set)----試判斷是否檔案描述符被置位。
  Timeout引數是一個指向struct timeval型別的指標,它可以使select()在等待timeout長時間後沒有檔案描述符準備好即返回。struct timeval資料結構為:
  struct timeval {
   int tv_sec; /* seconds */
   int tv_usec; /* microseconds */
};

POP3客戶端例項
  下面的程式碼例項基於POP3的客戶協議,與郵件伺服器連線並取回指定使用者帳號的郵件。與郵件伺服器互動的命令儲存在字串陣列POPMessage中,程式通過一個do-while迴圈依次傳送這些命令。
#include<stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <netdb.h>
#include <sys/types.h>
#include <netinet/in.h>
#include <sys/socket.h>
#define POP3SERVPORT 110
#define MAXDATASIZE 4096

main(int argc, char *argv[]){
int sockfd;
struct hostent *host;
struct sockaddr_in serv_addr;
char *POPMessage[]={
"USER userid/r/n",
"PASS password/r/n",
"STAT/r/n",
"LIST/r/n",
"RETR 1/r/n",
"DELE 1/r/n",
"QUIT/r/n",
NULL
};
int iLength;
int iMsg=0;
int iEnd=0;
char buf[MAXDATASIZE];

if((host=gethostbyname("your.server"))==NULL) {
perror("gethostbyname error");
exit(1);
}
if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
perror("socket error");
exit(1);
}
serv_addr.sin_family=AF_INET;
serv_addr.sin_port=htons(POP3SERVPORT);
serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
bzero(&(serv_addr.sin_zero),8);
if (connect(sockfd, (struct sockaddr *)&serv_addr,sizeof(struct sockaddr))==-1){
perror("connect error");
exit(1);
}

do {
send(sockfd,POPMessage[iMsg],strlen(POPMessage[iMsg]),0);
printf("have sent: %s",POPMessage[iMsg]);

iLength=recv(sockfd,buf+iEnd,sizeof(buf)-iEnd,0);
iEnd+=iLength;
buf[iEnd]='/0';
printf("received: %s,%d/n",buf,iMsg);

iMsg++;
} while (POPMessage[iMsg]);

close(sockfd);
}

相關文章