程式間通訊(Socket)

布瑋發表於2018-08-31

程式間通訊(Socket)


知識面前,不分貴賤。 –RuiDer


一、什麼是socket

socket,即套接字是一種通訊機制,憑藉這種機制,客戶/伺服器
(即要進行通訊的程式)系統的開發工作既可以在本地單機上進行,
也可以跨網路進行。也就是說它可以讓不在同一臺計算機但通過網
絡連線計算機上的程式進行通訊。也因為這樣,套接字明確地將客
戶端和伺服器區分開來。

二、套接字的屬性

套接字的特性由3個屬性確定,它們分別是:域、型別和協議。

1、套接字的域

它指定套接字通訊中使用的網路介質,最常見的套接字域是AF_INET,它指的是Internet網路。當客戶使用套接字進行跨網路的連線時,它就需要用到伺服器計算機的IP地址和埠來指定一臺聯網機器上的某個特定服務,所以在使用socket作為通訊的終點,伺服器應用程式必須在開始通訊之前繫結一個埠,伺服器在指定的埠等待客戶的連線。另一個域AF_UNIX表示UNIX檔案系統,它就是檔案輸入/輸出,而它的地址就是檔名。

2、套接字型別

因特網提供了兩種通訊機制:流(stream)和資料包(datagram),因而套接字的型別也就分為流套接字和資料包套接字。這裡主要講流套接字。

流套接字由型別SOCK_STREAM指定,它們是在AF_INET域中通過TCP/IP連線實現,同時也是AF_UNIX中常用的套接字型別。流套接字提供的是一個有序、可靠、雙向位元組流的連線,因此傳送的資料可以確保不會丟失、重複或亂序到達,而且它還有一定的出錯後重新傳送的機制。

與流套接字相對的是由型別SOCK_DGRAM指定的資料包套接字,它不需要建立連線和維持一個連線,它們在AF_INET中通常是通過UDP/IP協議實現的。它對可以傳送的資料的長度有限制,資料包作為一個單獨的網路訊息被傳輸,它可能會丟失、複製或錯亂到達,UDP不是一個可靠的協議,但是它的速度比較高,因為它並一需要總是要建立和維持一個連線。

3、套接字協議
只要底層的傳輸機制允許不止一個協議來提供要求的套接字型別,我們就可以為套接字選擇一個特定的協議。通常只需要使用預設值。

三、套接字地址

每個套接字都有其自己的地址格式,對於AF_UNIX域套接字來說,它的地址由結構sockaddr_un來描述,該結構定義在標頭檔案sys/un.h中,它的定義如下:

struct sockaddr_un{  
    sa_family_t sun_family;//AF_UNIX,它是一個短整型  
    char        sum_path[];//路徑名  
};  

對於AF_INET域套接字來說,它的地址結構由sockaddr_in來描述,它至少包括以下幾個成員:

struct sockaddr_in{  
    short int            sin_family;//AF_INET  
    unsigned short int    sin_port;//埠號  
    struct in_addr        sin_addr;//IP地址  
};  

而in_addr被定義為:


struct in_addr{  
    unsigned long int s_addr;  
};  

四、基於流套接字的客戶/伺服器的工作流程

使用socket進行程式通訊的程式採用的客戶/伺服器系統是如何工作的呢?

1、伺服器端

首先伺服器應用程式用系統呼叫socket來建立一個套接安,它是系統分配給該伺服器程式的類似檔案描述符的資源,它不能與其他的程式共享。

接下來,伺服器程式會給套接字起個名字,我們使用系統呼叫bind來給套接字命名。然後伺服器程式就開始等待客戶連線到這個套接字。

然後,系統呼叫listen來建立一個佇列並將其用於存放來自客戶的進入連線。

最後,伺服器通過系統呼叫accept來接受客戶的連線。它會建立一個與原有的命名套接不同的新套接字,這個套接字只用於與這個特定客戶端進行通訊,而命名套接字(即原先的套接字)則被保留下來繼續處理來自其他客戶的連線。

2、客戶端

基於socket的客戶端比伺服器端簡單,同樣,客戶應用程式首先呼叫socket來建立一個未命名的套接字,然後將伺服器的命名套接字作為一個地址來呼叫connect與伺服器建立連線。

一旦連線建立,我們就可以像使用底層的檔案描述符那樣用套接字來實現雙向資料的通訊。

五、流式socket的介面及作用

socket的介面函式宣告在標頭檔案sys/types.h和sys/socket.h中。

1、建立套接字——socket系統呼叫

該函式用來建立一個套接字,並返回一個描述符,該描述符可以用來訪問該套接字,它的原型如下:

int socket(int domain, int type, int protocol);  

函式中的三個引數分別對應前面所說的三個套接字屬性。protocol引數設定為0表示使用預設協議。

2、命名(繫結)套接字——bind系統呼叫

該函式把通過socket呼叫建立的套接字命名,從而讓它可以被其他程式使用。對於AF_UNIX,呼叫該函式後套接字就會關聯到一個檔案系統路徑名,對於AF_INET,則會關聯到一個IP埠號。函式原型如下:

int bind( int socket, const struct sockaddr *address, size_t address_len);  

成功時返回0,失敗時返回-1;

3、建立套接字佇列(監聽)——listen系統呼叫

該函式用來建立一個佇列來儲存未處理的請求。成功時返回0,失敗時返回-1,其原型如下:

int listen(int socket, int backlog);  

backlog用於指定佇列的長度,等待處理的進入連線的個數最多不能超過這個數字,否則往後的連線將被拒絕,導致客戶的連線請求失敗。呼叫後,程式一直會監聽這個IP埠,如果有連線請求,就把它加入到這個佇列中。

4、接受連線——accept系統呼叫

該系統呼叫用來等待客戶建立對該套接字的連線。accept系統呼叫只有當客戶程式試圖連線到由socket引數指定的套接字上時才返回,也就是說,如果套接字佇列中沒有未處理的連線,accept將阻塞直到有客戶建立連線為止。accept函式將建立一個新套接字來與該客戶進行通訊,並且返回新套接字的描述符,新套接字的型別和伺服器監聽套接字型別是一樣的。它的原型如下:

int accept(int socket, struct sockaddr *address, size_t *address_len);  

address為連線客戶端的地址,引數address_len指定客戶結構的長度,如果客戶地址的長度超過這個值,它將會截斷。

5、請求連線——connect系統呼叫

該系統呼叫用來讓客戶程式通過在一個未命名套接字和伺服器監聽套接字之間建立連線的方法來連線到伺服器。它的原型如下:

int connect(int socket, const struct sockaddr *address, size_t address_len);  

引數socket指定的套接字連線到引數addres指定的伺服器套接字。成功時返回0,失敗時返回-1.

6、關閉socket——close系統呼叫

該系統呼叫用來終止伺服器和客戶上的套接字連線,我們應該總是在連線的兩端(伺服器和客戶)關閉套接字。

About Me

我的CSDN

我的Github