Linux 程式設計之 Ping 的實現

冠軍的試煉發表於2017-01-29

PING(Packet InterNet Groper)中文名為因特網包探索器,是用來檢視網路上另一個主機系統的網路連線是否正常的一個工具。ping命令的工作原理是:向網路上的另一個主機系統傳送ICMP報文,如果指定系統得到了報文,它將把回覆報文傳回給傳送者,這有點象潛水艇聲納系統中使用的發聲裝置。所以,我們想知道我這臺主機能不能和另一臺進行通訊,我們首先需要確認的是我們兩臺主機間的網路是不是通的,也就是我說的話能不能傳到你那裡,這是雙方進行通訊的前提。在Linux下使用指令ping的方法和現象如下:

PING的實現看起來並不複雜,我想自己寫程式碼實現這個功能,需要些什麼知識儲備?我簡單羅列了一下:

  • ICMP協議的理解
  • RAW套接字
  • 網路封包和解包技能

搭建這麼一個ping程式的步驟如下:

  1. ICMP包的封裝和解封
  2. 建立一個執行緒用於ICMP包的傳送
  3. 建立一個執行緒用於ICMP包的接收
  4. 原始套接字程式設計

PING的流程如下:

一、ICMP包的封裝和解封

(1) ICMP協議理解

要進行PING的開發,我們首先需要知道PING的實現是基於ICMP協議來開發的。要進行ICMP包的封裝和解封,我們首先需要理解ICMP協議。ICMP位於網路層,允許主機或者路由器報告差錯情況和提供有關異常情況的報告。ICMP報文是封裝在IP資料包中,作為其中的資料部分。ICMP報文作為IP層資料包的資料,加上資料包頭,組成IP資料包傳送出去。ICMP報文格式如下:

ICMP報文的種類有兩種,即ICMP差錯報告報文和ICMP詢問報文。PING程式使用的ICMP報文種類為ICMP詢問報文。注意一下上面說到的ICMP報文格式中的“型別”欄位,我們在組包的時候可以向該欄位填寫不同的值來標定該ICMP報文的型別。下面列出的是幾種常用的ICMP報文型別。

我們的PING程式需要用到的ICMP的型別是回送請求(8)。

因為ICMP報文的具體格式會因為ICMP報文的型別而各不相同,我們ping包的格式是這樣的:

(2) ICMP包的組裝

對照上面的ping包格式,我們封裝ping包的程式碼可以這麼寫:

void icmp_pack(struct icmp* icmphdr, int seq, int length)
{
    int i = 0;

    icmphdr->icmp_type = ICMP_ECHO;  //型別填回送請求
    icmphdr->icmp_code = 0;   
    icmphdr->icmp_cksum = 0; //注意,這裡先填寫0,很重要!
    icmphdr->icmp_seq = seq;  //這裡的序列號我們填1,2,3,4....
    icmphdr->icmp_id = pid & 0xffff;  //我們使用pid作為icmp_id,icmp_id只是2位元組,而pid有4位元組
    for(i=0;i<length;i++)
    {
        icmphdr->icmp_data[i] = i;  //填充資料段,使ICMP報文大於64B
    }

    icmphdr->icmp_cksum = cal_chksum((unsigned short*)icmphdr, length); //校驗和計算
}

這裡再三提醒一下,icmp_cksum 必須先填寫為0再執行校驗和演算法計算,否則ping時對方主機會因為校驗和計算錯誤而丟棄請求包,導致ping的失敗。我一個同事曾經就因為這麼一個錯誤而排查許久,血的教訓請銘記。

這裡簡單介紹一下checksum(校驗和)。

計算機網路通訊時,為了檢驗在資料傳輸過程中資料是否發生了錯誤,通常在傳輸資料的時候連同校驗和一塊傳輸,當接收端接受資料時候會從新計算校驗和,如果與原校驗和不同就視為出錯,丟棄該資料包,並返回icmp報文。

演算法基本思路:

IP/ICMP/IGMP/TCP/UDP等協議的校驗和演算法都是相同的,採用的都是將資料流視為16位整數流進行重複疊加計算。為了計算檢驗和,首先把檢驗和欄位置為0。然後,對有效資料範圍內中每個16位進行二進位制反碼求和,結果存在檢驗和欄位中,如果資料長度為奇數則補一位元組0。當收到資料後,同樣對有效資料範圍中每個16位數進行二進位制反碼的求和。由於接收方在計算過程中包含了傳送方存在首部中的檢驗和,因此,如果首部在傳輸過程中沒有發生任何差錯,那麼接收方計算的結果應該為全0或全1(具體看實現了,本質一樣) 。如果結果不是全0或全1,那麼表示資料錯誤。

/*校驗和演算法*/
unsigned short cal_chksum(unsigned short *addr,int len)
{       int nleft=len;
        int sum=0;
        unsigned short *w=addr;
        unsigned short answer=0;

        /*把ICMP報頭二進位制資料以2位元組為單位累加起來*/
        while(nleft>1)
        {       
            sum+=*w++;
            nleft-=2;
        }
        /*若ICMP報頭為奇數個位元組,會剩下最後一位元組。把最後一個位元組視為一個2位元組資料的高位元組,這個2位元組資料的低位元組為0,繼續累加*/
        if( nleft==1)
        {       
            *(unsigned char *)(&answer)=*(unsigned char *)w;
            sum+=answer;
        }
        sum=(sum>>16)+(sum&0xffff);
        sum+=(sum>>16);
        answer=~sum;
        return answer;
}

(3) ICMP包的解包

知道怎麼封裝包,那解包就也不難了,注意的是,收到一個ICMP包,我們不要就認為這個包就是我們發出去的ICMP回送回答包,我們需要加一層程式碼來判斷該ICMP報文的id和seq欄位是否符合我們傳送的ICMP報文的設定,來驗證ICMP回覆包的正確性。

int icmp_unpack(char* buf, int len)
{
    int iphdr_len;
    struct timeval begin_time, recv_time, offset_time;
    int rtt;  //round trip time

    struct ip* ip_hdr = (struct ip *)buf;
    iphdr_len = ip_hdr->ip_hl*4;
    struct icmp* icmp = (struct icmp*)(buf+iphdr_len); //使指標跳過IP頭指向ICMP頭
    len-=iphdr_len;  //icmp包長度
    if(len < 8)   //判斷長度是否為ICMP包長度
    {
        fprintf(stderr, "Invalid icmp packet.Its length is less than 8\n");
        return -1;
    }

    //判斷該包是ICMP回送回答包且該包是我們發出去的
    if((icmp->icmp_type == ICMP_ECHOREPLY) && (icmp->icmp_id == (pid & 0xffff))) 
    {
        if((icmp->icmp_seq < 0) || (icmp->icmp_seq > PACKET_SEND_MAX_NUM))
        {
            fprintf(stderr, "icmp packet seq is out of range!\n");
            return -1;
        }

        ping_packet[icmp->icmp_seq].flag = 0;
        begin_time = ping_packet[icmp->icmp_seq].begin_time;  //去除該包的發出時間
        gettimeofday(&recv_time, NULL);

        offset_time = cal_time_offset(begin_time, recv_time);
        rtt = offset_time.tv_sec*1000 + offset_time.tv_usec/1000; //毫秒為單位

        printf("%d byte from %s: icmp_seq=%u ttl=%d rtt=%d ms\n",
            len, inet_ntoa(ip_hdr->ip_src), icmp->icmp_seq, ip_hdr->ip_ttl, rtt);        

    }
    else
    {
        fprintf(stderr, "Invalid ICMP packet! Its id is not matched!\n");
        return -1;
    }
    return 0;
}

二、發包執行緒的搭建

根據PING程式的框架,我們需要建立一個執行緒用於ping包的傳送,我的想法是這樣的:使用sendto進行發包,發包速率我們維持在1秒1發,我們需要用一個全域性變數記錄第一個ping包發出的時間,除此之外,我們還需要一個全域性變數來記錄我們發出的ping包到底有幾個,這兩個變數用於後來收到ping包回覆後的資料計算。

void ping_send()
{
    char send_buf[128];
    memset(send_buf, 0, sizeof(send_buf));
    gettimeofday(&start_time, NULL); //記錄第一個ping包發出的時間
    while(alive)
    {
        int size = 0;
        gettimeofday(&(ping_packet[send_count].begin_time), NULL);
        ping_packet[send_count].flag = 1; //將該標記為設定為該包已傳送

        icmp_pack((struct icmp*)send_buf, send_count, 64); //封裝icmp包
        size = sendto(rawsock, send_buf, 64, 0, (struct sockaddr*)&dest, sizeof(dest));
        send_count++; //記錄發出ping包的數量
        if(size < 0)
        {
            fprintf(stderr, "send icmp packet fail!\n");
            continue;
        }

        sleep(1);
    }
}

三、收包執行緒的搭建

我們同樣建立一個接收包的執行緒,這裡我們採用select函式進行收包,併為select函式設定超時時間為200us,若發生超時,則進行下一個迴圈。同樣地,我們也需要一個全域性變數來記錄成功接收到的ping回覆包的數量。

void ping_recv()
{
    struct timeval tv;
    tv.tv_usec = 200;  //設定select函式的超時時間為200us
    tv.tv_sec = 0;
    fd_set read_fd;
    char recv_buf[512];
    memset(recv_buf, 0 ,sizeof(recv_buf));
    while(alive)
    {
        int ret = 0;
        FD_ZERO(&read_fd);
        FD_SET(rawsock, &read_fd);
        ret = select(rawsock+1, &read_fd, NULL, NULL, &tv);
        switch(ret)
        {
            case -1:
                fprintf(stderr,"fail to select!\n");
                break;
            case 0:
                break;
            default:
                {
                    int size = recv(rawsock, recv_buf, sizeof(recv_buf), 0);
                    if(size < 0)
                    {
                        fprintf(stderr,"recv data fail!\n");
                        continue;
                    }

                    ret = icmp_unpack(recv_buf, size); //對接收的包進行解封
                    if(ret == -1)  //不是屬於自己的icmp包,丟棄不處理
                    {
                        continue;
                    }
                    recv_count++; //接收包計數
                }
                break;
        }

    }
}

四、中斷處理

我們規定了一次ping傳送的包的最大值為64個,若超出該數值就停止傳送。作為PING的使用者,我們一般只會傳送若干個包,若有這幾個包順利返回,我們就crtl+c中斷ping。這裡的程式碼主要是為中斷訊號寫一箇中斷處理函式,將alive這個全域性變數設定為0,進而使傳送ping包的迴圈停止而結束程式。

void icmp_sigint(int signo)
{
    alive = 0;
    gettimeofday(&end_time, NULL);
    time_interval = cal_time_offset(start_time, end_time);
}

signal(SIGINT, icmp_sigint);

五、總體實現

各模組介紹完了,現在貼出完整程式碼。

#include <stdio.h>
#include <netinet/in.h>
#include <netinet/ip.h>
#include <netinet/ip_icmp.h>
#include <unistd.h>
#include <signal.h>
#include <arpa/inet.h>
#include <errno.h>
#include <sys/time.h>
#include <string.h>
#include <netdb.h>
#include <pthread.h>

#define PACKET_SEND_MAX_NUM 64

typedef struct ping_packet_status
{
    struct timeval begin_time;
    struct timeval end_time;
    int flag;   //傳送標誌,1為已傳送
    int seq;     //包的序列號
}ping_packet_status;

ping_packet_status ping_packet[PACKET_SEND_MAX_NUM];

int alive;
int rawsock;
int send_count;
int recv_count;
pid_t pid;
struct sockaddr_in dest;
struct timeval start_time;
struct timeval end_time;
struct timeval time_interval;

/*校驗和演算法*/
unsigned short cal_chksum(unsigned short *addr,int len)
{       int nleft=len;
        int sum=0;
        unsigned short *w=addr;
        unsigned short answer=0;

        /*把ICMP報頭二進位制資料以2位元組為單位累加起來*/
        while(nleft>1)
        {       
            sum+=*w++;
            nleft-=2;
        }
        /*若ICMP報頭為奇數個位元組,會剩下最後一位元組。把最後一個位元組視為一個2位元組資料的高位元組,這個2位元組資料的低位元組為0,繼續累加*/
        if( nleft==1)
        {       
            *(unsigned char *)(&answer)=*(unsigned char *)w;
            sum+=answer;
        }
        sum=(sum>>16)+(sum&0xffff);
        sum+=(sum>>16);
        answer=~sum;
        return answer;
}

struct timeval cal_time_offset(struct timeval begin, struct timeval end)
{
    struct timeval ans;
    ans.tv_sec = end.tv_sec - begin.tv_sec;
    ans.tv_usec = end.tv_usec - begin.tv_usec;
    if(ans.tv_usec < 0) //如果接收時間的usec小於傳送時間的usec,則向sec域借位
    {
        ans.tv_sec--;
        ans.tv_usec+=1000000;
    }
    return ans;
}

void icmp_pack(struct icmp* icmphdr, int seq, int length)
{
    int i = 0;

    icmphdr->icmp_type = ICMP_ECHO;
    icmphdr->icmp_code = 0;
    icmphdr->icmp_cksum = 0;
    icmphdr->icmp_seq = seq;
    icmphdr->icmp_id = pid & 0xffff;
    for(i=0;i<length;i++)
    {
        icmphdr->icmp_data[i] = i;
    }

    icmphdr->icmp_cksum = cal_chksum((unsigned short*)icmphdr, length);
}

int icmp_unpack(char* buf, int len)
{
    int iphdr_len;
    struct timeval begin_time, recv_time, offset_time;
    int rtt;  //round trip time

    struct ip* ip_hdr = (struct ip *)buf;
    iphdr_len = ip_hdr->ip_hl*4;
    struct icmp* icmp = (struct icmp*)(buf+iphdr_len);
    len-=iphdr_len;  //icmp包長度
    if(len < 8)   //判斷長度是否為ICMP包長度
    {
        fprintf(stderr, "Invalid icmp packet.Its length is less than 8\n");
        return -1;
    }

    //判斷該包是ICMP回送回答包且該包是我們發出去的
    if((icmp->icmp_type == ICMP_ECHOREPLY) && (icmp->icmp_id == (pid & 0xffff))) 
    {
        if((icmp->icmp_seq < 0) || (icmp->icmp_seq > PACKET_SEND_MAX_NUM))
        {
            fprintf(stderr, "icmp packet seq is out of range!\n");
            return -1;
        }

        ping_packet[icmp->icmp_seq].flag = 0;
        begin_time = ping_packet[icmp->icmp_seq].begin_time;
        gettimeofday(&recv_time, NULL);

        offset_time = cal_time_offset(begin_time, recv_time);
        rtt = offset_time.tv_sec*1000 + offset_time.tv_usec/1000; //毫秒為單位

        printf("%d byte from %s: icmp_seq=%u ttl=%d rtt=%d ms\n",
            len, inet_ntoa(ip_hdr->ip_src), icmp->icmp_seq, ip_hdr->ip_ttl, rtt);        

    }
    else
    {
        fprintf(stderr, "Invalid ICMP packet! Its id is not matched!\n");
        return -1;
    }
    return 0;
}

void ping_send()
{
    char send_buf[128];
    memset(send_buf, 0, sizeof(send_buf));
    gettimeofday(&start_time, NULL); //記錄第一個ping包發出的時間
    while(alive)
    {
        int size = 0;
        gettimeofday(&(ping_packet[send_count].begin_time), NULL);
        ping_packet[send_count].flag = 1; //將該標記為設定為該包已傳送

        icmp_pack((struct icmp*)send_buf, send_count, 64); //封裝icmp包
        size = sendto(rawsock, send_buf, 64, 0, (struct sockaddr*)&dest, sizeof(dest));
        send_count++; //記錄發出ping包的數量
        if(size < 0)
        {
            fprintf(stderr, "send icmp packet fail!\n");
            continue;
        }

        sleep(1);
    }
}

void ping_recv()
{
    struct timeval tv;
    tv.tv_usec = 200;  //設定select函式的超時時間為200us
    tv.tv_sec = 0;
    fd_set read_fd;
    char recv_buf[512];
    memset(recv_buf, 0 ,sizeof(recv_buf));
    while(alive)
    {
        int ret = 0;
        FD_ZERO(&read_fd);
        FD_SET(rawsock, &read_fd);
        ret = select(rawsock+1, &read_fd, NULL, NULL, &tv);
        switch(ret)
        {
            case -1:
                fprintf(stderr,"fail to select!\n");
                break;
            case 0:
                break;
            default:
                {
                    int size = recv(rawsock, recv_buf, sizeof(recv_buf), 0);
                    if(size < 0)
                    {
                        fprintf(stderr,"recv data fail!\n");
                        continue;
                    }

                    ret = icmp_unpack(recv_buf, size); //對接收的包進行解封
                    if(ret == -1)  //不是屬於自己的icmp包,丟棄不處理
                    {
                        continue;
                    }
                    recv_count++; //接收包計數
                }
                break;
        }

    }
}

void icmp_sigint(int signo)
{
    alive = 0;
    gettimeofday(&end_time, NULL);
    time_interval = cal_time_offset(start_time, end_time);
}

void ping_stats_show()
{
    long time = time_interval.tv_sec*1000+time_interval.tv_usec/1000;
    /*注意除數不能為零,這裡send_count有可能為零,所以執行時提示錯誤*/
    printf("%d packets transmitted, %d recieved, %d%c packet loss, time %ldms\n",
        send_count, recv_count, (send_count-recv_count)*100/send_count, '%', time);
}

int main(int argc, char* argv[])
{
    int size = 128*1024;//128k
    struct protoent* protocol = NULL;
    char dest_addr_str[80];
    memset(dest_addr_str, 0, 80);
    unsigned int inaddr = 1;
    struct hostent* host = NULL;

    pthread_t send_id,recv_id;

    if(argc < 2)
    {
        printf("Invalid IP ADDRESS!\n");
        return -1;
    }

    protocol = getprotobyname("icmp"); //獲取協議型別ICMP
    if(protocol == NULL)
    {
        printf("Fail to getprotobyname!\n");
        return -1;
    }

    memcpy(dest_addr_str, argv[1], strlen(argv[1])+1);

    rawsock = socket(AF_INET,SOCK_RAW,protocol->p_proto);
    if(rawsock < 0)
    {
        printf("Fail to create socket!\n");
        return -1;
    }

    pid = getpid();

    setsockopt(rawsock, SOL_SOCKET, SO_RCVBUF, &size, sizeof(size)); //增大接收緩衝區至128K

    bzero(&dest,sizeof(dest));

    dest.sin_family = AF_INET;

    inaddr = inet_addr(argv[1]);
    if(inaddr == INADDR_NONE)   //判斷使用者輸入的是否為IP地址還是域名
    {
        //輸入的是域名地址
        host = gethostbyname(argv[1]);
        if(host == NULL)
        {
            printf("Fail to gethostbyname!\n");
            return -1;
        }

        memcpy((char*)&dest.sin_addr, host->h_addr, host->h_length);
    }
    else
    {
        memcpy((char*)&dest.sin_addr, &inaddr, sizeof(inaddr));//輸入的是IP地址
    }
    inaddr = dest.sin_addr.s_addr;
    printf("PING %s, (%d.%d.%d.%d) 56(84) bytes of data.\n",dest_addr_str,
        (inaddr&0x000000ff), (inaddr&0x0000ff00)>>8, 
        (inaddr&0x00ff0000)>>16, (inaddr&0xff000000)>>24);

    alive = 1;  //控制ping的傳送和接收

    signal(SIGINT, icmp_sigint);

    if(pthread_create(&send_id, NULL, (void*)ping_send, NULL))
    {
        printf("Fail to create ping send thread!\n");
        return -1;
    }

    if(pthread_create(&recv_id, NULL, (void*)ping_recv, NULL))
    {
        printf("Fail to create ping recv thread!\n");
        return -1;
    }

    pthread_join(send_id, NULL);//等待send ping執行緒結束後程式再結束
    pthread_join(recv_id, NULL);//等待recv ping執行緒結束後程式再結束

    ping_stats_show();

    close(rawsock);
    return 0;

}

編譯以及實驗現象如下:

我的實驗環境是兩臺伺服器,發起ping的主機是172.0.5.183,被ping的主機是172.0.5.182,以下是我的兩次實驗現象(ping IP和ping 域名)。

特別注意: 

只有root使用者才能利用socket()函式生成原始套接字,要讓Linux的一般使用者能執行以上程式,需進行如下的特別操作:用root登陸,編譯以上程式gcc -lpthread -o ping ping.c

實驗現象可以看出,PING是成功的,表明兩主機間的網路是通的,發出的所有ping包都收到了回覆。

下面是Linux系統自帶的PING程式,我們可以對比一下我們設計的PING程式跟系統自帶的PING程式有何不同。

相關文章