在C#中利用Keep-Alive處理Socket網路異常斷開的方法

一劍平江湖發表於2014-07-28


  最近我負責一個IM專案的開發,服務端和客戶端採用TCP協議連線。服務端採用C#開發,客戶端採用Delphi開發。在服務端開發中我碰到了各種各樣的網路異常斷開現象。在處理這些異常的時候有了一些心得,現在寫出來和大家分享一下。

那網路異常斷開原因主要有那些呢?歸納起來主要有以下兩種:

1、客戶端程式異常。

  對於這種情況,我們很好處理,因為客戶端程式異常退出會在服務端引發ConnectionResetSocket異常(就是WinSock2中的10054異常)。只要在服務端處理這個異常就可以了。

2、網路鏈路異常。

  如:網線拔出、交換機掉電、客戶端機器掉電。當出現這些情況的時候服務端不會出現任何異常。這樣的話上面的程式碼就不能處理這種情況了。對於這種情況在MSDN裡面是這樣處理的,我在這裡貼出MSDN的原文:

如果您需要確定連線的當前狀態,請進行非阻止、零位元組的 Send 呼叫。如果該呼叫成功返回或引發 WAEWOULDBLOCK 錯誤程式碼 (10035),則該套接字仍然處於連線狀態;否則,該套接字不再處於連線狀態。

  但是我在實際應用中發現,MSDN說的這種處理方法在很多時候根本無效,無法檢測出網路已經異常斷開了。那我們該怎麼辦呢?

  我們知道,TCP有一個連線檢測機制,就是如果在指定的時間內(一般為2個小時)沒有資料傳送,會給對端傳送一個Keep-Alive資料包,使用的序列號是曾經發出的最後一個報文的最後一個位元組的序列號,對端如果收到這個資料,回送一個TCPACK,確認這個位元組已經收到,這樣就知道此連線沒有被斷開。如果一段時間沒有收到對方的響應,會進行重試,重試幾次後,向對端發一個reset,然後將連線斷掉。

  在Windows中,第一次探測是在最後一次資料傳送的兩個小時,然後每隔1秒探測一次,一共探測5次,如果5次都沒有收到迴應的話,就會斷開這個連線。但兩個小時對於我們的專案來說顯然太長了。我們必須縮短這個時間。那麼我們該如何做呢?我要利用Socket類的IOControl()函式。我們來看看這個函式能幹些什麼:

使用 IOControlCode 列舉指定控制程式碼,為 Socket 設定低階操作模式。 

名稱空間:System.Net.Sockets 
程式集:System(在 system.dll 中) 

語法 

C# 
public int IOControl ( 
IOControlCode ioControlCode, 
byte[] optionInValue, 
byte[] optionOutValue 



引數 
ioControlCode 
一個 IOControlCode 值,它指定要執行的操作的控制程式碼。 

optionInValue 
Byte 型別的陣列,包含操作要求的輸入資料。 

optionOutValue 
Byte 型別的陣列,包含由操作返回的輸出資料。 

返回值 
optionOutValue 引數中的位元組數。

如:

socket.IOControl(IOControlCode.KeepAliveValues, inOptionValues, null);

我們要搞清楚的就是inOptionValues的定義,在C++裡它是一個結構體。我們來看看這個結構體:

struct tcp_keepalive 

    u_long  onoff; //是否啟用Keep-Alive
    u_long  keepalivetime; //多長時間後開始第一次探測(單位:毫秒)
    u_long  keepaliveinterval; //探測時間間隔(單位:毫秒)
}; 

C#中,我們直接用一個Byte陣列傳遞給函式:

uint dummy = 0;
byte[] inOptionValues = new byte[Marshal.SizeOf(dummy) * 3];
BitConverter.GetBytes((uint)1).CopyTo(inOptionValues, 0);//是否啟用Keep-Alive
BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy));//多長時間開始第一次探測
BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy) * 2);//探測時間間隔

具體實現程式碼:

        public static void AcceptThread()
        {
            Thread.CurrentThread.IsBackground = true;
            while (true)
            {
                uint dummy = 0;
                byte[] inOptionValues = new byte[Marshal.SizeOf(dummy) * 3];
                BitConverter.GetBytes((uint)1).CopyTo(inOptionValues, 0);
                BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy));
                BitConverter.GetBytes((uint)5000).CopyTo(inOptionValues, Marshal.SizeOf(dummy) * 2);
                try
                {
                    Accept(inOptionValues);
                }
                catch { }
            }
        }

        private static void Accept(byte[] inOptionValues)
        {
            Socket socket = Public.s_socketHandler.Accept();
            socket.IOControl(IOControlCode.KeepAliveValues, inOptionValues, null);
            UserInfo info = new UserInfo();
            info.socket = socket;
            int id = GetUserId();
            info.Index = id;
            Public.s_userList.Add(id, info);
            socket.BeginReceive(info.Buffer, 0, info.Buffer.Length, SocketFlags.None, new AsyncCallback(ReceiveCallBack), info);
        }

好了,這樣就成功了。

相關文章