Linux Netlink 基本使用

lvyilong316發表於2016-08-10

1. 什麼是 Netlink

什麼是Netlink?Netlink是linux提供的用於核心和使用者態程式之間的通訊方式。但是注意雖然Netlink主要用於使用者空間和核心空間的通訊,但是也能用於使用者空間的兩個程式通訊。只是程式間通訊有其他很多方式,一般不用Netlink。除非需要用到Netlink的廣播特性時。

那麼Netlink有什麼優勢呢?一般來說使用者空間和核心空間的通訊方式有三種:/proc、ioctl、Netlink。而前兩種都是單向的,但是Netlink可以實現雙工通訊。

Netlink協議基於BSD socket和AF_NETLINK地址簇(address family),使用32位的埠號定址(以前稱作PID),每個Netlink協議(或稱作匯流排,man手冊中則稱之為netlink family),通常與一個或一組核心服務/元件相關聯,如NETLINK_ROUTE用於獲取和設定路由與鏈路資訊、NETLINK_KOBJECT_UEVENT用於核心向使用者空間的udev程式傳送通知等。netlink具有以下特點:

① 支援全雙工、非同步通訊(當然同步也支援)

② 使用者空間可使用標準的BSD socket介面(但netlink並沒有遮蔽掉協議包的構造與解析過程,推薦使用libnl等第三方庫)

③ 在核心空間使用專用的核心API介面

④ 支援多播(因此支援“匯流排”式通訊,可實現訊息訂閱)

⑤ 在核心端可用於程式上下文與中斷上下文

如何學習Netlink?我覺得最好的方式就是將Netlink和UDP socket對比學習。因為他們真的很對地方相似。AF_NETLINK和AF_INET對應,是一個協議族,而NETLINK_ROUTE、NETLINK_GENERIC這些是協議,對應於UDP。

那麼我們主要關注Netlink和UDP socket之間的不同點,其中最重要的一點就是:使用UDP socket傳送資料包時,使用者無需構造UDP資料包的包頭,核心協議棧會根據原、目的地址(sockaddr_in)填充頭部資訊。但是Netlink需要我們自己構造一個包頭(這個包頭有什麼用,我們後面再說)。

一般我們使用Netlink都要指定一個協議,我們可以使用核心為我們預留的NETLINK_GENERIC(定義在linux/netlink.h中),也可以使用我們自定義的協議,其實就是定義一個核心還沒有佔用的數字。下面我們用NETLINK_TEST做為我們定義的協議寫一個例子(注意:自定義協議不一定非要新增到linux/netlink.h中,只要使用者態和核心態程式碼都能找到該定義就行)。我們知道使用UDP傳送報文有兩種方式:sendto和sendmsg,同樣Netlink也支援這兩種方式。下面先看使用sendmsg的方式。

2. 使用者態資料結構

首先看一下幾個重要的資料結構的關係:

Linux Netlink 基本使用

 

2.1 struct msghdr

msghdr這個結構在socket變成中就會用到,並不算Netlink專有的,這裡不在過多說明。只說明一下如何更好理解這個結構的功能。我們知道socket訊息的傳送和接收函式一般有這幾對:recv/send、readv/writev、recvfrom/sendto。當然還有recvmsg/sendmsg,前面三對函式各有各的特點功能,而recvmsg/sendmsg就是要囊括前面三對的所有功能,當然還有自己特殊的用途。msghdr的前兩個成員就是為了滿足recvfrom/sendto的功能,中間兩個成員msg_iov和msg_iovlen則是為了滿足readv/writev的功能,而最後的msg_flags則是為了滿足recv/send中flag的功能,剩下的msg_control和msg_controllen則是滿足recvmsg/sendmsg特有的功能。

2.2 Struct sockaddr_ln

Struct sockaddr_ln為Netlink的地址,和我們通常socket程式設計中的sockaddr_in作用一樣,他們的結構對比如下。

Linux Netlink 基本使用

 

struct sockaddr_nl{}的詳細定義和描述如下:

(1) nl_pid:在Netlink規範裡,PID全稱是Port-ID(32bits),其主要作用是用於唯一的標識一個基於netlink的socket通道。通常情況下nl_pid都設定為當前程式的程式號。前面我們也說過,Netlink不僅可以實現使用者-核心空間的通訊還可使現實使用者空間兩個程式之間,或核心空間兩個程式之間的通訊。該屬性為0時一般指核心。

(2) nl_groups:如果使用者空間的程式希望加入某個多播組,則必須執行bind()系統呼叫。該欄位指明瞭呼叫者希望加入的多播組號的掩碼(注意不是組號,後面我們會詳細講解這個欄位)。如果該欄位為0則表示呼叫者不希望加入任何多播組。對於每個隸屬於Netlink協議域的協議,最多可支援32個多播組(因為nl_groups的長度為32位元),每個多播組用一個位元來表示。

2.3 struct nlmsghdr

Netlink的報文由訊息頭和訊息體構成,struct nlmsghdr即為訊息頭。訊息頭定義在檔案裡,由結構體nlmsghdr表示:

訊息頭中各成員屬性的解釋及說明:

(1) nlmsg_len:整個訊息的長度,按位元組計算。包括了Netlink訊息頭本身。

(2) nlmsg_type:訊息的型別,即是資料還是控制訊息。目前(核心版本2.6.21)Netlink僅支援四種型別的控制訊息,如下:

a) NLMSG_NOOP-空訊息,什麼也不做;

b) NLMSG_ERROR-指明該訊息中包含一個錯誤;

c) NLMSG_DONE-如果核心通過Netlink佇列返回了多個訊息,那麼佇列的最後一條訊息的型別為NLMSG_DONE,其餘所有訊息的nlmsg_flags屬性都被設定NLM_F_MULTI位有效。

d) NLMSG_OVERRUN-暫時沒用到。

(3) nlmsg_flags:附加在訊息上的額外說明資訊,如上面提到的NLM_F_MULTI。

那訊息體怎麼設定呢?可以使用NLMSG_DATA,具體見後面例子。

3. 使用者態範例一

  • 客戶端1

上面程式首先向核心傳送一條訊息;“Hello you”,然後進入迴圈一直等待讀取核心的回覆,並將收到的回覆列印出來。如果看上面程式感覺很吃力,那麼應該首先複習一下UDP中使用sendmsg的用法,特別時struct msghdr的結構要清楚,這裡再贅述。下面主要分析與UDP傳送資料包的不同點:

1. socket地址結構不同,UDP為sockaddr_in,Netlink為struct sockaddr_nl;

2. 與UDP傳送資料相比,Netlink多了一個訊息頭結構struct nlmsghdr需要我們構造。

注意程式碼註釋中的A、B、C三處分別設定了pid。首先解釋一下什麼是pid,網上很多文章把這個欄位說成是程式的pid,其實這完全是望文生義。這裡的pid和程式pid沒有什麼關係,僅僅相當於UDP的port。對於UDP來說port和ip標示一個地址,那對我們的NETLINK_TEST協議(注意Netlink本身不是一個協議)來說,pid就唯一標示了一個地址。所以你如果用程式pid做為標示當然也是可以的。當然同樣的pid對於NETLINK_TEST協議和核心定義的其他使用Netlink的協議是不衝突的(就像TCP的80埠和UDP的80埠)。

下面分析這三處設定pid分別有什麼作用,首先A和B位置的比較好理解,這是在地址(sockaddr_nl)上進行的設定,就是相當於設定源地址和目的地址(其實是埠),只是注意B處設定pid為0,0就代表是核心,可以理解為核心專用的pid,那麼使用者程式就不能用0做為自己的pid嗎?這個只能說如果你非要用也是可以的,只是會產生一些問題,後面在分析。接下來看為什麼C處的訊息頭仍然需要設定pid呢?這裡首先要知道一個前提:核心不會像UDP一樣根據我們設定的原、目的地址為我們構造訊息頭,所以我們不在包頭寫入我們自己的地址(pid),那核心怎麼知道是誰發來的報文呢?當然如果核心只是處理訊息不需要回復程式的話舍不設定這個訊息頭pid都可以。

所以每個pid的設定功能不同:A處的設定是要設定傳送者的源地址,有人會說既然源地址又不會自動填充到報文中,我們為什麼還要設定這個,因為你還可能要接收回復啊。就像寄信,你連“門牌號”都沒有,即使你在寫信時候寫上你的地址是100號,對方回信目的地址也是100號,但是郵局發現根本沒有這個地址怎麼可能把信送到你手裡呢?所以A的主要作用是註冊源地址,保證可以收到回覆,如果不需要回復當然可以簡單將pid設定為0;B處自然就是收信人的地址,pid為0代表核心的地址,假如有一個程式在101號上註冊了地址,並呼叫了recvmsg,如果你將B處的pid設定為101,那資料包就發給了另一個程式,這就實現了使用Netlink進行程式間通訊;C相當於你在信封上寫的源地址,通常情況下這個應該和你的真實地址(A)處註冊的源地址相同,當然你要是不想收到回信,又想惡搞一下或者有特殊需求,你可以寫成其他程式註冊的pid(比如101)。這和我們現實中寄信是一樣的,你給你朋友寫封情書,把寫信人寫成你的另一個好基友,然後後果你懂得……

好了,有了這個例子我們就大概知道使用者態怎麼使用Netlink了,至於我們沒有用到的nl_groups等其他資訊後面講到再說,下面看下核心是怎麼處理Netlink的。

4. 核心 Netlink api

4.1建立 netlink socket

引數說明:

(1) net:是一個網路名字空間namespace,在不同的名字空間裡面可以有自己的轉發資訊庫,有自己的一套net_device等等。預設情況下都是使用 init_net這個全域性變數。

(2) unit:表示netlink協議型別,如NETLINK_TEST、NETLINK_SELINUX。

(3) groups:多播地址。

(4) input:為核心模組定義的netlink訊息處理函式,當有消 息到達這個netlink socket時,該input函式指標就會被引用,且只有此函式返回時,呼叫者的sendmsg才能返回。

(5)  cb_mutex:為訪問資料時的互斥訊號量。

(6) module: 一般為THIS_MODULE。

4.2 傳送單播訊息 netlink_unicast

引數說明:

(1) ssk:為函式 netlink_kernel_create()返回的socket。

(2) skb:存放訊息,它的data欄位指向要傳送的netlink訊息結構,而 skb的控制塊儲存了訊息的地址資訊,巨集NETLINK_CB(skb)就用於方便設定該控制塊。

(3) pid:為接收此訊息程式的pid,即目標地址,如果目標為組或核心,它設定為 0。

(4) nonblock:表示該函式是否為非阻塞,如果為1,該函式將在沒有接收快取可利用時立即返回;而如果為0,該函式在沒有接收快取可利用定時睡眠。

4.3 傳送廣播訊息 netlink_broadcast

int netlink_broadcast(struct sock *ssk, struct sk_buff *skb, u32 pid, u32 group, gfp_t allocation)

前面的三個引數與 netlink_unicast相同,引數group為接收訊息的多播組,該引數的每一個位代表一個多播組,因此如果傳送給多個多播組,就把該引數設定為多個多播組組ID的位或。引數allocation為核心記憶體分配型別,一般地為GFP_ATOMIC或GFP_KERNEL,GFP_ATOMIC用於原子的上下文(即不可以睡眠),而GFP_KERNEL用於非原子上下文。

4.4 釋放 netlink socket

5. 核心態程式範例一

附上核心程式碼的Makefile檔案:

6. 程式結構分析

我們將核心模組insmod後,執行使用者態程式,結果如下:

Linux Netlink 基本使用

 

這個結果複合我們的預期,但是執行過程中列印出“state_smg”卡了好久才輸出了後面的結果。這時候檢視客戶程式是處於D狀態的(不瞭解D狀態的同學可以google一下)。這是為什麼呢?因為程式使用Netlink向核心發資料是同步,核心向程式發資料是非同步。什麼意思呢?也就是使用者程式呼叫sendmsg傳送訊息後,核心會呼叫相應的接收函式,但是一定到這個接收函式執行完使用者態的sendmsg才能夠返回。我們在核心態的接收函式中呼叫了10次回發函式,每次都等待3秒鐘,所以核心接收函式30秒後才返回,所以我們使用者態程式的sendmsg也要等30秒後才返回。相反,核心回發的資料不用等待使用者程式接收,這是因為核心所發的資料會暫時存放在一個佇列中。

再來回到之前的一個問題,使用者態程式的源地址(pid)可以用0嗎?我把上面的使用者程式的A和C處pid都改為了0,結果一執行就當機了。為什麼呢?我們看一下核心程式碼的邏輯,收到使用者訊息後,根據訊息中的pid傳送回去,而pid為0,核心並不認為這是使用者程式,認為是自身,所有又將回發的10個訊息發給了自己(核心),這樣就陷入了一個死迴圈,而使用者態這時候程式一直處於D。

另外一個問題,如果同時啟動兩個使用者程式會是什麼情況?答案是再呼叫bind時出錯:“Address already in use”,這個同UDP一樣,同一個地址同一個port如果沒有設定SO_REUSEADDR兩次bind就會出錯,之後我用同樣的方式再Netlink的socket上設定了SO_REUSEADDR,但是並沒有什麼效果。

7. 使用者態範例二

之前我們說過UDP可以使用sendmsg/recvmsg也可以使用sendto/recvfrom,那麼Netlink同樣也可以使用sendto/recvfrom。具體實現如下:

熟悉UDP程式設計的同學看到這個程式一定很熟悉,除了多了一個Netlink訊息頭的設定。但是我們發現程式中呼叫了bind函式,這個函式再UDP程式設計中的客戶端不是必須的,因為我們不需要把UDP socket與某個地址關聯,同時再傳送UDP資料包時核心會為我們分配一個隨即的埠。但是對於Netlink必須要有這一步bind,因為Netlink核心可不會為我們分配一個pid。再強調一遍訊息頭(nlmsghdr)中的pid是告訴核心接收端要回復的地址,但是這個地址存不存在核心並不關心,這個地址只有使用者端呼叫了bind後才存在。

再說一個體外話,我們看到這兩個例子都是使用者態首先發起的,那Netlink是否支援核心態主動發起的情況呢?當然是可以的,只是核心一般需要事件觸發,這裡,只要和使用者態約定號一個地址(pid),核心直接呼叫netlink_unicast就可以了。

打賞支援我寫出更多好文章,謝謝!

打賞作者

打賞支援我寫出更多好文章,謝謝!

Linux Netlink 基本使用

相關文章