非VXLAN的收發包呼叫棧
netdev_frame_hook()
netdev_port_receive()
ovs_vport_receive()
ovs_dp_process_packet()
(在查表失敗後,對於帶gso標記的大包,會分片進行upcall)
ovs_dp_upcall()
ovs_execute_actions()
output: do_output()
(通常情況下OVS_CB(skb)->mru為0,直接傳送)
ovs_vport_send()
(在OVS_CB(skb)->mru不為0,(即在output之前還經歷了ct,且ct流程進行了分片重組。)且小於出埠的mtu的情況下,進入分片流程)
ovs_fragment()
(執行分片)
ip_do_fragment(net, skb->sk, skb, ovs_vport_output);
(發包,這裡程式碼寫的比較繞)
ovs_vport_output()
ovs_vport_send()
ct : ovs_ct_execute()
(在進行conntrack的commit或lookup之前,會對分片進行重組,並會設定OVS_CB(skb)->mru的值不為0,為分片中最大的分片的尺寸)
handle_fragments()
ovs_ct_commit() / ovs_ct_lookup()
ovs_vport_send()
vport->ops->send(skb) == dev_queue_xmit(skb) == rpl_dev_queue_xmit(skb)
(檢查包的gso標記,需要分片的情況下進行分片,然後再遞迴呼叫dev_queue_xmit()傳送分片)
skb_gso_segment
總結:
非VXLAN組網,邏輯基本如下:
1. 收到多個分片
1.1. datapath查表失敗
分片各自上送至使用者態,走upcall流程
1.2. datapath查表成功,或從upcall流程下來
開始執行actions
while(1)
ct 會對分片進行重組,重組後的大包的OVS_CB(skb)->mru會被設定成一個非0值
ovs_vport_send()
output 如果沒有經過ct,則分片直接被轉發,如果經過了ct,則大包還要進行分片操作
ovs_fragment() -> ip_do_fragment() -> ovs_vport_output() -> ovs_vport_send()
2. 收到帶gso標記的大包
2.1. datapath查表失敗
先進行分片,然後把分片各自upcall
2.2. datapath查表成功
開始執行actions
while(1)
ct 直接ct,沒有額外操作
output 由於OVS_CB(skb)->mru為0,所以直接進入ovs_vport_send()
ovs_vport_send()
在這裡檢查包的gso標記,然後進行分片,再對各個分片遞迴呼叫dev_queue_xmit()傳送分片
vport->ops->send == dev_queue_xmit() == rpl_dev_queue_xmit()
VXLAN組網,邏輯基本如下:
1:首先是Kernel收到udp報文,走以下流程解封裝
udp_rcv -> __udp4_lib_rcv -> udp_queue_rcv_skb -> encap_rcv -> vxlan_rcv
2:最終呼叫 netdev_port_receive -> ovs_vport_receive -> ovs_dp_process_packet
也就是說,VXLAN收包終結之後,不存在分片與重組,而在終結之前的ip報文是否需要重組,則是由kernel負責,不是ovs的責任
接下來的處理流程都與非VXLAN組網一致了,直至發包
在VXLAN組網中,發包最終調到 ovs_vport_send() 函式時,vport->ops->send 指標實際呼叫的函式是 vxlan_xmit
vxlan_xmit -> rpl_vxlan_xmit -> vxlan_xmit_one -> udp_tunnel_xmit_skb -> iptunnel_xmit == rpl_iptunnel_xmit -> ip_local_out == rpl_ip_local_out
在 rpl_ip_local_out 中,類似於 rpl_dev_queue_xmit(),會檢查gso標記,如果有gso標記,會將這個ip報文分片然後各片各自傳送