從veth看虛擬網路裝置的qdisc

YY哥發表於2014-10-14

從veth看虛擬網路裝置的qdisc

背景

前段時間在測試docker的網路效能的時候，發現了一個veth的效能問題，後來給docker官方提交了一個PR，參考set tx_queuelen to 0 when create veth device，引起了一些討論。再後來，RedHat的網路專家Jesper Brouer 出來詳細的討論了一下這個問題。

從veth看虛擬網路裝置的qdisc

可以看到，veth裝置qdisc佇列，而環回裝置/橋接裝置是沒qdisc佇列的，參考br_dev_setup函式。

核心實現

在註冊（建立）裝置時，qdisc設定為noop_qdisc，
register_netdevice -> dev_init_scheduler

void dev_init_scheduler(struct net_device *dev)
{
    dev->qdisc = &noop_qdisc;
    netdev_for_each_tx_queue(dev, dev_init_scheduler_queue, &noop_qdisc);
    dev_init_scheduler_queue(dev, &dev->rx_queue, &noop_qdisc);

    setup_timer(&dev->watchdog_timer, dev_watchdog, (unsigned long)dev);
}

開啟裝置時，如果沒有配置qdisc時，就指定為預設的pfifo_fast佇列：
dev_open -> dev_activate，

void dev_activate(struct net_device *dev)
{
    int need_watchdog;

    /* No queueing discipline is attached to device;
       create default one i.e. pfifo_fast for devices,
       which need queueing and noqueue_qdisc for
       virtual interfaces
     */

    if (dev->qdisc == &noop_qdisc)
        attach_default_qdiscs(dev);
...
}

static void attach_default_qdiscs(struct net_device *dev)
{
    struct netdev_queue *txq;
    struct Qdisc *qdisc;

    txq = netdev_get_tx_queue(dev, 0);

    if (!netif_is_multiqueue(dev) || dev->tx_queue_len == 0) {
        netdev_for_each_tx_queue(dev, attach_one_default_qdisc, NULL);
        dev->qdisc = txq->qdisc_sleeping;
        atomic_inc(&dev->qdisc->refcnt);
    } else {///multi queue
        qdisc = qdisc_create_dflt(dev, txq, &mq_qdisc_ops, TC_H_ROOT);
        if (qdisc) {
            qdisc->ops->attach(qdisc);
            dev->qdisc = qdisc;
        }
    }
}

static void attach_one_default_qdisc(struct net_device *dev,
                     struct netdev_queue *dev_queue,
                     void *_unused)
{
    struct Qdisc *qdisc;

    if (dev->tx_queue_len) {
        qdisc = qdisc_create_dflt(dev, dev_queue,
                      &pfifo_fast_ops, TC_H_ROOT);
        if (!qdisc) {
            printk(KERN_INFO "%s: activation failed\n", dev->name);
            return;
        }

        /* Can by-pass the queue discipline for default qdisc */
        qdisc->flags |= TCQ_F_CAN_BYPASS;
    } else {
        qdisc =  &noqueue_qdisc;
    }
    dev_queue->qdisc_sleeping = qdisc;
}

建立noqueue

開始嘗試直接刪除裝置預設的pfifo_fast佇列，發現會出錯：

# tc qdisc del dev vethd4ea root
RTNETLINK answers: No such file or directory
# tc  -s qdisc ls dev vethd4ea
qdisc pfifo_fast 0: root refcnt 2 bands 3 priomap  1 2 2 2 1 2 0 0 1 1 1 1 1 1 1 1
 Sent 29705382 bytes 441562 pkt (dropped 0, overlimits 0 requeues 0) 
 backlog 0b 0p requeues 0

後來看到Jesper Brouer給出一個替換預設佇列的方式，嘗試了一下，成功完成。

替換預設的qdisc佇列

# tc qdisc replace dev vethd4ea root pfifo limit 100
# tc  -s qdisc ls dev vethd4ea                      
qdisc pfifo 8001: root refcnt 2 limit 100p
 Sent 264 bytes 4 pkt (dropped 0, overlimits 0 requeues 0) 
 backlog 0b 0p requeues 0 
# ip link show vethd4ea
9: vethd4ea: <BROADCAST,UP,LOWER_UP> mtu 1500 qdisc pfifo master docker0 state UP mode DEFAULT qlen 1000
link/ether 3a:15:3b:e1:d7:6d brd ff:ff:ff:ff:ff:ff

修改佇列長度

# ifconfig vethd4ea txqueuelen 0

刪除qdisc

# tc qdisc del dev vethd4ea root                    
# ip link show vethd4ea                
9: vethd4ea: <BROADCAST,UP,LOWER_UP> mtu 1500 qdisc noqueue master docker0 state UP mode DEFAULT 
link/ether 3a:15:3b:e1:d7:6d brd ff:ff:ff:ff:ff:ff

可以看到，UP的veth裝置成功修改成noqueue。

小結

總之，給虛擬網路裝置建立預設的qdisc，是不太合理的。這會讓虛擬機器（或者容器）的網路瓶頸過早的出現在qdisc，而不是真實的物理裝置（除非應用需要建立qdisc）。更多詳細參考這裡。

【kubernetes】網路虛擬網路卡對veth pair、flannel網路模型實現原理
2020-12-06
AI模型
如何找到VEth裝置的對端介面VEth peer
2019-04-09
從 VLAN 到 IPVLAN: 聊聊虛擬網路裝置及其在雲原生中的應用
2022-08-06
虛擬化中裝置直通的實現
2021-06-17
虛擬網路卡介面VETH(Virtual Ethernet )建立使用和繫結關係
2020-09-23
Centos安裝vncserver虛擬網路控制檯
2020-09-29
CentOSVNCServer
網路裝置
2020-10-19
網路虛擬化之linux虛擬網路基礎
2020-06-24
Linux
網路虛擬化VXLAN網路架構
2020-04-20
架構
Centos7.7安裝vncserver虛擬網路控制檯
2020-02-05
CentOSVNCServer
VMware 安裝 Centos 7 虛擬機器配置網路
2021-08-12
CentOS虛擬機
VMware安裝CentOS虛擬機器與配置網路
2020-11-22
CentOS虛擬機
Ubuntu系統安裝VNC虛擬網路控制檯
2020-09-13
UbuntuVNC
virtualbox虛擬機器上安裝centOS的網路配置
2013-06-03
虛擬機CentOS
VPN介紹--虛擬網路
2013-08-09
使用Vmware搭建虛擬網路
2006-03-30
Linux 中的虛擬網路介面
2021-08-15
Linux
【VMware】虛擬機器中對映USB裝置
2015-07-28
虛擬機
vmware 虛擬機器中配置共享裸裝置
2010-11-10
虛擬機
Ubuntu 18.04 LTS安裝vncserver虛擬網路控制檯
2020-02-19
UbuntuVNCServer
網路裝置重的loopback介面
2017-04-22
OOP
守護物聯網的邊界：從裝置開始從裝置結束
2017-07-04
華為雲DevCloud為虛擬模擬插上網際網路的翅膀
2019-03-01
devCloud
【轉】虛擬機器安裝Ubuntu的上網設定（有線網路和無線網路）
2017-09-02
虛擬機Ubuntu
VMware虛擬機器的網路設定
2009-04-18
虛擬機
Vmware中的虛擬網路 ( by quqi99 )
2013-03-27
虛擬機器網路啟用
2019-10-13
虛擬機
虛擬機器網路設定
2020-11-09
虛擬機
Linux虛擬網路技術
2020-08-28
Linux
網路虛擬化技術棧
2018-04-21
Docker實踐(2)—虛擬網路
2014-08-01
Docker
虛擬機器入門二，虛擬機器的三種網路模式
2016-09-01
虛擬機模式
Openstack的刪除錯誤網橋，虛擬網路
2016-10-18
除錯
vmware虛擬機器網路卡裝置名與配置檔案不符的故障處理
2011-10-19
虛擬機
Genymotion無法啟動虛擬裝置的解決辦法
2017-09-21
虛擬裝置驅動程式的設計與實現 (轉)
2008-05-19
計算機網路原理——網路裝置
2017-11-12
計算機網路
使用Windows 95虛擬裝置驅動程式(VxD) (轉)
2007-12-09
Windows

從veth看虛擬網路裝置的qdisc

從veth看虛擬網路裝置的qdisc

背景

核心實現

建立noqueue

小結

相關文章