簡述
MPTCP在進行三次握手之後,客戶端和服務端會進行地址資訊的交換,讓對方知道彼此未用的地址資訊。
當客戶端知道服務端的地址後就可以建立其他子路徑。三次握手和建立子路徑的過程如圖1:
圖1
關於Token、隨機數R、以及HMAC(Hash-based Message Authentication Code)的詳細解釋可以閱讀參考文獻[1]。
MPTCP的核心實現:
這裡我們主要關注建立子路徑過程中,master sock對slave sock的影響。當客戶端傳送第一個SYN準備建立子路徑的時候就會呼叫
mptcp_init4_subsockets來建立一個新的socket和相應的sock。
"net/mptcp/mptcp_ipv4.c" line 328 of 488 328 int mptcp_init4_subsockets(struct sock *meta_sk, const struct mptcp_loc4 *loc, 329 struct mptcp_rem4 *rem) 330 { 331 struct tcp_sock *tp; 332 struct sock *sk; 333 struct sockaddr_in loc_in, rem_in; 334 struct socket sock; 335 int ulid_size = 0, ret; 336 337 /** First, create and prepare the new socket */ 338 339 sock.type = meta_sk->sk_socket->type; 340 sock.state = SS_UNCONNECTED; 341 sock.wq = meta_sk->sk_socket->wq; 342 sock.file = meta_sk->sk_socket->file; 343 sock.ops = NULL; 344 345 ret = inet_create(sock_net(meta_sk), &sock, IPPROTO_TCP, 1); 346 if (unlikely(ret < 0)) { 347 mptcp_debug("%s inet_create failed ret: %d\n", __func__, ret); 348 return ret; 349 } 350 351 sk = sock.sk; 352 tp = tcp_sk(sk);
第345行的函式inet_create建立了子路徑的socket和sock。
354 /* All subsockets need the MPTCP-lock-class */ 355 lockdep_set_class_and_name(&(sk)->sk_lock.slock, &meta_slock_key, "slock-AF_INET-MPTCP"); 356 lockdep_init_map(&(sk)->sk_lock.dep_map, "sk_lock-AF_INET-MPTCP", &meta_key, 0); 357 358 if (mptcp_add_sock(meta_sk, sk, loc->loc4_id, rem->rem4_id, GFP_KERNEL)) 359 goto error; 360 361 tp->mptcp->slave_sk = 1; 362 tp->mptcp->low_prio = loc->low_prio; 363 364 /* Initializing the timer for an MPTCP subflow */ 365 setup_timer(&tp->mptcp->mptcp_ack_timer, mptcp_ack_handler, (unsigned long)sk);
第358行的mptcp_add_sock將master sock 和 子路徑的sock聯絡起來。第361行表面此sock為 slave subsock。
第362行設定此子路徑是否為備用路徑。只有現在路徑都不可用的情況下,才會通過備用子路徑傳送資料。
第365行設定的定時器用於重發建立子路徑的最後一個ACK,這樣做是為了保證上圖中的HMAC-A可以送達。
368 369 ulid_size = sizeof(struct sockaddr_in); 370 loc_in.sin_family = AF_INET; 371 rem_in.sin_family = AF_INET; 372 loc_in.sin_port = 0; 373 if (rem->port) 374 rem_in.sin_port = rem->port; 375 else 376 rem_in.sin_port = inet_sk(meta_sk)->inet_dport; 377 loc_in.sin_addr = loc->addr; 378 rem_in.sin_addr = rem->addr; 379 380 ret = sock.ops->bind(&sock, (struct sockaddr *)&loc_in, ulid_size); 381 if (ret < 0) { 382 mptcp_debug("%s: MPTCP subsocket bind() failed, error %d\n", 383 __func__, ret); 384 goto error; 385 } 386 387 mptcp_debug("%s: token %#x pi %d src_addr:%pI4:%d dst_addr:%pI4:%d\n", 388 __func__, tcp_sk(meta_sk)->mpcb->mptcp_loc_token, 389 tp->mptcp->path_index, &loc_in.sin_addr, 390 ntohs(loc_in.sin_port), &rem_in.sin_addr, 391 ntohs(rem_in.sin_port)); 392 393 if (tcp_sk(meta_sk)->mpcb->pm_ops->init_subsocket_v4) 394 tcp_sk(meta_sk)->mpcb->pm_ops->init_subsocket_v4(sk, rem->addr); 395 396 ret = sock.ops->connect(&sock, (struct sockaddr *)&rem_in, 397 ulid_size, O_NONBLOCK); 398 if (ret < 0 && ret != -EINPROGRESS) { 399 mptcp_debug("%s: MPTCP subsocket connect() failed, error %d\n", 400 __func__, ret); 401 goto error; 402 }
第380行是將子路徑的socket的與地址繫結。第396行此套接字將會呼叫tcp_v4_connect進行連線操作。
403 404 sk_set_socket(sk, meta_sk->sk_socket); 405 sk->sk_wq = meta_sk->sk_wq; 406 407 return 0; 408 409 error: 410 /* May happen if mptcp_add_sock fails first */ 411 if (!mptcp(tp)) { 412 tcp_close(sk, 0); 413 } else { 414 local_bh_disable(); 415 mptcp_sub_force_close(sk); 416 local_bh_enable(); 417 } 418 return ret; 419 }
第404和405行將子路徑的sk和master的socket建立聯絡,因為對於應用程式來說只有
master的socket是可見,而slave subsock的socket是不可見。
下面的情景是服務端收到上圖1中ACK/MP_JOIN(HMAC-A)包,這時狀態將由SYN_RECV變為ESTABLISHED。函式的呼叫
關係如下:
tcp_v4_rcv
=》tcp_v4_do_rcv
=》mptcp_v4_do_rcv
=》tcp_v4_hnd_req
=》tcp_check_req
=》mptcp_check_req_child
=》mptcp_add_sock
在函式tcp_check_req中將會建立新的sock。主要程式碼如下:
"net/ipv4/tcp_minisocks.c" line 766 of 872 760 /* OK, ACK is valid, create big socket and 761 * feed this segment to it. It will repeat all 762 * the tests. THIS SEGMENT MUST MOVE SOCKET TO 763 * ESTABLISHED STATE. If it will be dropped after 764 * socket is created, wait for troubles. 765 */ 766 #ifdef CONFIG_MPTCP 767 if (mptcp(tcp_sk(sk))) 768 /* MPTCP: We call the mptcp-specific syn_recv_sock */ 769 child = tcp_sk(sk)->mpcb->syn_recv_sock(sk, skb, req, NULL); 770 else 771 #endif 772 child = inet_csk(sk)->icsk_af_ops->syn_recv_sock(sk, skb, 773 req, NULL); 774 775 if (child == NULL) 776 goto listen_overflow;
第769行將會呼叫mptcp_syn_recv_sock和tcp_v4_syn_recv_sock和tcp_create_openreq_child建立新的sock並進行初始化。
函式mptcp_check_req_child和mptcp_add_sock會將此sock和master sock建立聯絡,並且設定此sock的屬性slave_sk為1.
結論:
1. MPTCP利用Token、隨機數R、以及HMAC(Hash-based Message Authentication Code)這些資訊的交換保證構建子路徑正確。
2.sub sock是在meta sock基礎上建立,只有meta對於應用層是可見,其餘sub sock並不可見。
參考文獻:
問題:
1.第394行函式作用未知?
2.函式mptcp_v4_add_lsrr的功能?