SOFA 原始碼分析 — 連線管理器

莫那·魯道發表於2018-05-19

SOFA 原始碼分析 — 連線管理器

前言

RPC 框架需要維護客戶端和服務端的連線,通常是一個客戶端對應多個服務端,而客戶端看到的是介面,並不是服務端的地址,服務端地址對於客戶端來講是透明的。

那麼,如何實現這樣一個 RPC 框架的網路連線呢?

我們從 SOFA 中尋找答案。

連線管理器介紹

先從一個小 demo 開始看:

ConsumerConfig<HelloService> consumerConfig = new ConsumerConfig<HelloService>()
    .setInterfaceId(HelloService.class.getName()) // 指定介面
    .setProtocol("bolt") // 指定協議
    .setDirectUrl("bolt://127.0.0.1:9696"); // 指定直連地址

HelloService helloService = consumerConfig.refer();

while (true) {
  System.out.println(helloService.sayHello("world"));
  try {
    Thread.sleep(2000);
  } catch (Exception e) {
  }
}
複製程式碼

上面的程式碼中,一個 ConsumerConfig 對應一個介面服務,並指定了直連地址。

然後呼叫 ref 方法。每個 ConsumerConfig 繫結了一個 ConsumerBootstrap,這是一個非單例的類。

而每個 ConsumerBootstrap 又繫結了一個 Cluster,這是真正的客戶端。該類包含了一個客戶端所有的關鍵資訊,例如:

  1. Router 路由鏈
  2. loadBalance 負載均衡
  3. addressHolder 地址管理器
  4. connectionHolder 連線管理器
  5. filterChain 過濾器鏈

這 5 個例項是 Cluster 的核心。一個客戶端的正常使用絕對離不開這 5 個元素。

我們之前分析了 5 箇中的 4 個,今天分析最後一個 —— 連線管理器。

他可以說是 RPC 網路通訊的核心。

地址管理器代表的是:一個客戶端可以擁有多個介面。 連線管理器代表的是:一個客戶端可以擁有多個 TCP 連線。

很明顯,地址管理器的資料肯定比連線管理器要多。因為通常一個 TCP 連線(Server 端)可以含有多個介面。

那麼 SOFA 是如何實現連線管理器的呢?

從 AbstractCluster 的 init 方法中,我們知道,該方法初始化了 Cluster。同時也初始化了 connectionHolder。

具體程式碼如下:

// 連線管理器
connectionHolder = ConnectionHolderFactory.getConnectionHolder(consumerBootstrap);
複製程式碼

使用了 SPI 的方式進行的初始化。目前 RPC 框架的具體實現類只有一個 AllConnectConnectionHolder。即長連線管理器。

該類需要一個 ConsumerConfig 才能初始化。

該類中包含很多和連線相關的屬性,有 4 個 Map,未初始化的 Map,存活的節點列表,存活但亞健康的列表,失敗待重試的列表。這些 Map 的元素都會隨著服務的網路變化而變化。

而這些 Map 中的元素則是:ConcurrentHashMap<ProviderInfo, ClientTransport> 。

即每個服務者的資訊對應一個客戶端傳輸。那麼這個 ClientTransport 是什麼呢?看過之前文章的都知道,這個一個 RPC 和 Bolt 的膠水類。該類的預設實現 BoltClientTransport 包含了一個 RpcClient 屬性,注意,該屬性是個靜態的。也就是說,是所有例項公用的。並且,BoltClientTransport 包含一個 ProviderInfo 屬性。還有一個 Url 屬性,Connection 屬性(網路連線)。

我們理一下:一個 ConsumerConfig 繫結一個 Cluster,一個 Cluster 繫結一個 connectionHolder,一個 connectionHolder 繫結多個 ProviderInfo 和 ClientTransport。

因為一個客戶端可以和多個服務進行通訊。

程式碼如何實現?

在 Cluster 中,會對 connectionHolder 進行初始化,在 Cluster 從註冊中心得到服務端列表後,會建立長連線。

從這裡開始,地址管理器開始運作。

Cluster 的 updateAllProviders 方法是源頭。該方法會將服務列表新增到 connectionHolder 中。即呼叫 connectionHolder.updateAllProviders(providerGroups) 方法。該方法會全量更新服務端列表。

如果更新的時候,發現有新的服務,便會建立長連線。具體程式碼如下:

if (!needAdd.isEmpty()) {
    addNode(needAdd);
}
複製程式碼

addNode 方法就是新增新的節點。該方法會多執行緒建立 TCP 連線。

首先會根據 ProviderInfo 資訊建立一個 ClientTransport,然後向執行緒池提交一個任務,任務內容是 initClientTransport(),即初始化客戶端傳輸。

該方法程式碼如下(精簡過了):

private void initClientTransport(String interfaceId, ProviderInfo providerInfo, ClientTransport transport) {
        transport.connect();
        if (doubleCheck(interfaceId, providerInfo, transport)) {
            printSuccess(interfaceId, providerInfo, transport);
            addAlive(providerInfo, transport);
        } else {
            printFailure(interfaceId, providerInfo, transport);
            addRetry(providerInfo, transport);
        }
}
複製程式碼

其中關鍵是呼叫 transport 的 connect 方法建立連線。

該方法的預設實現在 BoltClientTransport 中,符合我們的預期。我們知道, BoltClientTransport 有一個 RpcClient 的靜態例項。這個例項在類載入的時候,就會在靜態塊中初始化。初始化內容則是初始化他的一些屬性,例如地址解析器,連線管理器,連線監控等等。

我們再看 BoltClientTransport 的 connect 方法,該方法主要邏輯是初始化連線。方式則是通過 RpcClient 的 getConnection 方法來獲取,具體程式碼如下:

 connection = RPC_CLIENT.getConnection(url, url.getConnectTimeout());
複製程式碼

傳入一個 URL 和超時時間。 RpcClient 則是呼叫連線管理器的 getAndCreateIfAbsent 方法獲取,同樣傳入 Url,這個方法的名字很好,根據 URL 獲取連線,如果沒有,就建立一個。

有必要看看具體程式碼:

public Connection getAndCreateIfAbsent(Url url) throws InterruptedException, RemotingException {
    // get and create a connection pool with initialized connections.
    ConnectionPool pool = this.getConnectionPoolAndCreateIfAbsent(url.getUniqueKey(),
        new ConnectionPoolCall(url));
    if (null != pool) {
        return pool.get();
    } else {
        logger.error("[NOTIFYME] bug detected! pool here must not be null!");
        return null;
    }
}
複製程式碼

該方法會繼續呼叫自身的 getConnectionPoolAndCreateIfAbsent 方法,傳入 URL 的唯一標識,和一個 ConnectionPoolCall 物件(實現了 Callable)。

然後阻塞等待返回連線。

我們看看這個 ConnectionPoolCall 的 call 方法實現。該方法呼叫了連線管理器的 doCreate 方法。傳入了 URL 和一個連線池。然後 call 方法返回連線池。

doCreate 方法中,重點就是 create 方法,傳入了一個 url,返回一個 Connection,並放入連線池。預設池中只有一個長連線。

而 create 方法則是呼叫連線工廠的 createConnection 方法。然後呼叫 doCreateConnection 方法。該方法內部給了我們明確的答案:呼叫 Netty 的 Bootstrap 的 connect 方法。

程式碼如下:

bootstrap.option(ChannelOption.CONNECT_TIMEOUT_MILLIS, connectTimeout);
ChannelFuture future = bootstrap.connect(new InetSocketAddress(targetIP, targetPort));
複製程式碼

熟悉 Netty 的同學一眼便看出來了。這是一個連線服務端的操作。而這個 BootStrap 的初始化則是在 RpcClient 初始化的時候進行的。注意:BootStrap 是可以共享的。

可以看到, ConnectionPoolCall 的 call 方法就是用來建立 Netty 連線的。回到 getAndCreateIfAbsent 方法裡,繼續看 getConnectionPoolAndCreateIfAbsent 方法的實現。

該方法內部將 Callable 包裝成一個 FutureTask,目的應該是為了以後的非同步執行吧,總之,最後還是同步呼叫了 run 方法。然後呼叫 get 方法阻塞等待,等待剛剛 call 方法返回的連線池。然後返回。

得到連線池,連線池呼叫 get 方法,從池中根據策略選取一個連線返回。目前只有一個隨機選取的策略。

這個 Connection 連線例項會儲存在 BoltClientTransport 中。

在客戶端進行呼叫的時候, RpcClient 會根據 URL 找到對應的連線,然後,獲取這個連線對應的 Channel ,向服務端傳送資料。具體程式碼如下:

conn.getChannel().writeAndFlush(request).addListener(new ChannelFutureListener() {
    @Override
    public void operationComplete(ChannelFuture f) throws Exception {
        if (!f.isSuccess()) {
            conn.removeInvokeFuture(request.getId());
            future.putResponse(commandFactory.createSendFailedResponse(
                conn.getRemoteAddress(), f.cause()));
            logger.error("Invoke send failed, id={}", request.getId(), f.cause());
        }
    }
});
複製程式碼

以上,就是 SOFA 的連線的原理和設計。

總結

連線管理器是我們分析 SOFA—RPC Cluster 中的最後一個模組,他管理著一個客戶端對應的所有服務網路連線。

connectionHolder 內部包含多個 Map,Map 中的 key 是 Provider,value 是 ClientTransport,ClientTransport 是 RpcClient 和 SOFA 的膠水類,通常一個 Provider 對應一個 ClientTransport。ClientTransport 其實就是一個連線的包裝。

ClientTransport 獲取連線的方式則是通過 RpcClient 的 連線管理器獲取的。該連線管理器內部包含一個連線工廠,會根據 URL 建立連線。建立連線的凡是則是通過 Netty 的 BootStrap 來建立。

當我們使用 Provider 對應的 ClientTransport 中的 RpcClient 傳送資料的時候,則會根據 URL 找到對應 Connection,並獲取他的 Channel ,向服務端傳送資料。

好了,以上就是 SOFA—RPC 連線管理的分析。

篇幅有限,如有錯誤,還請指正。

相關文章