Flume-NG原始碼閱讀之SourceRunner，及選擇器selector和攔截器interceptor的執行

玖瘋發表於2014-05-26

　　在AbstractConfigurationProvider類中loadSources方法會將所有的source進行封裝成SourceRunner放到了Map<String, SourceRunner> sourceRunnerMap之中。相關程式碼如下：

 1 　　　　　　Map<String, String> selectorConfig = context.getSubProperties(
 2               BasicConfigurationConstants.CONFIG_SOURCE_CHANNELSELECTOR_PREFIX);
 3 
 4           ChannelSelector selector = ChannelSelectorFactory.create(
 5               sourceChannels, selectorConfig);
 6 
 7           ChannelProcessor channelProcessor = new ChannelProcessor(selector);
 8           Configurables.configure(channelProcessor, context);
 9           source.setChannelProcessor(channelProcessor);
10           sourceRunnerMap.put(sourceName,
11               SourceRunner.forSource(source));

　　每個source都有selector。上述程式碼會獲取配置檔案中關於source的selector配置資訊；然後構造ChannelSelector物件selector；並封裝selector物件成ChannelProcessor物件channelProcessor；執行channelProcessor.configure方法進行配置；設定soure的channelprocessor，最後封裝為sourceRunner和source名稱一起放入sourceRunnerMap中。　

　　一、ChannelSelector selector = ChannelSelectorFactory.create(sourceChannels, selectorConfig)會根據配置檔案中指定的型別例項化一個ChannelSelector(共兩種ReplicatingChannelSelector複製和MultiplexingChannelSelector複用)如果沒有指定型別預設是ReplicatingChannelSelector，也就是配置檔案中不用配置selector會將每個event複製傳送到多個channel；selector.setChannels(channels)；對此slector進行配置configure(context)。這兩中selector都實現了三個方法getRequiredChannels(Event event)、getOptionalChannels(Event event) 以及configure(Context context)。其實Event要傳送到的channel有兩種組成：RequiredChannels和OptionalChannels，對應兩個方法。

　　(1)ReplicatingChannelSelector的configure(context)方法會獲得通過"optional"在配置檔案中指定的可選傳送的channels(可以多個，通過空格分割)；獲取requiredChannels是此source對應的channel中可以活動的channel列表；然後獲取所有channel的名字及其與channel的對映channelNameMap；然後將可選的channel加入optionalChannels並從requiredChannels去掉有對應的channel，在這裡並沒有檢查可選channel的合法性以及可以配置此source指定的channel之外的channel，requiredChannels和optionalChannels不能有交集，有交集的話會從requiredChannels中刪除相交的channel，所以如果配置檔案中optional指定的channel列表和source指定的列表相同getOptionalChannels方法有可能會返回全部可活動channel列表使得資料重複，所以建議optional指定的channel最好是source指定之外的其他channel（比如是其他source的channel）。getOptionalChannels方法就是直接返回optionalChannels列表，getRequiredChannels方法返回requiredChannels列表，如果requiredChannels為null，則返回全部的可以活動的channel列表。

　　(2)MultiplexingChannelSelector的configure(context)先獲取要匹配的event的header的headerName，只能選擇一個headerName；獲得預設傳送到的channel列表defaultChannels，可以指定多個預設channel；獲得mapping的各個子值，及對應的channel名稱mapConfig；用來儲存header不同的值及其對應的要傳送到的channel列表（每個map可以傳送到多個channel中，每個channel也可以同時對應多個mapping），存入channelMapping（這個資料結構是用來儲存mapping值及對應的channel列表的）；optionalChannels是配置的可選值及其要傳送到的channel列表的對映關係，channelMapping中已經出現的channel不允許再次在optionalChannels出現(防止資料重複)，如果channelMapping沒有這個值對應的channel列表(表示可能會使用預設的channel列表)則使過濾與預設channel列表的交集，optionalChannels儲存的是對應header的各個值及其等於該值的event要傳送到的可選擇的channel列表。getOptionalChannels(Event event)方法返回的是optionalChannels中該event的指定header對應的可選擇的channel列表。getRequiredChannels(Event event)方法返回的是channelMapping中該event的指定header對應的channel列表，如果為null(表示由於該event的headers沒有匹配的channel就傳送到預設的channel中)就返回預設傳送列表defaultChannels。需要說明的是選擇器配置檔案中的"default"、"mapping."、"optional."這三個是同等級的，沒有匹配後兩者的值時才會選擇傳送到default對應的channel列表，後兩者的值都是event的header中對應配置檔案中指定的"header"的各種值。當呼叫getRequiredChannels(Event event)和getOptionalChannels(Event event)方法時都會對這個event的相應header查詢對應要傳送到的channel列表。

　　二、 ChannelProcessor channelProcessor = new ChannelProcessor(selector)這個是封裝選擇器構造channelprocessor。其構造方法會賦值selector並構造一個InterceptorChain物件interceptorChain。ChannelProcessor類負責管理選擇器selector和攔截器interceptor。

　　三、執行channelProcessor.configure(Context)進行必要的配置，該方法會呼叫channelProcessor.configureInterceptors(context)對攔截器們進行獲取和配置，configureInterceptors方法會先從配置檔案中獲取interceptor的元件名字interceptorNames[](可以多個)，然後獲取所有的“interceptors.”的配置資訊interceptorContexts，然後遍歷所有interceptorNames從配置檔案中獲取屬於這個interceptor的配置資訊及型別(type)，根據型別構建相應的interceptor並進行配置configure，加入interceptors列表(用來存放例項化的interceptor)；最後將列表傳遞給interceptorChain。關於更多interceptor的資訊可以看這篇Flume-NG原始碼閱讀之Interceptor(原創) 。　　

　　四、source.setChannelProcessor(channelProcessor)賦值。各個source通過getChannelProcessor()方法獲取processor呼叫其processEventBatch(events)或者processEvent(event)來將event送到channel中。

　　五、sourceRunnerMap.put(sourceName,SourceRunner.forSource(source))將source封裝成SourceRunner放入sourceRunnerMap。SourceRunner.forSource會根據這個source所實現的介面封裝成不同的Runner，有兩種介面PollableSource和EventDrivenSource，前者是有自己執行緒來驅動的需要實現process方法，後者是沒有單獨的執行緒來驅動的沒有process方法。

 1 public static SourceRunner forSource(Source source) {
 2     SourceRunner runner = null;
 3 
 4     if (source instanceof PollableSource) {
 5       runner = new PollableSourceRunner();
 6       ((PollableSourceRunner) runner).setSource((PollableSource) source);
 7     } else if (source instanceof EventDrivenSource) {
 8       runner = new EventDrivenSourceRunner();
 9       ((EventDrivenSourceRunner) runner).setSource((EventDrivenSource) source);
10     } else {
11       throw new IllegalArgumentException("No known runner type for source "
12           + source);
13     }
14 
15     return runner;
16   }

　　(1)PollableSourceRunner的start()方法會獲取source的ChannelProcessor，然後執行其initialize()方法，該方法會呼叫interceptorChain.initialize()方法對攔截器們進行初始化(遍歷所有攔截器然後執行攔截器的initialize()方法)；然後執行source.start()啟動source；再啟動一個執行緒PollingRunner，它的run方法會始終執行source.process()並根據返回的狀態值做一些統計工作。

　　(2)EventDrivenSourceRunner的start()方法會獲取source的ChannelProcessor，然後執行其initialize()方法，該方法會呼叫interceptorChain.initialize()方法對攔截器們進行初始化(遍歷所有攔截器然後執行攔截器的initialize()方法)；然後執行source.start()啟動source。

　　這樣就完成了sourceRunnerMap的組裝。當在Application中的startAllComponents方法中通過materializedConfiguration.getSourceRunners()獲取所有的SourceRunner並放入supervisor.supervise中去執行，會呼叫到SourceRunner.start()方法，即上面剛講到的內容。這樣source就啟動了。然後當將封裝的Events或者Event傳送到channel時，需要使用對應的方法ChannelProcessor.processEventBatch(List<Event> events)或者ChannelProcessor.processEvent(Event event)就可以將資料從source傳輸到channel中，這兩個方法都會在開始呼叫interceptorChain.intercept(events)或者interceptorChain.intercept(event)對event增加headers(如果有多個interceptor會遍歷interceptors處理每個event)。ChannelProcessor都是通過在source中直接呼叫getChannelProcessor()(在所有的source的父類AbstractSource中實現的)獲得。看一看processEventBatch(List<Event> events)程式碼：

 1 public void processEventBatch(List<Event> events) {
 2     Preconditions.checkNotNull(events, "Event list must not be null");
 3 
 4     events = interceptorChain.intercept(events);
 5 
 6     Map<Channel, List<Event>> reqChannelQueue =        //需要傳送到的每個channel及其要傳送到這個channel的event列表
 7         new LinkedHashMap<Channel, List<Event>>();
 8 
 9     Map<Channel, List<Event>> optChannelQueue =        //可選的每個channel及其要傳送到這個channel的event列表
10         new LinkedHashMap<Channel, List<Event>>();
11 
12     for (Event event : events) {
13       List<Channel> reqChannels = selector.getRequiredChannels(event);    //獲取需要傳送到的所有channel
14 
15       for (Channel ch : reqChannels) {
16         List<Event> eventQueue = reqChannelQueue.get(ch);
17         if (eventQueue == null) {
18           eventQueue = new ArrayList<Event>();
19           reqChannelQueue.put(ch, eventQueue);
20         }
21         eventQueue.add(event);        //將event放入對應channel的event列表
22       }
23 
24       List<Channel> optChannels = selector.getOptionalChannels(event);    //獲取可選的要傳送到的所有channel
25 
26       for (Channel ch: optChannels) {
27         List<Event> eventQueue = optChannelQueue.get(ch);
28         if (eventQueue == null) {
29           eventQueue = new ArrayList<Event>();
30           optChannelQueue.put(ch, eventQueue);
31         }
32 
33         eventQueue.add(event);        //將event放入對應channel的event列表
34       }
35     }
36 
37     // Process required channels
38     for (Channel reqChannel : reqChannelQueue.keySet()) {
39       Transaction tx = reqChannel.getTransaction();    //建立事務
40       Preconditions.checkNotNull(tx, "Transaction object must not be null");
41       try {
42         tx.begin();
43 
44         List<Event> batch = reqChannelQueue.get(reqChannel);
45 
46         for (Event event : batch) {        //傳送到需要傳送到的channel
47           reqChannel.put(event);
48         }
49 
50         tx.commit();
51       } catch (Throwable t) {
52         tx.rollback();    //事務回滾
53         if (t instanceof Error) {
54           LOG.error("Error while writing to required channel: " +
55               reqChannel, t);
56           throw (Error) t;
57         } else {
58           throw new ChannelException("Unable to put batch on required " +
59               "channel: " + reqChannel, t);
60         }
61       } finally {
62         if (tx != null) {
63           tx.close();
64         }
65       }
66     }

　　上述程式碼不復雜，會獲得所有需要傳送到的channel和所有可選的channel，然後針對每個channel，將所有event放入一個列表與該channel組成對映；然後會遍歷兩種channel列表中的每個channel將它對應的所有event傳送到對應的channel中。這個方法寫的不夠友好，還可以再優化，因為方法的引數本身就是一個列表可以省去一層for迴圈，直接將reqChannelQueue.put(ch, eventQueue)和optChannelQueue.put(ch, eventQueue)中的eventQueue改為傳遞過來的引數List<Event> events就可以達到優化的目的。

　　processEvent(Event event)方法就更簡單了，將這個event傳送到這兩種channel列表中每個channel就可以。

　　在傳送到channel的過程中我們也發現都會有事務的建立(getTransaction())、開始(tx.begin())、提交(tx.commit())、回滾(tx.rollback())、關閉(tx.close())等操作，這是必須的。在sink中這些操作需要顯示的去呼叫，而在source端則封裝在processEvent和processEventBatch方法中，不需要顯示的呼叫了，但不是不呼叫。

　　至此，sourceRunner的配置、初始化、執行就講解完畢了。在配置檔案中看到的interceptor和selector都是在這裡進行配置及執行的。通過了解上述，我們自定義source元件是不是更容易了。呵呵

　　後續還有精彩內容！敬請期待哈！

Flume-NG原始碼閱讀之Interceptor(原創)
2014-04-14
原始碼
Okhttp的Interceptor攔截器原始碼解析
2019-07-23
HTTP原始碼
OkHttp 3.x 原始碼解析之Interceptor 攔截器
2017-11-14
HTTP原始碼
Mybatis Interceptor 攔截器
2019-01-19
MyBatis
Java interceptor 攔截器
2016-12-08
Java
攔截器（Interceptor）與過濾器（Filter）
2021-05-18
過濾器Filter
Flume-NG原始碼閱讀之FileChannel
2014-05-18
原始碼
Flume-NG原始碼閱讀之AvroSink
2014-05-27
原始碼VRROS
Flume-NG原始碼閱讀之SinkGroups和SinkRunner
2014-05-25
原始碼
SpringMVC中使用Interceptor攔截器
2016-03-23
SpringMVC
Solon 的過濾器 Filter 和兩種攔截器 Handler、 Interceptor
2021-05-17
過濾器Filter
過濾器 Filter 與攔截器 Interceptor 的區別
2022-12-22
過濾器Filter
SpringBoot攔截器及原始碼分析
2021-07-11
Spring Boot原始碼
SpringMVC中的攔截器Interceptor實現
2024-03-23
SpringMVC
gRPC（六）進階：攔截器 interceptor
2022-11-09
RPC
Spring-cloud學習筆記---Ribbon原始碼剖析之攔截器Interceptor方法
2020-11-13
SpringCloud筆記原始碼
Java NIO之Selector（選擇器）
2018-05-16
Java
axios原始碼分析——攔截器
2018-06-18
iOS原始碼
spring mvc攔截器，spring攔截器以及AOP切面的區別和原始碼
2020-09-28
SpringMVC原始碼
通過攔截器Interceptor優化Mybatis的in查詢
2017-11-30
優化MyBatis
監聽器，過濾器，攔截器的執行過程和對比
2020-11-25
過濾器
Spring MVC 中的攔截器的使用“攔截器基本配置” 和 “攔截器高階配置”
2024-07-15
SpringMVC
OKHttp原始碼解析(2)----攔截器RetryAndFollowUpInterceptor
2018-12-05
HTTP原始碼
OKHttp原始碼解析(4)----攔截器CacheInterceptor
2018-12-06
HTTP原始碼
OKHttp原始碼解析(6)----攔截器CallServerInterceptor
2018-12-09
HTTP原始碼Server
okhttp3 攔截器原始碼分析
2018-02-27
HTTP原始碼
Java NIO 選擇器 Selector
2021-01-15
Java
Tomcat聯結器執行過程（原始碼閱讀）
2016-05-01
Tomcat原始碼
Day71 Spring MVC的攔截器和執行原理
2018-05-10
SpringMVC
攔截器,攔截器棧總結
2014-09-15
ARouter 攔截器之多 module 獨立執行
2021-10-28
ThinkPHP6 原始碼閱讀（八）：控制器操作的執行
2019-08-18
PHP原始碼
OKHttp原始碼解析(3)----攔截器BridgeInterceptor
2018-12-06
HTTP原始碼
OKHttp原始碼解析(5)----攔截器ConnectInterceptor
2018-12-06
HTTP原始碼
Struts2 原始碼分析-----攔截器原始碼解析 --- ParametersInterceptor
2019-05-16
原始碼
解決在Interceptor攔截器中使用@DubboReference注入為null
2020-10-16
Null
原始碼解析Grpc攔截器(C#版本)
2021-09-17
原始碼RPCC#
原始碼分析三：OkHttp（2）—攔截器簡介
2018-03-09
原始碼HTTP

Flume-NG原始碼閱讀之SourceRunner，及選擇器selector和攔截器interceptor的執行

相關文章