BlockCanary原理解析

妖久發表於2024-01-11

原文網址 : https://www.cnblogs.com/tangZH/p/17142437.html

一、背景

為了解決應卡頓，分析耗時。

二、原理

Looper中的loop方法：

public static void loop() {
    ...

    for (;;) {
        ...

        // This must be in a local variable, in case a UI event sets the logger
        Printer logging = me.mLogging;
        if (logging != null) {
            logging.println(">>>>> Dispatching to " + msg.target + " " +
                    msg.callback + ": " + msg.what);
        }

        msg.target.dispatchMessage(msg);

        if (logging != null) {
            logging.println("<<<<< Finished to " + msg.target + " " + msg.callback);
        }

        ...
    }
}

可以看到在執行訊息的時候，如果有設定logging，那麼它會在訊息開始與結束的時候列印出相關資訊。如果主執行緒卡住了，就是在dispatchMessage這裡卡住，所以我們可以透過計算這兩條log的時間差來判斷訊息的執行時間。

我們可以透過這個方法來設定Printer。

Looper.getMainLooper().setMessageLogging(mainLooperPrinter);

三、原始碼解析

application中呼叫初始化：
BlockCanary.install(this, AppBlockCanaryContext()).start()

最終會執行到：

    private BlockCanary() {
        BlockCanaryInternals.setContext(BlockCanaryContext.get());
        mBlockCanaryCore = BlockCanaryInternals.getInstance();
        mBlockCanaryCore.addBlockInterceptor(BlockCanaryContext.get());
        if (!BlockCanaryContext.get().displayNotification()) {
            return;
        }
        mBlockCanaryCore.addBlockInterceptor(new DisplayService());

    }

核心就是mBlockCanaryCore = BlockCanaryInternals.getInstance();它會對BlockCanaryInternals進行初始化。

    public BlockCanaryInternals() {

        stackSampler = new StackSampler(
                Looper.getMainLooper().getThread(),
                sContext.provideDumpInterval());

        cpuSampler = new CpuSampler(sContext.provideDumpInterval());

        setMonitor(new LooperMonitor(new LooperMonitor.BlockListener() {

            @Override
            public void onBlockEvent(long realTimeStart, long realTimeEnd,
                                     long threadTimeStart, long threadTimeEnd) {
                // Get recent thread-stack entries and cpu usage
                ArrayList<String> threadStackEntries = stackSampler
                        .getThreadStackEntries(realTimeStart, realTimeEnd);
                if (!threadStackEntries.isEmpty()) {
                    BlockInfo blockInfo = BlockInfo.newInstance()
                            .setMainThreadTimeCost(realTimeStart, realTimeEnd, threadTimeStart, threadTimeEnd)
                            .setCpuBusyFlag(cpuSampler.isCpuBusy(realTimeStart, realTimeEnd))
                            .setRecentCpuRate(cpuSampler.getCpuRateInfo())
                            .setThreadStackEntries(threadStackEntries)
                            .flushString();
                    LogWriter.save(blockInfo.toString());

                    if (mInterceptorChain.size() != 0) {
                        for (BlockInterceptor interceptor : mInterceptorChain) {
                            interceptor.onBlock(getContext().provideContext(), blockInfo);
                        }
                    }
                }
            }
        }, getContext().provideBlockThreshold(), getContext().stopWhenDebugging()));

        LogWriter.cleanObsolete();
    }

stackSampler：記錄棧相關資訊
cpuSampler：記錄CPU相關資訊
LooperMonitor：繼承Printer

    private void setMonitor(LooperMonitor looperPrinter) {
        monitor = looperPrinter;
    }

當我們呼叫BlockCanary的start方法的時候，便將其設給了Looper的printer，然後我們便可以在LooperMonitor的print方法裡面去記錄列印的log的時間。

    public void start() {
        if (!mMonitorStarted) {
            mMonitorStarted = true;
            Looper.getMainLooper().setMessageLogging(mBlockCanaryCore.monitor);
        }
    }

核心程式碼：

    @Override
    public void println(String x) {
        if (mStopWhenDebugging && Debug.isDebuggerConnected()) {
            return;
        }
        if (!mPrintingStarted) {
            mStartTimestamp = System.currentTimeMillis();
            mStartThreadTimestamp = SystemClock.currentThreadTimeMillis();
            mPrintingStarted = true;
            startDump();
        } else {
            final long endTime = System.currentTimeMillis();
            mPrintingStarted = false;
            if (isBlock(endTime)) {
                notifyBlockEvent(endTime);
            }
            stopDump();
        }
    }

在開始執行訊息的時候去記錄相關資訊，結束訊息的時候停止記錄相關資訊，並且判斷訊息執行的時間是否超過了我們設定的閾值，超過了的話便執行notifyBlockEvent(endTime);取出記錄的相關訊息提示使用者。

說到此處，想到是不是可以用mainLooperPrinter來做更多事情呢？既然主執行緒都在這裡，那隻要parse出app包名的第一行，每次列印出來，是不是就不需要打點也能記錄出使用者操作路徑？再者，比如想做onClick到頁面建立後的耗時統計，是不是也能用這個原理呢？之後可以試試看這個思路（目前存在問題是獲取執行緒堆疊是定時3秒取一次的，很可能一些比較快的方法操作一下子完成了沒法在stacktrace裡面反映出來）。

我們看一下怎麼記錄棧以及cpu的訊息的。

    private void startDump() {
        if (null != BlockCanaryInternals.getInstance().stackSampler) {
            BlockCanaryInternals.getInstance().stackSampler.start();
        }

        if (null != BlockCanaryInternals.getInstance().cpuSampler) {
            BlockCanaryInternals.getInstance().cpuSampler.start();
        }
    }

StackSampler與CpuSampler都繼承與AbstractSampler：
AbstractSampler裡面的start方法：

    public void start() {
        if (mShouldSample.get()) {
            return;
        }
        mShouldSample.set(true);

        HandlerThreadFactory.getTimerThreadHandler().removeCallbacks(mRunnable);
        HandlerThreadFactory.getTimerThreadHandler().postDelayed(mRunnable,
                BlockCanaryInternals.getInstance().getSampleDelay());
    }

    private Runnable mRunnable = new Runnable() {
        @Override
        public void run() {
            doSample();

            if (mShouldSample.get()) {
                HandlerThreadFactory.getTimerThreadHandler()
                        .postDelayed(mRunnable, mSampleInterval);
            }
        }
    };

    long getSampleDelay() {
        return (long) (BlockCanaryInternals.getContext().provideBlockThreshold() * 0.8f);
    }

它其實是開了一個子執行緒每隔一定的時間就去記錄。

四、流程圖

五、總結

BlockCanary作為一個Android元件，目前還有侷限性，因為其在一個完整的監控系統中只是一個生產者，還需要對應的消費者去分析日誌，比如歸類排序，以便看出哪些卡慢更有修復價值，需要優先處理；又比如需要過濾機型，有些奇葩機型的問題造成的卡慢，到底要不要去修復是要斟酌的。扯遠一點的話，像是埋點除了統計外，完全還能用來做鏈路監控，比如一個完整的流程是A -> B -> D -> E, 但是某個時間節點突然A -> B -> D後沒有到達E，這時候監控平臺就可以發出預警，讓開發人員及時定位。很多監控方案都需要C/S兩端的配合。

解析HOT原理
2020-06-09
DNS解析原理
2020-12-27
DNS
Sentinel 原理-全解析
2019-01-09
Promise原理解析
2019-02-27
Promise
cli原理解析
2019-04-15
MyBatis原理解析
2024-03-14
MyBatis
Flutter原理深度解析
2019-09-06
Flutter
InheritWidget原理解析
2020-06-07
EventBus 原理解析
2020-11-01
kafka原理解析
2019-05-08
Kafka
CAS原理深度解析
2019-03-15
webpack原理解析
2019-03-04
Web
ThreadLocal原理深入解析
2021-09-09
thread
KonvaJS 原理解析
2021-10-11
JS
HTTPS原理解析
2021-02-18
HTTP
gpfdist原理解析
2021-03-10
Volley的原理解析
2019-03-01
CTMediator 原理解析（三）
2019-01-09
binder核心原理解析
2019-02-21
Flutter 路由原理解析
2019-03-17
Flutter路由
spring ioc原理解析
2019-03-10
Spring
singleflight 包原理解析
2020-03-08
Netty（DotNetty）原理解析
2019-07-23
Netty
InnoDB search原理解析
2018-04-29
Markdown-it 原理解析
2022-01-25
Mobx autorun 原理解析
2021-12-20
NameServer 核心原理解析
2021-07-12
Server
Spring Session原理解析
2022-03-20
SpringSession
JavaScript執行原理解析
2019-02-16
JavaScript
SpringMVC實現原理及解析
2018-10-28
SpringMVC
EventBus原理與原始碼解析
2018-10-25
原始碼
CSS的原理，如何解析？
2019-02-27
CSS
Chromium Command Buffer原理解析
2023-10-26
vue之mvvm原理解析
2019-10-12
VueMVVM
Flutter之Future原理解析
2020-06-22
Flutter
Flutter之Timer原理解析
2020-06-22
Flutter
Spring IOC 原理深層解析
2020-08-09
Spring
全面解析Flutter Platform Channel原理
2019-03-23
FlutterPlatform