Golang原始碼學習：監控執行緒

蝦敏四把刀發表於2020-05-28

原文網址 : https://www.cnblogs.com/flhs/p/12695351.html

Golang原始碼執行緒

監控執行緒是在runtime.main執行的時候在系統棧中建立的，監控執行緒與普通的工作執行緒區別在於，監控執行緒不需要繫結p來執行。

監控執行緒的建立與啟動

簡單的呼叫圖

先給出個簡單的呼叫圖，好心裡有數，逐個分析完後做個小結。

主體程式碼

以下會合並小篇幅且易懂的程式碼段，個人認為重點的會單獨摘出來。

main->newm->newm1->newosproc

func main() {
        ......
	if GOARCH != "wasm" { // no threads on wasm yet, so no sysmon
		systemstack(func() {
			newm(sysmon, nil)
		})
	}
        ......
}

func newm(fn func(), _p_ *p) {
	mp := allocm(_p_, fn)	// 分配一個m
	mp.nextp.set(_p_)
	mp.sigmask = initSigmask
	......
	newm1(mp)
}

func newm1(mp *m) {
	......
	execLock.rlock() // Prevent process clone.
	newosproc(mp)
	execLock.runlock()
}

cloneFlags = _CLONE_VM | /* share memory */
		_CLONE_FS | /* share cwd, etc */
		_CLONE_FILES | /* share fd table */
		_CLONE_SIGHAND | /* share sig handler table */
		_CLONE_SYSVSEM | /* share SysV semaphore undo lists (see issue #20763) */
		_CLONE_THREAD /* revisit - okay for now */

func newosproc(mp *m) {
	stk := unsafe.Pointer(mp.g0.stack.hi)
        ......
	sigprocmask(_SIG_SETMASK, &sigset_all, &oset)
        // 這裡注意一下，mstart會被作為工作執行緒的開始，在runtime.clone中會被呼叫。
	ret := clone(cloneFlags, stk, unsafe.Pointer(mp), unsafe.Pointer(mp.g0), unsafe.Pointer(funcPC(mstart)))
	sigprocmask(_SIG_SETMASK, &oset, nil)
        ......
}

allocm

在此場景中其工作是new一個m，m.mstartfn = sysmon。

分配一個g與mp相互繫結，這個g就是mp的g0。但不是全域性變數的那個g0，全域性變數g0是m0的m.g0。

func allocm(_p_ *p, fn func()) *m {
	_g_ := getg()
	acquirem() // disable GC because it can be called from sysmon
	// 忽略sysmon不會執行的程式碼
	mp := new(m)	// 新建一個m
	mp.mstartfn = fn	// fn 指向 sysmon
	mcommoninit(mp)	// 之前的文章有分析過，做一些初始化工作。

	if iscgo || GOOS == "solaris" || GOOS == "illumos" || GOOS == "windows" || GOOS == "plan9" || GOOS == "darwin" {
		mp.g0 = malg(-1)
	} else {
		mp.g0 = malg(8192 * sys.StackGuardMultiplier)	// 分配一個g
	}
	mp.g0.m = mp
        ......
	releasem(_g_.m)
	return mp
}

runtime.clone

呼叫clone，核心會建立出一個子執行緒，返回兩次。返回0是子執行緒，否則是父執行緒。

效果與fork類似，其實是fork封裝了clone。

// int32 clone(int32 flags, void *stk, M *mp, G *gp, void (*fn)(void));
TEXT runtime·clone(SB),NOSPLIT,$0
        // 準備clone系統呼叫的引數
	MOVL	flags+0(FP), DI
	MOVQ	stk+8(FP), SI
	MOVQ	$0, DX
	MOVQ	$0, R10

	// 從父程式棧複製mp, gp, fn。子執行緒會用到。
	MOVQ	mp+16(FP), R8
	MOVQ	gp+24(FP), R9
	MOVQ	fn+32(FP), R12

        // 呼叫clone
	MOVL	$SYS_clone, AX
	SYSCALL

	// 父執行緒，返回.
	CMPQ	AX, $0
	JEQ	3(PC)
	MOVL	AX, ret+40(FP)
	RET

	// 子執行緒，設定棧頂
	MOVQ	SI, SP

	// If g or m are nil, skip Go-related setup.
	CMPQ	R8, $0    // m
	JEQ	nog
	CMPQ	R9, $0    // g
	JEQ	nog

	// 呼叫系統呼叫 gettid 獲取執行緒id初始化 mp.procid
	MOVL	$SYS_gettid, AX
	SYSCALL
	MOVQ	AX, m_procid(R8)

	// 設定執行緒tls
	LEAQ	m_tls(R8), DI
	CALL	runtime·settls(SB)

	// In child, set up new stack
	get_tls(CX)
	MOVQ	R8, g_m(R9)	// gp.m = mp
	MOVQ	R9, g(CX)	// mp.tls[0] = gp
	CALL	runtime·stackcheck(SB)

nog:
	// Call fn
	CALL	R12		// 呼叫fn，此處是mstart，永不返回。

	// It shouldn't return. If it does, exit that thread.
	MOVL	$111, DI
	MOVL	$SYS_exit, AX
	SYSCALL
	JMP	-3(PC)	// keep exiting

總結一下clone的工作：

準備系統呼叫clone的引數
將mp，gp，fn從父執行緒棧複製到暫存器中，給子執行緒用
呼叫clone
父執行緒返回
子執行緒設定 m.procid、tls、gp，mp互相繫結、呼叫fn

呼叫sysmon

在newosproc中呼叫clone，並將 mstart 的地址傳入。也就是整個執行緒開始執行。

mstart 與 mstart1 在之前的文章有分析過，現在來看一下與本文有關的段落。

func mstart1() {
	_g_ := getg()
	save(getcallerpc(), getcallersp())
	asminit()
	minit()
        // 之前初始化時的呼叫邏輯是 rt0_go->mstart->mstart1，當時這裡的fn == nil。所以會繼續向下走，進入排程迴圈。
        // 現在呼叫邏輯是通過 newm(sysmon, nil)->allocm 中設定了 mp.mstartfn 為 sysmon的指標。所以下面的 fn 就不是 nil 了
        // fn != nil 呼叫 sysmon，並且sysmon永不會返回。也就是說不會走到下面schedule中。
	if fn := _g_.m.mstartfn; fn != nil {
		fn()
	}
        ......
	schedule()
}

小結

監控執行緒通過在runtime.main中呼叫newm(sysmon, nil)建立。

newm：呼叫了allocm 獲得了mp。
allocm：new了一個m，也就是前面的mp。並且將 mp.mstartfn 賦值為 sysmon的指標，這很重要，後面會用。
newm->newm1->newosproc->runtime.clone(cloneFlags, stk, unsafe.Pointer(mp), unsafe.Pointer(mp.g0), unsafe.Pointer(funcPC(mstart)))
runtime.clone：準備系統呼叫clone的引數；從父執行緒棧複製mp，gp，fn到暫存器；呼叫clone；父執行緒返回；子執行緒設定sp，m.procid，tls，互相繫結mp與gp。呼叫mstart作為子執行緒的開始執行。
mstart->mstart1：呼叫 _g_.m.mstartfn 指向的函式，也就是sysmon，此時監控工作正式開始。

搶佔排程

主體程式碼

sysmon開始會檢查死鎖，接下來是函式主體，一個無限迴圈，每隔一個短時間執行一次。其工作包含網路輪詢、搶佔排程、垃圾回收。

sysmon中搶佔排程程式碼

func sysmon() {
	lock(&sched.lock)
	sched.nmsys++
	checkdead()
	unlock(&sched.lock)

	lasttrace := int64(0)
	idle := 0 // how many cycles in succession we had not wokeup somebody
	delay := uint32(0)	// 睡眠時間，開始是20微秒；idle大於50後，翻倍增長；但最大為10毫秒
	for {
		if idle == 0 { // start with 20us sleep...
			delay = 20
		} else if idle > 50 { // start doubling the sleep after 1ms...
			delay *= 2
		}
		if delay > 10*1000 { // up to 10ms
			delay = 10 * 1000
		}
		usleep(delay)
		now := nanotime()
		......
		// retake P's blocked in syscalls
		// and preempt long running G's
		if retake(now) != 0 {
			idle = 0
		} else {
			idle++
		}
                ......
	}
}

retake

preemptone：搶佔執行時間過長的G。
handoffp：嘗試為過長時間處在_Psyscall的P關聯一個M繼續排程。

func retake(now int64) uint32 {
	n := 0
	lock(&allpLock)
	for i := 0; i < len(allp); i++ {
		_p_ := allp[i]
		if _p_ == nil {
			continue
		}
		pd := &_p_.sysmontick
		s := _p_.status
		sysretake := false             
		if s == _Prunning || s == _Psyscall {
                        // 如果執行時間太長，則搶佔g
			t := int64(_p_.schedtick)
			if int64(pd.schedtick) != t {
				pd.schedtick = uint32(t)
				pd.schedwhen = now
			} else if pd.schedwhen+forcePreemptNS <= now {
				preemptone(_p_)	// 在系統呼叫的情況下，preemptone() 不會工作，因為P沒有與之關聯的M。
				sysretake = true
			}
		}
                // 因為此時P的狀態是 _Psyscall，所以是呼叫過了Syscall(或者Syscall6)開頭的 entersyscall 函式，而此函式會解綁P和M，所以 p.m = 0；m.p=0。
		if s == _Psyscall {
			......
                        // p的local佇列為空 && （存在自旋的m || 存在空閒的p） && 距離上次系統呼叫不超過10ms ==> 不需要繼續執行
			if runqempty(_p_) && atomic.Load(&sched.nmspinning)+atomic.Load(&sched.npidle) > 0 && pd.syscallwhen+10*1000*1000 > now {
				continue
			}
			......
                        // p的狀態更改為空閒
			if atomic.Cas(&_p_.status, s, _Pidle) {
				......
				n++
				_p_.syscalltick++
				handoffp(_p_) // 嘗試為p尋找一個m（startm），如果沒有尋找到則 pidleput
			}
			......
		}
	}
	unlock(&allpLock)
	return uint32(n)
}

preemptone

協作式搶佔排程：設定搶佔排程的標記，在下次進行函式呼叫前會檢查此標記，然後呼叫 runtime.morestack_noctxt 最終搶佔當前G
基於訊號的非同步搶佔：給執行時間過長的G的M執行緒傳送 _SIGURG。使其收到訊號後執行 doSigPreempt 最終搶佔當前G

func preemptone(_p_ *p) bool {
	mp := _p_.m.ptr()
	if mp == nil || mp == getg().m {
		return false
	}
	gp := mp.curg
	if gp == nil || gp == mp.g0 {
		return false
	}
	gp.preempt = true	// 設定搶佔標記
	gp.stackguard0 = stackPreempt	// 設定為一個大於任何真實sp的值。

	// 基於訊號的非同步的搶佔排程
	if preemptMSupported && debug.asyncpreemptoff == 0 {
		_p_.preempt = true
		preemptM(mp)
	}
	return true
}

協作式搶佔排程

golang的編譯器一般會在函式的彙編程式碼前後自動新增棧是否需要擴張的檢查程式碼。

   0x0000000000458360 <+0>:     mov    %fs:0xfffffffffffffff8,%rcx  # 將當前g的指標存入rcx。tls還記得麼？
   0x0000000000458369 <+9>:     cmp    0x10(%rcx),%rsp              # 比較g.stackguard0和rsp。g結構體地址偏移16個位元組就是g.stackguard0。
   0x000000000045836d <+13>:    jbe    0x4583b0 <main.caller+80>    # 如果rsp較小,表示棧有溢位風險,呼叫runtime.morestack_noctxt
   // 此處省略具體函式彙編程式碼
   0x00000000004583b0 <+80>:	callq  0x451b30 <runtime.morestack_noctxt>
   0x00000000004583b5 <+85>:	jmp    0x458360 <main.caller>

假設上面的彙編程式碼是屬於一個叫 caller 的函式的（實際上確實是的）。

當執行caller的G（暫且稱其為gp）由於執行時間過長，被監控執行緒sysmon通過preemptone函式標記其 gp.preempt = true；gp.stackguard0 = stackPreempt。

當caller被呼叫時，會先進行棧的檢查，因為 stackPreempt 是一個大於任何真實sp的值，所以jbe指令跳轉呼叫 runtime.morestack_noctxt 。

goschedImpl

goschedImpl是搶佔排程的關鍵邏輯，從 morestack_noctxt 到 goschedImpl 的呼叫鏈如下：

morestack_noctxt->morestack->newstack->gopreempt_m->goschedImpl。其中 morestack_noctxt 和 morestack 由彙編編寫。

goschedImpl 的主要邏輯是：

更改gp的狀態為_Grunable，dropg解綁G和M
globrunqput放入全域性佇列
schedule重新排程

func newstack() {
	thisg := getg()
	......
	gp := thisg.m.curg
        preempt := atomic.Loaduintptr(&gp.stackguard0) == stackPreempt
        ......
        if preempt {
		......
		// Act like goroutine called runtime.Gosched.
		gopreempt_m(gp) // never return
	}
}

func gopreempt_m(gp *g) {
	if trace.enabled {
		traceGoPreempt()
	}
	goschedImpl(gp)
}

func goschedImpl(gp *g) {
	status := readgstatus(gp)
	if status&^_Gscan != _Grunning {
		dumpgstatus(gp)
		throw("bad g status")
	}
	casgstatus(gp, _Grunning, _Grunnable)	// 狀態從 _Grunning 改為 _Grunnable。你執行的太久了，下來吧你。
	dropg()		// 解綁G和M
	lock(&sched.lock)
	globrunqput(gp)	// 放入全域性佇列
	unlock(&sched.lock)
	schedule()	// 重新排程，進入排程迴圈。
}

基於訊號的非同步搶佔

上述的 preemptone函式會呼叫preemptM函式，並且最終會呼叫tgkill系統呼叫，向需要被搶佔的G所在的工作執行緒傳送 _SIGURG 訊號。

傳送訊號

func preemptM(mp *m) {
	......
	signalM(mp, sigPreempt)
}
// signalM sends a signal to mp.
func signalM(mp *m, sig int) {
	tgkill(getpid(), int(mp.procid), sig)
}

TEXT ·tgkill(SB),NOSPLIT,$0
	MOVQ	tgid+0(FP), DI
	MOVQ	tid+8(FP), SI
	MOVQ	sig+16(FP), DX
	MOVL	$SYS_tgkill, AX
	SYSCALL
	RET

執行搶佔

核心在收到 _SIGURG 訊號後，會呼叫該執行緒註冊的訊號處理程式，最終會執行到以下程式。

因為註冊邏輯不是問題的關注核心，所以就放在後面有介紹。

func sighandler(sig uint32, info *siginfo, ctxt unsafe.Pointer, gp *g) {
	_g_ := getg()
	c := &sigctxt{info, ctxt}
        ......
	if sig == sigPreempt {    // const sigPreempt
		doSigPreempt(gp, c)
	}
        ......
}

func doSigPreempt(gp *g, ctxt *sigctxt) {
	// Check if this G wants to be preempted and is safe to
	// preempt.
	if wantAsyncPreempt(gp) && isAsyncSafePoint(gp, ctxt.sigpc(), ctxt.sigsp(), ctxt.siglr()) {
		// Inject a call to asyncPreempt.
		ctxt.pushCall(funcPC(asyncPreempt))
	}

	// Acknowledge the preemption.
	atomic.Xadd(&gp.m.preemptGen, 1)
}

func (c *sigctxt) pushCall(targetPC uintptr) {
	// Make it look like the signaled instruction called target.
	pc := uintptr(c.rip())
	sp := uintptr(c.rsp())
	sp -= sys.PtrSize
	*(*uintptr)(unsafe.Pointer(sp)) = pc
	c.set_rsp(uint64(sp))
	c.set_rip(uint64(targetPC)) // pc指向asyncPreempt
}

// asyncPreempt->asyncPreempt2
func asyncPreempt2() {
	gp := getg()
	gp.asyncSafePoint = true
	if gp.preemptStop {
		mcall(preemptPark)
	} else {
		mcall(gopreempt_m)
	}
	gp.asyncSafePoint = false
}

// gopreempt_m裡呼叫了goschedImpl，這個函式上面分析過，是完成搶佔的關鍵。此時也就是完成了搶佔，進入排程迴圈。
func gopreempt_m(gp *g) {
	if trace.enabled {
		traceGoPreempt()
	}
	goschedImpl(gp)
}

訊號處理程式的註冊與執行

註冊

m0的訊號處理程式是在整個程式一開始就在 mstart1 中開始註冊的。

而其他M所屬執行緒因為在clone的時候指定了 _CLONE_SIGHAND 標記，共享了訊號handler table。所以一出生就有了。

註冊邏輯如下：

// 省略了一些無關程式碼
func mstart1() {
	if _g_.m == &m0 {
		mstartm0()
	}
}

func mstartm0() {
	initsig(false)
}

// 迴圈註冊訊號處理程式
func initsig(preinit bool) {
	for i := uint32(0); i < _NSIG; i++ {
                ......
		setsig(i, funcPC(sighandler))
	}
}

// sigtramp註冊為處理程式
func setsig(i uint32, fn uintptr) {
	var sa sigactiont
	sa.sa_flags = _SA_SIGINFO | _SA_ONSTACK | _SA_RESTORER | _SA_RESTART
	sigfillset(&sa.sa_mask)
	if GOARCH == "386" || GOARCH == "amd64" {
		sa.sa_restorer = funcPC(sigreturn)
	}
	if fn == funcPC(sighandler) {
		if iscgo {
			fn = funcPC(cgoSigtramp)
		} else {
			fn = funcPC(sigtramp)
		}
	}
	sa.sa_handler = fn
	sigaction(i, &sa, nil)
}

// sigaction->sysSigaction->rt_sigaction
// 呼叫rt_sigaction系統呼叫，註冊處理程式
TEXT runtime·rt_sigaction(SB),NOSPLIT,$0-36
	MOVQ	sig+0(FP), DI
	MOVQ	new+8(FP), SI
	MOVQ	old+16(FP), DX
	MOVQ	size+24(FP), R10
	MOVL	$SYS_rt_sigaction, AX
	SYSCALL
	MOVL	AX, ret+32(FP)
	RET

以上邏輯主要作用就是迴圈註冊 _NSIG（65）個訊號處理程式，其實都是 sigtramp 函式。作業系統核心在收到訊號後會呼叫此函式。

執行

sigtramp是入口，sighandler根據不同訊號呼叫處理程式。

TEXT runtime·sigtramp(SB),NOSPLIT,$72
        ......
	MOVQ	DX, ctx-56(SP)
	MOVQ	SI, info-64(SP)
	MOVQ	DI, signum-72(SP)
	MOVQ	$runtime·sigtrampgo(SB), AX
	CALL AX
        ......
	RET

func sigtrampgo(sig uint32, info *siginfo, ctx unsafe.Pointer) {
        ......
        c := &sigctxt{info, ctx}
	g := sigFetchG(c) // getg()
        ......
	sighandler(sig, info, ctx, g)
        ......
}

編碼：執行緒執行監控
2024-08-28
執行緒
Java利用執行緒工廠監控執行緒池
2021-04-10
Java執行緒
Golang原始碼學習：排程邏輯（三）工作執行緒的執行流程與排程迴圈
2020-05-27
Golang原始碼執行緒
執行緒池監控2-監控執行緒池狀態、執行緒數量和佇列任務數量等
2024-10-10
執行緒佇列
Java併發包原始碼學習系列：執行緒池ThreadPoolExecutor原始碼解析
2021-02-10
Java原始碼執行緒thread
Java併發包原始碼學習系列：執行緒池ScheduledThreadPoolExecutor原始碼解析
2021-02-19
Java原始碼執行緒thread
Adnroid原始碼學習筆記：Handler 執行緒間通訊
2019-02-28
原始碼筆記執行緒
Java併發之執行緒池ThreadPoolExecutor原始碼分析學習
2018-09-05
Java執行緒thread原始碼
iOS執行緒生命週期的監控
2019-05-05
iOS執行緒
乾貨：教你如何監控 Java 執行緒池執行狀態
2018-05-22
Java執行緒
執行緒池原始碼探究
2020-04-16
執行緒原始碼
執行緒池原始碼分析
2021-02-16
執行緒原始碼
Java多執行緒學習——執行緒通訊
2019-01-19
Java執行緒
Java多執行緒學習（2）執行緒控制
2018-10-14
Java執行緒
#大學#Java多執行緒學習02（執行緒同步）
2019-01-07
Java執行緒
java 執行緒學習
2023-05-07
Java執行緒
執行緒池學習
2019-03-19
執行緒
執行緒池執行模型原始碼全解析
2019-03-24
執行緒模型原始碼
Java多執行緒學習（3）執行緒同步與執行緒通訊
2018-10-15
Java執行緒
多執行緒學習一（多執行緒基礎）
2019-04-09
執行緒
JDK執行緒池原始碼研究
2021-11-12
JDK執行緒原始碼
執行緒池之ScheduledThreadPoolExecutor執行緒池原始碼分析筆記
2019-06-16
執行緒thread原始碼筆記
執行緒池之ThreadPoolExecutor執行緒池原始碼分析筆記
2019-05-26
執行緒thread原始碼筆記
iOS 多執行緒-學習
2018-05-02
iOS執行緒
python之多執行緒（學習）
2020-10-11
Python執行緒
Java多執行緒學習
2020-11-20
Java執行緒
多執行緒學習（二）
2019-06-24
執行緒
多執行緒學習一
2021-10-19
執行緒
redis原始碼學習之lua執行原理
2020-12-22
Redis原始碼
Java多執行緒學習（1）建立執行緒與執行緒的生命週期
2018-10-10
Java執行緒
多執行緒Demo學習（執行緒的同步，簡單的執行緒通訊）
2020-12-20
執行緒
Java Profilers 可以用來監控執行緒池嗎
2024-10-10
Java執行緒
原始碼|從序列執行緒封閉到物件池、執行緒池
2019-01-10
原始碼執行緒物件
Netty原始碼解析一——執行緒池模型之執行緒池NioEventLoopGroup
2022-02-21
Netty原始碼執行緒模型OOP
Java原始碼解析 ThreadPoolExecutor 執行緒池
2019-01-25
Java原始碼thread執行緒
Java原始碼解析 - ThreadPoolExecutor 執行緒池
2019-01-19
Java原始碼thread執行緒
Java執行緒池ThreadPoolExecutor原始碼解析
2023-12-27
Java執行緒thread原始碼
Python執行緒池ThreadPoolExecutor原始碼分析
2019-07-15
Python執行緒thread原始碼

Golang原始碼學習：監控執行緒

監控執行緒的建立與啟動

簡單的呼叫圖

主體程式碼

main->newm->newm1->newosproc

allocm

runtime.clone

呼叫sysmon

小結

搶佔排程

主體程式碼

sysmon中搶佔排程程式碼

retake

preemptone

協作式搶佔排程

goschedImpl

基於訊號的非同步搶佔

傳送訊號

執行搶佔

訊號處理程式的註冊與執行

註冊

執行

相關文章