摘要:Java 的執行緒建立和啟動非常簡單,但如果問一個執行緒是怎麼啟動起來的往往並不清楚,甚至不知道為什麼啟動時是呼叫start(),而不是呼叫run()方法呢?
本文分享自華為雲社群《Thread.start() ,工作這麼久,還不知道它是怎麼讓執行緒跑起來的!》,作者:小傅哥。
面試官:我考你個題,看看你進大廠的機率大不。嗯... Java 執行緒如何啟動的?
謝飛機:如何啟動的?start 啟動的!
面試官:還有嗎?
謝飛機:嗯…,沒了!
面試官:嗯,可能會與不會這一個題並不會讓你程式碼有多牛、有多好,但是你的技術棧深度和廣度,決定你的程式設計職業生涯是否有一條康莊大道。還是要多努力!
一、執行緒啟動分析
new Thread(() -> { // todo }).start();
咳咳,Java 的執行緒建立和啟動非常簡單,但如果問一個執行緒是怎麼啟動起來的往往並不清楚,甚至不知道為什麼啟動時是呼叫start(),而不是呼叫run()方法呢?
那麼,為了讓大家有一個更直觀的認知,我們先站在上帝視角。把這段 Java 的執行緒程式碼,到 JDK 方法使用,以及 JVM 的相應處理過程,展示給大家,以方便我們後續逐步分析。
以上,就是一個執行緒啟動的整體過程分析,會涉及到如下知識點:
- 執行緒的啟動會涉及到本地方法(JNI)的呼叫,也就是那部分 C++ 編寫的程式碼。
- JVM 的實現中會有不同作業系統對執行緒的統一處理,比如:Win、Linux、Unix。
- 執行緒的啟動會涉及到執行緒的生命週期狀態(RUNNABLE),以及喚醒操作,所以最終會有回撥操作。也就是呼叫我們的 run() 方法
接下來,我們就開始逐步分析每一步原始碼的執行內容,從而瞭解執行緒啟動過程。
二、執行緒啟動過程
1. Thread start UML 圖
如圖 19-2 是執行緒的啟動過程時序圖,整體的鏈路較長,會涉及到 JVM 的操作。核心原始碼如下:
- Thread.c
- jvm.cpp
- thread.cpp
- os.cpp
- os_linux.cpp
- os_windows.cpp
- vmSymbols.hpp
2. Java 層面 Thread 啟動
2.1 start() 方法
new Thread(() -> { // todo }).start(); // JDK 原始碼 public synchronized void start() { if (threadStatus != 0) throw new IllegalThreadStateException(); group.add(this); boolean started = false; try { start0(); started = true; } finally { try { if (!started) { group.threadStartFailed(this); } } catch (Throwable ignore) {} } }
- 執行緒啟動方法 start(),在它的方法英文註釋中已經把核心內容描述出來。Causes this thread to begin execution; the Java Virtual Machine calls the run method of this thread. 這段話的意思是:由 JVM 呼叫此執行緒的 run 方法,使執行緒開始執行。其實這就是一個 JVM 的回撥過程,下文原始碼分析中會講到
- 另外 start() 是一個 synchronized 方法,但為了避免多次呼叫,在方法中會由執行緒狀態判斷。threadStatus != 0。
- group.add(this),是把當前執行緒加入到執行緒組,ThreadGroup。
- start0(),是一個本地方法,通過 JNI 方式呼叫執行。這一步的操作才是啟動執行緒的核心步驟。
2.2 start0() 本地方法
// 本地方法 start0 private native void start0(); // 註冊本地方法 public class Thread implements Runnable { /* Make sure registerNatives is the first thing <clinit> does. */ private static native void registerNatives(); static { registerNatives(); } // ... }
- start0(),是一個本地方法,用於啟動執行緒。
- registerNatives(),這個方法是用於註冊執行緒執行過程中需要的一些本地方法,比如:start0、isAlive、yield、sleep、interrupt0等。
registerNatives,本地方法定義在 Thread.c 中,以下是定義的核心原始碼:
static JNINativeMethod methods[] = { {"start0", "()V", (void *)&JVM_StartThread}, {"stop0", "(" OBJ ")V", (void *)&JVM_StopThread}, {"isAlive", "()Z", (void *)&JVM_IsThreadAlive}, {"suspend0", "()V", (void *)&JVM_SuspendThread}, {"resume0", "()V", (void *)&JVM_ResumeThread}, {"setPriority0", "(I)V", (void *)&JVM_SetThreadPriority}, {"yield", "()V", (void *)&JVM_Yield}, {"sleep", "(J)V", (void *)&JVM_Sleep}, {"currentThread", "()" THD, (void *)&JVM_CurrentThread}, {"interrupt0", "()V", (void *)&JVM_Interrupt}, {"holdsLock", "(" OBJ ")Z", (void *)&JVM_HoldsLock}, {"getThreads", "()[" THD, (void *)&JVM_GetAllThreads}, {"dumpThreads", "([" THD ")[[" STE, (void *)&JVM_DumpThreads}, {"setNativeName", "(" STR ")V", (void *)&JVM_SetNativeThreadName}, };
- 從定義中可以看到,start0 方法會執行 &JVM_StartThread 方法,最終由 JVM 層面啟動執行緒。
3. JVM 建立執行緒
3.1 JVM_StartThread
JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread)) JVMWrapper("JVM_StartThread"); JavaThread *native_thread = NULL; // 建立執行緒 native_thread = new JavaThread(&thread_entry, sz); // 啟動執行緒 Thread::start(native_thread); JVM_END
- 這部分程式碼比較多,但核心內容主要是建立執行緒和啟動執行緒,另外 &thread_entry 也是一個方法,如下:
thread_entry,執行緒入口
static void thread_entry(JavaThread* thread, TRAPS) { HandleMark hm(THREAD); Handle obj(THREAD, thread->threadObj()); JavaValue result(T_VOID); JavaCalls::call_virtual(&result, obj, KlassHandle(THREAD, SystemDictionary::Thread_klass()), vmSymbols::run_method_name(), vmSymbols::void_method_signature(), THREAD); }
重點,在建立執行緒引入這個執行緒入口的方法時,thread_entry 中包括了 Java 的回撥函式 JavaCalls::call_virtual。這個回撥函式會由 JVM 呼叫。
vmSymbols::run_method_name(),就是那個被回撥的方法,原始碼如下:
#define VM_SYMBOLS_DO(template, do_alias) template(run_method_name, "run")
- 這個 run 就是我們的 Java 程式中會被呼叫的 run 方法。接下來我們繼續按照程式碼執行鏈路,尋找到這個被回撥的方法在什麼時候呼叫的。
3.2 JavaThread
native_thread = new JavaThread(&thread_entry, sz);
接下來,我們繼續看 JavaThread 的原始碼執行內容。
JavaThread::JavaThread(ThreadFunction entry_point, size_t stack_sz) : Thread() #if INCLUDE_ALL_GCS , _satb_mark_queue(&_satb_mark_queue_set), _dirty_card_queue(&_dirty_card_queue_set) #endif // INCLUDE_ALL_GCS { if (TraceThreadEvents) { tty->print_cr("creating thread %p", this); } initialize(); _jni_attach_state = _not_attaching_via_jni; set_entry_point(entry_point); // Create the native thread itself. // %note runtime_23 os::ThreadType thr_type = os::java_thread; thr_type = entry_point == &compiler_thread_entry ? os::compiler_thread :os::java_thread; os::create_thread(this, thr_type, stack_sz); }
- ThreadFunction entry_point,就是我們上面的 thread_entry 方法。
- size_t stack_sz,表示程式中已有的執行緒個數。
- 這兩個引數,都會傳遞給 os::create_thread 方法,用於建立執行緒使用。
3.3 os::create_thread
原始碼:
- os_linux.cpp:
- os_windows.cpp:
眾所周知,JVM 是個啥!,所以它的 OS 服務實現,Liunx 還有 Windows 等,都會實現執行緒的建立邏輯。這有點像介面卡模式
os_linux -> os::create_thread
bool os::create_thread(Thread* thread, ThreadType thr_type, size_t stack_size) { assert(thread->osthread() == NULL, "caller responsible"); // Allocate the OSThread object OSThread* osthread = new OSThread(NULL, NULL); // Initial state is ALLOCATED but not INITIALIZED osthread->set_state(ALLOCATED); pthread_t tid; int ret = pthread_create(&tid, &attr, (void* (*)(void*)) java_start, thread); return true; }
- osthread->set_state(ALLOCATED),初始化已分配的狀態,但此時並沒有初始化。
- pthread_create,是類Unix作業系統(Unix、Linux、Mac OS X等)的建立執行緒的函式。
- java_start,重點關注類,是實際建立執行緒的方法。
3.4 java_start
static void *java_start(Thread *thread) { // 執行緒ID int pid = os::current_process_id(); // 設定執行緒 ThreadLocalStorage::set_thread(thread); // 設定執行緒狀態:INITIALIZED 初始化完成 osthread->set_state(INITIALIZED); // 喚醒所有執行緒 sync->notify_all(); // 迴圈,初始化狀態,則一致等待 wait while (osthread->get_state() == INITIALIZED) { sync->wait(Mutex::_no_safepoint_check_flag); } // 等待喚醒後,執行 run 方法 thread->run(); return 0; }
- JVM 設定執行緒狀態,INITIALIZED 初始化完成。
- sync->notify_all(),喚醒所有執行緒。
- osthread->get_state() == INITIALIZED,while 迴圈等待
- thread->run(),是等待執行緒喚醒後,也就是狀態變更後,才能執行到。這在我們的執行緒執行UML圖中,也有所體現
4. JVM 啟動執行緒
JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread)) JVMWrapper("JVM_StartThread"); JavaThread *native_thread = NULL; // 建立執行緒 native_thread = new JavaThread(&thread_entry, sz); // 啟動執行緒 Thread::start(native_thread); JVM_END
- JVM_StartThread 中有兩步,建立(new JavaThread)、啟動(Thread::start)。建立的過程聊完了,接下來我們聊啟動。
4.1 Thread::start
void Thread::start(Thread* thread) { trace("start", thread); if (!DisableStartThread) { if (thread->is_Java_thread()) { java_lang_Thread::set_thread_status(((JavaThread*)thread)->threadObj(), java_lang_Thread::RUNNABLE); } // 不同的 OS 會有不同的啟動程式碼邏輯 os::start_thread(thread); } }
- 如果沒有禁用執行緒 DisableStartThread 並且是 Java 執行緒 thread->is_Java_thread(),那麼設定執行緒狀態為 RUNNABLE。
- os::start_thread(thread),呼叫執行緒啟動方法。不同的 OS 會有不同的啟動程式碼邏輯
4.2 os::start_thread(thread)
void os::start_thread(Thread* thread) { // guard suspend/resume MutexLockerEx ml(thread->SR_lock(), Mutex::_no_safepoint_check_flag); OSThread* osthread = thread->osthread(); osthread->set_state(RUNNABLE); pd_start_thread(thread); }
- osthread->set_state(RUNNABLE),設定執行緒狀態 RUNNABLE
- pd_start_thread(thread),啟動執行緒,這個就由各個 OS 實現類,實現各自系統的啟動方法了。比如,windows系統和Linux系統的程式碼是完全不同的。
4.3 pd_start_thread(thread)
void os::pd_start_thread(Thread* thread) { OSThread * osthread = thread->osthread(); assert(osthread->get_state() != INITIALIZED, "just checking"); Monitor* sync_with_child = osthread->startThread_lock(); MutexLockerEx ml(sync_with_child, Mutex::_no_safepoint_check_flag); sync_with_child->notify(); }
- 這部分程式碼 notify() 最關鍵,它可以喚醒執行緒。
- 執行緒喚醒後,3.4 中的 thread->run(); 就可以繼續執行了。
5. JVM 執行緒回撥
5.1 thread->run()[JavaThread::run()]
// The first routine called by a new Java thread void JavaThread::run() { // ... 初始化執行緒操作 thread_main_inner(); }
- os_linux.cpp 類中的 java_start 裡的 thread->run(),最終呼叫的就是 thread.cpp 的 JavaThread::run() 方法。
- 這部分還需要繼續往下看,thread_main_inner(); 方法。
5.2 thread_main_inner
void JavaThread::thread_main_inner() { if (!this->has_pending_exception() && !java_lang_Thread::is_stillborn(this->threadObj())) { { ResourceMark rm(this); this->set_native_thread_name(this->get_thread_name()); } HandleMark hm(this); this->entry_point()(this, this); } DTRACE_THREAD_PROBE(stop, this); this->exit(false); delete this; }
- 這裡有你熟悉的設定的執行緒名稱,this->set_native_thread_name(this->get_thread_name())。
- this->entry_point(),實際呼叫的就是 3.1 中的 thread_entry 方法。
- thread_entry,方法最終會呼叫到 JavaCalls::call_virtual 裡的vmSymbols::run_method_name()。也就是 run() 方法,至此執行緒啟動完成。終於串回來了!
三、總結
- 執行緒的啟動過程涉及到了 JVM 的參與,所以如果沒有認真瞭解過,確實很難從一個本地方法瞭解的如此透徹。
- 整個原始碼分析可以結合著程式碼呼叫UML時序圖進行學習,基本核心過程包括:Java 建立執行緒和啟動、呼叫本地方法 start0()、JVM 中 JVM_StartThread 的建立和啟動、設定執行緒狀態等待被喚醒、根據不同的OS啟動執行緒並喚醒、最後回撥 run() 方法啟動 Java 執行緒。