面試官:Java 執行緒如何啟動的?

華為雲開發者社群發表於2021-12-01
摘要:Java 的執行緒建立和啟動非常簡單,但如果問一個執行緒是怎麼啟動起來的往往並不清楚,甚至不知道為什麼啟動時是呼叫start(),而不是呼叫run()方法呢?

本文分享自華為雲社群《Thread.start() ,工作這麼久,還不知道它是怎麼讓執行緒跑起來的!》,作者:小傅哥。

面試官:我考你個題,看看你進大廠的機率大不。嗯... Java 執行緒如何啟動的?

謝飛機:如何啟動的?start 啟動的!

面試官:還有嗎?

謝飛機:嗯…,沒了!

面試官:嗯,可能會與不會這一個題並不會讓你程式碼有多牛、有多好,但是你的技術棧深度和廣度,決定你的程式設計職業生涯是否有一條康莊大道。還是要多努力!

一、執行緒啟動分析

new Thread(() -> {
    // todo
}).start();

咳咳,Java 的執行緒建立和啟動非常簡單,但如果問一個執行緒是怎麼啟動起來的往往並不清楚,甚至不知道為什麼啟動時是呼叫start(),而不是呼叫run()方法呢?

那麼,為了讓大家有一個更直觀的認知,我們先站在上帝視角。把這段 Java 的執行緒程式碼,到 JDK 方法使用,以及 JVM 的相應處理過程,展示給大家,以方便我們後續逐步分析。

面試官:Java 執行緒如何啟動的?

以上,就是一個執行緒啟動的整體過程分析,會涉及到如下知識點:

  • 執行緒的啟動會涉及到本地方法(JNI)的呼叫,也就是那部分 C++ 編寫的程式碼。
  • JVM 的實現中會有不同作業系統對執行緒的統一處理,比如:Win、Linux、Unix。
  • 執行緒的啟動會涉及到執行緒的生命週期狀態(RUNNABLE),以及喚醒操作,所以最終會有回撥操作。也就是呼叫我們的 run() 方法

接下來,我們就開始逐步分析每一步原始碼的執行內容,從而瞭解執行緒啟動過程。

二、執行緒啟動過程

1. Thread start UML 圖

面試官:Java 執行緒如何啟動的?

如圖 19-2 是執行緒的啟動過程時序圖,整體的鏈路較長,會涉及到 JVM 的操作。核心原始碼如下:

  1. Thread.c
  2. jvm.cpp
  3. thread.cpp
  4. os.cpp
  5. os_linux.cpp
  6. os_windows.cpp
  7. vmSymbols.hpp

2. Java 層面 Thread 啟動

2.1 start() 方法

new Thread(() -> {
    // todo
}).start();

// JDK 原始碼
public synchronized void start() {

    if (threadStatus != 0)
        throw new IllegalThreadStateException();

    group.add(this);
    boolean started = false;
    try {
        start0();
        started = true;
    } finally {
        try {
            if (!started) {
                group.threadStartFailed(this);
            }
        } catch (Throwable ignore) {}
    }
}
  • 執行緒啟動方法 start(),在它的方法英文註釋中已經把核心內容描述出來。Causes this thread to begin execution; the Java Virtual Machine calls the run method of this thread. 這段話的意思是:由 JVM 呼叫此執行緒的 run 方法,使執行緒開始執行。其實這就是一個 JVM 的回撥過程,下文原始碼分析中會講到
  • 另外 start() 是一個 synchronized 方法,但為了避免多次呼叫,在方法中會由執行緒狀態判斷。threadStatus != 0。
  • group.add(this),是把當前執行緒加入到執行緒組,ThreadGroup。
  • start0(),是一個本地方法,通過 JNI 方式呼叫執行。這一步的操作才是啟動執行緒的核心步驟。

2.2 start0() 本地方法

// 本地方法 start0
private native void start0();

// 註冊本地方法
public class Thread implements Runnable {
    /* Make sure registerNatives is the first thing <clinit> does. */
    private static native void registerNatives();
    static {
        registerNatives();
    }
    // ...
}    
  • start0(),是一個本地方法,用於啟動執行緒。
  • registerNatives(),這個方法是用於註冊執行緒執行過程中需要的一些本地方法,比如:start0、isAlive、yield、sleep、interrupt0等。

registerNatives,本地方法定義在 Thread.c 中,以下是定義的核心原始碼:

static JNINativeMethod methods[] = {
    {"start0",           "()V",        (void *)&JVM_StartThread},
    {"stop0",            "(" OBJ ")V", (void *)&JVM_StopThread},
    {"isAlive",          "()Z",        (void *)&JVM_IsThreadAlive},
    {"suspend0",         "()V",        (void *)&JVM_SuspendThread},
    {"resume0",          "()V",        (void *)&JVM_ResumeThread},
    {"setPriority0",     "(I)V",       (void *)&JVM_SetThreadPriority},
    {"yield",            "()V",        (void *)&JVM_Yield},
    {"sleep",            "(J)V",       (void *)&JVM_Sleep},
    {"currentThread",    "()" THD,     (void *)&JVM_CurrentThread},
    {"interrupt0",       "()V",        (void *)&JVM_Interrupt},
    {"holdsLock",        "(" OBJ ")Z", (void *)&JVM_HoldsLock},
    {"getThreads",        "()[" THD,   (void *)&JVM_GetAllThreads},
    {"dumpThreads",      "([" THD ")[[" STE, (void *)&JVM_DumpThreads},
    {"setNativeName",    "(" STR ")V", (void *)&JVM_SetNativeThreadName},
};
  • 從定義中可以看到,start0 方法會執行 &JVM_StartThread 方法,最終由 JVM 層面啟動執行緒。

3. JVM 建立執行緒

3.1 JVM_StartThread

JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread))
  JVMWrapper("JVM_StartThread");
  JavaThread *native_thread = NULL;
 
  // 建立執行緒
  native_thread = new JavaThread(&thread_entry, sz);
  // 啟動執行緒
  Thread::start(native_thread);

JVM_END
  • 這部分程式碼比較多,但核心內容主要是建立執行緒和啟動執行緒,另外 &thread_entry 也是一個方法,如下:

thread_entry,執行緒入口

static void thread_entry(JavaThread* thread, TRAPS) {
  HandleMark hm(THREAD);
  Handle obj(THREAD, thread->threadObj());
  JavaValue result(T_VOID);
  JavaCalls::call_virtual(&result,
                          obj,
                          KlassHandle(THREAD, SystemDictionary::Thread_klass()),
                          vmSymbols::run_method_name(),
                          vmSymbols::void_method_signature(),
                          THREAD);
}

重點,在建立執行緒引入這個執行緒入口的方法時,thread_entry 中包括了 Java 的回撥函式 JavaCalls::call_virtual。這個回撥函式會由 JVM 呼叫。

vmSymbols::run_method_name(),就是那個被回撥的方法,原始碼如下:

#define VM_SYMBOLS_DO(template, do_alias)
template(run_method_name, "run") 
  • 這個 run 就是我們的 Java 程式中會被呼叫的 run 方法。接下來我們繼續按照程式碼執行鏈路,尋找到這個被回撥的方法在什麼時候呼叫的。

3.2 JavaThread

native_thread = new JavaThread(&thread_entry, sz);

接下來,我們繼續看 JavaThread 的原始碼執行內容。

JavaThread::JavaThread(ThreadFunction entry_point, size_t stack_sz) :
  Thread()
#if INCLUDE_ALL_GCS
  , _satb_mark_queue(&_satb_mark_queue_set),
  _dirty_card_queue(&_dirty_card_queue_set)
#endif // INCLUDE_ALL_GCS
{
  if (TraceThreadEvents) {
    tty->print_cr("creating thread %p", this);
  }
  initialize();
  _jni_attach_state = _not_attaching_via_jni;
  set_entry_point(entry_point);
  // Create the native thread itself.
  // %note runtime_23
  os::ThreadType thr_type = os::java_thread;
  thr_type = entry_point == &compiler_thread_entry ? os::compiler_thread :os::java_thread;
  os::create_thread(this, thr_type, stack_sz);
}
  • ThreadFunction entry_point,就是我們上面的 thread_entry 方法。
  • size_t stack_sz,表示程式中已有的執行緒個數。
  • 這兩個引數,都會傳遞給 os::create_thread 方法,用於建立執行緒使用。

3.3 os::create_thread

原始碼:

  • os_linux.cpp:
  • os_windows.cpp:

眾所周知,JVM 是個啥!,所以它的 OS 服務實現,Liunx 還有 Windows 等,都會實現執行緒的建立邏輯。這有點像介面卡模式

os_linux -> os::create_thread

bool os::create_thread(Thread* thread, ThreadType thr_type, size_t stack_size) {
  assert(thread->osthread() == NULL, "caller responsible");

  // Allocate the OSThread object
  OSThread* osthread = new OSThread(NULL, NULL);
  // Initial state is ALLOCATED but not INITIALIZED
  osthread->set_state(ALLOCATED);
 
  pthread_t tid;
  int ret = pthread_create(&tid, &attr, (void* (*)(void*)) java_start, thread);

  return true;
}
  • osthread->set_state(ALLOCATED),初始化已分配的狀態,但此時並沒有初始化。
  • pthread_create,是類Unix作業系統(Unix、Linux、Mac OS X等)的建立執行緒的函式。
  • java_start,重點關注類,是實際建立執行緒的方法。

3.4 java_start

static void *java_start(Thread *thread) {

  // 執行緒ID
  int pid = os::current_process_id();

  // 設定執行緒
  ThreadLocalStorage::set_thread(thread);

  // 設定執行緒狀態:INITIALIZED 初始化完成
  osthread->set_state(INITIALIZED);
 
  // 喚醒所有執行緒
  sync->notify_all();

 // 迴圈,初始化狀態,則一致等待 wait
 while (osthread->get_state() == INITIALIZED) {
    sync->wait(Mutex::_no_safepoint_check_flag);
 }

  // 等待喚醒後,執行 run 方法
  thread->run();

  return 0;
}
  • JVM 設定執行緒狀態,INITIALIZED 初始化完成。
  • sync->notify_all(),喚醒所有執行緒。
  • osthread->get_state() == INITIALIZED,while 迴圈等待
  • thread->run(),是等待執行緒喚醒後,也就是狀態變更後,才能執行到。這在我們的執行緒執行UML圖中,也有所體現

4. JVM 啟動執行緒

JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread))
  JVMWrapper("JVM_StartThread");
  JavaThread *native_thread = NULL;
 
  // 建立執行緒
  native_thread = new JavaThread(&thread_entry, sz);
  // 啟動執行緒
  Thread::start(native_thread);

JVM_END
  • JVM_StartThread 中有兩步,建立(new JavaThread)、啟動(Thread::start)。建立的過程聊完了,接下來我們聊啟動。

4.1 Thread::start

void Thread::start(Thread* thread) {
  trace("start", thread);

  if (!DisableStartThread) {
    if (thread->is_Java_thread()) {
      java_lang_Thread::set_thread_status(((JavaThread*)thread)->threadObj(),
                                          java_lang_Thread::RUNNABLE);
    }
    // 不同的 OS 會有不同的啟動程式碼邏輯
    os::start_thread(thread);
  }
}
  • 如果沒有禁用執行緒 DisableStartThread 並且是 Java 執行緒 thread->is_Java_thread(),那麼設定執行緒狀態為 RUNNABLE。
  • os::start_thread(thread),呼叫執行緒啟動方法。不同的 OS 會有不同的啟動程式碼邏輯

4.2 os::start_thread(thread)

void os::start_thread(Thread* thread) {
  // guard suspend/resume
  MutexLockerEx ml(thread->SR_lock(), Mutex::_no_safepoint_check_flag);
  OSThread* osthread = thread->osthread();
  osthread->set_state(RUNNABLE);
  pd_start_thread(thread);
}
  • osthread->set_state(RUNNABLE),設定執行緒狀態 RUNNABLE
  • pd_start_thread(thread),啟動執行緒,這個就由各個 OS 實現類,實現各自系統的啟動方法了。比如,windows系統和Linux系統的程式碼是完全不同的。

4.3 pd_start_thread(thread)

void os::pd_start_thread(Thread* thread) {
  OSThread * osthread = thread->osthread();
  assert(osthread->get_state() != INITIALIZED, "just checking");
  Monitor* sync_with_child = osthread->startThread_lock();
  MutexLockerEx ml(sync_with_child, Mutex::_no_safepoint_check_flag);
  sync_with_child->notify();
}
  • 這部分程式碼 notify() 最關鍵,它可以喚醒執行緒。
  • 執行緒喚醒後,3.4 中的 thread->run(); 就可以繼續執行了。

5. JVM 執行緒回撥

5.1 thread->run()[JavaThread::run()]

// The first routine called by a new Java thread
void JavaThread::run() {
  // ... 初始化執行緒操作
 
  thread_main_inner();
}
  • os_linux.cpp 類中的 java_start 裡的 thread->run(),最終呼叫的就是 thread.cpp 的 JavaThread::run() 方法。
  • 這部分還需要繼續往下看,thread_main_inner(); 方法。

5.2 thread_main_inner

void JavaThread::thread_main_inner() {

  if (!this->has_pending_exception() &&
      !java_lang_Thread::is_stillborn(this->threadObj())) {
    {
      ResourceMark rm(this);
      this->set_native_thread_name(this->get_thread_name());
    }
    HandleMark hm(this);
    this->entry_point()(this, this);
  }

  DTRACE_THREAD_PROBE(stop, this);

  this->exit(false);
  delete this;
}
  • 這裡有你熟悉的設定的執行緒名稱,this->set_native_thread_name(this->get_thread_name())。
  • this->entry_point(),實際呼叫的就是 3.1 中的 thread_entry 方法。
  • thread_entry,方法最終會呼叫到 JavaCalls::call_virtual 裡的vmSymbols::run_method_name()。也就是 run() 方法,至此執行緒啟動完成。終於串回來了!

三、總結

  • 執行緒的啟動過程涉及到了 JVM 的參與,所以如果沒有認真瞭解過,確實很難從一個本地方法瞭解的如此透徹。
  • 整個原始碼分析可以結合著程式碼呼叫UML時序圖進行學習,基本核心過程包括:Java 建立執行緒和啟動、呼叫本地方法 start0()、JVM 中 JVM_StartThread 的建立和啟動、設定執行緒狀態等待被喚醒、根據不同的OS啟動執行緒並喚醒、最後回撥 run() 方法啟動 Java 執行緒。

 

點選關注,第一時間瞭解華為雲新鮮技術~

相關文章