? 盡人事,聽天命。博主東南大學碩士在讀,攜程 Java 後臺開發暑期實習生,熱愛健身和籃球,樂於分享技術相關的所見所得,關注公眾號 @ 飛天小牛肉,第一時間獲取文章更新,成長的路上我們一起進步
? 本文已收錄於 「CS-Wiki」Gitee 官方推薦專案,現已累計 1.6k+ star,致力打造完善的後端知識體系,在技術的路上少走彎路,歡迎各位小夥伴前來交流學習
? 如果各位小夥伴春招秋招沒有拿得出手的專案的話,可以參考我寫的一個專案「開源社群系統 Echo」Gitee 官方推薦專案,目前已累計 700+ star,基於 SpringBoot + MyBatis + MySQL + Redis + Kafka + Elasticsearch + Spring Security + ... 並提供詳細的開發文件和配套教程。公眾號後臺回覆 Echo 可以獲取配套教程,目前尚在更新中
不想看解釋的小夥伴可直接翻到文末尋找答案。
1. 使用者空間和核心空間
關於核心態和使用者態我們在 瞭解作業系統的那些事兒,從這篇文章開始 這篇文章中已經詳細介紹過,這裡不再過多贅述。
至於什麼是系統空間和使用者空間也非常好理解:在作業系統中,記憶體通常會被分成使用者空間(User space)與核心空間(Kernel space)這兩個部分。當程式/執行緒執行在使用者空間時就處於使用者態,執行在核心空間時就處於核心態:
- 執行在核心態的程式可以訪問使用者空間和核心空間,或者說它可以訪問計算機的任何資源,不受限制,為所欲為,例如協調 CPU 資源,分配記憶體資源,提供穩定的環境供應用程式執行等
- 而應用程式基本都是執行在使用者態的,或者說使用者態就是提供應用程式執行的空間。執行在使用者態的程式只能訪問使用者空間
那為什麼要區分使用者態和核心態呢?
其實早期作業系統是不區分使用者態和核心態的,也就是說應用程式可以訪問任意記憶體空間,如果程式不穩定常常會讓系統崩潰,比如清除了作業系統的記憶體資料。為此大佬們設計出了一套規則:對於那些比較危險的操作需要切到核心態才能執行,比如 CPU、記憶體、裝置等資源管理器程式就應該在核心態執行,否則安全性沒有保證。
舉個例子,對於檔案系統和資料來說,檔案系統資料和管理就必須放在核心態,但是使用者的資料和管理可以放在使用者態。
使用者態的程式不能隨意操作核心地址空間,這樣有效地防止了作業系統程式受到應用程式的侵害。
那如果處於使用者態的程式想要訪問核心空間的話怎麼辦呢?就需要進行系統呼叫從使用者態切換到核心態。
2. 作業系統執行緒
① 在使用者空間中實現執行緒
在早期的作業系統中,所有的執行緒都是在使用者空間下實現的,作業系統只能看到執行緒所屬的程式,而不能看到執行緒。
從我們開發者的角度來理解使用者級執行緒就是說:在這種模型下,我們需要自己定義執行緒的資料結構、建立、銷燬、排程和維護等,這些執行緒執行在作業系統的某個程式內,然後作業系統直接對程式進行排程。
這種方式的好處一目瞭然,首先第一點,就是即使作業系統原生不支援執行緒,我們也可以通過庫函式來支援執行緒;第二點,執行緒的排程只發生在使用者態,避免了作業系統從核心態到使用者態的轉換開銷。
當然缺點也很明顯:由於作業系統看不見執行緒,不知道執行緒的存在,而 CPU 的時間片切換是以程式為維度的,所以如果程式中某個執行緒進行了耗時比較長的操作,那麼由於使用者空間中沒有時鐘中斷機制,就會導致此程式中的其它執行緒因為得不到 CPU 資源而長時間的持續等待;另外,如果某個執行緒進行系統呼叫時比如缺頁中斷而導致了執行緒阻塞,此時作業系統也會阻塞住整個程式,即使這個程式中其它執行緒還在工作。
② 在核心空間中實現執行緒
所謂核心級執行緒就是執行在核心空間的執行緒, 直接由核心負責,只能由核心來完成執行緒的排程。
幾乎所有的現代作業系統,包括 Windows、Linux、Mac OS X 和 Solaris 等,都支援核心執行緒。
每個核心執行緒可以視為核心的一個分身,這樣作業系統就有能力同時處理多件事情,支援多執行緒的核心就叫做多執行緒核心(Multi-Threads Kernel)。
從我們開發者的角度來理解核心級執行緒就是說:我們可以直接使用作業系統中已經內建好的執行緒,執行緒的建立、銷燬、排程和維護等,都是直接由作業系統的核心來實現,我們只需要使用系統呼叫就好了,不需要像使用者級執行緒那樣自己設計執行緒排程等。
上圖畫的是 1:1 的執行緒模型,所謂執行緒模型,也就是使用者執行緒和核心執行緒之間的關聯方式,執行緒模型當然不止 1:1 這一種,下面我們來詳細解釋以下這三種多執行緒模型:
下文翻譯自 https://www.cs.uic.edu/~jbell/CourseNotes/OperatingSystems/4_Threads.html
1)多對一執行緒模型:
- 在多對一模型中,多個使用者級執行緒對映到某一個核心執行緒上
- 執行緒管理由使用者空間中的執行緒庫處理,這非常有效
- 但是,如果進行了阻塞系統呼叫,那麼即使其他使用者執行緒能夠繼續,整個程式也會阻塞
- 由於單個核心執行緒只能在單個 CPU 上執行,因此多對一模型不允許在多個 CPU 之間拆分單個程式
從併發性角度來總結下,雖然多對一模型允許開發人員建立任意多的使用者執行緒,但是由於核心只能一次排程一個執行緒,所以並未增加併發性。現在已經幾乎沒有作業系統來使用這個模型了,因為它無法利用多個處理核。
2)一對一執行緒模型:
- 一對一模型克服了多對一模型的問題
- 一對一模型建立一個單獨的核心執行緒來處理每個使用者執行緒
- 但是,管理一對一模型的開銷更大,涉及更多開銷和減慢系統速度
- 此模型的大多數實現都限制了可以建立的執行緒數
從併發性角度來總結下,雖然一對一模型提供了更大的併發性,但是開發人員應注意不要在應用程式內建立太多執行緒(有時系統可能會限制建立執行緒的數量),因為管理一對一模型的開銷更大。Windows (從 Win95 開始) 和 Linux 都實現了執行緒的一對一模型。
3)多對多執行緒模型:
- 多對多模型將任意數量的使用者執行緒複用到相同或更少數量的核心執行緒上,結合了一對一和多對一模型的最佳特性
- 使用者對建立的執行緒數沒有限制
- 阻止核心系統呼叫不會阻止整個程式
- 程式可以分佈在多個處理器上
- 可以為各個程式分配可變數量的核心執行緒,具體取決於存在的 CPU 數量和其他因素
3. Java 執行緒
在進入 Java 執行緒主題之前,有必要講解一下執行緒庫 Thread library 的概念。
在上面的模型介紹中,我們提到了通過執行緒庫來建立、管理執行緒,那麼什麼是執行緒庫呢?
執行緒庫就是為開發人員提供建立和管理執行緒的一套 API。
當然,執行緒庫不僅可以在使用者空間中實現,還可以在核心空間中實現。前者涉及僅在使用者空間內實現的 API 函式,沒有核心支援。後者涉及系統呼叫,也就是說呼叫庫中的一個 API 函式將會導致對核心的系統呼叫,並且需要具有執行緒庫支援的核心。
下面簡單介紹下三個主要的執行緒庫:
1)POSIX Pthreads:可以作為使用者或核心庫提供,作為 POSIX 標準的擴充套件
2)Win32 執行緒:用於 Window 作業系統的核心級執行緒庫
3)Java 執行緒:Java 執行緒 API 通常採用宿主系統的執行緒庫來實現,也就是說在 Win 系統上,Java 執行緒 API 通常採用 Win API 來實現,在 UNIX 類系統上,採用 Pthread 來實現。
下面我們來詳細講解 Java 執行緒:
事實上,在 JDK 1.2 之前,Java 執行緒是基於稱為 "綠色執行緒"(Green Threads)的使用者級執行緒實現的,也就是說程式設計師大佬們為 JVM 開發了自己的一套執行緒庫或者說執行緒管理機制。
而在 JDK 1.2 及以後,JVM 選擇了更加穩定且方便使用的作業系統原生的核心級執行緒,通過系統呼叫,將執行緒的排程交給了作業系統核心。而對於不同的作業系統來說,它們本身的設計思路基本上是完全不一樣的,因此它們各自對於執行緒的設計也存在種種差異,所以 JVM 中明確宣告瞭:虛擬機器中的執行緒狀態,不反應任何作業系統中的執行緒狀態。
也就是說,在 JDK 1.2 及之後的版本中,Java 的執行緒很大程度上依賴於作業系統採用什麼樣的執行緒模型,這點在不同的平臺上沒有辦法達成一致,JVM 規範中也並未限定 Java 執行緒需要使用哪種執行緒模型來實現,可能是一對一,也可能是多對多或多對一。
總結來說,回答下文題,現今 Java 中執行緒的本質,其實就是作業系統中的執行緒,其執行緒庫和執行緒模型很大程度上依賴於作業系統(宿主系統)的具體實現,比如在 Windows 中 Java 就是基於 Wind32 執行緒庫來管理執行緒,且 Windows 採用的是一對一的執行緒模型。
References
- Operating Systems - Threads:https://www.cs.uic.edu/~jbell/CourseNotes/OperatingSystems/4_Threads.html
- Java 執行緒和作業系統執行緒的關係:https://blog.csdn.net/CringKong/article/details/79994511?utm_medium
? 關注公眾號 | 飛天小牛肉,即時獲取更新
- 博主東南大學碩士在讀,攜程 Java 後臺開發暑期實習生,利用課餘時間運營一個公眾號『 飛天小牛肉 』,2020/12/29 日開通,專注分享計算機基礎(資料結構 + 演算法 + 計算機網路 + 資料庫 + 作業系統 + Linux)、Java 技術棧等相關原創技術好文。本公眾號的目的就是讓大家可以快速掌握重點知識,有的放矢。希望大家多多支援哦,和小牛肉一起成長 ?
- 並推薦個人維護的開源教程類專案: CS-Wiki(Gitee 推薦專案,現已累計 1.6k+ star), 致力打造完善的後端知識體系,在技術的路上少走彎路,歡迎各位小夥伴前來交流學習 ~ ?
- 如果各位小夥伴春招秋招沒有拿得出手的專案的話,可以參考我寫的一個專案「開源社群系統 Echo」Gitee 官方推薦專案,目前已累計 700+ star,基於 SpringBoot + MyBatis + MySQL + Redis + Kafka + Elasticsearch + Spring Security + ... 並提供詳細的開發文件和配套教程。公眾號後臺回覆 Echo 可以獲取配套教程,目前尚在更新中。