讀《程式是如何跑起來的》

weixin_34321977發表於2018-04-14

原文網址 : https://blog.csdn.net/weixin_34321977/article/details/87409494

2018-04-05

前言

作業系統將底層的很多抽象的原理封裝成物件導向的、方便大眾理解和操作的圖形介面、這大大提高了計算機操作的便利性，然而，享受方便的同事也付出了代價，對於底層的瞭解越來越少，只會使用工具，卻無法明白工具的底層機制就無法創造出更好的工具。

image

第1章對程式設計師來說CPU是什麼

熱身問題

問：

程式是什麼?
程式是由什麼組成的?
什麼是機器語言?
正在執行的程式儲存在什麼位置?
什麼是記憶體地址?
計算機的構成元件中，負責程式的解釋和執行的是哪個?

答：

指示計算機每一步動作的一組指令
指令和資料
CPU 可以直接識別並使用的語言
記憶體
記憶體中，用來表示命令和資料儲存位置的數值
CPU

解析

一般所說的程式,譬如運動會、音樂會的程式等,指的是“行事的先後次序”。計算機程式也是一樣的道理。
程式是指令和資料的組合體。例如，C 語言“printf(" 你好");”這個簡單的程式中，printf是指令，" 你好" 是資料。
CPU 能夠直接識別和執行的只有機器語言。使用C、Java 等語言編寫的程式,最後都會轉化成機器語言。
硬碟和磁碟等媒介上儲存的程式被複制到記憶體後才能執行。
記憶體中儲存命令和資料的場所，通過地址來標記和指定。地址由整數值表示。
計算機的構成元件中，根據程式的指令來進行資料運算，並控制整個計算機的裝置稱作CPU。大家熟知的奔騰( Pentium )就是CPU 的一種。

1.1 CPU內部結構

積體電路 = CPU + 記憶體

CPU
- 暫存器：暫存指令、資料, 一般一個CPU包含20~100個暫存器.
- 控制器：負責把記憶體上指令、資料的讀入暫存器.
- 運算器: 負責運算，從記憶體讀入暫存器的資料。
- 時鐘：發出CPU開始計時的時鐘訊號。
image

程式啟動後，根據時鐘訊號，控制器會從記憶體中讀取指令和資料。通過對這些指令加以解釋和執行，運算器就會對資料進行運算。控制器根據該運算結果來控制(主要是資料輸人輸出的時機控制)計算機。

image

小總結

程式編寫好後，被計算機複製到記憶體中，然後CPU的控制器從記憶體中讀取指令和資料，運算器對資料進行運算，最後控制器根據運算器的結果來控制計算器。因為現在計算機CPU的計算能力很強，所以這個過程很快。

暫存器

暫存器的主要種類和功能

image

表1-1 暫存器的主要種類和功能

種類	功能
程式計數器( program counter )	儲存下一條指令所在記憶體的地址
標誌暫存器( flag register )	儲存運算處理後的CPU 的狀態

組合語言

彙編：將組合語言編寫的程式轉化成機器語言的過程稱為彙編。
反彙編：將機器語言轉化成組合語言程式的過程稱為反彙編。

組合語言：組合語言採用助記符(memonic )來編寫程式,每一個原本是電氣訊號的機器語言“指令都會有一個與其相應的助記符，組合語言和機器語言基本上是一一對應的。

條件分支和迴圈機制

程式的流程
* 順序執行：按照地址內容的順序執行指令
* 條件分支：根據條件執行任意地址的指令
* 迴圈：重複執行同一地址的指令

函式的呼叫機制

image

函式實現了程式碼指令在記憶體的離散分佈。

Call指令：呼叫函式後需要執行的質量地址存在棧中
Return指令：將儲存在棧中的地址設定到程式計數器中，函式處理完後，下一個指令就會被讀取出來，再被設定到程式計數器中。
棧(stack) 本來是“乾草等堆積如山”的意思。在程式領域中，通常使用
該詞來表示不斷地儲存各種資料的記憶體區域。函式呼叫後之所以能正確
地返回撥用前的地址，就是棧的功勞。
陣列: 是指同樣長度的資料, 在記憶體中進行連續排列的資料構造。一個陣列名來表示全體資料，通過索引來區分陣列的各個資料(元素)。
位：1位代表二進位制數的一個位元組位。

綜合使用地址和索引來決定實際地址

image

機器語言

image

原來CPU可以進行的處理非常少。雖然高階程式語言編寫的程式看起來非常複雜,但CPU實際處理的事情就是這麼簡單。

一點感想

機器語言指令必須要有讀寫和傳送的操作，還有邏輯運算，而跳轉和Call、Return指令是高階一點的指令。

感覺CPU其實主要發揮它的效能優勢，計算速度快，但是專注於快速處理資料運算，CPU無法處理複雜的高階邏輯，所以才出現了各種方便程式設計師理解的高階程式語言。反應到生活中，人也要儘量發揮個人的長處，才能創造更大的價值吧，

第2章資料是用二進位制表示的

問

32 位是幾個位元組?
二進位制數01011100 轉換成十進位制數是多少?
二進位制數00001111左移兩位後，會變成原數的幾倍?
補碼形式表示的8位二進位制數11111111,用十進位制數表示
的話是多少?
補碼形式表示的8位二進位制數10101010，用16位的二進
制數表示的話是多少?
反轉部分圖形模式時，使用的是什麼邏輯運算?

解析

因為8位=1位元組，所以32位就是32/8=4位元組。
92, 將二進位制數的各數位的值和位權相乘後再相加，即可轉換成十進位制數。
4倍, 二進位制數左移1位後會變成原來的值的2倍。左移兩位後，就是2倍的2倍，即4倍。
-1, 所有位都是1的二進位制數,用十進位制數表示的話就是-1。
1111111110101010, 使用原數的最高位1來填充高位。
XOR 運算只反轉與1相對應的位。NOT運算是反轉所有的位。

二進位制的IC

計算機處理資訊最小的單位是位——就相當於二進位制中的一位（binary digit）

image

位元組

二進位制數的位數一般是8位、16位、32位.....也就是8的倍數, 這是因為計算機所處理的資訊的基本單位是8位二進位制數。

8位二進位制數被稱為一個位元組。位元組是最基本的資訊計量單位。

位是最小單位，位元組是基本單位。

記憶體和磁碟都使用位元組單位來儲存和讀寫資料，使用位單位則無法讀寫資料。因此，位元組是資訊的基本單位。

用位元組單位處理資料時,如果數字小於儲存資料的位元組數( 二進位制數的位數),那麼高位上就用0填補。例如，100111這個6 位二進位制數，用8位(=1位元組)表示時為00100111,用16位(=2位元組)表示時為000000000100111。

對於用二進位制數表示的資訊，計算機不會區分它是數值、文字，還是某種圖片的模式等，而是根據編寫程式的各位對計算機發出的指示來進行資訊的處理(運算)。具體進行何種處理，取決於程式的編寫方式。

位運算

十進位制數左移後會變成原來的10倍、100倍、1000倍.....樣，二進位制數左移後就會變成原來的2倍、4倍、8倍.....之二進位制數右移後則會變成原來的1/4、1./.....這樣一來，大家應該能夠理解為什麼移位運算能代替1/2、乘法運算和除法運算了吧。

二進位制數中最高位稱為符號位。符號位是0 時表示正數，符號位是1時表示負數。

image

image

補數

二進位制的補數為"取反+1"
一個負數可用它的正補數來代替，而這個正補數可以用模加上負數本身來得到。
一個正數和一個負數互為補數時，兩數的絕對值之和為模
正數的補數為其自身。

邏輯右移

image

算術右移

將二進位制數作為帶符號的數值進行運算時，移位後要在最高位填充移位前符號位的值(0 或1)。
如果數值是用補數表示的負數值，那麼右移後在空出來的最高位補1,就可以正確地實現1/2、1/4、1/8 等的數值運算。如果是正數，只需在最高位補0即可。
只有在右移時才必須區分邏輯位移和算術位移。左移時，只需在空出來的低位補0即可。

image

第3章計算機進行小數運算出錯的原因

問：

二進位制數0.1,用十進位制數表示的話是多少?
用小數點後有3 位的二進位制數，能表示十進位制數0.625 嗎?
將小數分為符號、尾數、基數、指數4 部分進行表現的形式
稱為什麼?
二進位制數的基數是多少?
通過把0 作為數值範圍的中間值，從而在不使用符號位的情
況下來表示負數的表示方法稱為什麼?
10101100.01010011這個二進位制數，用十六進位制數表示的
話是多少?

答：

二進位制數的小數點後第一位的位權是2^-1= 0.5。也就是說，二進位制數0.1—> 1 x 0.5 —> 十進位制數0.5。
十進位制數0.625 轉換成二進位制0.101。
浮點數是指把小數用“符號尾數x 基數的指數次冪”這種形式來表示。
二進位制數的基數是2,十進位制數的基數是10。以此類推，XX進位制數的基數就是X X。
EXCESS是“剩餘的”的意思。例如，把0111111看作是0 的話，比這個數小1的01111110就是 -1。
整數部分和小數部分一樣, 二進位制數的4 位，就相當於十六進位制數的1位。

3.1 計算機的誤差

image

結果：

sum = 10.000002

3.2 用二進位制表示小數

image

計算機之所以會出現運算錯誤，是因為“有一些十進位制數的小數無法轉換成二進位制數”。例如，十進位制數0.1,就無法用二進位制數正確表示，小數點後面即使有幾百位也無法表示。

image

因為無法正確表示的數值，最後都變成了近似值。計算機這個功能有限的機器裝置,是無法處理無限迴圈的小數的。因此，在遇到迴圈小數時，計算機就會根據變數資料型別所對應的長度將數值從中間截斷或者四捨五入。

3.4 浮點數

image

單精度浮點數，32位， float
雙精度浮點數， 64位，double

image

3.7 如何避免計算機計算出錯

計算機計算出錯的原因之一是，採用浮點數來處理小數(另外,也
有因“位溢位”而造成計算錯誤的情況)。

將小數轉換成整數計算
在一定誤差範圍內忽略

image

第4章熟練使用有稜有角的記憶體

問：

二進位制數0.1,用十進位制數表示的話是多少?
用小數點後有3 位的二進位制數，能表示十進位制數0.625 嗎?
將小數分為符號、尾數、基數、指數4 部分進行表現的形式
稱為什麼?
二進位制數的基數是多少?
通過把 0 作為數值範圍的中間值，從而在不使用符號位的情
況下來表示負數的表示方法稱為什麼?
10101100.01010011這個二進位制數，用十六進位制數表示的
話是多少?

答：

二進位制數的小數點後第一位的位權是2^-1= 0.5。也就是說，二進位制數0.1—> 1 x 0.5 —> 十進位制數0.5。
十進位制數0.625 轉換成二進位制0.101。
浮點數是指把小數用“符號尾數x 基數的指數次冪”這種形式來表示。
二進位制數的基數是2,十進位制數的基數是10。以此類推，XX進位制數的基數就是X X。
EXCESS是“剩餘的”的意思。例如，把0111111看作是0 的話，比這個數小1的01111110就是 -1。
整數部分和小數部分一樣, 二進位制數的4 位，就相當於十六進位制數的1位。

4.1 記憶體的物流機制

記憶體IC
- DRAM Dynamic 隨機儲存器, 需要不斷是重新整理電路
- SRAM Staic 隨機儲存器，不需要不斷是重新整理電路
- ROM 只讀儲存器
- 電源
- 地址訊號
- 資料訊號
- 控制訊號

4.2 記憶體的邏輯模型是樓房

image

記憶體為1KB時，表示的是如圖所示的有1024層的樓房(這裡地址的值是從上往下逐漸變大，不過也有與此相反的
情況)。

image

物理上以1個位元組為單位來逐一讀寫資料的記憶體，在程式中，通過指定其型別(變數的資料型別等),也能實現以特定位元組數為單位進行讀寫。

根據程式中所指定的變數的資料型別的不同，讀寫的實體記憶體大小也會隨之發生變化。C 語言中，8位元組(=64 位)的double 型別是最大的。

4.3 簡單的指標

指標也是一種變數
它所表示的不資料的值，而是儲存著資料的記憶體的地址。
通過使用指標，就可以對任意指定地址的資料進行讀寫。
定義指標時候，常在變數名前加一個星號（*）
定義指標的資料型別表示從指標儲存的地址中一次能讀寫的資料位元組數

image

image

4.4 陣列

陣列是指多個同樣資料型別的資料在記憶體中連續排列的形式。
作為陣列元素的各個資料會通過連續的編號被區分開來，這個編號稱為索引index。
指定索引後，可以對該索引所對應地址的記憶體進行讀寫操作。
索引和記憶體地址的變換工作則是由編譯器自動實現的。

image

陣列可以使程式設計工作變得更加高效，如果在迴圈中反覆使用陣列，使用索引可以很方便的達到按順序進行讀寫陣列元素的目的。

4.5 棧和佇列

在對記憶體資料進行讀寫時

棧用的是LIFO (Last Input First Out,後人先出)方式
佇列用的則是FIFO( First Input First Out,先人先出) 方式

image

image

佇列的環狀緩衝區(ring buffer )方式

image

有6 個元素的陣列來實現一個佇列。從陣列的起始位置開始有序儲存資料，再按照儲存的順序讀出資料。陣列末尾寫人資料後，後一個資料就會被寫人陣列的起始位置(此時資料已經被讀出所以該位置是空的)。這樣，陣列的末尾就和開頭連線了起來，資料的寫人和讀出也就迴圈起來了

4.6 連結串列

連結串列：使陣列元素的新增和刪除更容易
在陣列的各個元素中，除了資料的值之外，通過為其附帶上下一
個元素的索引，即可實現連結串列。資料的值和下一個元素的索引組合在一起，就構成了陣列的一個元素。

image

連結串列刪除元素

image

連結串列追加元素

image

如果單純通過移動元素來挪出空間，每次都需要移動數千至數萬個元素，那麼哪怕是高速計算機也會花費很長時間。

4.7 二叉樹

二叉查詢樹：可以更加高效地對陣列資料進行檢索。

在連結串列的基礎上
往陣列中追加元素時，根據資料的大小
分成左右兩個方向的表現形式
二叉查詢樹是由連結串列構造發展而來的表現形式，因此在追加或刪除元素方面也同樣是有效的。

image

在使用一般的陣列時，必須從陣列的開頭按照索引順序來查詢目標資料。
而使用二叉查詢樹時，當目標資料比現在讀出來的資料小時就可以轉到左側，反之目標資料較大時即可轉到連結串列的右側
這樣就加快了找到目標資料的速度。

image

第5章記憶體和磁碟

問：

儲存程式方式指的是什麼?
通過使用記憶體來提高磁碟訪問速度的機制稱為什麼?
把磁碟的一部分作為假想記憶體來使用的機制稱為什麼?
Windows 中，在程式執行時，儲存著可以動態載入呼叫的
函式和資料的檔案稱為什麼?
在EXE 程式檔案中，靜態載入函式的方式稱為什麼?
在Windows 計算機中，一般磁碟的1個扇區是多少位元組?

答：

在儲存裝置中儲存程式，並逐一執行的方式
Disk Cache( 磁碟快取)
虛擬記憶體( virtual memory )
DLL( DLL 檔案)
靜態連結
512 位元組

記憶體

用電流來實現儲存的記憶體
高速高價

磁碟

利同利用磁效應來實現儲存
低速廉價
磁碟中，利用磁極的不同來標記0、1

image

5.1 程式的執行需要被讀入記憶體

儲存程式方式(程式內建方式)： 程式儲存在儲存裝置中，通過有序地被讀出來實現執行

原因：負責解析和執行程式內容的CPU,
需要通過內部程式計數器來指定記憶體地址，然後才能讀出程式。

CPU可以直接從讀磁碟中儲存的程式，但是磁碟讀取速度太慢，程式的執行速度會大大降低。

image

5.2 磁碟快取加快了磁碟訪問速度

磁碟快取

指的是把從磁碟中讀出的資料儲存到記憶體空間中的方式。
需要讀取同一資料時，就不用通過實際的磁碟，而是從磁碟快取中把內容讀出。加快訪問速度

image

5.3 虛擬記憶體把磁碟作為部分記憶體來使用

虛擬記憶體( virtual memory )

虛擬儲存：在有限容量的記憶體中，以頁為單位自動裝入更多更大的程式
虛擬記憶體是指把磁碟的一部分作為假想的記憶體來使用。
這與磁碟快取是假想的磁碟(實際上是記憶體)相對，虛擬記憶體是假想的記憶體(實際上是磁碟)。

實現方式

覆蓋（overlay）：應用程式手動把需要的指令和資料儲存在記憶體中
交換（swapping）：作業系統自動把暫時不能執行的程式儲存到外存中

CPU 只能執行載入到記憶體中的程式。虛擬記憶體雖說是把磁碟作為記憶體的一部分來使用，但實際上正在執行的程式部分，在這個時間點上是必須存在在記憶體中的。

為了實現虛擬記憶體,就必須把實際記憶體(也可稱為實體記憶體)的內容，和磁碟上的虛擬記憶體的內容進行部分置換(swap ),並同時執行程式。

虛擬記憶體是計算機系統記憶體管理的一種技術。它使得應用程式認為它擁有連續可用的記憶體(一個連續完整的地址空間)，而實際上，它通常是被分隔成多個實體記憶體碎片，還有部分暫時儲存在外部磁碟儲存器上，在需要時進行資料交換。

image

虛擬記憶體無法徹底解決記憶體不足的問題

而虛擬記憶體也確實能避免因記憶體不足導致的應用無法啟動。
不過，由於使用虛擬記憶體時發生的Page In 和Page Out 往往伴隨著低速的磁碟訪問，因此在這個過程中應用的執行會變得遲鈍起來。
虛擬記憶體無法徹底解決記憶體不足的問題。

image

5.4 節約記憶體的程式設計方法

從根本上解決記憶體不足的問題

需要增加記憶體的容量
儘量把執行的應用檔案變小

(1)通過DLL 檔案實現函式共有
DLL( Dynamic Link Library )檔案”，顧名思義,是在程式執行時可以動態載入Library( 函式和資料的集合)的檔案。

那就是多個應用可以共有同一個DLL 檔案。而通過共有同一個DLL 檔案則可以達到節約記憶體的效果。

image

image

棧清理

image

image

5.5 磁碟的物理結構

image

扇區是對磁碟進行物理讀寫的最小單位。Windows 中使用的磁碟, 一般1個扇區是512 位元組。不過，Windows 在邏輯方面(軟體方面)對磁碟進行讀寫的單位是扇區整數倍簇。根據磁碟容量的不同，1簇可以
是512位元組(1簇=1扇區)、1KB(1簇=2扇區)、2KB、4KB、8KB、16KB、32KB (1簇= 64 扇區)。磁碟的容量越大,簇的容量也越大。不過，在軟盤中，1簇=512 位元組= 1扇區，簇和扇區的大小是相等的。

附：

硬碟的儲存原理是什麼？為什麼一張小小的硬碟可以存下如此多的資料？

磁鐵有兩個極性, 一個是南極(S極) , 一個是北極(N 極) , 硬碟正是利用磁粒子的極性來記錄資料的。
碟片表面的那些磁粉就是磁粒子。碟片被劃分成若干個同心圓( 稱為磁軌),在每個同心圓的磁軌上就好像有無數的任意排列的小磁鐵, 當這些小磁鐵受到來自磁頭磁場的影響時,排列的方向隨之改變, 利用磁頭的磁力統一某區域小磁鐵的方向, 就可以使該區域磁場呈現相同極性, 如果把 S/N 兩種極性與二進位制中的 0和 1 對應, 就可以表示二進位制資料, 這些磁粒子都是永磁體, 即便磁頭離開, 它依然可以長時間保持形成的極性, 這樣就能達到儲存資訊的目的了。
磁頭在讀取資料時, 可以感應磁粒子的不同極性, 從而轉換成不同的電脈衝訊號, 利用解碼器將這些原始訊號翻譯出來, 就成為了電腦能使用的資料。