深入理解電腦系統-學習筆記 (1)

本部落格由個人對於 深入理解電腦系統(第三版) 一書的學習筆記整理而成
挺亂的,也挺簡略,畢竟整理筆記也挺麻煩的(

電腦系統漫遊

先看一段程式碼:

#include<stdio.h>

int main()
{
	printf("Hello, world\n");
	return 0;
}

讓我們看看這段程式的組成,以及它是如何運行的

程式組成

image

可以看到,這段程式是以位元組序列的方式存儲在文件中的,每個位元組都有一個整數值,對應某些字元,這就是ASCII碼

只由ASCII碼組成的文件稱為文本文件,其餘文件稱為二進位文件

程式編譯過程

像hello.c這樣的高級語言寫出來的程式,雖然能讓人看懂,但卻無法在系統上直接運行。為了能讓系統也讀懂這段程式碼,需要對該程式碼進行多次轉換

image

  1. 預處理階段

    預處理器(cpp)根據以字元#開頭的命令,修改原始的C程式,主要是將讀取的系統頭文件stdio.h中的內容插入到程式文本中。所得的另一個C程式以.i作為文件擴展名

  2. 編譯階段

    編譯器(cll)將hello.i程式翻譯為彙編語言,翻譯後的文件以.s作為文件擴展名。這裡只放出main函數的彙編語言:

    彙編語言為不同的高級語言的不同編譯器提供了通用的輸出語言

  3. 彙編階段

    彙編器(as)將hello.s程式翻譯為機器語言指令,並將其打包成可重定位目標程式的格式,並將結果保存在hello.o中。這是一個二進位文件

  4. 鏈接階段

    因為hello程式中調用了printf函數,這是標準C語言庫中的一個函數,存在與一個名為printf.o的單獨的預編譯好了的文件中。為了調用此函數,就必須將這個文件以某種方式合併到我們的程式中,鏈接器(ld)就負責處理這種合併。最終得到的hello文件,就是一個可執行文件,可以被載入到記憶體中,由系統使用

系統的硬體組成

image

  1. 匯流排

    貫穿整個系統的一組點句子管道,攜帶資訊位元組並負責在各個部位間傳遞。通常被設計為傳送定長的位元組塊

  2. I/O 設備

    I/O(輸入/輸出)設備時系統與外部世界的聯繫通道,如作為輸入設備的鍵盤滑鼠,作為輸出設備的顯示器等。通過控制器與適配器與I/O匯流排相連

  3. 主存

    一個臨時存儲設備,用於存放程式和程式處理的數據

  4. 處理器

    中央處理單元(CPU)簡稱處理器,是解釋(或執行)存儲在主存中指令的引擎

    處理器的核心是一個大小為一個字的存儲設備(或暫存器),稱為程式計數器(PC)。PC會一直指向主存中的某條機器語言指令,並進行執行

    CPU執行指令的過程圍繞著主存,暫存器文件(register file)和算術/邏輯單元(ALU)進行。暫存器文件是一個小的存儲設備,由一些單個字長的暫存器組成,且每個暫存器都有唯一的名字。ALU則計算新的數據和地址值

    CPU大致能夠執行以下一些操作:

    • 載入:從主存複製一個位元組或者一個字到暫存器,覆蓋暫存器原來的內容
    • 存儲:從暫存器複製一個位元組或者一個字到主存中的某個位置,覆蓋該位置上原本的內容
    • 操作:把兩個暫存器的內容複製到ALU,ALU對這兩個字做算術運算 ,並將結果存放到一個暫存器中
    • 跳轉:從指令本身中抽取一個字,將這個字輔助到PC中,覆蓋PC原本的值

    等等

程式運行過程

接下來我們看看hello程式在運行過程中都發生了什麼:

若我們要在Unix系統中執行hello程式,就需要將程式的文件名輸入到一個名為shell的應用程式中

我們在鍵盤上輸入”./hello”字元串後,shell程式將字元逐一讀入暫存器,再將其存放到記憶體中

image

當我們敲下回車鍵時,shell程式就知道我們已經結束了命令的輸入,shell會執行一系列指令載入可執行的hello文件。這些指令將hello目標文件中的程式碼和數據從磁碟複製到主存。這裡利用了直接存儲器存取(DMA)技術,讓數據可以不通過處理器而直接從磁碟到主存

image

目標文件hello中的程式碼和數據被載入到主存後,處理器就開始執行hello程式的main函數中的機器語言指令。這些指令將”hello, world\n”字元串中的位元組從主存複製到暫存器文件,再從暫存器文件中複製到顯示設備,最終顯示在螢幕上

image

抽象

文件是對I/O設備的抽象,虛擬記憶體是對主存和I/O設備的抽象,進程是對處理器,主存和I/O設備的抽象

進程

程式運行時系統看上去總是只有這個程式在運行,就好像這個程式獨佔了CPU,主存和I/O設備。但運行程式的數量總比CPU數量多,這是由上下文切換實現的

在任何一個時刻,單處理器系統都只能執行一個進程的程式碼。當作業系統決定要吧控制權從當前進程轉移到新進程時,就會發生上下文切換。CPU會不斷切換正在執行的進程,給人CPU在並發地執行多個進程的感覺

執行緒

現代系統中,一個進程可以由多個稱為執行緒的執行單元組成。每個執行緒都運行在進程的上下文中,並共享程式碼和全局數據

虛擬記憶體

虛擬記憶體提供了一個假象:每個進程都在獨佔地使用主存。每個進程看到的記憶體都是一致的,稱為虛擬地址空間
每個進程看到的虛擬地址空間都由大量準確定義的區構成,每個區都有專門的功能。
image

文件

文件就是位元組序列,每個I/O設備,包括磁碟,鍵盤,顯示器,甚至網路,都可以看成是文件。

文件嚮應用程式提供了一個統一的視圖,來讓程式可以在使用不同磁碟技術的不同系統上運行