操作系統實現(一):從Bootloader到ELF內核(轉載)
- 2019 年 11 月 10 日
- 筆記
原文鏈接:
http://www.cppblog.com/airtrack/archive/2014/10/30/208729.html
Bootloader
我們知道計算機啟動是從BIOS開始,再由BIOS決定從哪個設備啟動以及啟動順序,比如先從DVD啟動再從硬盤啟動等。計算機啟動後,BIOS根據配置找到啟動設備,並讀取這個設備的第0個扇區,把這個扇區的內容加載到0x7c00,之後讓CPU從0x7c00開始執行,這時BIOS已經交出了計算機的控制權,由被加載的扇區程序接管計算機。
這第一個扇區的程序就叫Boot,它一般做一些準備工作,把操作系統內核加載進內存,並把控制權交給內核。由於Boot只能有一個扇區大小,即512位元組,它所能做的工作很有限,因此它有可能不直接加載內核,而是加載一個叫Loader的程序,再由Loader加載內核。因為Loader不是BIOS直接加載的,所以它可以突破512位元組的程序大小限制(在實模式下理論上可以達到1M)。如果Boot沒有加載Loader而直接加載內核,我們可以把它叫做Bootloader。
Bootloader加載內核就要讀取文件,在實模式下可以用BIOS的INT 13h中斷。內核文件放在哪裡,怎麼查找讀取,這裡牽涉到文件系統,Bootloader要從硬盤(軟盤)的文件系統中查找內核文件,因此Bootloader需要解析文件系統的能力。GRUB是一個專業的Bootloader,它對這些提供了很好的支持。
對於一個Toy操作系統來說,可以簡單處理,把內核文件放到Bootloader之後,即從軟盤的第1個扇區開始,這樣我們可以不需要支持文件系統,直接讀取扇區數據加載到內存即可。
實模式到保護模式
我們知道Intel x86系列CPU有實模式和保護模式,實模式從8086開始就有,保護模式從80386開始引入。為了兼容,Intel x86系列CPU都支持實模式。現代操作系統都是運行在保護模式下(Intel x86系列CPU)。計算機啟動時,默認的工作模式是實模式,為了讓內核能運行在保護模式下,Bootloader需要從實模式切換到保護模式,切換步驟如下:
- 準備好GDT(Global Descriptor Table)
- 關中斷
- 加載GDT到GDTR寄存器
- 開啟A20,讓CPU尋址大於1M
- 開啟CPU的保護模式,即把cr0寄存器第一個bit置1
- 跳轉到保護模式代碼
GDT是Intel CPU保護模式運行的核心數據結構,所有保護模式操作的數據都從GDT表開始查找,這裡有GDT的詳細介紹。
GDT中的每一個表項由8位元組表示,如下圖:

其中Access Byte和Flags如下圖:

這裡是詳細說明。
GDTR是一個6位元組的寄存器,有4位元組表示GDT表的基地址,2位元組表示GDT表的大小,即最大65536(實際值是65535,16位最大值是65535),每個表項8位元組,那麼GDT表最多可以有8192項。
實模式的尋址總線是20bits,為了讓尋址超過1M,需要開啟A20,可以通過以下指令開啟:
in al, 0x92
or al, 2
out 0x92, al
or al, 2
out 0x92, al
把上述步驟完成之後,我們就進入保護模式了。在保護模式下我們要使用GDT通過GDT Selector完成,它是GDT表項相對於起始地址的偏移,因此它的值一般是0x0 0x8 0x10 0x18等。
ELF文件
Bootloader程序是原始可執行文件,如果程序由彙編寫成,彙編編譯器編譯生成的文件就是原始可執行文件,也可以使用C語言編寫,編譯成可執行文件之後通過objcopy轉換成原始可執行文件,這篇文章介紹了用C語言寫Bootloader。
那麼內核文件是什麼格式的呢?跟Bootloader一樣的當然可以。內核一般使用C語言編寫,每次編譯鏈接完成之後調用objcopy是可以的。我們也可以支持通用的可執行文件格式,ELF(Executable and Linkable Format)即是一種通用的格式,它的維基百科。
ELF文件有兩種視圖(View),鏈接視圖和執行視圖,如下圖:

鏈接視圖通過Section Header Table描述,執行視圖通過Program Header Table描述。Section Header Table描述了所有Section的信息,包括所在的文件偏移和大小等;Program Header Table描述了所有Segment的信息,即Text Segment, Data Segment和BSS Segment,每個Segment中包含了一個或多個Section。
對於加載可執行文件,我們只需關注執行視圖,即解析ELF文件,遍歷Program Header Table中的每一項,把每個Program Header描述的Segment加載到對應的虛擬地址即可,然後從ELF header中取出Entry的地址,跳轉過去就開始執行了。對於ELF格式的內核文件來說,這個工作就需要由Bootloader完成。Bootloader支持ELF內核文件加載之後,用C語言編寫的內核編譯完成之後就不需要objcopy了。