程式設計師需要了解的硬核知識之作業系統和應用
- 2019 年 11 月 21 日
- 筆記
這是 Java 建設者的第 45 篇原創文章
利用電腦運行程式大部分都是為了提高處理效率。例如,Microsoft Word 這樣的文字處理軟體,是用來提高文本文件處理效率的程式,Microsoft Excel 等表格計算軟體,是用來提高賬本處理效率的程式。這種為了提高特定處理效率的程式統稱為 應用
程式設計師的工作就是編寫各種各樣的應用來提高工作效率,程式設計師一般不編寫作業系統,但是程式設計師編寫的應用離不開作業系統,此篇文章我們就針對 Windows 作業系統來說明一下作業系統和應用之間的關係。
作業系統功能的歷史
作業系統
其實也是一種軟體,任何新事物的出現肯定都有它的歷史背景,那麼作業系統也不是憑空出現的,肯定有它的歷史背景。
在電腦尚不存在作業系統的年代,完全沒有任何程式,人們通過各種按鈕
來控制電腦,這一過程非常麻煩。於是,有人開發出了僅具有載入和運行功能的監控程式
,這就是作業系統的原型。通過事先啟動監控程式,程式設計師可以根據需要將各種程式載入到記憶體中運行。雖然仍舊比較麻煩,但比起在沒有任何程式的狀態下進行開發,工作量得到了很大的緩解。

隨著時代的發展,人們在利用監控程式編寫程式的過程中發現很多程式都有公共的部分。例如,通過鍵盤進行文字輸入,顯示器進行數據展示等,如果每編寫一個新的應用程式都需要相同的處理的話,那真是太浪費時間了。因此,基本的輸入輸出部分的程式就被追加到了監控程式中。初期的作業系統就是這樣誕生了。

類似的想法可以共用,人們又發現有更多的應用程式可以追加到監控程式中,比如硬體控制程式
,程式語言處理器(彙編、編譯、解析)
以及各種應用程式等,結果就形成了和現在差異不大的作業系統,也就是說,其實作業系統是多個程式的集合體。

我在 程式設計師需要了解的硬核知識之CPU這篇文章中提到了彙編語言,這裡簡單再提一下。 彙編語言是一種低級語言,也被稱為
符號語言
。彙編語言是第二代電腦語言,在彙編語言中,用助記符代替機器指令的操作碼,用地址符號或標號代替指令或操作數的地址。用一些容易理解和記憶的字母,單詞來代替一個特定的指令,比如:用ADD
代表數字邏輯上的加減,MOV
代表數據傳遞等等,通過這種方法,人們很容易去閱讀已經完成的程式或者理解程式正在執行的功能,對現有程式的bug修復以及運營維護都變得更加簡單方便
可以說共用思想真是人類前進的一大步,對於解放生產力而言簡直是太重要了。
要把作業系統放在第一位
對於程式設計師來說,程式設計師創造的不是硬體,而是各種應用程式,但是如果程式設計師只做應用不懂硬體層面的知識的話,是無法成為硬核程式設計師的。現在培訓機構培養出了一批怎麼用的人才,卻沒有培訓出為什麼這麼做的人才,畢竟為什麼
不是培訓機構教的,而是學校教的,我很相信耗子叔說的話:學習沒有速成這回事。言歸正題。
在作業系統誕生之後,程式設計師不需要在硬體層面考慮問題,所以程式設計師的數量就增加了。哪怕自稱對硬體一竅不通
的人也可能製作出一個有模有樣的程式。不過,要想成為一個全面的程式設計師,有一點需要清楚的就是,掌握硬體的基本知識,並藉助作業系統進行抽象化,可以大大提高編程效率。
下面就看一下作業系統是如何給開發人員帶來便利的,在 Windows 作業系統下,用 C 語言製作一個具有表示當前時間功能的應用。time()
是用來取得當前日期和時間的函數,printf()
是把結果列印到顯示器上的函數,如下:
#include <stdio.h> #include <time.h> void main(){ // 保存當前日期和時間資訊 time_t tm; // 取得當前的日期和時間 time(&tm); // 在顯示器上顯示日期和時間 printf("%sn", ctime(&tm)); }
讀者可以自行運行程式查看結果,我們主要關注硬體在這段程式碼中做了什麼事情
- 通過 time_t tm,為 time_t 類型的變數申請分配記憶體空間;
- 通過 time(&tm) ,將當前的日期和時間數據保存到變數的記憶體空間中
- 通過 printf("%sn",ctime(&tm)), 把變數記憶體空間的內容輸出到顯示器上。
應用的可執行文件指的是,電腦的 CPU 可以直接解釋並運行的本地程式碼,不過這些程式碼是無法直接控制硬體的,事實上,這些程式碼是通過作業系統來間接控制硬體的。變數中涉及到的記憶體分配情況,以及 time() 和 printf() 這些函數的運行結果,都不是面向硬體而是面向作業系統
的。作業系統收到應用發出的指令後,首先會對該指令進行解釋,然後會對 時鐘IC
和顯示器用的 I/O 進行控制。
電腦中都安裝有保存日期和時間的實時時鐘(Real-time clock),上面提到的時鐘IC 就是值該實時時鐘。

系統調用和程式語言的移植性
作業系統控制硬體的功能,都是通過一些小的函數集合體的形式來提供的。這些函數以及調用函數的行為稱為系統調用
,也就是通過應用進而調用作業系統的意思。在前面的程式中用到了 time()
以及 printf()
函數,這些函數內部也封裝了系統調用。
C 語言等高級程式語言並不依存於特定的作業系統,這是因為人們希望不管是Windows
作業系統還是 Linux
作業系統都能夠使用相同的源程式碼。因此,高級程式語言的機制就是,使用獨自的函數名,然後在編譯的時候將其轉換為系統調用的方式(也有可能是多個系統調用的組合)。也就是說,高級語言編寫的應用在編譯後,就轉換成了利用系統調用的本地程式碼。

不過,在高級語言中也存在直接調用系統調用的程式語言,不過,利用這種方式做成應用,移植性並不友好。
移植性:移植性指的是同樣的程式在不同作業系統下運行時所花費的時間,時間越少證明移植性越好。
作業系統和高級程式語言使硬體抽象化
通過使用作業系統提供的系統調用,程式設計師不必直接編寫控制硬體的程式,而且,通過使用高級程式語言,有時也無需考慮系統調用的存在,系統調用往往是自動觸發的,作業系統和高級程式語言能夠使硬體抽象化,這很了不起。
下面讓我們看一個硬體抽象化的具體實例
#include <stdio.h> void main(){ // 打開文件 FILE *fp = fopen("MyFile.txt","w"); // 寫入文件 fputs("你好", fp); // 關閉文件 fclose(fp); }
上述程式碼使用 C 編寫的程式,fputs()
是用來往文件中寫入字元串的函數,fclose()
是用來關閉文件的函數。
上述應用在編譯運行後,會向文件中寫入 "你好" 字元串。文件是作業系統對磁碟空間的抽象化,就如同我們在 程式設計師需要了解的硬核知識之磁碟 這篇文章提到的一樣,磁碟就如同樹的年輪,磁碟的讀寫是以扇區為單位的,通過磁軌來定址,如果直接對硬體讀寫的話,那麼就會變為通過向磁碟用的 I/O 指定扇區位置來對數據進行讀寫了。
但是,在上面程式碼中,扇區壓根就沒有出現過傳遞給 fopen() 函數的參數,是文件名 MyFile.txt
和指定文件寫入的 w
。傳遞給 fputs() 的參數,是往文件中寫入的字元串"你好" 和 fp,傳遞給 fclose() 的參數,也僅僅是 fp,也就是說磁碟通過打開文件這個操作,把磁碟抽象化了,打開文件這個操作就可以說是操作硬體的指令。

下面讓我們來看一下程式碼清單中 fp 的功能,變數 fp 中被賦予的是 fopen() 函數的返回值,該值被稱為文件指針
。應用打開文件後,作業系統就會自動申請分配用來管理文件讀寫的記憶體空間。記憶體地址可以通過 fopen() 函數的返回值獲得。用 fopen() 打開文件後,接下來就是通過制定的文件指針進行操作,正因為如此,fputs() 和 fclose() 以及 fclose() 參數中都制定了文件指針。
由此我們可以得出一個結論,應用程式是通過系統調用,磁碟抽象來實現對硬碟的控制的。
Windows 作業系統的特徵
Windows 作業系統是世界上用戶數量最龐大的群體,作為 Windows 作業系統的資深
用戶,你都知道 Windows 作業系統有哪些特徵嗎?下面列舉了一些 Windows 作業系統的特性
- Windows 作業系統有兩個版本:32位和64位
- 通過
API
函數集成來提供系統調用 - 提供了採用圖形用戶介面的用戶介面
- 通過
WYSIWYG
實現列印輸出,WYSIWYG 其實就是 What You See Is What You Get ,值得是顯示器上顯示的圖形和文本都是可以原樣輸出到印表機列印的。 - 提供多任務功能,即能夠同時開啟多個任務
- 提供網路功能和資料庫功能
- 通過即插即用實現設備驅動的自設定
這些是對程式設計師來講比較有意義的一些特徵,下面針對這些特徵來進行分別的介紹
32位作業系統
這裡表示的32位作業系統表示的是處理效率最高的數據大小。Windows 處理數據的基本單位是 32 位。這與最一開始在 MS-DOS
等16位作業系統不同,因為在16位作業系統中處理32位數據需要兩次,而32位作業系統只需要一次就能夠處理32位的數據,所以一般在 windows 上的應用,它們的最高能夠處理的數據都是 32 位的。
比如,用 C 語言來處理整數數據時,有8位的 char
類型,16位的short
類型,以及32位的long
類型三個選項,使用位數較大的 long 類型進行處理的話,增加的只是記憶體以及磁碟的開銷,對性能影響不大。
現在市面上大部分都是64位作業系統了,64位作業系統也是如此。
通過 API 函數集來提供系統調用
Windows 是通過名為 API
的函數集來提供系統調用的。API是聯繫應用程式和作業系統之間的介面,全稱叫做 Application Programming Interface
,應用程式介面。
當前主流的32位版 Windows API 也稱為 Win32 API
,之所以這樣命名,是需要和不同的作業系統進行區分,比如最一開始的 16 位版的 Win16 API
,和後來流行的 Win64 API
。
API 通過多個 DLL 文件來提供,各個 API 的實體都是用 C 語言編寫的函數。所以,在 C 語言環境下,使用 API 更加容易,比如 API 所用到的 MessageBox()
函數,就被保存在了 Windows 提供的 user32.dll 這個 DLL 文件中。
提供採用了 GUI 的用戶介面
GUI(Graphical User Interface)
指得就是圖形用戶介面,通過點擊顯示器中的窗口以及圖標等可視化的用戶介面,舉個例子:Linux 作業系統就有兩個版本,一種是簡潔版,直接通過命令行控制硬體,還有一種是可視化版,通過游標點擊圖形介面來控制硬體。
通過 WYSIWYG 實現列印輸出
WYSIWYG 指的是顯示器上輸出的內容可以直接通過印表機列印輸出。在 Windows 中,顯示器和印表機被認作同等的圖形輸出設備處理的,該功能也為 WYSIWYG 提供了條件。
藉助 WYSIWYG 功能,程式設計師可以輕鬆不少。最初,為了實現在顯示器中顯示和在印表機中列印,就必須分別編寫各自的程式,而在 Windows 中,可以藉助 WYSIWYG 基本上在一個程式中就可以做到顯示和列印這兩個功能了。
提供多任務功能
多任務指的就是同時能夠運行多個應用程式的功能,Windows 是通過時鐘分割
技術來實現多任務功能的。時鐘分割指的是短時間間隔內,多個程式切換運行的方式。在用戶看來,就好像是多個程式在同時運行,其底層是 CPU 時間切片
,這也是多執行緒多任務的核心。

提供網路功能和資料庫功能
Windows 中,網路功能是作為標準功能提供的。資料庫(資料庫伺服器)功能有時也會在後面追加。網路功能和資料庫功能雖然並不是作業系統不可或缺的,但因為它們和作業系統很接近,所以被統稱為中間件
而不是應用。意思是處於作業系統和應用的中間層,作業系統和中間件組合在一起,稱為系統軟體
。應用不僅可以利用作業系統,也可以利用中間件的功能。

相對於作業系統一旦安裝就不能輕易更換,中間件可以根據需要進行更換,不過,對於大部分應用來說,更換中間件的話,會造成應用也隨之更換,從這個角度來說,更換中間件也不是那麼容易。
通過即插即用實現設備驅動的自動設定
即插即用(Plug-and-Play)
指的是新的設備連接(plug) 後就可以直接使用的機制,新設備連接電腦後,電腦就會自動安裝和設定用來控制該設備的驅動程式
設備驅動是作業系統的一部分,提供了同硬體進行基本的輸入輸出的功能。鍵盤、滑鼠、顯示器、磁碟裝置等,這些電腦中必備的硬體的設備驅動,一般都是隨作業系統一起安裝的。
有時 DLL 文件也會同設備驅動文件一起安裝。這些 DLL 文件中存儲著用來利用該新追加的硬體API,通過 API ,可以製作出運行該硬體的新應用。
文章參考:
https://baike.baidu.com/item/彙編語言/61826?fr=aladdin
《程式是怎樣跑起來的》第九章
https://baike.baidu.com/item/Windows作業系統/852149?fr=aladdin