Linux是否能在8位MCU上運行?
- 2020 年 4 月 1 日
- 筆記
轉自網絡
我們經常可以看到初學者在單片機論壇中詢問他們是否可以在他們微不足道的小的8位微機中運行Linux。這些問題的結果通常是帶來笑聲。我們也經常看到,在Linux論壇中,詢問Linux運行的最低要求是什麼。常見的答案是Linux需要一個32位架構和一個MMU(存儲器管理單元),並至少1MB的RAM來滿足內核的需求。
本項目旨在(並且成功)粉碎這些概念。下圖中您所看到的開發板基於ATmega1284P。我(歪果仁)還製作了一塊基於ATmega644a的開發板,也同樣獲得了成功。該開發板沒有使用其他處理器,啟動Linux 2.6.34內核。事實上,它甚至可以運行一個完整的Ubuntu棧,包括X(如果你有時間等它啟動)和gnome。
RAM(隨即存取存儲器)
是的,沒錯,完整的Linux安裝需要數兆位元組的RAM和32位帶有MMU的CPU。本項目擁有這一切。首先,讓我們訪問RAM。正如您所看到的,在電路中有一塊古董級的30引腳SIMM內存模塊。這些是基於80286的PC曾經使用的。它通過接口和ATmega連接,我寫代碼來訪問它並按照規格刷新它(SDRAM需要恆定速率刷新以避免丟失數據)。它到底有多快呢?刷新中斷每62ms發生一次,佔用時間1.5ms,因此佔用3%以下的CPU。訪問RAM,為了便於編程,一次訪問一個位元組。這樣產生的最大帶寬約為300KBps。
存 儲
對於RAM需要工作在休眠狀態,我們有兩件事要處理。存儲並不是太難解決的問題。使用SPI可以十分容易的與SD卡交互,我的項目中做到了這一點。一個1GB的SD卡可以工作的很好,雖然512MB就已經滿足這一特殊的文件系統(Ubuntu Jaunty)。ATmega擁有一個硬件SPI模塊,但無論出於何種原因,它工作的不是十分順暢,因此我將這個接口進行位拆裂。它仍然足夠塊——大約200KBps。這對項目來說還非常有意義——它能夠在有足夠管腳的任何微控制器上實現,而不用使用其他硬件模塊。
CPU(中央處理單元)
所有剩下的就是那個32位CPU和MMU需求。不過AVR沒有MMU,並且它是8位的。為了克服這一困難,我編寫了一款ARM仿真器。ARM是我最熟悉的架構,並且它足夠簡單,可以讓我很舒服的為它編寫出一個仿真器。為什麼要編寫一個,而不是移植一個呢?好吧,移植別人的代碼是沒有樂趣的,再加上我看到沒有將仿真器輕鬆移植到8位設備上的書面資料。原因之一:AVR編譯器堅持16位處理整數將會給你帶來麻煩,如簡單的「(1<<20)」,產生0。你需要用「1UL<<20」。不必要的說,困擾其他人的未知基本代碼尋遍所有的地方,整數都被假定並將會失敗,這將是一個災難。另外,我想用這個機會編寫一款很好的模塊化ARM仿真器。所以我付諸行動。
其他功能
電路板通過一個串行端口和真實世界進行通信。目前,它通過串行端口連接到我PC運行的minicom上,但是它可測的替代連接是連接到電路上的一個鍵盤和一個字符LCD,可以使其完全獨立。電路板上還有兩個LED。它們指示SD卡的訪問情況。一個代表讀操作,一個代表寫操作。電路板上還有一個按鈕。當按下並按住1秒時它將使串行端口脫離仿真的CPU的當前有效速度。AVR的主頻是24MHz(超過原有20MHz的輕微超頻)。
它的速度有多快?
uARM肯定沒有速率守護進程。它花了大約2個小時啟動到BASH提示符("init=/bin/bash"內核命令行)。然後用4個多小時啟動整個Ubuntu("exec init"然後登陸)。啟動X將消耗更長時間。有效的仿真CPU速度約為6.5KHz,這與你期望的在一個可憐的8位微控制器上仿真一個32位CPU和MMU是同等的水平。奇怪的是,一旦啟動,該系統是有些可用的。您可以輸入一個命令,並在一分鐘之內得到答覆。也就是說實際上你是可以使用它的。比如,今天我還用它來格式化我的SD卡。這絕對不是最快的,但我覺得它可能是最便宜、最慢、最簡單的手工組裝、最低的部件數量以及最低端的Linux PC。電路板是使用導線手工焊接的,甚至沒有使用印刷電路板(PCB)的必要。
仿真器的細節?
仿真器是相當模塊化的,允許它隨意擴展仿真其他SoC(片上系統)和硬件配置。仿真的CPU是ARMv5TE。前一段時間,我開始進行支持ARMv6的工作,但是一直沒有完成(從代碼中可以看出來),因為不是很需要。仿真的SoC是PXA255。由於模塊化的設計,你可以替換SoC.c文件,並使用相同的ARMv5TE核心編譯一個完整的新的SoC,或者替換核心,或者按照意願替換外設。這是有目的的,我的意思是這個代碼也是一個關於ARM SoC如何工作的相當整潔的範例。CPU仿真器自身的代碼並不是太整潔,那麼,好吧,它是一個CPU模擬器。這是幾年前花了超過6個月的空閑時間寫的,然後就放在一邊了。它最近復活是專門為了這個項目。仿真器實現了i-cache來提高速度。這給予了AVR很多幫助,使內部存儲器能夠以超過每秒5MB的速率訪問,而不像我的外部RAM。我還沒有抽出時間去實現d-cache(數據緩存),但是這已經在我的待辦事項列表上了。訪問塊設備沒有被仿真為SD設備。事實證明這太慢了。取而代之的是一個準虛擬化磁盤設備(pvdisk,參見pvDisk.tar.bz2,GPL許可證),我編寫的時候使用了一個無效的操作碼來調入仿真器並訪問磁盤。我的鏡像中的ramdisk(虛擬磁盤)加載這個pvdisk,然後改變根目錄到/dev/pvd1。
ramdisk被包含在了「rd.img」中。我使用的「機器類型」是PalmTE2。為什麼?因為我非常熟悉這款硬件,它是我見到的第一款PXA255機器類型。
Hypercall(超級調用)?
有一些服務你可以通過使用一個特殊的操作碼向仿真器發出請求。在ARM中它是0xF7BBBBBB,在Thumb中它是0xBBBB。挑選這些是由於它們所在的範圍ARM保證是未定義的。超級調用號碼通過寄存器R12被傳遞,參數通過寄存器R0-R3被傳遞,返回值被放置在R0中。
調用:
· 0 = 停止仿真
· 1 = 打印十進制數
· 2 = 打印字符
· 3 = 獲取RAM大小
· 4 = 塊設備操作(R0 = 操作,R1 = 扇區(sector)號)。請注意,這些不寫入仿真的RAM,它們使用另一個超級調用填充了仿真用戶訪問的仿真器內部緩衝區,一次一個字。我的意思是實現DMA,但是還沒有抽出時間去做。
操作:
· 0 = 獲取信息(如果扇區號是0,返回扇區的數量;如果扇區號是1,以位元組位單位返回扇區大小) · 1 = 扇區讀取 · 2 = 扇區寫入
· 5 = 塊設備緩衝區訪問(R0 = 值輸入/值輸出,R1 = 字數,R2 = 如果寫入為1,其他情況為0)
Thumb支持?
完全支持Thumb。我欺騙了一下,解碼每個Thumb指令字符串(instr)為等價的ARM指令字符串並執行,以此代替使用ARM仿真器函數。它不像它原來一樣快,但是它簡單並且代碼小巧。可以使用256KB的查找表,但是我感覺256KB對於微控制器的閃存來說太大了。一些Thumb指令不能被轉換為ARM指令,它們被正確處理代替。
我想要建立一個!
用於非商業目的,你肯定可以做到這一點。接線方式如下:
· RAM的DQ0-DQ7連接AVR的C0-C7;
· RAM的A0-A7連接AVR的A0-A7;
· RAM的A8-A11連接AVR的B0-B3;
· RAM的nRAM nRAS nCAS nWE連接AVR的D7 B4 B5;
· SD的DI SCK DO連接AVR的B6 B7 D6;
· LED的read write連接AVR的D2 D3(LED的其他管腳接地);
· 按鈕連接AVR的D4(其他管腳接地)。
RAM可以是任何30引腳的16MB的SIMM,可以運行在每64毫秒4000個周期的CAS-before-RAS刷新頻率下。我使用的(OWC)可以花幾塊錢在網上買到。原理圖顯示在這裡,點擊可以放大。
源代碼?
這個代碼有點兒亂,但是它可以工作(代碼國內無法下載)。要在PC上建立仿真器並進行嘗試輸入「make」。要運行使用「./uARM DISK_IMAGE」。要建立優化的PC版本使用「make BUILD=opt」。要建立AVR運行的版本使用「make BUILD=avr」。現在,它的編譯目標是ATmega1284P。要以ATmega644為編譯目標,除了要修改makefile,減少icache.h中的數字以便於i-cache足夠小來配合644內部的RAM。在歸檔文件中還包括用於1284p最終的hex文件。
啟動過程
要在AVR中保留代碼空間,幾乎沒有啟動代碼存在於仿真器中。事實上,「ROM」總共50位元組:8位元組用來選擇Thumb模式,一些Thumb代碼要讀取SD卡的第一個扇區並跳到Thumb模式(參看embeddedBoot.c)。SD卡的MBR有另一個bootloader(在Thumb模式下寫入)。這個bootloader看着MBR,找到活動分區並加載它的內容到RAM的末尾。然後,它跳到目的RAM地址+512(參看mbrBoot.c)。這裡運行着第三個,也是最大的bootloader,ELLE(參看ELLE.c)。這個bootloader重新定位了ramdisk,建立ATAGS,並調用內核。我提供了所有的二進制文件和源代碼以便於大家能夠按照意願製作您自己鏡像。啟動過程會讓人回憶起PC開機。:)包含的mkbooting.sh工具可以用來製作用於啟動分區的工作鏡像。