【计算机组成原理】第2章计算机系统的硬件结构

2021 年 10 月 2 日
筆記
计算机组成原理

系统总线

总线的基本概念

❔ 为什么要用总线

早期计算机外部设备少时大多采原分散连接方式，不易实现随时增减外部设备。为了更好地解决I/O设备和主机之间连接的灵活性问题，计算机的结构从分散连接发展为总线连接。

🔔 知识点：

1️⃣ 总线是连接多个部件的信息传输线，是各部件共享的传输介质。

2️⃣ 在某一时刻，只允许有一个部件向总线发送信息，而多个部件可以同时从总线上接收相同的信息。如果系统中有多个部件，那它们只能分时地向总线发送信息

总线的分类

总线的特性及性能指标

总线特性

1️⃣ 机械特性：总线在机械连接方式上的一些特性（尺寸、形状、引脚个数、排列顺序……）

2️⃣ 电气特性：总线的每一根传输线上信号的传递方向和有效的电平范围

3️⃣ 功能特性：总线中每根传输线的功能（地址、数据、控制信号）

4️⃣ 时间特性：信号与时序的关系

总线的性能指标

1️⃣ 总线宽度：数据线的根数（bit）

2️⃣ 总线带宽：每秒传输最大字节数(MBps)=总线工作频率×总线宽度(bit/s）=总线工作频率×(总线宽度/8)（B/s）= 总线宽度/总线周期(bit/s） = (总线宽度/8)/总线周期（B/s）

3️⃣ 时钟同步/异步：总线上数据与时钟是否同步

4️⃣ 总线复用：地址线与数据线复用并在线路上分时传输地址信号和数据信号，可提高总线利用率

5️⃣ 信号线数：地址总线、数据总线、控制总线的总和

6️⃣ 总线控制方式：突发工作、自动配置、仲裁、逻辑、计数

7️⃣ 其他指标：负载能力、电源电压……

8️⃣ 总线周期：一次总线操作所需的时间(包括申请阶段、寻址阶段、传输阶段和结束阶段），通常由若干个总线时钟周期构成。

9️⃣ 总线的工作频率：总线上各种操作的频率，为总线周期的倒数。若总线周期=N个时钟周期，则总线的工作频率=时钟频率/N。实际上指一秒内传送几次数据。

1️⃣0️⃣ 总线的时钟周期：即机器的时钟周期。计算机有一个统一的时钟，以控制整个计算机的各个部件，总线也要受此时钟的控制。

1️⃣1️⃣ 总线的时钟频率：即机器的时钟频率，为时钟周期的倒数。若时钟周期为T，则时钟频率为1/T。实际上指一秒内有多少个时钟周期。

🔔 注意：
1️⃣ 总线带宽是指总线本身所能达到的最高传输速率。
2️⃣ 在计算实际的有效数据传输率时，要用实际传输的数据量除以耗时。

总线标准

总线结构

单总线结构

双总线结构

三总线结构

总线控制

总线判优控制

主设备：获得总线控制权的设备。
从设备：被主设备访问的设备，只能响应从主设备发来的各种总线命令。

🌈 链式查询

🌈 计数器定时查询

🌈 独立请求方式

总线通信控制

1️⃣ 目的：解决通信双方 协调配合问题

2️⃣ 总线传输周期

🌈 总线通信的四种方式

🌈 同步通信方式

🌈 异步通信方式

1️⃣ 分类

2️⃣ 优缺点

3️⃣ 数据传输率

🌈 半同步通信方式

🌈 分离式通信

存储器

存储器分类

存储器的层次结构

存储器三个主要特性的关系

缓存——主存层次和主存——辅存层次

1️⃣ 缓存——主存层次主要解决CPU和主存速度不匹配的问题

2️⃣ 主存——辅存主要解决存储系统的容量问题

3️⃣ 主存——辅存层次发展形成虚拟存储系统。

主存储器

概述

主存的基本组成

主存和CPU的联系

1️⃣ 驱动器、译码器和读写电路在存储芯片中

2️⃣ MAR和MDR在CPU芯片中

3️⃣ 存储芯片和CPU芯片可通过总线连接

主存中存储单元地址的分配

主存的技术指标

1️⃣ 存储容量：主存存放二进制代码的总位数，存储容量（位）=存储单元个数*存储字长，存储容量（字节）=存储单元个数*存储字长 / 8

2️⃣ 存储速度

存取时间：存储器的访问时间=读出时间+写入时间
存取周期：连续两次独立的存储器操作（读或写）所需的最小间隔时间

3️⃣ 存储器的带宽：单位时间内存储器存取的信息量，每个存储周期可以访问的位（字节）数 / 存储周期

提高存储器带宽的措施

缩短存储周期
增加存储字长
增加存储体

半导体存储芯片简介

半导体存储芯片的基本结构

1️⃣ 地址线：单向输入，位数与存储字的个数有关

2️⃣ 数据线：双向的，位数与读/写的数据位数有关

3️⃣ 控制线

读/写控制线：决定芯片进行读/写操作
片选线：选择存储芯片

半导体存储芯片的译码驱动方式

🌈 线选法

1️⃣ 特点：一根字选择线（字线），直接选中一个存储单元的各位

2️⃣ 结构简单，只适于容量不大的存储芯片

🌈 重合法

1️⃣ 特点：被选单元是由X、Y两个方向的地址决定的

2️⃣ 适合容量较大的存储芯片

随机存取存储器 ( RAM )

静态 RAM (SRAM)

基本电路

动态 RAM ( DRAM )

基本电路

动态 RAM 刷新

1️⃣ 多久需要刷新一次：刷新周期一般为 2 ms

2️⃣ 每次刷新多少存储单元：以行为单位，每次刷新一行存储单元
————为什么要使用行列地址：减少选通线的数量

3️⃣ 如何刷新：有硬件支持，读出一行的信息后重新写入，占用1个读/写周期

4️⃣ 在什么时候刷新：

动态 RAM 和静态 RAM 的比较

只读存储器（ROM）

存储器与 CPU 的连接

存储器容量的扩展

位扩展（增加存储字长）

片选线相同，分配数据线

字扩展（增加存储字的数量）

数据线相同，设置片选线

字、位同时扩展

数据线和片选线都要重新考虑

例题以及解题步骤

🔔 系统程序区用ROM，用户程序区用RAM

1️⃣ 写出对应的二进制地址码

:two：确定芯片的数量及类型

由题目知 CPU 数据线8根，则存储器位数应扩展为8位。再根据题目所给的存储芯片

系统程序区选择一片 2 K * 8 位的存储芯片

用户程序区选择两片 1 K * 4 位的存储芯片

3️⃣ 分配地址线

4️⃣ 确定片选信号

RAM 是位拓展，共享片选线，分配数据线

而 ROM 和 RAM 需要考虑片选线的设置

译码器的 Y4 端可以作为 ROM 的片选线端口

译码器的 Y5 端和 RAM 的 A10 地址线可以联合作为 RAM 的片选控制

🔔 有一个默认的原则：不要有任何地址线空着不用！！！

5️⃣ 连接图

6️⃣ 注意的细节

ROM 要接地

与门都取了非，也就是说输入的数据都为 0 时，输出为 1

RAM 的地址线分配，RAM 要连接读写控制线 WR

使能端只有输入信号为 G1 G2A G2B： 1 0 0 时才工作

真题

该题与上一个题的区别就是 RAM 是字拓展而不是位拓展，所以数据线相同，片选线要配置，用 A12 作为划分

存储器的校验

海明码

🔔 默认是偶校验，如果题目要求是奇校验，那不论是求海明码还是纠错，每个运算最后都要多异或一个 1 。

提高访存速度的措施

采用高速器件
采用层次结构 Cache – 主存
调整主存结构

单体多字系统

普通存储器：每行为一个存储单元

🌈 单体多字存储器

每个存储单元存储 m 个字，每个字 w 位，总线宽度为 m 个字。一个存取周期内可以读出 m 个字，也就是 m * w 位的指令或数据，使主存带宽提高到 m 倍

🔔 缺点：指令和数据在主存内必须是连续存放的，一旦遇到转移指令，或者操作数不能连续存放，这种方法的效果就不明显

多体并行系统

高位交叉（顺序存储）
- 存储体的存储单元通过地址的高位进行分组，高位地址相同的存储单元属于同一个存储体
- CPU 有较大概率需要连续访问同一个存储体，效率较低
低位交叉（交叉存储）
- 存储体的存储单元通过地址的低位进行分组，低位地址相同的存储单元属于同一个存储体
- CPU 可以较大概率同时访问多个存储体，效率高，属于流水线方式
- 可以在不改变每个模块存取周期的前提下，提高存储器的带宽
- 可以并行工作，如总线宽度为 mw 时，可以同时取出长度为 mw 的数据。等同于高位交叉存储方式的 m 个存储体并行工作

流水线的概念

例题

设有 4 个模块组成的四体存储器结构，每个体的存储字长为 32 位，存储周期为 200 ns。假设数据总线宽度为 32 位，总线传输周期为 50 ns，试求顺序存储和交叉存储的存储器带宽。

解：顺序存储和交叉存储连续读出 4 个字的信息量是 32 * 4 = 128 位。

顺序存储器连续读出 4 个字的时间是 200 ns * 4 = 800 ns

交叉存储其连续读出 4 个字的时间是 200 ns + 50 ns * (4 – 1) = 350 ns

顺序存储器的带宽是 128 b / 800 ns = 16 * 10 ^ 7 bps

交叉存储器的带宽是 128 b / 350 ns = 37 * 10 ^ 7 bps

高速缓冲存储器

概述

局部性原理

CPU 和主存（DRAM）的速度存在差异，为了避免 CPU 可能存在的“空等”现象

性能分析

1️⃣ 命中：
1.主存块调入缓存
2.主存块与缓存块建立了对应关系
3.用标记记录与某缓存块建立了对应关系的主存块号

2️⃣ 未命中：
1.主存块未调入缓存
2.主存块与缓存块未建立对应关系

3️⃣ Cache 的命中率：
1.CPU 欲访问的信息在 Cache 中的比率
2.命中率与 Cache 的容量与块长有关

4️⃣ 主存系统的效率
1.效率 e 与命中率有关

🌈 例题

Cache 的基本结构

Cache 的读写操作

🌈 读

🌈 写

Cache 的改进

1️⃣ 单一缓存和二级缓存

2️⃣ 统一缓存和分立缓存

Cache – 主存的地址映射

直接映射

1️⃣ 每个缓存块 i 可以和若干个主存块对应
2️⃣ 每个主存块 j 只能和一个缓存块对应
3️⃣ i = j mod C （C 是 Cache 块总数）

全相联映射

主存中的任一块可以映射到缓存中的任一块

组相联映射

某一主存块 j 按模 Q 映射到缓存的第 i 组中的任一块

🔔 n 路组相联：Cache n 个块为一组，即 Q = n

1️⃣ 当 n = 1 时，Cache 分成 1 组，相当于全相联映射

2️⃣ 当 n = Cache 块行数时，Cache 的每个块都是一组。相当于直接映射

三种映射方式的总结

替换算法

例题一

🌈 FIFO：每个组内，就是一个小的队列，组内整体向上移动一个单位，新元素放下面，弹出最上面的元素

🌈 LRU：每个组中，最不常用的放最上，刚刚用到的（命中）的放最下；遇到新的元素且组满，则组内整体向上移动一个单位，新元素放最下，弹出最上面的元素

例题二

Tags: 计算机组成原理

Previous post

国庆节拒绝上班被开除！法院判了：员工拿到万元赔偿

Next post

史诗级合作！支付宝向银联云闪付：首次支持扫码互认