java并发系列——底层CPU

java并发有诸多难点,实际上并非java语言本身的问题,本质上说一部分是因为并发操作本身的问题,另外一部分是因为计算机体系结构带来的。为了更好地理解java并发过程中的问题,我们应该对CPU有一些基础的认知。

CPU

在信息时代,CPU是我们耳熟能详的一个概念,大家都知道CPU就是计算机的大脑。计算机中一连串复杂的指令都是由它负责执行的,而这些指令通常就是我们称之为程序的东西。那么CPU到底是什么呢?CPU即中央处理器,它是计算机中控制数据操控的电路。主要由三部分组成:算术/逻辑单元、控制单元、寄存器单元。

控制单元是整个CPU的指挥控制中心,它的主要职责就是协调机器活动,通过向其他两个单元发送控制指令来达到控制效果。算数/逻辑单元主要的职责是负责执行运算,包括算术和逻辑运算,它估计控制单元发送过来的指令执行相应的运算操作。寄存器单元主要的作用是用来临时保存数据,它保存着待处理的或者已经处理的数据,它的出现是为了减少CPU对内存的访问次数,提升读取数据的性能,从而提升CPU的整体工作效率。

cpu与内存的协作

CPU中的寄存器分为通用寄存器和专用寄存器,通用寄存器用于临时存放CPU正在使用的数据,而专用寄存器用于CPU专有用途,比如指令寄存器和程序计数器。CPU与主存通过总线进行通信,CPU通过控制单元能够操作主存中的数据。

-执行两个数值相加的大致过程为:从主存读取第一个操作数放到寄存器A->从主存读取第二个操作数放到寄存器B->两个寄存器保存的值作为输入送入到加法电路->将加法结果保存到寄存器C->控制单元将结果放入主存中。

程序等于数据

原始的计算机并不像现代计算机一样将程序保存起来,以前的人们只对数据进行保存,而设备执行的步骤作为计算机的一部分而被内置在控制单元中。这样就很不灵活,最多通过重新布线来提升灵活性。将程序和数据视作相同本质是很大的计算机思维的突破,因为人们一直认为它们是不同的事物,数据应该存放在主存中而程序应该属于CPU的一部分。

将程序作为数据一样保存在主存中大有好处,控制单元能够从主存读取程序,然后对它们解码并执行。当我们要修改执行程序时可以在计算机的主存中修改,而不必对CPU更改或者重新布线。

指令系统

程序包含了大量的机器指令,CPU对这些指令进行解码并执行。CPU分为两类体系:精简指令集计算机(RISC)和复杂指令级计算机(CISC)。RISC提供了最小的机器指令集,计算机效率高速度快且制造成本低。而CISC提供了强大丰富的指令集,能更方便实现复杂的软件。

机器指令分为三类:数据传输类、算术/逻辑类、控制类。

数据传输类指令用于将数据从一个地方移动到另一个地方。比如将主存单元的内容加载到寄存器的LOAD指令,反之将寄存器的内容保存到主存的STORE指令。此外,CPU与其他设备(键盘、鼠标、打印机、显示器、磁盘等)进行通信的指令被称为I/O指令。

算术/逻辑类指令用于让控制单元请求在算术/逻辑单元内执行运算。这些运算包括算术、与、或、异或和位移等。

控制类指令用于指导程序执行。比如转移(JUMP)指令,它包括无条件转移和条件转移。

指令寄存器与程序计数器

CPU将主存的指令加载进来解码并执行,其中涉及到两个重要的寄存器:指令寄存器和程序计数器。指令寄存器用于存储正在执行的指令,而程序计数器则保持下一个待执行的指令地址。

CPU向主存请求加载程序计数器指定的地址的指令,将其存放到指令寄存器中,加载后将程序计数器的值加2(加入指令长度为2个字节)。

指令如何执行

比如我们要计算11+22,假设过程为:将主存地址为00的内容加载到寄存器A中->将主存地址为01的内容加载到寄存器B中->将寄存器A和寄存器B的数据相加并将结果保存到寄存器C->将寄存器C的结果保存到主存地址为02的位置->end。

这个过程CPU涉及到四个操作:加载(LOAD)、存储(STORE)、加法(ADD)和停止(HALT)。可以对这些操作进行编码,比如可以分别用1、2、3、0000表示。

控制器

CPU与其他设备的通信一般通过控制器来实现,控制器可能在主板上,也可能以电路板形式插到主板。控制器本身可以看成是小型计算机,也有自己简单的CPU。以前每连接一种外设都需要购买相应的控制器,而现在随着通用串行总线(USB)称为通用的标准,很多外设都可以直接用USB控制器作为通信接口。每个控制器都连接在总线上,通过总线进行通信。

每个控制器可能被设计成对应一组地址引用,主存则会忽略这些地址引用。当CPU往这些地址发送消息时,其实是直接穿过主存而到控制器的,操作的是控制器而非主存。这种模式称为存储映射输入/输出。此外,这种模式的另一种实现可以在机器指令中提供特定的操作码,专门用于与控制器通信,这样的操作码称为I/O指令。

直接存储器存取

直接存储器存取(DMA)是一种提升外设通信性能的措施,CPU并非总是需要使用总线,在总线空闲的时间里控制器能够充分利用起来。因为控制器都与总线相连接,而控制器又有执行指令的能力,所以可以将CPU的一些工作分给控制器来完成。比如在磁盘中检索数据时,CPU可以将告知控制器,然后由控制器找到数据并放到主存上,期间CPU可以去执行其他任务。这样可以节省CPU资源。不过DMA会使得总线通信过于复杂,而且会导致总线竞争问题。总线瓶颈源自冯.诺伊曼体系结构。