网络IO模型与Reactor模式
一、三种网络IO模型:
分类:
- BIO 同步的、阻塞式 IO
- NIO 同步的、非阻塞式 IO
- AIO 异步非阻塞式 IO
阻塞和同步的概念:
- 阻塞:若读写未完成,调用读写的线程一直等待
- 非阻塞:若读写未完成,调用读写的线程不用等待,可以处理其他工作
- 异步:读写过程完全托管给操作系统完成,操作系统完成后通知调用读写的线程
- 同步:读写过程由本线程完成,期间可以处理其他工作,但要轮询读写是否完毕
BIO 虽然可以使用线程池+等待队列进行优化,避免使用过多的线程,但是依然无法解决线程利用率低的问题。
数据通过通道 Channel 传输,往Channel中读写数据需要先经过缓冲区Buffer
NIO为每个客户端连接分配Channel和Buffer,并注册到多路复用器 Selector上,Selector通过轮询,找到有IO活动的连接进行处理,这种处理模式称为Reactor模式
若当前通道无可用数据,线程不会阻塞,而是可以处理其他通道的读写
这样 降低了线程的需求量,提高了线程的利用率 实现了IO 多路复用
IO 多路复用的定义:单个线程 管理多个IO流
二、Reactor模式
Reactor模式基本原理是
1)Reactor:Reactor 在一个单独的线程中运行,负责监听和分发多个客户端的事件,分发给适当的handler线程来对 IO 事件做出反应。
2)Handlers:处理线程 会执行处理方法来 响应 I/O 事件
Reactor 模式就是实现网络 IO 程序高并发特性的关键。
它又可以分为单 Reactor 单线程模式、单 Reactor 多线程模式、主从 Reactor 多线程模式。
这种模式的基本工作流程为:
1)Reactor 通过 select 监听客户端请求事件,收到事件之后通过 dispatch 进行分发
2)若事件是建立连接的请求,则由 Acceptor 通过 accept 处理连接请求,然后创建一个 Handler 对象处理连接建立后的后续业务。
3)若不是建立连接的请求,则分发给此连接对应的 Handler 处理。
4)Handler 会完成 read–>业务处理–>send 的完整处理流程。
简单来说就是:一个线程 处理多个连接的请求、分发、read,send、业务处理 操作
优点是:模型简单,没有多线程、进程通信、竞争的问题,一个线程完成所有的事件响应和业务处理。
缺点是:
1)存在性能问题,只有一个线程,无法完全发挥多核 CPU 的性能。Handler 在处理某个连接上的业务时,整个进程无法处理其他连接事件,很容易导致性能瓶颈。
2)存在可靠性问题,若线程意外终止,或者进入死循环,会导致整个系统通信模块不可用,不能接收和处理外部消息,造成节点故障。
使用场景为:客户端的数量有限,业务处理非常快速,比如 Redis // 在业务处理的时间复杂度为 O(1)的情况。
单 Reactor 多线程模式 使用了
一个Reactor主线程 处理 多个客户端的 监听 连接 分发 read和send
多个Worker线程 处理多个客户端的业务
这种模式的优点是可以充分的利用多核 CPU的处理能力,
缺点是多线程数据共享和控制比较复杂,Reactor 处理所有的事件的监听和响应,在单线程中运行,面对高并发场景还是容易出现性能瓶颈。
主从 Reactor 多线程模式 使用了
一个Reactor主线程 处理 多个客户端的监听,连接,分发
多个Reactor子线程处理多个客户端的 read和send
多个Worker线程 处理多个客户端的业务
MainReactor 只负责监听客户端连接请求,和客户端建立连接之后将连接交由 SubReactor 监听后面的 IO 事件。
这种模式的优点是:
1)MainReactor 线程与 SubReactor 线程职责明确,MainReactor 线程只需要接收新连接,SubReactor 线程完成后续的业务处理。
2)交互简单, MainReactor 线程只需要把新连接传给 SubReactor 线程,由SubReactor 返回数据给客户端
3)多个 SubReactor 线程能够应对更高的并发请求。
这种模式的缺点是编程复杂度较高。但是由于其优点明显,在许多项目中被广泛使用,包括 Nginx、Memcached、Netty 等。
这种模式也被叫做服务器的 1+M+N 线程模式,即使用该模式开发的服务器包含一个(或多个,1 只是表示相对较少)连接建立线程+M 个 IO 线程+N 个业务处理线程。这是业界成熟的服务器程序设计模式。