Keepalived服务详解

2020 年 9 月 23 日
筆記
linux

1. VRRP协议

1.1 VRRP协议概述

VRRP协议的出现是为了解决静态路由的单点故障，它是通过一种竞选机制来将路由任务交给某个vrrp路由器的
在VRRP物理结构中，有多个物理的VRRP路由器，其中有一台称为“master”（主节点路由器），其他的都是“backup”（备节点路由器）
- master和backup的身份，是通过他妈的优先级来定义竞选的
在VRRP虚拟结构中，虚拟路由都是通过“MAC+VRID”的形式来标识的，如“00-00-5E-00-01-{VRID}”
- 只有master节点才会发送VRRP广告包（vrrp advertisement message）
- 当master节点宕掉的时候，backup中优先级最高的VRRP设备会抢占并升级为master

1.2 VRRP的术语

虚拟路由器
- 由一个Master路由器和多个Backup路由器组成，主机将虚拟路由器当做默认网关（将Master和Backup看做一个整体）
VRID
- 虚拟路由器的标识，有相同的VRID的一组路由器构成一个虚拟路由器
Master路由器
- 虚拟路由器中承担报文转发任务的路由器
Backup路由器
- 虚拟路由器中备份节点路由器
虚拟IP地址
- 虚拟路由器的IP地址，一个虚拟路由器可以拥有一个或多个IP地址
VIP
- IP地址拥有者，接口IP地址与虚拟IP地址相同的路由器被称为IP地址拥有者
VMAC
- 虚拟MAC地址，一个虚拟路由器拥有一个虚拟MAC地址，通常情况下，虚拟路由器回应ARP请求使用的是虚拟MAC地址
优先级
- VRRP根据优先级来确定虚拟路由器中每台路由器的地位
非抢占式
- 如果backup路由器工作在此模式下，则若Master路由器没有出现故障，backup即使随后被配置了更高的优先级也不会成为Master
抢占式
- 如果backup路由器工作在抢占方式下，当它收到VRRP报文后，会将主机的优先级与通告报文中的优先级进行比较，
- 如果主机的优先级比当前的Master路由器的优先级高，就会主动抢占成为Master路由器，否则，将保持Backup状态

1.3 VRRP的工作过程

虚拟路由器中的路由器根据优先级选举出Master
- Master路由器通过发送免费ARP报文，将主机的虚拟MAC地址通知给它连接的设备或者主机，从而承担报文转发任务
Master路由器周期性发送VRRP报文，以公布其配置信息（优先级等）和工作状况
如果Master路由器出现故障，虚拟路由器中的Backup路由器将根据优先级重新选举出新的Master
虚拟路由器状态切换时，Master路由器由一台设备切换为另一台设备
- 新的Master路由器发送一个携带虚拟路由器的MAC地址和虚拟IP地址信息的免费ARP报文，以更新与它连接的主机中的ARP相关的信息
- 网路中的主机感知不到Master路由器已经切换为另外一台设备
Backup路由器的优先级高于Master路由器时，由Backup路由器的工作方式（抢占方式和非抢占方式）决定是否重新选举Master
为了保证Master路由器和Backup路由器能够协调工作，VRRP需要实现以下功能
- Master路由器的选举
- Master路由器状态的通告
- 为了提高安全性，VRRP还提供了认证功能

1.4 Master路由器的选举

VRRP根据优先级来确定虚拟路由器中每台路由器的角色（Master路由器或Backup路由器），优先级越高，则越有可能成为Master路由器
初始创建的路由器在Backup状态，通过VRRP报文获知虚拟路由器中其他成员的优先级
- 如果VRRP报文中Master路由器的优先级高于自己的优先级，则路由器保持在Backup状态
- 如果VRRP报文中Master路由器的优先级低于自己的优先级
  - 采用抢占工作方式的路由器将抢占成为Master状态，周期性的发送VRRP报文
  - 采用非抢占式工作方式的路由器仍保持Backup状态
- 如果在一定时间内没有收到VRRP报文，则路由器切换为Master状态
VRRP优先级的取值范围为0到255（数值越大优先级越高），可配置的范围是1到254
- 优先级0为系统保留给路由器放弃Master位置时候使用，255则是系统保留给IP地址拥有者使用
- 当路由器为IP地址拥有者时，其优先级始终为255，因此当虚拟路由器内存在IP地址拥有者时，只要其工作正常，则为Master路由器

1.5 Master路由器状态的通告

Master路由器周期性发送VRRP报文，在虚拟路由器中公布其配置信息（优先级等）和工作状况
- Backup路由器通过接收到VRRP报文的情况来判断Master路由器是否工作正常
Master路由器主动放弃Master地位（如Master路由器退出虚拟路由器）时
- 会发送优先级为0的VRRP报文，致使Backup路由器快速切换变成Master路由器，这个切换时间称为Skew time
- 计算方式为（256-Backup路由器的优先级）/256，单位为秒
当Master路由器因故障不能发送VRRP报文时，Backup路由器并不能立即知道其工作状况
- Backup路由器等待一段时间后，如果还没接收到VRRP报文，那么会认为Master路由器无法正常工作，而把自己升级为Master路由器，周期性发送VRRP报文，如果此时多个Backup路由器竞争Master路由器的位置，将通过优先级来选举Master路由器，Backup路由器默认等待的时间称为Master_Down_Interval，取值为:(3*VRRP报文的发送时间间隔)+Skewtime，单位为秒
说明
- 在性能不够稳定的网络中，Backup路由器可能因为网络堵塞而在Master_Down_Interval期间没有收到Master路由器的报文而主动抢占为Master位置，如果此时原Master路由器的报文又到达了，就会出现虚拟路由器的成员频繁的进行Master抢占现象，为了缓解这种现象的发生，特制定了延迟等待定时器，它可以使得Backup路由器在等待了Master_Down_Interval后，再等待延迟等待时间，如在此期间仍然没有收到VRRP报文，此时Backup路由器才会切换为Master路由器，对外发送VRRP报文

1.6 认证方式

1）无认证

不进行任何VRRP报文的合法性认证，不提供安全性保障

2）简单字符认证

在一个有可能受到安全威胁的网络中，可以将认证方式设置为简单字符认证（一般就采用这种认证）
发送VRRP报文的路由器将认证字填入到报文中，而收到VRRP报文的路由器会将收到的VRRP报文中的认证字和本地配置的认证字进行比较，如果认证字相同，则认为接受到的报文是合法的VRRP报文，否则认为接收到的报文是一个非法报文

3）MD5认证

在一个非常不安全的网络中，可以将认证方式设置为MD5认证
发送VRRP报文的路由器利用认证字和MD5算法对VRRP报文进行加密，加密后的报文保存在Authentication Header（认证头）中，收到VRRP报文的路由器会利用认证字解密报文，检查该报文的合法性

2. keepalived

2.1 keepalived概述

1）keepalived的功能

对后端RealServer进行健康状况检查，支持4层、5层和7层协议进行健康检查
对负载均衡器进行高可用，防止Director单点故障

2）keepalived的运作

通过VRRP（Virtual Router Redundancy Protocol）虚拟路由冗余协议来实现故障转移。
keepalived正常工作时，主节点（master）会不断的发送心跳信息给备节点（backup）
- 当备节点在一定时间内没有收到主节点的心跳信息时，备节点会认为主节点宕了，就会接管主节点上的资源，并继续向外提供服务保证其可用性
- 当主节点恢复时，备节点会自动让出资源并再次自动成为备节点

3）keepalived监控LVS

使用keepalived监控、高可用LVS集群时（keepalived+lvs），并不需要在Director上使用ipvsadm额外配置ipvs规则。
因为keepalived中集合了管理ipvs规则的组件（ipvs wrapper），可以直接在keepalived的配置文件中配置ipvs相关规则，在解析配置文件时会通过特定的组件将规则发送给到内核中的ipvs模块。

2.2 keepalived软件结构

1）VRRP协议

vrrp协议在Linux主机上以守护进程方式的实现，原生设计目的是为了高可用ipvs服务
能够根据配置文件生成ipvs规则，并对各RS的健康做检测
- vrrp_script
- vrrp_track
基于vrrp协议完成地址滚动
为vip地址所在的节点生成ipvs规则（在配置文件中预先定义）
基于脚本调用接口通过执行脚本完成脚本中定义的功能，进而影响集群事务

2）keepalived的组件

keepalived服务启动时，将产生三个相关进程，一个父进程和两个子进程
- 主进程：Watchdog看门狗主进程
- 子进程1：VRRP Child
- 子进程2：Healthchecking Child
两个子进程都会开启本地套接字Unix Domain Socket
- 当keepalived服务启动后，父进程会通过unix domain socket每隔5秒发送一个hello消息给子进程
- 如果父进程无法发送消息给子进程，将认为子进程出现问题，于是会重启子进程

核心组件
- Watchdog
  - 看门狗，负责fork和监控子进程，对Checkers和vrrp stack进行监控
- Checkers
  - 负责RealServer的健康状况检查，并在LVS的拓扑中移除、添加RealServer
  - 它支持layer4/5/7层的协议检查，该组件使用独立的子进程负责，但被父进程监控
- VRRP Stack
  - 提供Director的故障转移功能从而实现Director的高可用
  - 该组件可独立提供功能，无需LVS的支持，该组件使用独立的子进程负责，但被父进程监控
- System Call
  - 提供读取自定义脚本的功能，该组件在使用时，将临时产生一个子进程来执行任务
- IPVS wrapper
  - 负责将配置文件中的IPVS相关规则发送到内核的ipvs模块
- Netlink Reflector
  - 用来设定、监控vrrp的ip地址
IO复用器
内存管理
配置文件分析器

3）工作模型

主备：单虚拟路由器
主主：主/备（虚拟路由器1）+ 备/主（虚拟路由器2）

3. keepalived的配置和使用

3.1 使用前的配置

各节点时间要同步
确保iptables和selinux不会成为阻碍
确保各节点的用于集群服务的接口支持MULTICAST通信
- 开启网卡的多播功能：ip link set multicast on dev ens33
- D类地址：224-239（多播地址的范围）
各节点之间可通过主机名互相通信（可选）
- 节点的名称设定与hosts文件中解析的主机名都要保持一致
- uname -n 获得的主机，与解析的主机名要相同
各节点之间基于密钥认证的方式通过ssh互相通信（可选）

3.2 程序环境

主程序文件
- /usr/sbin/keepalived
Unit file
- /usr/lib/systemd/system/keepalived.service
- Unix file 的配置文件：/etc/sysconfig/keepalived
配置文件
- /etc/keepalived/keepalived.conf

3.3 配置文件概述

# 全局配置（全局配置有Global definitions和Static routes/address，全局定义和静态路由）
# GLOBAL CONFIGURATION： 
     global_defs                 # Block id
         {
            ...
         }
        
# 配置vrrp实例（VRRP实例和VRRP同步组）
# VRRPD CONFIGURATION：
     vrrp instance               # 虚拟路由器，VRRP实例
         vrrp_instance  NAME {
              ...
         }
     vrrp synchronization group  # VRRP同步组
         vrrp_sync_group  NAME  {
              ...
         }
# ipvs的相关配置
# LVS CONFIGURATION：
      # 集群服务，服务内的RS
      Virtual server groups 
      Virtual server               #ipvs集群的vs和rs

如果多个实例同进同退，那么就要把他们配置成一个同步组（高可用LVS的NAT模式时）
- 如下图所示，当vip1在网卡1上时，vip2必须要在网卡2上，所以vip1和vip2必须同进同退
- vip1在哪个节点上，vip2就应该在哪个节点上

3.4 配置文件详解

1）全局配置

### 全局配置 ###
global_defs {              # 全局部分定义邮件报警系统，可以不用定义
    notification_email {   # 定义邮件发送目标，收件人邮箱地址                
        [email protected]
        [email protected]
    } 
    notification_email_from  [email protected] # 定义发件人邮箱地址
    smtp_server 192.168.200.1    # 定义邮件发送服务器IP，本地发送写localhost
    smtp_connect_timeout 30      # 定义邮件服务器建立连接的超时时长
    router_id c7_node_03         # 标识keepalived服务器的字符串，物理节点的标识符；建议使用主机名

    vrrp_skip_check_adv_addr     # 如果通告与接收的上一个通告来自相同的master路由器，则不执行检查
    ！vrrp_strict                # 严格遵守VRRP协议，这一项最好关闭（加感叹号），若不关闭，可用vip无法被ping通
    vrrp_garp_interval 0.001     # 在一个接口发送的两个免费ARP之间的延迟，可以精确到毫秒级（默认是0）
    vrrp_mcast_group4 225.0.0.18 # IPV4多播地址，默认224.0.0.18，要改一改
    # 可以在多播地址上抓包来看vrrp报文：tcpdump -i ens33 -nn host 224.0.0.18
}

2）vrrp实例配置

### VRRP实例配置 ###
vrrp_instance NAME {
    state MASTER          # 定义实例的角色状态是master还是backup，在当前VRRP实例中此节点的初始状态
    interface eth0        # 定义vrrp绑定的接口，即接收或发送心跳通告的接口，即HA监测接口
    virtual_router_id 51  # 虚拟路由标识(VRID)，同一实例该数值必须相同，即master和backup中该值要相同
                               # 同一网卡上的不同vrrp实例，该值一定不能相同，取值范围为0-255，默认为51
    priority 100          # 该vrrp实例中本机的keepalived的优先级，优先级最高的为master（可用范围0-255）
                               # 该选项的优先级高于state选项，
                               # 即若state指定的是backup，但这里设置的值最高，则仍为master
    advert_int 1          # 心跳信息发送和接收时间间隔，单位为秒

    authentication {      # 认证方式，同一实例中这个配置必须完全一样才可通过认证，只建议使用PASS认证
        auth_type PASS         # 使用简单字符认证的方式
        auth_pass 1111         # 最多支持8字符，超过8字符将只取前8字符
    }

    virtual_ipaddress {   # 设置的VIP，当master出现故障后，VIP会故障转移到backup
                               # 这些vip默认配置在interface指定的接口别名上，可使用dev选项来指定配置接口
                               # 使用ip add的方式添加，若要被ifconfig查看，在IP地址后加上label即可
       192.168.200.16 label eth0:1
       192.168.200.17
       192.168.200.19/24 dev eth1
       # 格式：<IPADDR>/<MASK> brd <IPADDR> dev <STRING> scope <SCOPE> label <LABEL>
    }

    # 使用非抢占模式
    nopreempt   
         
    # 使用延迟抢占模式
    preempt_delay  TIME     
}

3）定义通知脚本

定义格式：可以通过notify参数来实现master和backup的切换，且可以附加执行通知脚本

vrrp_instance {
    ...
    notify_master  <STRING>|<QUOTED-STRING>  # 当切换到master模式时，执行此脚本
    notify_backup  <STRING>|<QUOTED-STRING>  # 当切换到backup模式时，执行此脚本
    notify_fault  <STRING>|<QUOTED-STRING>   # 当切换到fault模式时，执行此脚本
    notify  <STRING>|<QUOTED-STRING>
}

定义示例

vrrp_instance {
    ...
    notify_master "/etc/keepalived/notify.sh master"
    notify_backup "/etc/keepalived/notify.sh backup"
    notify_fault "/etc/keepalived/notify.sh fault"
}

脚本示例

#!/bin/bash
# Author: hgzerowzh
# Description: An notify script
#
contact='root@localhost'

notify() {
        mailsubject="$(hostname) to be $1: vip floating"
        mailbody="$(date +'%F %H:%M:%S'): vrrp transition, $(hostname) changed to be $1"
        echo $mailbody | mail -s "$mailsubject" $contact
}

case $1 in
    master)
    notify master
    exit 0
    ;;
    backup)
    notify backup
    exit 0
    ;;
    fault)
    notify fault
    exit 0
    ;;
    *)
    echo "Usage: $(basename $0) {master|backup|fault}"
    exit 1
    ;;
esac

3.5 双主配置示例

1）配置图示

2）配置示例

### node1:###
    vrrp_instance VI_1 {
            state MASTER
            interface eno16777736
            virtual_router_id 101
            priority 100
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass ZPNnTQ6F
            }
            virtual_ipaddress {
                    172.16.100.9/16
            }
    }
    vrrp_instance VI_2 {
            state BACKUP
            interface eno16777736
            virtual_router_id 102
            priority 99
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass IWyijM5Q
            }
            virtual_ipaddress {
                    172.16.100.10/16
            }
    }                                
            
### node2:###
    vrrp_instance VI_1 {
            state BACKUP
            interface eno16777736
            virtual_router_id 101
            priority 99
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass ZPNnTQ6F
            }
            virtual_ipaddress {
                    172.16.100.9/16
            }
    }
    vrrp_instance VI_2 {
            state MASTER
            interface eno16777736
            virtual_router_id 102
            priority 100
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass IWyijM5Q
            }
            virtual_ipaddress {
                    172.16.100.10/16
            }
    }

4. keepalived中配置ipvs

4.1 ipvs配置语法格式

1）定义Virtual Server

virutal_server  vip  port  {  # 虚拟服务地址和端口，使用空格分隔，其中地址为VIP
       ...
}

virtual_server fwmark int  {  # 可以使用防火墙标记来定义
        ...
}
        
### 常用的参数 ###
    delay_loop  <INT>                       # 对后端主机做检测，每隔多长时间发一次请求
    lb_algo   rr|wrr|lc|wlc|lblc|sh|dh      # 调度算法
    lb_kind   NAT|DR|TUN                    # 集群类型
    persistence_timeout  <INT>              # 持久连接时长
    protocol TCP                            # 1.3.0版本之前只支持TCP
    sorry_server  <IPADDR>  <PORT>          # 当所有的RS都挂掉，则使用这里定义的主机提供服务

2）定义Real Server & 健康状态检测

real_server <IPADDR> <PORT>  {
    ### 常用的参数 ###
    weight <INT>                          # 权重
    notify_up  <STRING>|<QUOTED-STRING>   # 上线脚本
    notify_down  <STRING>|<QUOTED-STRING> # 下线脚本
    ...

    ### 健康状态检测机制（web应用层检测）
    HTTP_GET|SSL_GET
    {
         # 检测参数
         url  {     
                 path  <STRING>        # 对哪个url做检测，使用path指明url
                 status_code <INT>     # 要获得什么响应码才算正确
                 digest <STRING>       # 获取内容的校验码跟所期望的一样 
         }
         nb_get_retry <INT>            # get请求的重试次数
         delay_before_retry <INT>      # 两次重试之间的时间间隔
         connect_timeout <INTEGER>     # 连接超时时长，默认为5s
         warmup <INT>                  # 健康状态检测延迟
    }
    
    ### 传输层健康状态检测（tcp协议层）
    TCP_CHECK
    {
         # 检测参数
         connect_timeout  <INTEGER>    # 每次发起连接时的超时时间
         
         nb_get_retry <INT>            # get请求的重试次数
         delay_before_retry <INT>      # 两次重试之间的时间间隔
         connect_timeout <INTEGER>     # 连接超时时长，默认为5s
         warmup <INT>                  # 健康状态检测延迟
         
         # 其它参数
         connect_ip <IP ADDRESS>       # 向哪个地址的哪个端口做检测
         connect_port <PORT>
         bindto <IP ADDRESS>           # 自己使用固定的地址当源地址发请求
         bind_port <PORT>
    }
}

4.2 keepalived + LVS（NAT）

1）主节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_03
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.18
}

vrrp_instance VI_1 {
    state MASTER
    interface ens37
    virtual_router_id 66
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {  
       172.168.1.99/24   # 这个虚拟ip是流动网关地址
    }
}

vrrp_instance VI_2 {
    state MASTER
    interface ens33
    virtual_router_id 67
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass taba
    }
    virtual_ipaddress {
       10.0.0.11/24      # 这个虚拟ip是外网访问的浮动ip
    } 
}

# 将VI_1和VI_2做成一个同步组，在这个节点上，VI_1和VI_2同进退
vrrp_sync_group VG_1 {   
    group {
        VI_1
        VI_2
    }
}

# 虚拟服务地址和端口，使用空格分隔，其中地址为外网VIP
virtual_server  10.0.0.11 80 {  
    delay_loop 2              # 健康检查时间间隔
    lb_algo rr                # 定义负载均衡LB的算法，这里使用的是rr轮询调度算法
    lb_kind NAT               # lvs的模型，有NAT、DR、TUN三种
    ! persistence_timeout 3   # 持久会话保持时长
    protocol TCP              # 监控服务的协议类型，1.3.0版本之前只支持tcp，之后还支持udp

    real_server 172.168.1.101 80 {  # 定义后端的real_server部分，地址和端口使用空格分隔
        weight 1              # lvs权重
        HTTP_GET {            # 监控状况检查的检查方式，常见的有HTTP_GET、SSL_GET、TCP_CHECK、MISC_CHECK
            url {
              path /          # 指定http_get健康状况检查的路径，例如检查index.html是否正常
                  status_code 200
                         # 健康状况需要状态码，可以是status_code、digest、或者digest+status_code
                         # digest值用keepalived的genhash命令生成，一般使用status_code即可
                         # curl  -s  //172.168.0.6 |  md5sum
                         # genhash -s 172.168.0.6 -p 80 -u /index.html
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 172.168.1.102 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2     # 表示3秒无响应就超时，即此realserver不健康，需重试连接
            nb_get_retry 3        # 表示重试3次，3次之后都超时就是宕机，防止误伤（nb=number）
            delay_before_retry 1  # 重试的时间间隔
        }                         # 时间如果太久，应改小
    }
}

2）备节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_04
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.18

}

vrrp_instance VI_1 {
    state BACKUP
    interface ens37
    virtual_router_id 66
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {
       172.168.1.99/24
    }
}

vrrp_instance VI_2 {
    state BACKUP
    interface ens33
    virtual_router_id 67
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass taba
    }
    virtual_ipaddress {
       10.0.0.11/24
    }
}

vrrp_sync_group VG_1 {
    group {
        VI_1
        VI_2
    }        
}

virtual_server  10.0.0.11 80 {
    delay_loop 2
    lb_algo rr
    lb_kind NAT
    ! persistence_timeout 3
    protocol TCP

    real_server 172.168.1.101 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 172.168.1.102 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

4.3 keepalived + LVS（DR）

1）主节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_03
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.16
}

vrrp_instance VI_1 {
    state MASTER
    interface ens33
    virtual_router_id 66
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {
       10.0.0.10
    }
}

virtual_server  10.0.0.10 80 {
    delay_loop 2
    lb_algo wrr
    lb_kind DR
    ! persistence_timeout 3
    protocol TCP

    real_server 10.0.0.205 80 {
        weight 2
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 10.0.0.206 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

2）备节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_04
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.16
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    virtual_router_id 66
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {
       10.0.0.10
    }
}

virtual_server  10.0.0.10 80 {
    delay_loop 2
    lb_algo wrr
    lb_kind DR
    ! persistence_timeout 3
    protocol TCP

    real_server 10.0.0.205 80 {
        weight 2
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 10.0.0.206 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

3）在DR模式中各个Real Server上的自定义脚本

要在每个Real Server上执行此脚本

#!/bin/bash

vip=10.0.0.10
mask='255.255.255.255'

case $1 in
start)
    echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
    echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
    echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
    ifconfig lo:0 $vip netmask $mask broadcast $vip up
    route add -host $vip dev lo:0
    ;;
stop)
    ifconfig lo:0 down
    echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
    ;;
*) 
    echo "Usage $(basename $0) start|stop"
    exit 1
    ;;
esac

5. keepalived高可用nginx

5.1 keepalived高可用其他服务

1）原理

keepalived调用外部的辅助脚本进行资源监控，并根据监控的结果状态能实现优先动态调整

2）步骤

定义一个脚本

vrrp_script  <SCRIPT_NAME> {   # 脚本名，后面要基于脚本名来进行调用
        script  "/script.sh"   # 执行的命令或脚本
        interval  INT          # 每隔多少时间，这个监控脚本要执行一次
        weight   -INT          # 万一失败了，当前节点的权重要减去多少，一般来讲讲，减去后的值要小于备用节点
}

调用此脚本

# 在某个vrrp的示例中去调用脚本实例
track_script {
        SCRIPT_NAME_1
        SCRIPT_NAME_2
        ...
}

5.2 keepalived高可用nginx

1）配置keepalived.conf文件

global_defs {
    notification_email {
            root@localhost
    }
    notification_email_from  keepalived@localhost
    smtp_server 127.0.0.1
    smtp_connect_timeout 30
    router_id node1
    vrrp_mcast_group4 224.0.100.19
}

# 如果想要调整某个keepalived主机，只需要在keepalived目录下创建一个down文件
# 通过监测这个文件的存在与否，即可将该节点权重降低，从而可以去配置调整它
# 如果不想让它降权了，就将down文件删除
vrrp_script chk_down { 
    # 如果这个文件存在就错误退出，否则就正常退出  
    script  "[[  -f /etc/keepalived/down  ]]  &&  exit 1  ||  exit 0"  
    # 注意，这里最好将脚本写入shell文件中，然后在这里调用shell脚本文件，注意用全路径
        interval 1          
        weight -5           # 一旦上面的文件存在（错误退出），就将这个节点降权
        fall 1
        rise 1
}

vrrp_script chk_nginx {
    script  "killall  -0  nginx  &&  exit 0 ||  exit 1"  # 这里killall -0表示检测nginx进程是否存在
    # 注意，这里最好将脚本写入shell文件中，然后在这里调用shell脚本文件，注意用全路径
    interval  1             # 每隔一秒检测一次上面的脚本是否能成功执行
    weight  -5              # 如果脚本执行失败就将权重-2
    fall  3                 # 如果失败3次失败，才确认为失败
    rise  3                 # 需要成功的次数，如果3次检查都成功，那么就立即将减去的权重加回去
}

vrrp_instance  VI_1 {
    state  MASTER
    interface eno16777736
    virtual_router_id 14
    priority  100
    advert_int  1
    authentication {
            auth_type  PASS
            auth_pass 571f97b2  # 如果有多个vrrp实例，这里的密码一定不能相同
    }
    vritual_ipaddress {
            10.1.0.93/16  dev  eno16777736
    }
    track_script {              # 在这里来调用之前的脚本
            chk_down
            chk_nginx
    }

    notify_master  "/etc/keepalived/notify.sh  master"
    notify_backup  "/etc/keepalived/notify.sh  backup"
    notify_fault   "/etc/keepalived/notify.sh  fault"
}

2）定义notify脚本

#!/bin/bash
#
contact='root@localhost'
notify() {
        local  mailsubject="$(hostname) to be $1,  vip floating"
        local  mailbody="$(date  + '%F  %T' ): vrrp  transition, $(hostname)  changed  to  be  $1"
        echo "$mailbody"  |  mail  -s  "$mailsubject"  $contact
}

case  $1  in
master)
        # 当当前节点变成主节点的时候，就启用nginx服务
        systemctl  start  nginx.service  
        notify  master
        ;;
backup)
        # 当当前节点变成备用节点的时候，要启用nginx，防止备节点也被降权，导致vip没有被转移
        systemctl  start  nginx.service   
    notify  backup
        ;;
fault)
        # 当当前节点出错时，就停掉nginx服务（但是如果做nginx的双主，即使fault也不能停掉nginx）
        systemctl  stop  nginx.service  
        notify  fault
        ;;
*)
        echo  "Usage: $(basename  $0) { master|backup|fault}"
        exit  1
        ;;
esac

3）其他相关

# 监控关注的网络接口
    track_interface {
            IFACE_NAME_1
        IFACE_NAME_2
    }

# 在nginx上配置反向代理：
    upstream  websrvs  {
            server  192.168.10.11:80;
            server  192.168.10.12:80;
    }
    location  /  {
            proxy_pass  http:/websrvs;
    }

Tags: linux

Keepalived服务详解

1. VRRP协议

1.1 VRRP协议概述

1.2 VRRP的术语

1.3 VRRP的工作过程

1.4 Master路由器的选举

1.5 Master路由器状态的通告

1.6 认证方式

2. keepalived

2.1 keepalived概述

2.2 keepalived软件结构

3. keepalived的配置和使用

3.1 使用前的配置

3.2 程序环境

3.3 配置文件概述

3.4 配置文件详解

3.5 双主配置示例

4. keepalived中配置ipvs

4.1 ipvs配置语法格式

4.2 keepalived + LVS（NAT）

4.3 keepalived + LVS（DR）

5. keepalived高可用nginx

5.1 keepalived高可用其他服务

5.2 keepalived高可用nginx

VirMach 便宜 VPS

QNews

Keepalived服务详解

1. VRRP协议

1.1 VRRP协议概述

1.2 VRRP的术语

1.3 VRRP的工作过程

1.4 Master路由器的选举

1.5 Master路由器状态的通告

1.6 认证方式

2. keepalived

2.1 keepalived概述

2.2 keepalived软件结构

3. keepalived的配置和使用

3.1 使用前的配置

3.2 程序环境

3.3 配置文件概述

3.4 配置文件详解

3.5 双主配置示例

4. keepalived中配置ipvs

4.1 ipvs配置语法格式

4.2 keepalived + LVS（NAT）

4.3 keepalived + LVS（DR）

5. keepalived高可用nginx

5.1 keepalived高可用其他服务

5.2 keepalived高可用nginx

分享此文：

Related Posts

MySQL数据库innodb_rollback_on_timeout参数

Halo 开源项目学习（四）：发布文章与页面

特斯拉中国内部禁止吃韭菜？官方回应：食堂有韭菜馅饺子

Laravel Exception结合自定义Log服务的使用

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋