Nginx 集群搭建(主备切换)

Nginx 集群搭建(主备切换)

当前文章收录状态:
查询中...

nginx集群原理

  • 利用虚拟IP,将同一个虚拟IP绑定到多个实际网卡上的IP,形成访问一个虚拟IP时,实际访问的是多个实际IP。每个实际IP对应一个nginx服务。

keepalived 交换机制软件

  • Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
  • VRRP协议:VRRP全称 Virtual Router Redundancy Protocol,即 虚拟路由冗余协议。可以认为它是实现路由器高可用的容错协议,即将N台提供相同功能的路由器组成一个路由器组(Router Group),这个组里面有一个master和多个backup,但在外界看来就像一台一样,构成虚拟路由器,拥有一个虚拟IP。

keepalived虚拟IP切换的原理如下:

  • 正常情况下,用户通过虚拟IP是直接访问到Keepalived-Master的(没有成为Master的就是Backup);
  • 成为Master的Keepalived,会每秒向所有的Backup发送VRRP包,通告自己是主,且运行正常;
  • 当Master因为网络原因或者是别的原因导致与集群断开之后,Backup会在3.6秒左右(以优先级100为例,计算公式为3 × 1 + 256 × (256 – 100))认定Master宕机;
  • 如果是多播的情况下,Master宕机,那么剩余的Backup要通过选举产生新的Master
  • 如果是单播,则由剩下的Bakcup直接作为新的Master。
选举机制如下:
  • keepalived中优先级高的节点为MASTER。MASTER其中一个职责就是响应VIP的arp包,将VIP和mac地址映射关系告诉局域网内其他主机,同时,它还会以多播的形式(默认目的地址224.0.0.18)向局域网中发送VRRP通告,告知自己的优先级
  • 网络中的所有BACKUP节点只负责处理MASTER发出的多播包,在抢占模式下,当发现MASTER的优先级没自己高,或者没收到MASTER的VRRP通告时,BACKUP将自己切换到MASTER状态,然后做MASTER该做的事:响应arp包和发送VRRP通告
  • 如果在同一个广播域的同一个VRRP组内出现了两台Master路由器,那么它们收到对方发送的VRRP通
    告报文之后,将比较自己与对方的优先级,优先级的值更大的设备胜出,继续保持Master状态,而
    竞争失败的路由器则切换到Backup状态。
  • 如果这两台Master路由器的优先级相等,那么接口IP地址
    更大的路由器接口将会保持Master状态,而另一台设备则切换到Backup状态。

Nginx + Keepalived 搭建(实现主备切换)

  • 原理图
    图片[1]-Nginx 集群搭建(主备切换)-明恒博客
    原理图

环境准备

  • Centos 7 x86_64系统2台,实际IP分别为:192.168.250.102 和 192.168.250.103
  • nginx version: nginx/1.20.2
  • Keepalived v1.3.5 (03/19,2017)
  • 虚拟IP设置为:192.168.250.250
  • Keepalived Master 在192.168.250.102机器上,Backup 在192.168.250.103机器上。

安装nginx 和 keepalived

  • nginx 安装自行查阅,不赘述
  • keepalived 安装:yum install -y keepalived 即可

keepalived配置

  • keepalived配置文件在:/etc/keepalived/keepalived.conf(有可能跟我不一样,自行确认一下)
  • Master(192.168.250.102机器上是master)配置信息如下
#全局配置
global_defs {
#启用脚本安全
enable_script_security
}
# 调整优先级脚本
vrrp_script chk_nginx {
# shell脚本路径
script "/etc/keepalived/chk_nginx.sh"
#执行脚本的用户名
user root
# 脚本执行间隔时间(单位s)
interval 2
# weight 大于0
# 如果脚本监测失败,优先级不变,如果成功,优先级增加,
# 如果后续监测失败,则优先级在增加的基础上回退,
# 这个weight不会持续增加或减小,只会存在两个值
# weight 小于0
# 如果脚本监测失败,优先级降低,
# 如果成功,优先级不变,
# 这个weight不会持续增加或减小,只会存在两个值
weight -30
}
# 虚拟IP配置
vrrp_instance VI_1 {
# 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP)
# 都设置为BACKUP,首先启动的作为Master
state MASTER
# 虚拟IP绑定网卡 值为:网卡名称(注意:改成自己机器网卡)
interface ens33
# 主、备服务器的 virtual_router_id需要一致
# 虚拟路由id,这个id在整个局域网中需要唯一
virtual_router_id 99
# 优先级(主大备小)master优先级大于backup
# 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换
# 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换
priority 120
# VRRP广播的时间间隔
advert_int 1
# keepalived认证,类型有AH加密和PASS明文
# 密码,集群中保持一致,且取前8个字符
authentication {
auth_type PASS
auth_pass 123456
}
# 绑定本机实际IP
unicast_src_ip 192.168.250.102
# 其他 keepalived ip地址
unicast_peer {
192.168.250.103
}
#虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip)
virtual_ipaddress {
192.168.250.250
}
# 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置)
track_script {
# 脚本名称
chk_nginx
}
}
#全局配置
global_defs {
   #启用脚本安全
   enable_script_security
}
# 调整优先级脚本
vrrp_script chk_nginx {
    # shell脚本路径
    script "/etc/keepalived/chk_nginx.sh"
    #执行脚本的用户名
    user root
    # 脚本执行间隔时间(单位s)
    interval 2
    # weight 大于0
    #       如果脚本监测失败,优先级不变,如果成功,优先级增加,
    #       如果后续监测失败,则优先级在增加的基础上回退,
    #       这个weight不会持续增加或减小,只会存在两个值
    # weight 小于0
    #       如果脚本监测失败,优先级降低,
    #       如果成功,优先级不变,
    #       这个weight不会持续增加或减小,只会存在两个值
    weight -30
}

# 虚拟IP配置
vrrp_instance VI_1 {
    # 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP)
    # 都设置为BACKUP,首先启动的作为Master
    state MASTER
    # 虚拟IP绑定网卡 值为:网卡名称(注意:改成自己机器网卡)
    interface ens33
    # 主、备服务器的 virtual_router_id需要一致
    # 虚拟路由id,这个id在整个局域网中需要唯一
    virtual_router_id 99
    # 优先级(主大备小)master优先级大于backup
    # 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换
    # 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换
    priority 120
    # VRRP广播的时间间隔
    advert_int 1
    # keepalived认证,类型有AH加密和PASS明文
    # 密码,集群中保持一致,且取前8个字符
    authentication {
        auth_type PASS
        auth_pass 123456
    }
    # 绑定本机实际IP
    unicast_src_ip 192.168.250.102
    # 其他 keepalived ip地址
    unicast_peer {
        192.168.250.103
    }
    #虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip)
    virtual_ipaddress {
        192.168.250.250
    }
    # 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置)
    track_script {
        # 脚本名称
        chk_nginx
    }
}
#全局配置 global_defs { #启用脚本安全 enable_script_security } # 调整优先级脚本 vrrp_script chk_nginx { # shell脚本路径 script "/etc/keepalived/chk_nginx.sh" #执行脚本的用户名 user root # 脚本执行间隔时间(单位s) interval 2 # weight 大于0 # 如果脚本监测失败,优先级不变,如果成功,优先级增加, # 如果后续监测失败,则优先级在增加的基础上回退, # 这个weight不会持续增加或减小,只会存在两个值 # weight 小于0 # 如果脚本监测失败,优先级降低, # 如果成功,优先级不变, # 这个weight不会持续增加或减小,只会存在两个值 weight -30 } # 虚拟IP配置 vrrp_instance VI_1 { # 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP) # 都设置为BACKUP,首先启动的作为Master state MASTER # 虚拟IP绑定网卡 值为:网卡名称(注意:改成自己机器网卡) interface ens33 # 主、备服务器的 virtual_router_id需要一致 # 虚拟路由id,这个id在整个局域网中需要唯一 virtual_router_id 99 # 优先级(主大备小)master优先级大于backup # 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换 # 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换 priority 120 # VRRP广播的时间间隔 advert_int 1 # keepalived认证,类型有AH加密和PASS明文 # 密码,集群中保持一致,且取前8个字符 authentication { auth_type PASS auth_pass 123456 } # 绑定本机实际IP unicast_src_ip 192.168.250.102 # 其他 keepalived ip地址 unicast_peer { 192.168.250.103 } #虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip) virtual_ipaddress { 192.168.250.250 } # 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置) track_script { # 脚本名称 chk_nginx } }
  • Backup Keepalived配置
#全局配置
global_defs {
#启用脚本安全
enable_script_security
}
# 调整优先级脚本
vrrp_script chk_nginx {
# shell脚本路径
script "/etc/keepalived/chk_nginx.sh"
#执行脚本的用户名
user root
# 脚本执行间隔时间(单位s)
interval 2
# weight 大于0
# 如果脚本监测失败,优先级不变,如果成功,优先级增加,
# 如果后续监测失败,则优先级在增加的基础上回退,
# 这个weight不会持续增加或减小,只会存在两个值
# weight 小于0
# 如果脚本监测失败,优先级降低,
# 如果成功,优先级不变,
# 这个weight不会持续增加或减小,只会存在两个值
weight -30
}
#虚拟IP配置
vrrp_instance VI_1 {
# 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP)
# 都设置为BACKUP,首先启动的作为Master
state BACKUP
# 虚拟IP绑定网卡 值为:网卡名称(注意:机器网卡)
interface ens33
# 主、备服务器的 virtual_router_id需要一致
# 虚拟路由id,这个id在整个局域网中需要唯一
virtual_router_id 99
# 优先级(主大备小)master优先级大于backup
# 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换
# 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换
priority 110
# VRRP广播的时间间隔
advert_int 1
# keepalived认证,类型有AH加密和PASS明文
# 密码,集群中保持一致,且取前8个字符
authentication {
auth_type PASS
auth_pass 123456
}
# 绑定本机实际IP
unicast_src_ip 192.168.250.103
# 其他 keepalived ip地址
unicast_peer {
192.168.250.102
}
#虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip)
virtual_ipaddress {
192.168.250.250
}
# 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置)
track_script {
# 脚本名称
chk_nginx
}
}
#全局配置
global_defs {
   #启用脚本安全
   enable_script_security
}

# 调整优先级脚本
vrrp_script chk_nginx {
    # shell脚本路径
    script "/etc/keepalived/chk_nginx.sh"
    #执行脚本的用户名
    user root
    # 脚本执行间隔时间(单位s)
    interval 2
    # weight 大于0
    #       如果脚本监测失败,优先级不变,如果成功,优先级增加,
    #       如果后续监测失败,则优先级在增加的基础上回退,
    #       这个weight不会持续增加或减小,只会存在两个值
    # weight 小于0
    #       如果脚本监测失败,优先级降低,
    #       如果成功,优先级不变,
    #       这个weight不会持续增加或减小,只会存在两个值
    weight -30
}

#虚拟IP配置
vrrp_instance VI_1 {
    # 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP)
    # 都设置为BACKUP,首先启动的作为Master
    state BACKUP
    # 虚拟IP绑定网卡 值为:网卡名称(注意:机器网卡)
    interface ens33
    # 主、备服务器的 virtual_router_id需要一致
    # 虚拟路由id,这个id在整个局域网中需要唯一
    virtual_router_id 99
    # 优先级(主大备小)master优先级大于backup
    # 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换
    # 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换
    priority 110
    # VRRP广播的时间间隔
    advert_int 1
    # keepalived认证,类型有AH加密和PASS明文
    # 密码,集群中保持一致,且取前8个字符
    authentication {
        auth_type PASS
        auth_pass 123456
    }
    # 绑定本机实际IP
    unicast_src_ip 192.168.250.103
    # 其他 keepalived ip地址
    unicast_peer {
        192.168.250.102
    }
    #虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip)
    virtual_ipaddress {
        192.168.250.250
    }
    # 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置)
    track_script {
        # 脚本名称
        chk_nginx
    }
}
#全局配置 global_defs { #启用脚本安全 enable_script_security } # 调整优先级脚本 vrrp_script chk_nginx { # shell脚本路径 script "/etc/keepalived/chk_nginx.sh" #执行脚本的用户名 user root # 脚本执行间隔时间(单位s) interval 2 # weight 大于0 # 如果脚本监测失败,优先级不变,如果成功,优先级增加, # 如果后续监测失败,则优先级在增加的基础上回退, # 这个weight不会持续增加或减小,只会存在两个值 # weight 小于0 # 如果脚本监测失败,优先级降低, # 如果成功,优先级不变, # 这个weight不会持续增加或减小,只会存在两个值 weight -30 } #虚拟IP配置 vrrp_instance VI_1 { # 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP) # 都设置为BACKUP,首先启动的作为Master state BACKUP # 虚拟IP绑定网卡 值为:网卡名称(注意:机器网卡) interface ens33 # 主、备服务器的 virtual_router_id需要一致 # 虚拟路由id,这个id在整个局域网中需要唯一 virtual_router_id 99 # 优先级(主大备小)master优先级大于backup # 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换 # 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换 priority 110 # VRRP广播的时间间隔 advert_int 1 # keepalived认证,类型有AH加密和PASS明文 # 密码,集群中保持一致,且取前8个字符 authentication { auth_type PASS auth_pass 123456 } # 绑定本机实际IP unicast_src_ip 192.168.250.103 # 其他 keepalived ip地址 unicast_peer { 192.168.250.102 } #虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip) virtual_ipaddress { 192.168.250.250 } # 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置) track_script { # 脚本名称 chk_nginx } }

keepalived中执行的 chk_nginx.sh脚本

  • 脚本文件用户用户组 要设置成keepalived.conf中的 用户(我的是root
  • chk_nginx.sh脚本文件注意修改权限(最好改成0755防止keepalived无法执行)
  • chk_nginx.sh脚本文件路径要与keepalived.conf配置保持一致
  • 脚本内容如下:
#!/usr/bin/bash
#统计nginx 命令启动的进程数有几个
PIDS=`ps -C nginx --no-header | wc -l`
if [ $PIDS -eq 0 ]; then
# 如果没有nginx进程,利用exit退出带正数,表示有错误退出
# 那么keepalived认为此次脚本执行错误
# # 这里可以加 重启nginx逻辑 如下:
# # 如果重启后还是没有nginx进程,则脚本带错误退出
#/usr/local/bin/nginx -c /opt/nginx/conf/nginx.conf
# #等待3s
#sleep 3
#IDS=`ps -C nginx --no-header | wc -l`
#if [ $PIDS -eq 0 ]; then
# exit 127
#else
# exit 0
#fi
# 为了演示主备切换,就不设置重启nginx逻辑,直接返回脚本执行错误
exit 127
else
exit 0
fi
#!/usr/bin/bash

#统计nginx 命令启动的进程数有几个
PIDS=`ps -C nginx --no-header | wc -l`
if [ $PIDS -eq 0 ]; then
    # 如果没有nginx进程,利用exit退出带正数,表示有错误退出
    # 那么keepalived认为此次脚本执行错误

    # # 这里可以加 重启nginx逻辑 如下:
    # # 如果重启后还是没有nginx进程,则脚本带错误退出
    #/usr/local/bin/nginx -c /opt/nginx/conf/nginx.conf
    # #等待3s
    #sleep 3
    #IDS=`ps -C nginx --no-header | wc -l`
    #if [ $PIDS -eq 0 ]; then
    #   exit 127
    #else
    #   exit 0
    #fi

    # 为了演示主备切换,就不设置重启nginx逻辑,直接返回脚本执行错误
    exit 127
else
    exit 0
fi
#!/usr/bin/bash #统计nginx 命令启动的进程数有几个 PIDS=`ps -C nginx --no-header | wc -l` if [ $PIDS -eq 0 ]; then # 如果没有nginx进程,利用exit退出带正数,表示有错误退出 # 那么keepalived认为此次脚本执行错误 # # 这里可以加 重启nginx逻辑 如下: # # 如果重启后还是没有nginx进程,则脚本带错误退出 #/usr/local/bin/nginx -c /opt/nginx/conf/nginx.conf # #等待3s #sleep 3 #IDS=`ps -C nginx --no-header | wc -l` #if [ $PIDS -eq 0 ]; then # exit 127 #else # exit 0 #fi # 为了演示主备切换,就不设置重启nginx逻辑,直接返回脚本执行错误 exit 127 else exit 0 fi

nginx配置(略)

  • 请自行上网查阅
  • 至此搭建结束,下面进入测试

Nginx + Keepalived 集群测试

准备工作:

  • 我们在 192.168.250.102和103上分别启动nginx 和 keepalived(注意:先启动nginx,否则keepalived会发生主备切换)
  • nginx :启动/停止,自行查阅
  • keepalived 启动命令:keepalived -f /etc/keepalived/keepalived.conf(-f 后面是keepalived的配置文件路径)
  • keepalived 关闭:kill ${对应keepalived pid} 即可
  • keepalived 启动后,其日志文件在/var/log/messages可以看到(后续我将使用 tail -f /var/log/messages 来观察keepalived的变化)

102机器启动Keepalived

  • 下图可以看出,192.168.250.102机器上的keepalived以 Master 启动起来。
    图片[2]-Nginx 集群搭建(主备切换)-明恒博客
    192.168.250.102

103机器启动Keepalived

  • 下图:192.168.250.103机器上的keepalived以 Backup 启动起来。
    图片[3]-Nginx 集群搭建(主备切换)-明恒博客
    192.168.250.103

使用虚拟IP 192.168.250.250访问

  • 可以看出,我们当前访问的是Master上的nginx。
    图片[4]-Nginx 集群搭建(主备切换)-明恒博客
    虚拟IP访问

将102上的nginx服务停止

  • 下面2张图,可以看出102的优先级降低,从120 -> 90,并切换为Backup。
  • 而103变成新的Master。
    图片[5]-Nginx 集群搭建(主备切换)-明恒博客
    192.168.250.102上Nginx停止,102变成backup
    图片[6]-Nginx 集群搭建(主备切换)-明恒博客
    192.168.250.103变成Master

再用虚拟IP访问

  • 下图:再使用虚拟IP访问时,已经访问的是103上备份的nginx
    图片[7]-Nginx 集群搭建(主备切换)-明恒博客
    成功切换到备份Nginx上

重启102机器上Nginx

  • 可以看出:102优先级从90回到120,并且成功切换成Master。
  • 103 由于优先级为110,从而切换为Backup
    图片[8]-Nginx 集群搭建(主备切换)-明恒博客
    192.168.250.102重启Nginx,ch_nginx.sh脚本执行成功,从而102重回Master
    图片[9]-Nginx 集群搭建(主备切换)-明恒博客
    103优先级低于102,故重回Backup

再次访问虚拟IP 192.168.250.250

  • 下图:重新请求到102Master主机上的nginx。
    图片[10]-Nginx 集群搭建(主备切换)-明恒博客
    虚拟IP访问回到102主机上

总结

  • chk_nginx.sh 脚本要注意权限,防止keepalived没有权限自行脚本
  • keepalived.conf Master 和 Backup 配置文件不要搞乱
  • 注意Master 和 Backup 中的优先级值设置,防止主备切换时,优先级值设置不正确,导致主备切换失败。
  • 要利用 tail -f /var/log/messages 观察keepalived的执行日志
© 版权声明
THE END
我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=270198dipw4ko
点赞9赞赏 分享
No one can change another. But one can be the reason for another to change.
没人能改变另一个人,但是某个人能成为一个人改变的原因
评论 抢沙发

请登录后发表评论

    暂无评论内容