基于Linux的HA高可用服务搭建
HA高可用服务搭建
1、HA Cluster高可用集群
HA是High Available缩写。 HA Cluster是指高可用性集群,是保证业务连续性的有效解决方案,一般 有两个或两个以上的节点,且分为活动节点及备用节点。
FailOver:故障自动切换,MASTER/BACKUP,MASTER宕机了,BACKUP 充当主机使用。
2、为什么要引入HA高可用
答:主要是为了解决Web服务的单点故障。 HA高可用软件架构原理:keepalived/mha
3、Keepalived软件概述
Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS 集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功 能。因此,Keepalived除了能够管理LVS软件外,还可以作为其他服务 (例如:Nginx、HAproxy、MySQL等)的高可用解决方案软件。
4、Keepalived组成和原理
Keepalived软件主要是通过VRRP协议实现高可用功能的(故障切换方 式)。VRRP是Virtual Router RedundancyProtocol(虚拟路由器冗余协 议)的缩写,VRRP出现的目的就是为了解决静态路由单点故障问题的,它 能够保证当个别节点宕机时,整个网络可以不间断地运行。 (FailOver+VIP漂移)
使用Keepalived进行VIP(虚拟的IP地址),所有服务器共享一个虚拟的 VIP的实现。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供 相同功能的路由器组成一个路由器组,这个组里面有一个master和多个 backup,master上面有一个对外提供服务的vip(该路由器所在局域网内 其他机器的默认路由为该vip),master会发组播,当backup收不到vrrp 包时就认为master宕掉了,这时就需要根据VRRP的优先级来选举一个 backup当master。这样的话就可以保证路由器的高可用了。
Keepalived的功能体系结构,大致分两层:用户空间(user space)和内 核空间(kernel space)。
内核空间:主要包括IPVS(IP虚拟服务器,用于实现网络服务的负载均 衡)和NETLINK(提供高级路由及其他相关的网络功能)两个部份。
用户空间:
1 | WatchDog:负则监控checkers和VRRP进程的状况 |
keepalived主要使用三个模块,分别是core、check和vrrp。core模块为 keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和 解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现 VRRP协议的。
5、安装Keepalived软件
第一步:关闭防 火墙与SELinux、关闭NetworkManager、时间同步。
第二步:在Web01与Web02(两台机器组建高可用集群)使用yum命令安 装Keepalived软件
1 | yum install keepalived -y |
第三步:了解keepalived配置文件与日志信息输出的位置
配置文件:
1 | vim /etc/keepalived/keepalived.conf |
日志文件:
1 | cat /var/log/messages |
6、设置Keepalived配置文件
Web01与Web02同时操作:
1 | vim /etc/keepalived/keepalived.conf |
第一步:使用冒号:末行模式,切换光标到35行,然后按dG,删除35行以 后的所有内容
第二步:了解一下配置文件中每一行的含义19~34行
1 | vrrp_instance #组建vrrp实例组的组名(Web01与Web02要保持一致) { |
设置完成后,保存并退出
第三步:启动Keepalived软件
1 | systemctl start keepalived |
分别在Web01/Web02中使用ip a命令,查看网卡上是否挂载VIP地址:
1 | ip a |
Windows中找到hosts文件:
1 | ip 域名 |
8、让VIP可以ping通
把域名解析到VIP,通过VIP访问到提供服务的服务器。
特别注意:1.3以后版本要注释vrrp_strict,否则虚拟IP无法ping通
设置完成后,重启keepalived软件
1 | systemctl restart keepalived |
9、模拟服务器故障,VIP漂移
1 | MASTER:网络无法连接,keepalived软件关闭 |
10、让Keepalived可以监测Nginx服务
问题:当我们在MASTER服务器中,手工停止Nginx,VIP会发生漂移么?
答:不会,因为keepalived软件主要检测keepalived服务状态以及网络情 况。只要这两者正常,这个VIP就不会发生漂移。
这个时候就产生了一个问题:Nginx都已经停止了,实际上这台MASTER服 务器就无法对外提供Web服务了,所以这个时候VIP也应该正常发生漂移。
第一步:编写nginx.sh脚本,自动检测Nginx的运行状态 (Web01/Web02)
1 | # mkdir /scripts |
第二步:给nginx.sh文件添加一个可执行权限
1 | chmod +x /scripts/nginx.sh |
设置完成后,不要着急继续向下操作。首先测试一下nginx.sh脚本是否可用
1 | /scripts/nginx.sh |
第三步:在Web01/Web02两台机器的keepalived.conf文件中配置 nginx.sh脚本
1 | vim /etc/keepalived/keepalived.conf |
以上只是在keepalived配置文件中定义了一个检测脚本,但是还没有真正 的调用。
第四步:在vrrp_instance标签中真正调用check_nginx这个检测脚本
1 | vrrp_instance VI_1 { |
第五步:设置完成后,重启keepalived
1 | systemctl restart keepalived |
二、Keepalived配置补充
1、抢占与非抢占模式
☆ 什么是抢占模式
MASTER:权重100
BACKUP:权重90
当MASTER发生故障时(宕机),VIP会自动从MASTER漂移到BACKUP服 务器。但是当MASTER维修完毕后,启动keepalived的瞬间,其就会把VIP 从BACKUP服务器中抢占过来。我们把这种情况就称之为“抢占模式”。
扩展:keepalived中,到底是如何决定谁是MASTER?
答:主要通过权重配置以及IP地址的大小
① 如果Web01与Web02其权重不同,当我们同时启动keepalived的时候, 其默认会选择权重比较大的服务器充当MASTER。
② 如果Web01与Web02其权重相同,则IP地址大的,优先成为MASTER Web02(10.1.1.13) > Web01(10.1.1.11)
☆ 非抢占模式
问题:如果让我们的HA Cluster集群成为非抢占模式呢?
答:一共分三步
第一步:更改keepalived.conf配置文件
1 | vrrp_instance VI_1 { |
第二步:配置state角色都为BACKUP
1 | vrrp_instance VI_1 { |
第三步:重启keepalived软件
1 | systemctl restart keepalived |