rsync数据镜像备份工具

  • 1. rsync简介
  • 2. rsync特性
  • 3. rsync的ssh认证协议
  • 4. rsync命令
  • 5. rsync+inotify


1. rsync简介

rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。

2. rsync特性

rsync支持很多特性:

  • 可以镜像保存整个目录树和文件系统
  • 可以很容易做到保持原来文件的权限、时间、软硬链接等等
  • 无须特殊权限即可安装
  • 快速:第一次同步时rsync会复制全部内容,但在下一次只传输修改过的文件。rsync在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的带宽
  • 安全:可以使用scp、ssh等方式来传输文件,当然也可以通过直接的socket连接
  • 支持匿名传输,以方便进行网站镜像

3. rsync的ssh认证协议

rsync命令来同步系统文件之前要先登录remote主机认证,认证过程中用到的协议有2种:

  • ssh协议
  • rsync协议
    rsync server端不用启动rsync的daemon进程,只要获取remote host的用户名和密码就可以直接rsync同步文件

rsync server端因为不用启动daemon进程,所以也不用配置文件/etc/rsyncd.conf
ssh认证协议跟scp的原理是一样的,如果在同步过程中不想输入密码就用ssh-keygen -t rsa打通通道

//这种方式默认是省略了 -e ssh 的,与下面等价:
rsync -avz /SRC -e ssh root@ip:/DEST 
    -a  //文件宿主变化,时间戳不变
    -z  //压缩数据传输
 
//当遇到要修改端口的时候,我们可以:
rsync -avz /SRC -e "ssh -p2222" root@ip:/DEST  
//修改了ssh 协议的端口,默认是22

4. rsync命令

//Rsync的命令格式常用的有以下三种:
    rsync [OPTION]... SRC DEST
    rsync [OPTION]... SRC [USER@]HOST:DEST
    rsync [OPTION]... [USER@]HOST:SRC DEST
  
//对应于以上三种命令格式,rsync有三种不同的工作模式:
1)拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如:
[root@localhost ~]# ls
anaconda-ks.cfg  nfs.sh
[root@localhost ~]# rsync -a nfs.sh a.sh
[root@localhost ~]# ll
total 12
-rw-------. 1 root root 1453 Jun 13 19:27 anaconda-ks.cfg
-rwxr-xr-x  1 root root 1041 Aug  8 18:14 a.sh
-rwxr-xr-x  1 root root 1041 Aug  8 18:14 nfs.sh
[root@localhost ~]# ll -i
total 12
33574978 -rw-------. 1 root root 1453 Jun 13 19:27 anaconda-ks.cfg
33574979 -rwxr-xr-x  1 root root 1041 Aug  8 18:14 a.sh
33574990 -rwxr-xr-x  1 root root 1041 Aug  8 18:14 nfs.sh

2)使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。当DST路径地址包 \
含单个冒号":"分隔符时启动该模式。如:
[root@localhost ~]# rsync -avz nfs.sh root@192.168.249.146:/root/b.sh
sending incremental file list
nfs.sh

sent 643 bytes  received 35 bytes  1,356.00 bytes/sec
total size is 1,041  speedup is 1.54
[root@localhost ~]# ssh root@172.16.12.129 'ls -l /root'
total 8
-rw-------. 1 root root 1454 Aug  6 04:39 anaconda-ks.cfg
-rwxr-xr-x  1 root root 1041 Aug  8  2018 b.sh

3)使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。当SRC地址路径 \
包含单个冒号":"分隔符时启动该模式。如:
[root@localhost ~]# ls
anaconda-ks.cfg  a.sh  nfs.sh
[root@localhost ~]# rsync -avz root@192.168.249.146:/etc/yum.repos.d /root/
receiving incremental file list
yum.repos.d/
yum.repos.d/163.repo
yum.repos.d/redhat.repo

sent 66 bytes  received 918 bytes  1,968.00 bytes/sec
total size is 1,820  speedup is 1.85
[root@localhost ~]# ls
anaconda-ks.cfg  a.sh  nfs.sh  yum.repos.d
[root@localhost ~]# ls yum.repos.d/
163.repo  redhat.repo



//rsync常用选项:
    -a, --archive       //归档
    -v, --verbose       //啰嗦模式
    -q, --quiet         //静默模式
    -r, --recursive     //递归
    -p, --perms         //保持原有的权限属性
    -z, --compress      //在传输时压缩,节省带宽,加快传输速度
    --delete            //在源服务器上做的删除操作也会在目标服务器上同步

5. rsync+inotify

rsync与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出了更高的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!

Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。

实验环境:

服务器类型

IP

应用

源服务器

192.168.249.145

rsync

inotify-tools

脚本

目标服务器

192.168.249.146

rsync

需求:

  • 在源服务器上创建/runtime目录,在目标服务器上创建/lxr目录,同步/runtime目录至目标服务器的/lxr/目录下。

在目标服务器上做以下操作:

创建lxr目录
[root@146 /]# mkdir lxr

查看内核版本是否支持Inotify
[root@146 etc]# uname -r
4.18.0-257.el8.x86_64

设置防火墙和selinux开机自动关闭
[root@146 ~]# systemctl stop firewalld
[root@146 ~]# systemctl disable firewalld
[root@146 ~]# setenforce 0
[root@146 ~]# vim /etc/sysconfig/selinux
SELINUX=disabled  #修改如下行

安装rsync服务端软件
[root@146 ~]# yum -y install rsync

设置rsyncd.conf配置文件
[root@146 ~]# vim /etc/rsyncd.conf 
log file = /var/log/rsyncd.log    #日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile = /var/run/rsyncd.pid    # pid文件的存放位置  
lock file = /var/run/rsync.lock    # 支持max connections参数的锁文件
secrets file = /etc/rsync.pass   # 用户认证配置文件,里面保存用户名称和密码,必须手动创建这个文件
 
[xixi]    # 自定义同步名称
path = /lxr/    # rsync服务端数据存放路径,客户端的数据将同步至此目录        
comment = sync etc from client
uid = root    # 设置rsync运行权限为root    
gid = root    # 设置rsync运行权限为root    
port = 873   # 默认端口     
ignore errors    # 表示出现错误忽略错误    
use chroot = no       # 默认为true,修改为no,增加对目录文件软连接的备份
read only = no    # 设置rsync服务端为读写权限,表示能读能写
list = no     # 不显示rsync服务端资源列表
max connections = 200     # 最大连接数
timeout = 600     # 设置超时时间
auth users = admin        # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow = 192.168.249.145   # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny = 172.16.1.1      # 禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开

创建认证密码文件
[root@146 ~]# tr -dc A-Za-z0-9_ < /dev/urandom | head -c 10 |xargs  #随机生成10位随机密码
6eesP1GXrW
[root@146 /]# vim /etc/rsync.pass 
admin:6eesP1GXrW

设置文件权限,只设置文件所有者具有读取、写入权限即可
[root@146 ~]# chmod 600 /etc/rsync.pass 
[root@146 ~]# ll /etc/rsync*
-rw-r--r--. 1 root root 319 6月   7 21:51 /etc/rsyncd.conf
-rw-------. 1 root root  17 6月   7 21:51 /etc/rsync.pass

启动rsync服务并设置开机自启动
因为centos8版本上找不到启动配置文件,所以自己配置
[root@146 ~]# vim /etc/sysconfig/rsyncd
OPTIONS=""
[root@146 ~]# vim /usr/lib/systemd/system/rsyncd.service

[Unit]
Description=fast remote file copy program daemon

[Service]
User=root
Group=root
EnvironmentFile=/etc/sysconfig/rsyncd
ExecStart=/usr/bin/rsync --daemon --config=/etc/rsyncd.conf --no-detach
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
RestartSec=30s

[Install]
WantedBy=multi-user.target

[root@146 ~]# systemctl daemon-reload  #重新加载
[root@146 ~]# systemctl start rsyncd
[root@146 ~]# systemctl enable rsyncd  #开机自启
[root@146 ~]# ss -antl
State         Recv-Q        Send-Q               Local Address:Port               Peer Address:Port       Process        
LISTEN        0             5                          0.0.0.0:873                     0.0.0.0:*                         
LISTEN        0             128                        0.0.0.0:111                     0.0.0.0:*                         
LISTEN        0             128                        0.0.0.0:22                      0.0.0.0:*                         
LISTEN        0             5                             [::]:873                        [::]:*                         
LISTEN        0             128                           [::]:111                        [::]:*                         
LISTEN        0             128                           [::]:22                         [::]:*

在源服务器上做以下操作:

创建lxr目录
[root@145 ~]# mkdir /lxr
设置防火墙和selinux开机自动关闭
[root@145 ~]# systemctl stop firewalld
[root@145 ~]# systemctl disable firewalld
[root@145 ~]# setenforce 0
[root@145 ~]# vim /etc/sysconfig/selinux
SELINUX=disabled  #修改如下行

安装rsync服务端软件,只需要安装,不要启动,不需要配置
[root@145 ~]# yum -y install rsync

创建密码认证文件
[root@145 ~]# echo '6eesP1GXrW'
6eesP1GXrW
[root@145 ~]# echo '6eesP1GXrW' > /etc/rsync.pass
[root@145 ~]# cat /etc/rsync.pass
6eesP1GXrW

设置文件权限,只设置文件所有者具有读取、写入权限即可
[root@145 ~]# chmod 600 /etc/rsync.pass
[root@145 ~]# ll /etc/rsync.pass
-rw-------. 1 root root 11 6月   7 22:14 /etc/rsync.pass

在源服务器上创建测试目录,然后在源服务器运行以下命令
[root@145 ~]# mkdir etc
[root@145 ~]# ls
anaconda-ks.cfg  etc
[root@145 ~]# cd etc/
[root@145 etc]# touch hehe
[root@145 etc]# ls
hehe
[root@145 ~]#  rsync -avH --port 873 --progress --delete /root/etc/ admin@192.168.249.146::xixi --password-file=/etc/rsync.pass
sending incremental file list
./
hehe
              0 100%    0.00kB/s    0:00:00 (xfr#1, to-chk=0/2)

sent 113 bytes  received 46 bytes  106.00 bytes/sec
total size is 0  speedup is 0.00

运行完成后,在目标服务器上查看,在/lxr目录下有hehe,说明数据同步成功
[root@146 ~]# cd /lxr
[root@146 lxr]# ls
hehe

安装inotify-tools工具,实时触发rsync进行同步
[root@145 ~]# yum -y install epel-release
[root@145 ~]# yum -y install inotify-tools

写同步脚本,此步乃最最重要的一步,请慎之又慎。让脚本自动去检测我们制定的目录下 
文件发生的变化,然后再执行rsync的命令把它同步到我们的服务器端去
[root@145 ~]# mkdir /scripts
[root@145 ~]# touch /scripts/inotify.sh
[root@145 ~]# chmod +x /scripts/inotify.sh 
[root@145 ~]# cd /scripts/
[root@145 scripts]# ll
总用量 0
-rwxr-xr-x. 1 root root 0 6月   7 22:33 inotify.sh

[root@145 scripts]# vim inotify.sh 
host=192.168.249.146      # 目标服务器的ip(备份服务器)
src=/runtime        # 在源服务器上所要监控的备份目录(此处可以自定义,但是要保证存在)
des=xixi     # 自定义的模块名,需要与目标服务器上定义的同步名称一致
password=/etc/rsync.pass        # 执行数据同步的密码文件
user=admin          # 执行数据同步的用户名
inotifywait=/usr/bin/inotifywait

$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $src \
| while read files;do
    rsync -avzP --delete  --timeout=100 --password-file=${password} $src $user@$host::$des
    echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done

启动脚本在后台运行
[root@145 ~]# nohup /bin/bash /scripts/inotify.sh &
[2] 2258
[root@145 ~]# nohup: 忽略输入并把输出追加到'nohup.out'
查看一下进程是否启动
[root@145 ~]# ps -ef | grep inotify
root        2255    1665  0 22:43 pts/0    00:00:00 /bin/bash /scripts/inotify.sh
root        2256    2255  0 22:43 pts/0    00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /runtime
root        2257    2255  0 22:43 pts/0    00:00:00 /bin/bash /scripts/inotify.sh
root        2258    1665  0 22:44 pts/0    00:00:00 /bin/bash /scripts/inotify.sh
root        2259    2258  0 22:44 pts/0    00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /runtime
root        2260    2258  0 22:44 pts/0    00:00:00 /bin/bash /scripts/inotify.sh
root        2264    1665  0 22:45 pts/0    00:00:00 grep --color=auto inotify

测试
在源服务器上生成一个新文件
[root@145 runtime]# touch 456.txt
[root@145 runtime]# ls
456.txt
在目标服务器上查看
[root@146 lxr]# ls
hehe runtime
[root@146 lxr]# cd runtime/
[root@146 runtime]# ls
456.txt

设置脚本开机自动启动:

[root@145 ~]# chmod +x /etc/rc.d/rc.local
[root@145 ~]# ll /etc/rc.d/rc.local
-rwxr-xr-x. 1 root root 474 12月  2 2020 /etc/rc.d/rc.local
[root@145 ~]# echo 'nohup /bin/bash /scripts/inotify.sh' >> /etc/rc.d/rc.local
[root@145 ~]#  tail /etc/rc.d/rc.local
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.

touch /var/lock/subsys/local

nohup /bin/bash /scripts/inotify.sh