rsync+sersync數據同步

  • 2019 年 10 月 6 日
  • 筆記

RSYNC數據備份

RSYNC=Remote Sync 遠程同步 高效,一定要結合shell.

官方網站:https://rsync.samba.org/

Author: Andrew Tridgell, Wayne Davison, and others

Andrew Tridgell是Samba項目的領導者和主要開發人員,同時還在參與開發rsync、Linux Kernel。

#rsync version #查看rsync版本,可以看到相關作者相信

rsync version 3.0.6 protocol version 30

Copyright (C)19962009 by Andrew Tridgell, Wayne Davison, and others.

Web site: http://rsync.samba.org/

與SCP的比較:scp=無法備份大量數據,類似windows的複製

rsync=邊複製 ,邊統計,邊比較

Rysnc特性和優點

可以鏡像保存整個目錄樹和文件系統。

可以很容易做到保持原來文件的許可權、時間、軟硬鏈接等等。

無須特殊許可權即可安裝。

快速:第一次同步時 rsync 會複製全部內容,但在下一次只傳輸修改過的文件。

壓縮傳輸:rsync 在傳輸數據的過程中可以實行壓縮及解壓縮操作,因此可以使用更少的頻寬。

安全:可以使用scp、ssh等方式來傳輸文件,當然也可以通過直接的socket連接。

支援匿名傳輸,以方便進行網站鏡象。

選擇性保持:符號連接,硬鏈接,文件屬性,許可權,時間等

常見備份分類

完整備份,差異備份,增量備份

完整備份:每次備份都是從備份源將所有的文件或目錄備份到目的地

差量備份:備份上次完全備份以後有變化的數據(他針對的上次的完全備份,他備份過程中不清除存檔屬性)

增量備份:備份上次備份以後有變化的數據.(他才不管是那種類型的備份,有變化的數據就備份,他會清除存檔屬性)

運行模式和埠

採用C/S模式(客戶端/伺服器模式)[ 就是一個點到點的傳輸,直接使用rsync命令 ]

埠873

發起端和備份源

四個名詞的解釋:

發起端:負責發起rsync同步操作的客戶機叫做發起端,通知伺服器我要備份你的數據

備份源:負責相應來自客戶機rsync同步操作的伺服器腳在備份源,需要備份的伺服器

服務端:運行rsyncd服務,一般來說,需要備份的伺服器

客戶端:存放備份數據

數據同步方式

推push:一台主機負責把數據傳送給其他主機,伺服器開銷很大,比較適合後端伺服器少的情況

拉pull:所有主機定時去找一主機拉數據,可能就會導致數據緩慢

推:目的主機配置為rsync伺服器,源主機周期性的使用rsync命令把要同步的目錄推過去(需要備份的機器是客戶端,存儲備份的機器是服務端)

拉:源主機配置為rsync伺服器,目的主機周期性的使用rsync命令把要同步的目錄拉過來(需要備份的機器是服務端,存儲備份的機器是客戶端)

兩種方案,rsync都有對應的命令來實現

Xinetd管理Rsync工作原理

使用rsync來同步是先通過xinetd監聽873號埠,如果rsync進來的是873號埠,那麼xinetd就會通知它所管轄的rsync服務來做回應,接下來就是rsync倆服務於之間的通訊

Rsync服務安裝

實驗拓撲:

(源主機172.17.120.54)====(目標主機 172.17.120.55)

Rsync服務依賴Xinetd,是使用超級服務來管理的

需要在目標機器上安裝rsync服務端

[172.17.120.54-55]#yum -y install xinetd rsync

[172.17.120.55]#rsync –daemon

[172.17.120.55]#netstat -antup | grep 873

tcp 0 0:::873 :::* LISTEN 2349/xinetd

Rsync命令

rsync命令和scp命令很相似

-a, –archive archive mode 許可權保存模式,相當於 -rlptgoD 參數,存檔,遞歸,保持屬性等

-r, –recursive 複製所有下面的資料,遞歸處理

-p, –perms 保留檔案許可權 ,文件原有屬性

-t, –times 保留時間點,文件原有時間

-g, –group 保留原有屬組

-o, –owner 保留檔案所有者(root only)

-D, –devices 保留device資訊(root only)

-l, –links 複製所有的連接 ,拷貝連接文件

-z, –compress 壓縮模式, 當資料在傳送到目的端進行檔案壓縮.

-H, –hard-links 保留硬鏈接文件

-A, –acls 保留ACL屬性文件,需要配合–perms

-P,-P參數和 –partial –progress 相同.只是為了把參數簡單化,表示傳進度

–version, 輸出rsync版本

-v , –verbose 複雜的輸出資訊

-u, –update 僅僅進行更新,也就是跳過已經存在的目標位置,並且文件時間要晚於要備份的文件,不覆蓋新的文件

–port=PORT, 定義rsyncd(daemon)要運行的port(預設為tcp 873)

–delete, 刪除那些目標位置有的文件而備份源沒有的文件

–password-file=FILE ,從 FILE 中得到密碼

–bwlimit=KBPS, 限制 I/O 頻寬

–filter 「-filename」,需要過濾的文件

–exclude=filname,需要過濾的文件

–progress,顯示備份過程

常用的 –avz

使用rsync備份數據

對A機器:172.17.120.54網站根目錄的/var/www/html/目錄備份到B機器:172.17.120.55的/tmp/test/

源伺服器:172.17.120.54

目標伺服器:172.17.120.55

創建測試數據

[172.17.120.54]# mkdir /var/www/html/

[172.17.120.54]# cp -r /boot/* /var/www/html/ //boot目錄下的所有數據作為測試數據

[172.17.120.55]# mkdir /tmp/test

[172.17.120.54]# rsync -avz –delete /var/www/html/ [email protected]:/tmp/test/

rsyncd.conf配置文件

配置文件分為兩部分:全局參數,模組參數

全局參數:對rsync伺服器生效,如果模組參數和全局參數衝突,衝突的地方模組參數生效

模組參數:定義需要通過rsync輸出的目錄定義的參數

常見的全局參數:

port #→指定後台程式使用的埠號,默認為873。

uid #→該選項指定當該模組傳輸文件時守護進程應該具有的uid,配合gid選項使用可以確定哪些可以訪問怎麼樣的文件許可權,默認值是" nobody"。

gid #→該選項指定當該模組傳輸文件時守護進程應該具有的gid。默認值為" nobody"。

max connections #→指定該模組的最大並發連接數量以保護伺服器,超過限制的連接請求將被告知隨後再試。默認值是0,也就是沒有限制。

lock file #→指定支援max connections參數的鎖文件,默認值是/var/run/rsyncd.lock。

motd file #→" motd file"參數用來指定一個消息文件,當客戶連接伺服器時該文件的內容顯示給客戶,默認

是沒有motd文件的。

log file #→" log file"指定rsync的日誌文件,而不將日誌發送給syslog。

pid file #→指定rsync的pid文件,通常指定為「/var/run/rsyncd.pid」,存放進程ID的文件位置。

hosts allow = #→單個IP地址或網路地址 //允許訪問的客戶機地址

常見的模組參數:主要是定義伺服器哪個要被同步輸出,其格式必須為「 [ 共享模組名 ]」 形式,這個名字就是在 rsync 客戶端看到的名字,其實很像 Samba 伺服器提供的共享名。而伺服器真正同步的數據是通過 path 來指定的。

Comment #→給模組指定一個描述,該描述連同模組名在客戶連接得到模組列表時顯示給客戶。默認沒有描述定義。

Path #→指定該模組的供備份的目錄樹路徑,該參數是必須指定的。

read only #→yes為只允許下載,no為可以下載和上傳文件到伺服器

exclude #→用來指定多個由空格隔開的多個文件或目錄(相對路徑),將其添加到exclude列表中。這等同於在客戶端命令中使用―exclude或—-filter來指定某些文件或目錄不下載或上傳(既不可訪問)

exclude from #→指定一個包含exclude模式的定義的文件名,伺服器從該文件中讀取exclude列表定義,每個文件或目錄需要佔用一行

include #→用來指定不排除符合要求的文件或目錄。這等同於在客戶端命令中使用–include來指定模式,結合include和exclude可以定義複雜的exclude/include規則。

include from #→指定一個包含include模式的定義的文件名,伺服器從該文件中讀取include列表定義。

auth users #→該選項指定由空格或逗號分隔的用戶名列表,只有這些用戶才允許連接該模組。這裡的用戶和系統用戶沒有任何關係。如果" auth users"被設置,那麼客戶端發出對該模組的連接請求以後會被rsync請求challenged進行驗證身份這裡使用的challenge/response認證協議。用戶的名和密碼以明文方式存放在" secrets file"選項指定的文件中。默認情況下無需密碼就可以連接模組(也就是匿名方式)。

secrets file #→該選項指定一個包含定義用戶名:密碼對的文件。只有在" auth users"被定義時,該文件才有作用。文件每行包含一個username:passwd對。一般來說密碼最好不要超過8個字元。沒有默認的secures file名,注意:該文件的許可權一定要是600,否則客戶端將不能連接伺服器。

hosts allow #→指定哪些IP的客戶允許連接該模組。定義可以是以下形式:

單個IP地址,例如:192.167.0.1,多個IP或網段需要用空格隔開,

整個網段,例如:192.168.0.0/24,也可以是192.168.0.0/255.255.255.0

*」則表示所有,默認是允許所有主機連接。

hosts deny #→指定不允許連接rsync伺服器的機器,可以使用hosts allow的定義方式來進行定義。默認是沒有hosts deny定義。

list #→該選項設定當客戶請求可以使用的模組列表時,該模組是否應該被列出。如果設置該選項為false,

可以創建隱藏的模組。默認值是true。

timeout #→通過該選項可以覆蓋客戶指定的IP超時時間。通過該選項可以確保rsync伺服器不會永遠等待一個崩潰的客戶端。超時單位為秒鐘,0表示沒有超時定義,這也是默認值。對於匿名rsync伺服器來說,一個理想的數字是600。

用配置文件定義目錄輸出

[172.17.120.55]# vim /etc/rsyncd.conf //文件不存在,需要自己創建

uid = root #運行進程的身份

gid = root #運行進程的組

port = 873 #監聽埠

use chroot = no #是否囚牢,鎖定家目錄,rsync被黑之後,黑客無法再rsync運行的家目錄之外創建文件,選項設置為yes

max connections = 20 #最大連接數

pid file = /var/run/rsyncd.pid #進程PID,自動生成

lock file = /var/run/rsync.lock #指max connectios參數的鎖文件

log file = /var/log/rsyncd.log #日誌文件位置

[test] #共享模組名稱

path = /tmp/test #路徑

comment = rsync files #描述

ignore errors #指定在 rsync 伺服器上運行 delete 操作時是否忽略 I/O 錯誤

read only = no #設置服務端文件讀寫許可權

list = no #是否允許查看模組資訊

auth users = rsyncuser #備份的用戶,和系統用戶無關

secrets file =/etc/rsync.passwd #存放用戶的密碼文件,格式是 用戶名:密碼

創建用戶密碼

[172.17.120.55]# vim /etc/rsync.passwd

rsyncuser:password123

[172.17.120.55]# chmod 600 /etc/rsync.passwd //目錄權限必須是700或者600,否則的話身份驗證會失效,設置rsync user的時候

啟動服務測試

啟動rsync與xinetd服務

[172.17.120.54-55]#systemctl start xinetd #啟動xinetd服務

[172.17.120.55]#systemctl enable xinetd #將xinetd服務加入開機項

[172.17.120.55]#rsync –daemon –config=/etc/rsyncd.conf #載入配置文件rsyncd.conf啟動rsync服務

[172.17.120.55]#netstat -antup | grep :873

tcp 0 0:::873 :::* LISTEN 45089/xinetd

測試,rsync語法: rsync 選項 用戶名@備份源伺服器IP::共享模組名 目標目錄

[172.17.120.54]# rsync -avz –delete /var/www/html [email protected]::test

Password: #輸入密碼password123

密碼處理

新建一個文件保存好密碼,然後在rsync命令中使用–password-file指定此文件即可

[172.17.120.54]# vim /etc/rsync.passwd

password123

[172.17.120.54]# chmod 600 /etc/rsync.passwd

[172.17.120.54]#rsync -avz –delete /var/www/html [email protected]::test –password-file=/etc/rsync.passwd

腳本實現定時自動備份

[172.17.120.54]# vim autobackup.sh

#!/bin/bash

rsync -avz –delete /var/www/html [email protected]::test –password-file=/opt/passfile

[172.17.120.54]# chmod +x autobackup.sh

[172.17.120.54]# rm -rf /web-back/* //測試腳本

[172.17.120.54]# sh autobackup.sh

[172.17.120.54]# echo "01 3 * * * sh /root/autoback.sh &" >> /var/spool/cron/root

Rsync+sersync實現數據實時同步

  1. sersync+rsync原理

2、inotify和sersync同步的區別

  1. 配置sersync+rsync實現實時同步

一台裝sersync一台裝rsync服務

Sersync伺服器(數據源,源機器):192.168.0.63

Rsync伺服器(備份端,目標機器):192.168.0.64

一、為什麼要用rsync+sersync架構?

1、sersync是基於inotify開發的,類似於inotify-tools的工具

2、sersync可以記錄下被監聽目錄中發生變化的(包括增加、刪除、修改)具體某一個文件或者某一個目錄的名字,然後使用rsync同步的時候,只同步發生變化的文件或者目錄

二、rsync+inotify-tools與rsync+sersync架構的區別?

1、rsync+inotify-tools

a、inotify只能記錄下被監聽的目錄發生了變化(增,刪,改)並沒有把具體是哪個文件或者哪個目錄發生了變化記錄下來;

b、rsync在同步的時候,並不知道具體是哪個文件或目錄發生了變化,每次都是對整個目錄進行同步,當數據量很大時,整個目錄同步非常耗時(rsync要對整個目錄遍歷查找對比文件),因此效率很低

2、rsync+sersync

a、sersync可以記錄被監聽目錄中發生變化的(增,刪,改)具體某個文件或目錄的名字;

b、rsync在同步時,只同步發生變化的文件或目錄(每次發生變化的數據相對整個同步目錄數據來說很小,rsync在遍歷查找對比文件時,速度很快),因此效率很高。

同步過程:

1. 在同步伺服器上開啟sersync服務,sersync負責監控配置路徑中的文件系統事件變化;

2. 調用rsync命令把更新的文件同步到目標伺服器;

3. 需要在主伺服器配置sersync,在同步目標伺服器配置rsync server(注意:是rsync服務)

同步過程和原理:

1. 用戶實時的往sersync伺服器上寫入更新文件數據;

2. 此時需要在同步主伺服器上配置sersync服務;

3. 在另一台伺服器開啟rsync守護進程服務,以同步拉取來自sersync伺服器上的數據;

通過rsync的守護進程服務後可以發現,實際上sersync就是監控本地的數據寫入或更新事件;然後,在調用rsync客戶端的命令,將寫入或更新事件對應的文件通過rsync推送到目標伺服器

原機器上開始部署sersync服務

1、下載sersync

在google code下載sersync的可執行文件版本,裡面有配置文件與可執行文件

[172.17.120.54]#wget https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz(有時下載失敗,所有要本地留存才行)

上傳到伺服器 /opt 目錄下

[172.17.120.54]#tar xvf sersync2.5.4_64bit_binary_stable_final.tar.gz

[172.17.120.54]#mv GNU-Linux-x86 sersync

2、配置sersync

[172.17.120.54]# cp confxml.xml confxml.xml.bak

更改優化sersync配置文件:

修改24–28行

<sersync>

<localpath watch=「/var/www/html/"> #本地同步目錄

<remote ip=「172.17.120.55」 name="test"/> #rsync模組名稱

修改31–34行,認證部分【rsync密碼認證】

<rsync>

<commonParams params="-artuz"/>

<auth start="true" users="rsyncuser" passwordfile=「/tmp/test/"/>

<userDefinedPort start="false" port="874"/><!– port=874 –>

<timeout start="false" time="100"/><!– timeout=100 –>

<ssh start="false"/>

開啟sersync守護進程同步數據

[172.17.120.54]#/opt/sersync/sersync2 -d -r -o /opt/sersync/confxml.xml

測試

在172.17.120.54 /var/www/html/ 目錄 增刪改目錄文件,

看172.17.120.55 /tmp/test/ 目錄的變化

[172.17.120.54]#watch ls -l

設置sersync監控開機自動執行

[172.17.120.54]#vi /etc/rc.d/rc.local #編輯,在最後添加一行

[172.17.120.54]#/opt/sersync/sersync2 -d -r -o /opt/sersync/confxml.xml #設置開機自動運行腳本

添加腳本監控sersync是否正常運行

[172.17.120.54]#vi /opt/check_sersync.sh #編輯,添加以下程式碼

#!/bin/sh

sersync="/opt /sersync/sersync2"

confxml="/opt /sersync/confxml.xml"

status=$(ps aux |grep 'sersync2'|grep -v 'grep'|wc -l)

if [ $status -eq 0 ];

then

$sersync -d -r -o $confxml &

else

exit 0;

fi

[172.17.120.54]#chmod +x /opt /check_sersync.sh #添加腳本執行許可權

把這個腳本加到任務計劃,定期執行檢測

補充: 多實例情況

1、配置多個confxml.xml文件(比如:www、bbs、blog….等等)

2、根據不同的需求同步對應的實例文件

[172.17.120.54]#/opt/sersync/sersync2 -d -o /opt/sersync/www_confxml.xml

[172.17.120.54]#/opt/sersync/sersync2 -d -o /opt/sersync/bbs_confxml.xml

關於運維學習、分享、交流,筆者開通了微信公眾號【運維貓】,感興趣的朋友可以關注下,歡迎加入,建立屬於我們自己的小圈子,一起學運維知識。