­

PostgreSQL pg_archivecleanup 与怎么清理 archivelog

  • 2020 年 2 月 21 日
  • 筆記

pg_archivecleanup 和 pg_rewind 是PG 中两个重要的功能,一个是为了清理过期的 archive log 使用的命令,另一个是你可以理解为物理级别的 wal log的搬运工。

我们先说第一个 pg_archivecleanup 命令,这个命令主要是用于使用了archive log 功能的 postgresql 但在 archive log 堆积如山的情况下,你怎么来根据某些规则,清理这些日志呢?

这里面就要使用 pg_archivecleanup 这个命令了,可以定时的来运行它,将已经移动到archivecleanup 的目录的archivelog 根据要求开始清理。

当然我们先的说说如果不定期清理会出什么问题

1 如果不定期清理archive 如果存放archivelog 的位置无法在接受新的日志,则大量WAL日志会滞留在 wal_log 目录中,则整体数据库系统都会受到影响。

2 占用大量的存储空间,存储无效的数据

那一般来说如果没有第三方的备份工具的情况下,怎么来通过pg_archivecleanup 来进行archivelog 的清理。

需要关注几个点

1 清理的时,清理的WAL_LOG 是否已经是包含在最后一次的备份中,保证清理的WAL_LOG 也可以从备份文件中恢复数据库

2 清理的时候,对于保存在非主库的wal_log 怎么办

一般来说,设置自动清理archive_log 可以在配置文件中添加

archive_cleanup_command = 'pg_archivecleanup archivelocation %r'

来操作。

但一般来说这样做好处少,弊病多,我比较喜欢写相关的脚本,定时去运行的方式,并且可以记录相关的LOG 日志等等。

可以写一个脚本,来辅助定时清理相关的archive_log

当然这样的方法也是有弊端的,如果由于备份的原因的故障,而直接使用天数来清理会有因为没有备份而直接将 wal_log 给清理掉,所以更加靠谱的方法是通过某些命令来获得需要截止的清理的Wal_log 名称。

例如 备份后的

会在wal_log 里面有backup 的标记,这说明这个WAL log 以前的数据已经备份了,如果清理这个WAL LOG 之前的log 是安全的。

000000010000000300000030.00000060.backup

使用下面的脚本可以来更安全的清理

#!/bin/bash    ARCHIVEDIR='/pgdata/archive'  CHK_SAFE=$(find $ARCHIVEDIR -type f -mtime +3 -name '*backup' -printf '%fn' | sort -r | head -1)  cd $ARCHIVEDIR  /usr/local/postgres/bin/pg_archivecleanup $ARCHIVEDIR $CHK_SAFE    find $ARCHIVEDIR -type f -mtime +3 -a -name '*backup' -a ! -newer $CHKPOINT -delete