数据库与存储巡检
数据库是业务可靠性的最后一道防线。本章节覆盖 MySQL、PostgreSQL、Redis 等常用数据存储的巡检手册。
MySQL
- 备份
- 结合
mysqldump与xtrabackup,每日全备 + 每小时增量。 - 备份校验脚本:
scripts/mysql-restore-check.sh。
- 结合
- 性能
- 使用
performance_schema与pt-query-digest分析慢查询。 innodb_buffer_pool_reads持续高企时考虑扩容。
- 使用
PostgreSQL
- 主从复制延迟:
pg_stat_replication的replay_lag。 VACUUM调度:通过auto_vacuum_freeze_max_age控制膨胀。pgBackRest用于统一备份策略。
Redis
- 内存与持久化
used_memory,maxmemory,rdb_last_bgsave_status。- AOF rewrite 期间监控
aof_current_rewrite_time_sec。
- Cluster
cluster_state、cluster_slots_pfail指标。- 自动故障转移脚本记录在 Playbook。
常用命令
# MySQL 备份恢复演练
target=$1
tar -xf backup/$target.tar.gz -C /tmp/restore
mysql -uroot -p < /tmp/restore/$target.sql