用快照备份cassandra集群并上传到s3/vm?

3phpmpom  于 2021-06-15  发布在  Cassandra
关注(0)|答案(2)|浏览(495)

使用快照备份cassandra并上传它们是集群的常见做法吗?
我曾考虑让每个节点上都有一个cron作业,对其进行快照、tar处理,并每24小时上传一次,但我有点担心它对性能的影响。一旦一个节点上的数据变大了,它就不能瘫痪吗?

cx6n0qe3

cx6n0qe31#

创建的备份 nodetool snapshot 在cassandra中是硬链接,因此实际上不会比原始文件占用更多的空间。有关硬/软链接的说明,请参见此帖子:
https://askubuntu.com/questions/108771/what-is-the-difference-between-a-hard-link-and-a-symbolic-link
但是,如果不使用清除快照 nodetool clearsnapshot 然后,随着时间的推移,您的数据将在集群上增长。这里的文档是关于清除快照的
顺便说一句nodetool tablestats(以前是 nodetool cfstats )对于查看给定表的给定节点上使用了多少快照数据非常有用。

9njqaruj

9njqaruj2#

有两种备份策略,完全备份和增量备份。执行完整备份后,请在每个节点上启用增量备份。您可以创建一个cron作业,将所有增量备份同步到s3(fullbackup+在此之后的所有增量备份将生成最新备份)。
因此,您可以有另一个cron作业,您可能只在周末或每月运行一次,以删除所有以前的备份并进行完整备份。

相关问题