使用快照备份cassandra并上传它们是集群的常见做法吗?我曾考虑让每个节点上都有一个cron作业,对其进行快照、tar处理,并每24小时上传一次,但我有点担心它对性能的影响。一旦一个节点上的数据变大了,它就不能瘫痪吗?
cx6n0qe31#
创建的备份 nodetool snapshot 在cassandra中是硬链接,因此实际上不会比原始文件占用更多的空间。有关硬/软链接的说明,请参见此帖子:https://askubuntu.com/questions/108771/what-is-the-difference-between-a-hard-link-and-a-symbolic-link但是,如果不使用清除快照 nodetool clearsnapshot 然后,随着时间的推移,您的数据将在集群上增长。这里的文档是关于清除快照的顺便说一句nodetool tablestats(以前是 nodetool cfstats )对于查看给定表的给定节点上使用了多少快照数据非常有用。
nodetool snapshot
nodetool clearsnapshot
nodetool cfstats
9njqaruj2#
有两种备份策略,完全备份和增量备份。执行完整备份后,请在每个节点上启用增量备份。您可以创建一个cron作业,将所有增量备份同步到s3(fullbackup+在此之后的所有增量备份将生成最新备份)。因此,您可以有另一个cron作业,您可能只在周末或每月运行一次,以删除所有以前的备份并进行完整备份。
2条答案
按热度按时间cx6n0qe31#
创建的备份
nodetool snapshot
在cassandra中是硬链接,因此实际上不会比原始文件占用更多的空间。有关硬/软链接的说明,请参见此帖子:https://askubuntu.com/questions/108771/what-is-the-difference-between-a-hard-link-and-a-symbolic-link
但是,如果不使用清除快照
nodetool clearsnapshot
然后,随着时间的推移,您的数据将在集群上增长。这里的文档是关于清除快照的顺便说一句nodetool tablestats(以前是
nodetool cfstats
)对于查看给定表的给定节点上使用了多少快照数据非常有用。9njqaruj2#
有两种备份策略,完全备份和增量备份。执行完整备份后,请在每个节点上启用增量备份。您可以创建一个cron作业,将所有增量备份同步到s3(fullbackup+在此之后的所有增量备份将生成最新备份)。
因此,您可以有另一个cron作业,您可能只在周末或每月运行一次,以删除所有以前的备份并进行完整备份。