ttl行为-hbase

yuvru6vn  于 2021-06-03  发布在  Hadoop
关注(0)|答案(3)|浏览(356)

我们在hbase表中有很多数据。我对nosql这个世界还很陌生。我们希望只保留固定时间的数据。我们应该编写一个单独的清理脚本还是依赖于ttl配置?
我查阅了可用的文件,但不了解确切的行为。

fxnxkyjh

fxnxkyjh1#

它的行为方式是这样的,即一行中时间戳早于配置的ttl的所有值都将在下一次主压缩时被删除。它是列族的属性。如果您想将ttl应用于整个表,只需为表中的每个列族将其设置为相同的值。这样,一旦处理完数据,就可以将其清除。

8ljdwjyq

8ljdwjyq2#

hbase文档清楚地表明,早于ttl的数据将被hbase自动删除。

kwvwclae

kwvwclae3#

请记住,hbase永远不会删除数据,除非它执行压缩操作(即重写所有数据文件)。一旦数据通过ttl,它将是不可见的,直到主要的压缩发生。

相关问题