尽管cassandra允许-2^63到+2^63-1个分区,但是否有一个建议的分区最大数目,超过这个数目性能可能会受到影响?
ki0zmccv1#
在每节点大约10亿个分区之后,完全修复(非增量)开始出现严重的过度流问题。尤其是较小的分区,因为验证压缩运行较慢。理想情况下,我会推荐分区大小而不是计数。大约100mb的分区,您将有更有效的压缩,而不会有太多昂贵的读分区索引开销。我不会对它太严格,虽然它的手动摇了很多因素。首先尝试为您的查询建模,然后如果所说的模型最终有太大或太多太小的分区(数亿或更多的sub 1k或任何多gb的分区--每个节点不是总数),则对其进行微调
1条答案
按热度按时间ki0zmccv1#
在每节点大约10亿个分区之后,完全修复(非增量)开始出现严重的过度流问题。尤其是较小的分区,因为验证压缩运行较慢。
理想情况下,我会推荐分区大小而不是计数。大约100mb的分区,您将有更有效的压缩,而不会有太多昂贵的读分区索引开销。我不会对它太严格,虽然它的手动摇了很多因素。首先尝试为您的查询建模,然后如果所说的模型最终有太大或太多太小的分区(数亿或更多的sub 1k或任何多gb的分区--每个节点不是总数),则对其进行微调