titan db聚合

s8vozzvw  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(307)

我想使用titan db(存储后端:hbase)对我们维护的图形数据执行聚合。我们的目标是在titan db中以图形的形式存储数据仓库数据。但是,聚合需要很多时间,我使用的是titan的一个示例。步骤如下:1。创建图-4.5lac顶点,4 lac边。2创建索引-顶点和边。三。启用数据库缓存。
当我遍历深度为4的图以查找和以查找属性上约8000个顶点的和时,我发现第一次响应查询大约需要30秒。在不到1秒的时间内完成3分钟的后续查询(在3分钟内刷新数据库缓存)。但3分钟后,再次重建缓存并提供响应需要30秒。有没有人有过类似的用例和关于如何让titan在聚合中执行得更快的建议?我期待着泰坦的实时表演。

nwlls2ji

nwlls2ji1#

你可能已经知道这一点,但我会张贴我们所做的一些性能提升从泰坦。这里的列表都是基于泰坦文件的这一章。
复合索引-你可能有这些,但值得一提的是,他们大大加快了某些顶点的直接查找。
以顶点为中心的索引-如果你有超级节点,这些可以很快消除你不需要遍历的边。
混合索引-这是伟大的任何操作,需要数字范围或排序和ElasticSearch是一个非常强大的索引工具。
如果问题不是读而是写,你也可以尝试批量加载

相关问题