hadoop-cassandra集成设计

j2cgzkjk  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(243)

我有 3 Cassandra nodes 让我们说 c1,c2 and c3 . 我想将hadoop与cassandra集成,这样我就可以在hadoop上运行pig脚本,从cassandra读取数据并进行分析。所以我把hadoop设置成这样 h1 as name-node , h2 as data-node, c1 as data-node and c3 as data-node. Here h2 node is a only hadoop data-node and not with the any Cassandra node . 我的问题是 while reading and processing data through pig/mapredude does it uses h2 data-node?

1sbrub3j

1sbrub3j1#

如果我错了,请纠正我,但是您不需要在所有cassandra节点上安装hadoop datanodes吗?我的理解是,map reduce使用hdfs datanodes在减少数据之前存储中间结果。所以我认为使用h2是很有可能的。这是我的猜测,我期待着更正

相关问题