我有两个分开的elasticsearch群集,我想将数据从第一个群集重新索引到第二个群集,但是我发现我只能在sparkcontext配置中设置一个elasticsearch群集,例如:
var sparkConf : SparkConf = new SparkConf()
.setAppName("EsReIndex")
sparkConf.set("es.nodes", "node1.cluster1:9200")
那么,如何在同一个应用程序内的spark中使用elasticsearch hadoop在两个elasticsearch集群之间移动数据呢?
1条答案
按热度按时间wtzytmuj1#
您不需要为此在sparkconf中配置节点地址。
使用dataframewriter时
elasticsearch
格式,可以将节点地址作为选项传递,如下所示:这应该适用于spark 1.6.x和相应的elasticsearch hadoop连接器。