我是新的flink和ElasticSearch集成。我有一个场景,需要将历史数据(大约1tb)从旧的ElasticSearch集群(5.6)加载到新集群(6.8)。在迁移过程中,我必须进行一些数据过滤和修改。考虑与flink es sink操作符一起使用flink批处理作业。
但是由于目前没有可用的flink es源操作符,那么将数据源化到我的flink管道中的最佳方法是什么呢。我有两个选择。
编写flatmap函数/进程函数并获取记录
使用一些开源的第三方库将flink连接到es。但我不想冒险,因为我不知道这些程序是如何执行的
但不确定哪种方法是最好的,因为数据量很大,我可能不得不并行化source操作符。
如果你们中有人遇到这种情况,请给出一些建议。提前谢谢
暂无答案!
目前还没有任何答案,快来回答吧!