每天从oracle向cassandra传送数据

enyaitl3  于 2021-06-03  发布在  Sqoop
关注(0)|答案(1)|浏览(387)

我们每天都要从甲骨文到Cassandra。因为oracle每天都在更新表。所以当我搜索这个的时候,我发现这些选项:
将oracle表提取为文件,然后编写cassandra
使用sqoop从oracle获取表,编写map reduce job并插入cassandra?
我不知道哪条路合适?还有其他选择吗?
谢谢您。

pprl5pva

pprl5pva1#

选项1将oracle表提取为文件,然后每天手动写入cassandra可能是一个令人厌烦的过程,除非您正在安排cron作业。我以前尝试过这个,但是如果进程失败,那么日志记录可能会有问题。如果您正在使用这个过程,并导出到csv,并试图写入到cassandra,那么我建议使用cassandra批量加载程序(https://github.com/brianmhess/cassandra-loader)
选项2我还没用过这个,所以不能谈这个。
选项3(我使用这个)我使用一个开源工具,pentaho数据集成(spoon)(https://community.hitachivantara.com/docs/doc-1009855-data-integration-kettle)解决这个问题。这是一个相当简单的过程。您可以通过使用具有日志记录功能的carte服务器(spoon服务器)来自动执行此过程,如果过程在这段时间内失败,还可以自动重新启动。
如果你发现了其他对你有效的解决方案,请告诉我。

相关问题