falcon在hadoop生态系统中的角色

mfpqipee  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(322)

我应该在集群镜像上工作,我必须将类似的hdfs集群(相同的主集群和从集群)设置为现有集群,并将数据复制到新集群,然后按原样运行相同的作业。
我读过falcon作为feed处理和工作流协调工具的文章,它也用于hdfs集群的镜像。有人能告诉我什么是falcon在hadoop生态系统中的角色,以及它如何帮助镜像。我在这里寻找了解所有facon提供什么,当它是我的hadoop生态系统(hdp)的一部分。

lfapxunr

lfapxunr1#

apachefalcon简化了数据运动的配置:复制;生命周期管理;血统和可追溯性。这提供了跨hadoop组件的数据治理一致性。
falcon复制与增量更改是异步的。恢复是通过运行进程并交换源和目标来完成的。
数据丢失—如果主群集完全关闭,增量数据可能会丢失
根据带宽和网络可用性,可以在需要时安排备份。

相关问题