etl—是否建议使用hadoop生态系统并行处理来管理和维护缓慢变化的数据仓库维度?

x6492ojm  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(357)

我们有来自操作系统的事务性每小时数据和每日批量加载数据,我们将这些数据设计成ms sql server环境中的数据仓库维度(和事实)。如果推荐,我们可以应用什么快速有效的技术(flume、sqoop、kafka、hdfs、hbase、hive、kudu、spark、impla)在hadoop中实现这一点?假设mssqlserver数据仓库每小时使用这些维度。

htrmnn0y

htrmnn0y1#

一个可能的选择是nifi或minifi
https://nifi.apache.org/

相关问题