etl—是否建议使用hadoop生态系统并行处理来管理和维护缓慢变化的数据仓库维度？

x6492ojm 于 2021-05-27 发布在 Hadoop

关注(0)|答案(1)|浏览(369)

我们有来自操作系统的事务性每小时数据和每日批量加载数据，我们将这些数据设计成ms sql server环境中的数据仓库维度（和事实）。如果推荐，我们可以应用什么快速有效的技术（flume、sqoop、kafka、hdfs、hbase、hive、kudu、spark、impla）在hadoop中实现这一点？假设mssqlserver数据仓库每小时使用这些维度。

hadoop data-warehouse etl data-processing

来源：https://stackoverflow.com/questions/55440809/is-it-recommended-to-utilise-the-hadoop-ecosystems-parallel-processing-to-manage