hadoop上的tpc ds基准-为什么使用星型模式

nzrxty8p 于 2021-05-30 发布在 Hadoop

关注(0)|答案(0)|浏览(240)

我正在尝试用sparksql运行tpcds基准测试。
在文档中，他们讨论了星型模式和表的数量。
根据我对hadoop的理解，最好是使用非规范化的数据，然后您可以像paraquet那样格式化数据，这在压缩方面很好(使用分区实现并行性）
我还从sas找到了此文档->https://support.sas.com/resources/papers/data-modeling-hadoop.pdf
它也在同一个术语中讨论。我不是数据仓库Maven，所以我请求帮助我理解如何在hadoop中为数据仓库建模

hadoop apache-spark-sql tpc benchmarking

来源：https://stackoverflow.com/questions/31173180/tpc-ds-benchmark-on-hadoop-why-use-star-schema

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

hadoop上的tpc ds基准-为什么使用星型模式

暂无答案！

相关问题

热门标签

最新问答