使用hive作为数据仓库有什么好处吗？

lo8azlld 于 2021-06-26 发布在 Hive

关注(0)|答案(1)|浏览(517)

目前，我正在尝试采用大数据来取代我目前的数据分析平台。我目前的平台非常简单，我的系统从各种上游系统获得了大量结构化csv提要文件，然后，我们将它们作为java对象（即内存中）加载以进行聚合。
我正在寻找使用spark来代替我的java对象层来进行聚合过程。
我知道spark支持从hdfs/文件系统加载文件。因此，hive作为数据仓库似乎不是必须的。但是，我仍然可以先将csv文件加载到配置单元，然后使用spark从配置单元加载数据。
我的问题是，在我的情况下，如果我引入一个hive层，而不是直接将csv文件加载到spark-df，有什么好处。
谢谢。

Hive apache-spark bigdata

来源：https://stackoverflow.com/questions/43446717/any-benefit-for-my-case-when-using-hive-as-datawarehouse