在hdfs中创建具有多个连接的动态查询

n6lpvg4x  于 2021-06-08  发布在  Hbase
关注(0)|答案(0)|浏览(208)

我的用例是,我想创建一个报告工具,其中大约有200个表,每个表有数百万行和100列。表之间将有多个连接,以最终创建报表。用户将有多个字段可供选择并从中创建报告。因此,查询将在运行时生成。我想知道,有什么可能是最好的大数据技术,可以用于这一目的。当前的rdbms可能无法在如此大的数据量下进行扩展。我们可以将所有数据转储到hdfs上,但是如何在hdfs上实现连接,这样报表应用程序的性能就不会受到太大的影响。任何真正的实现或链接或类似的用例类论文将帮助我很大的时间。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题