使用什么hdfs上的 Impala ,hbase上的 Impala 还是hbase?

7qhs6swi  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(390)

我正在进行概念验证任务。任务是使用hadoop技术实现我们产品的一个特性。
功能很简单,我们有一个用户界面,可以让您插入有关“网络问题”的详细信息。有关此问题的所有详细信息都被捕获并插入到oracledb的表中。然后我们处理此表中的数据并计算健康评分。
我必须使用hadoop而不是传统的db,所以我的问题是要做什么? Impala 在hdfs上?还是 Impala ?还是hbase?
我使用clouderavm来实现poc。
据我所知,hbase是nosql分布式数据库,实际上是hdfs上的一层,它提供了javaapi来访问数据。impala是一个工具,它还提供jdbc访问,以便通过hbase或直接通过hdfs访问数据。我对hadoop很陌生,能有人帮忙吗?

oyxsuwqo

oyxsuwqo1#

好吧,这取决于几件事,比如你将要执行的处理类型,期望的响应时间等等。但是看看你在这里写的东西,hbase似乎还不错。我现在还不需要 Impala 。hbase api很好,可以满足您的大部分需求。
imho,最好一开始就保持简单,只有在真正需要的时候才添加工具。这里也一样。如果您发现hbase api不能达到这个目的,那么您肯定可以将impala添加到堆栈中。
尽管如此,有一件事你应该牢记在心。hbase是一个nosqldb,不遵循rdbms惯例和术语。所以,一开始你可能会觉得有点奇怪。最好记住这一点,然后继续,因为您必须以一种完全不同于rdbms模式设计风格的方式来设计模式。

相关问题