我们可以在hdfs中存储关系数据吗

ubof19bj  于 2021-06-03  发布在  Hadoop
关注(0)|答案(2)|浏览(309)

我正在尝试转换一个以关系数据库为后端的应用程序。我也可以在hdfs中存储数据关系吗?

yvgpqqbh

yvgpqqbh1#

任何文件都可以存储在hdfs中。但是如果你想要一个sql类型的db,你应该选择hbase。如果您直接将数据存储到hdfs中,您将无法存储数据。

lrl1mhuk

lrl1mhuk2#

为了存储,您可以在hdfs中存储任何内容。但这毫无意义。首先,您不应该认为hadoop是rdbms的替代品(您正在尝试这样做)。两者的目的完全不同。hadoop并不适合您的事务、关系或实时需求。它是为了满足您的离线批处理需要。所以,最好正确地分析用例,然后冻结决策。
作为一个建议,我想把你引向Hive。它在现有hadoop集群的基础上为您提供了仓储功能。它还为您的仓库提供了一个类似sql的接口,如果您来自sql后台,这将使您的生活更加轻松。不过,hive也是一个批处理系统,如果您需要实时处理,它并不适合。
不过,您可以看看hbase,正如abhinav所建议的那样。它是一个可以在hadoop集群上运行的数据库,为您提供对数据的随机、实时读/写访问。但是您应该记住一件事,那就是它是一个nosqldb。它不遵循sql术语和约定。所以,一开始你可能会觉得有点陌生。您可能需要考虑一些问题,例如如何以新的存储样式(列式)存储数据,而不是rdbms的行式存储。否则设置和使用它就不是问题了。
hth公司

相关问题