hdfs的数据源

5jdjgkvh  于 2021-06-03  发布在  Hadoop
关注(0)|答案(2)|浏览(460)

我想澄清以下几点:
hdfs如何获取it数据?
它是否从一些数据库中获取数据,如果是这样的话,那就意味着我们需要一个中央数据库。或者,它是否直接从单个终端机器获取数据(例如,在本例中,所有事务都发生在一个shops系统中),然后将其保存为块?
我知道hdfs是如何工作的(google搜索了很多),但只是对上面提到的几点感到困惑。
谢谢你的帮助。。。
谢谢,潘卡吉

iqih9akk

iqih9akk1#

你的问题听起来不太清楚。它取决于将数据写入hdfs的客户机。hdfs本身不会从任何地方提取数据。hdfs客户机的职责是从源中提取数据并将其转储到hdfs中。源可以是任何东西,从后端数据库到前端计算机。
客户端从源读取数据并将其缓存到临时本地文件中。当这个本地文件累积的数据超过一个hdfs块大小时,客户机在namenode的帮助下将其写入datanode。
所以,这取决于你从哪里读取数据。如果这不是你要找的,我很抱歉。如果是这样的话,请给我提供更多的细节,我会相应地更新答案。

jxct1oxe

jxct1oxe2#

您需要自己将数据加载到hdfs中。如果您使用的是配置单元表,则可以使用以下查询:配置单元>将数据[本地]inpath“数据文件路径”加载到表yourtablename中

相关问题