我想澄清以下几点:hdfs如何获取it数据?它是否从一些数据库中获取数据,如果是这样的话,那就意味着我们需要一个中央数据库。或者,它是否直接从单个终端机器获取数据(例如,在本例中,所有事务都发生在一个shops系统中),然后将其保存为块?我知道hdfs是如何工作的(google搜索了很多),但只是对上面提到的几点感到困惑。谢谢你的帮助。。。谢谢,潘卡吉
iqih9akk1#
你的问题听起来不太清楚。它取决于将数据写入hdfs的客户机。hdfs本身不会从任何地方提取数据。hdfs客户机的职责是从源中提取数据并将其转储到hdfs中。源可以是任何东西,从后端数据库到前端计算机。客户端从源读取数据并将其缓存到临时本地文件中。当这个本地文件累积的数据超过一个hdfs块大小时,客户机在namenode的帮助下将其写入datanode。所以,这取决于你从哪里读取数据。如果这不是你要找的,我很抱歉。如果是这样的话,请给我提供更多的细节,我会相应地更新答案。
jxct1oxe2#
您需要自己将数据加载到hdfs中。如果您使用的是配置单元表,则可以使用以下查询:配置单元>将数据[本地]inpath“数据文件路径”加载到表yourtablename中
2条答案
按热度按时间iqih9akk1#
你的问题听起来不太清楚。它取决于将数据写入hdfs的客户机。hdfs本身不会从任何地方提取数据。hdfs客户机的职责是从源中提取数据并将其转储到hdfs中。源可以是任何东西,从后端数据库到前端计算机。
客户端从源读取数据并将其缓存到临时本地文件中。当这个本地文件累积的数据超过一个hdfs块大小时,客户机在namenode的帮助下将其写入datanode。
所以,这取决于你从哪里读取数据。如果这不是你要找的,我很抱歉。如果是这样的话,请给我提供更多的细节,我会相应地更新答案。
jxct1oxe2#
您需要自己将数据加载到hdfs中。如果您使用的是配置单元表,则可以使用以下查询:配置单元>将数据[本地]inpath“数据文件路径”加载到表yourtablename中