您可以将什么类型的数据放入hdfs

sr4lhrrt  于 2021-06-03  发布在  Hadoop
关注(0)|答案(3)|浏览(254)

我刚安装完hadoop。我正在从网上下载数据样本。
我可以将哪些类型的数据放入hdfs?例如,我可以放excel表格吗?
谢谢您

balp4ylt

balp4ylt1#

hdfs可以存储结构化数据、半结构化数据和非结构化数据。

每种类型的示例:

-结构化data:database tables,来自企业系统(erp、crm等)的数据
-半结构化data:logs,xml文件
-非结构化数据:图像、视频、word文档、pdf文件、文本文件。

rt4zxlrg

rt4zxlrg2#

您可以将任何类型的数据放在hdfs(包括excel表)上。但是,您可能无法阅读它们。
例如,除非excel上存在hdfs连接器,否则您将无法打开集群上的文件,并且必须将它们复制回您的计算机上。
如果要从excel工作表中读取数据,最简单的方法是将每个工作表导出为csv,然后通过配置单元在hdfs上读取,因为有多个与excel兼容的odbc驱动程序(请参见此示例)。

brjng4g3

brjng4g33#

不知道你在运行什么版本的hadoop,但是你可以在hortonworks上试试
http://hortonworks.com/hadoop-tutorial/how-to-use-excel-2013-to-access-hadoop-data/

相关问题