我刚安装完hadoop。我正在从网上下载数据样本。我可以将哪些类型的数据放入hdfs?例如,我可以放excel表格吗?谢谢您
balp4ylt1#
hdfs可以存储结构化数据、半结构化数据和非结构化数据。
-结构化data:database tables,来自企业系统(erp、crm等)的数据-半结构化data:logs,xml文件-非结构化数据:图像、视频、word文档、pdf文件、文本文件。
rt4zxlrg2#
您可以将任何类型的数据放在hdfs(包括excel表)上。但是,您可能无法阅读它们。例如,除非excel上存在hdfs连接器,否则您将无法打开集群上的文件,并且必须将它们复制回您的计算机上。如果要从excel工作表中读取数据,最简单的方法是将每个工作表导出为csv,然后通过配置单元在hdfs上读取,因为有多个与excel兼容的odbc驱动程序(请参见此示例)。
brjng4g33#
不知道你在运行什么版本的hadoop,但是你可以在hortonworks上试试http://hortonworks.com/hadoop-tutorial/how-to-use-excel-2013-to-access-hadoop-data/
3条答案
按热度按时间balp4ylt1#
hdfs可以存储结构化数据、半结构化数据和非结构化数据。
每种类型的示例:
-结构化data:database tables,来自企业系统(erp、crm等)的数据
-半结构化data:logs,xml文件
-非结构化数据:图像、视频、word文档、pdf文件、文本文件。
rt4zxlrg2#
您可以将任何类型的数据放在hdfs(包括excel表)上。但是,您可能无法阅读它们。
例如,除非excel上存在hdfs连接器,否则您将无法打开集群上的文件,并且必须将它们复制回您的计算机上。
如果要从excel工作表中读取数据,最简单的方法是将每个工作表导出为csv,然后通过配置单元在hdfs上读取,因为有多个与excel兼容的odbc驱动程序(请参见此示例)。
brjng4g33#
不知道你在运行什么版本的hadoop,但是你可以在hortonworks上试试
http://hortonworks.com/hadoop-tutorial/how-to-use-excel-2013-to-access-hadoop-data/