将xlsx文件加载到pig中

m0rkklqb  于 2021-06-21  发布在  Pig
关注(0)|答案(2)|浏览(295)

有没有办法把.xlsx文件加载到pig中?我需要在pig中使用excel文件[.xlsx]作为输入执行一个操作,但是我找不到任何可用于此目的的内置函数。?
实现这一目标的任何帮助都是可观的。
谢谢,

piok6c0g

piok6c0g1#

没有,但是如果您的excel只有一张表,那么您可以尝试使用csvexcelstorage
如何使用?检查以下链接中的清管器示例
http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/csvexcelstorage.html

gab6jxml

gab6jxml2#

试试这个,
首先将xlsx文件转换为csv,然后执行以下操作,

REGISTER Location\to\piggybank.jar

Data = load 'Location\to\csv\file' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'NOCHANGE', 'SKIP_INPUT_HEADER') as (col1,col2,..);

它(csvexcelstorage)对我有用。希望有用。

相关问题