有没有办法把.xlsx文件加载到pig中?我需要在pig中使用excel文件[.xlsx]作为输入执行一个操作,但是我找不到任何可用于此目的的内置函数。?实现这一目标的任何帮助都是可观的。谢谢,
piok6c0g1#
没有,但是如果您的excel只有一张表,那么您可以尝试使用csvexcelstorage如何使用?检查以下链接中的清管器示例http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/csvexcelstorage.html
gab6jxml2#
试试这个,首先将xlsx文件转换为csv,然后执行以下操作,
REGISTER Location\to\piggybank.jar Data = load 'Location\to\csv\file' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'NOCHANGE', 'SKIP_INPUT_HEADER') as (col1,col2,..);
它(csvexcelstorage)对我有用。希望有用。
2条答案
按热度按时间piok6c0g1#
没有,但是如果您的excel只有一张表,那么您可以尝试使用csvexcelstorage
如何使用?检查以下链接中的清管器示例
http://pig.apache.org/docs/r0.9.1/api/org/apache/pig/piggybank/storage/csvexcelstorage.html
gab6jxml2#
试试这个,
首先将xlsx文件转换为csv,然后执行以下操作,
它(csvexcelstorage)对我有用。希望有用。