我想通过sqoop将hdfs中的输入数据导出到postgress db中。当我的输入数据与postgress表的格式正确时,我就能够做到这一点。但我想在将输入数据导出到db之前对其执行一些操作,比如说,在放入每个值之前,我想为每个值添加一些no。那么,sqoop是否提供了这样的API来实现这个。。sqoop公司version:1.4.6
2skhul331#
sqoop在导出时不支持任何操作。它只是以export dir作为输入。您可以使用pig/hive对导入的数据执行一些操作,并且输出数据集可以导出回postgress db。
1条答案
按热度按时间2skhul331#
sqoop在导出时不支持任何操作。它只是以export dir作为输入。您可以使用pig/hive对导入的数据执行一些操作,并且输出数据集可以导出回postgress db。