我正在使用java为hadoop环境中的pig拉丁语创建一个用户定义的函数udf。我想创建多个输出文件。我尝试创建一个java程序来输出这些csv文件,如下所示:
public String exec(Tuple input)
throws IOException {
if(input.equals("age")){
outputFile = new FileWriter("C:\\UDF\\output_age.csv");
}else{
outputFile = new FileWriter("C:\\UDF\\output_general.csv");
}
}
但这行不通。有没有其他方法可以做到这一点,不管是通过java还是通过pig拉丁语本身?
1条答案
按热度按时间vm0i2vca1#
在编写udf时,需要注意数据类型。在这里
exec
方法将元组作为输入。要读取元组值,需要使用tuple.get(0)
符号。即您可以参考在pig中编写javaudf。