如何在mahout中使用多个输入文件创建数据模型?

nhn9ugyo  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(407)

我想用许多*.csv文件制作数据模型。(这些文件格式相同,数据不同)
但是,我不知道怎么做。
我无法通过mahout文档找到函数
“将多个*.csv文件转换为一个*.csv文件的模块”唯一解决方案?
请帮忙。。。!

ergxz8rk

ergxz8rk1#

您可以合并所有的*.csv文件,即按以下方式合并两个文件

public static void main(String [] args) throws IOException{
    BufferedReader reader = new BufferedReader(new FileReader("YOUR_SOURCE_1"));
    BufferedReader reader2 = new BufferedReader(new FileReader("YOUR_SOURCE_2"));
    BufferedWriter writer = new BufferedWriter(new FileWriter("YOUR_TARGET");
    int x = 0;
    while ((line = reader.readLine()) != null) {
        if (x > 0) {
            String [] values = line.split("\\t", -1);
            writer.write(values[0] + "," + values[1]+","+values[2]+"\n");
        }
        x++;
    }
    String line;
    int x = 0;
    while ((line = reader.readLine()) != null) {
        if (x > 0) {
            String [] values = line.split("\\t", -1);
            writer.write(values[0] + "," + values[1]+","+values[2]+"\n");
        }
        x++;
    }
    reader.close();
    reader2.close();
    writer.close();
}

相关问题