我在hdfs中有逗号分隔的数据,我想把它转换成向量,与mahouts kmeans一起使用。马霍特有旗帜 seqdirectory 以及 seq2sparse 将目录中的数据转换为向量的。给出的示例是针对文本文件的。是否有一个等效的csv标志,或者有一个关于如何创建这样的文件的教程?
seqdirectory
seq2sparse
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!