我试图在hadoop中以append模式保存一个Dataframe。
命令如下:
df.repartition(5).map((row)=>row.toString()).write.mode(SaveMode.Append).text(op_dir)
问题是hdfs文本文件中的数据在行首和行尾有额外的方括号
hadoop dfs -cat op_dir/part*
[1,asdf,p1,Y]
[2,qwer,p2,N]
[3,,p5,Y]
请建议如何在不附加方括号或圆括号的情况下编写Dataframe
3条答案
按热度按时间zf9nrax11#
这会解决你的问题-
编辑-1(基于评论)
所有控制字符都使用十进制
xuo3flqw2#
你能做到的
还是这个
笔记
如果你想写(标题的开始)字符,你可以尝试在八进制模式
但已弃用,或使用unicode
clj7thdc3#
你可以用csv格式写