我正在尝试用选项sheetname将Dataframe写入csv文件,但它不适合我。
df13.coalesce(1).write.option("delimiter",",").mode(SaveMode.Overwrite).option("sheetName","Info").option("header","true").option("escape","").option("quote","").csv("path")
有人能帮我吗
我正在尝试用选项sheetname将Dataframe写入csv文件,但它不适合我。
df13.coalesce(1).write.option("delimiter",",").mode(SaveMode.Overwrite).option("sheetName","Info").option("header","true").option("escape","").option("quote","").csv("path")
有人能帮我吗
3条答案
按热度按时间50pmv0ei1#
我们只能在csv文件中有一个默认工作表如果我们想要多个工作表,那么我们应该将数据框写入excel格式而不是csv文件格式。
3hvapo4f2#
spark不能直接在写作的时候这样做
csv
,没有选择sheetName
,输出路径是您提到的.csv(“路径”)路径。spark使用hadoops文件格式,它在输出路径下的多个部分文件中进行分区,在您的案例中是一个部分文件。另外,除非您真的需要,否则不要将分区重新划分为1。
您可以做的一件事是编写Dataframe而不重新分区,并使用hadoopapi将这些小的多部分文件合并到单个文件中。
这里有更多关于使用spark csv编写单个csv文件的详细信息
9rnv2umw3#
我不认为在csv文件中实际上有一个表名,理想情况下,文件名是csv文件中的表名。你能试着换成excel然后试着。。