spark数据集写入之间的差异

k75qkfdt  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(571)

我用的是spark java。
我需要知道以下写入hadoop方法之间是否存在任何差异(性能等):

  1. ds.write().mode(mode).format("orc").save(path);

  1. ds.write().mode(mode).orc(path);

谢谢。

w8rqjzmb

w8rqjzmb1#

没有区别 orc(path) 只是一种 format("orc").save(path) 同样适用于 .json(path) 以及 csv(path) 使用默认值 write(path) 没有Parquet地板

相关问题