我正在使用数据库,我正在从一个桶中阅读.csv文件。
MOUNT_NAME = "myBucket/"
ALL_FILE_NAMES = [i.name for i in dbutils.fs.ls("/mnt/%s/" % MOUNT_NAME)] \
dfAll = spark.read.format('csv').option("header", "true").schema(schema).load(["/mnt/%s/%s" % (MOUNT_NAME, FILENAME) for FILENAME in ALL_FILE_NAMES])
我想同时在那里写一个表格。
myTable.write.format('com.databricks.spark.csv').save('myBucket/')
1条答案
按热度按时间ibps3vxo1#
下面的代码片段显示了如何在DBFS和S3上将 Dataframe 保存为单个CSV文件。
或