如何使用pyspark将读取的csv文件显示到正确的文件夹中？

yftpprvb 于 2023-11-14 发布在 Spark

关注(0)|答案(1)|浏览(168)

我试图从本地文件读取CSV文件，并显示需要应用SQL的数据。在这里，我能够从文件夹中读取文件，但在显示DF时，它仍然是不可读的格式（截图附后）。我尝试了下面的代码来读取和显示DF。你能帮我克服这个问题吗？谢谢。

的数据

from pyspark.sql import SparkSession
sc = SparkSession.builder.appName('PySpark Session').getOrCreate()
df = sc.read.option("header",True).csv("C:/Users/l/Desktop/data.csv") 
df.show()
another method :
df = sc.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('C:/Users/l/Desktop/data.csv')

字符串

csv

来源：https://stackoverflow.com/questions/77372448/how-to-display-the-read-csv-file-to-proper-dataframe-using-pyspark

1条答案

按热度按时间

piah890a1#

看起来你的编码有问题
尝试将另一个.option与encoding = 'UTF-8'链接：

df = sc.read.option("header",True).option("encoding", "UTF-8").csv("C:/Users/l/Desktop/data.csv")

字符串

赞(0）回复(0）举报 2023-11-14

我来回答

如何使用pyspark将读取的csv文件显示到正确的文件夹中？

1条答案

相关问题

热门标签

最新问答