我试图从本地文件读取CSV文件,并显示需要应用SQL的数据。在这里,我能够从文件夹中读取文件,但在显示DF时,它仍然是不可读的格式(截图附后)。我尝试了下面的代码来读取和显示DF。你能帮我克服这个问题吗?谢谢。
的数据
from pyspark.sql import SparkSession
sc = SparkSession.builder.appName('PySpark Session').getOrCreate()
df = sc.read.option("header",True).csv("C:/Users/l/Desktop/data.csv")
df.show()
another method :
df = sc.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('C:/Users/l/Desktop/data.csv')
字符串
1条答案
按热度按时间piah890a1#
看起来你的编码有问题
尝试将另一个
.option
与encoding = 'UTF-8'
链接:字符串