Spark塞不工作

rqcrx0a6 于 2021-05-27 发布在 Spark

关注(0)|答案(1)|浏览(384)

我使用的是scala 2.11的spark core版本2.0.1。我有简单的代码来读取一个csv文件，它有\转义符。

val myDA = spark.read
      .option("quote",null)
    .schema(mySchema)
    .csv(filePath)

根据文档\是csv读取器的默认转义。但它不起作用。spark正在读取\作为我数据的一部分。例如：csv文件中的city列是north rocks\，au。我期待城市专栏应该读在代码为北岩，澳州。但spark却把它读作northrocks\并把au移到下一列。
我试过以下方法，但没有成功：
显式定义的escape.option（“escape”，“\”）
在文件和代码中将escape改为| or:
我试过使用spark csv库
有人面临同样的问题吗？我错过什么了吗？
谢谢

apache-spark spark-csv

来源：https://stackoverflow.com/questions/40288086/spark-csv-escape-not-working