我使用SparkSession类DataProcessor中的以下spark_reader方法
from pyspark.sql import SparkSession
def spark_reader(spark: SparkSession, options: dict) -> DataFrame:
df = spark.read.load(**options)
return df
当文件夹是阅读从不包含Parquet文件,它抛出错误消息AnalysisException: Unable to infer schema for Parquet. It must be specified manually.
,但我想改变这更具体的东西,如folder contains no <file_type> files
-有人知道如何改变错误消息?
我尝试在spark_reader方法中引发一个异常,但是Spark消息在到达异常之前就被引发了,并抛出了上面提到的错误。
1条答案
按热度按时间fv2wmkja1#
这是你能做的最基本的事情。