pyspark 如何用我自己的错误描述覆盖spark错误消息

bhmjp9jg  于 2023-10-15  发布在  Spark
关注(0)|答案(1)|浏览(97)

我使用SparkSession类DataProcessor中的以下spark_reader方法

from pyspark.sql import SparkSession

def spark_reader(spark: SparkSession, options: dict) -> DataFrame:
        df = spark.read.load(**options)
        return df

当文件夹是阅读从不包含Parquet文件,它抛出错误消息AnalysisException: Unable to infer schema for Parquet. It must be specified manually.,但我想改变这更具体的东西,如folder contains no <file_type> files-有人知道如何改变错误消息?
我尝试在spark_reader方法中引发一个异常,但是Spark消息在到达异常之前就被引发了,并抛出了上面提到的错误。

fv2wmkja

fv2wmkja1#

这是你能做的最基本的事情。

def spark_reader(spark: SparkSession, options: dict) -> DataFrame:
        try:
            df = spark.read.load(**options)
            return df
        except AnalysisException:
            print("folder contains no <file_type> files")

相关问题