import os
# path of the directory
path = "/Users/test/Downloads/ABC.csv"
# Getting the list of directories
dir = os.listdir(path)
# Checking if the list is empty or not
if len(dir) == 0:
df = spark.createDataFrame([], StructType([]))
else:
df = spark.read.parquet("/Users/test/Downloads/ABC.csv")
或者如果你只想搜索 parquet 文件是否存在于文件夹中,那么就这样做,
import glob
import os.path
# path of the directory
path = "/Users/test/Downloads/ABC.csv"
parquet_files = glob.glob(os.path.join(path, '*.parquet'))
# Checking if the list is empty or not
if len(parquet_files) == 0:
df = spark.createDataFrame([], StructType([]))
else:
df = spark.read.parquet("/Users/test/Downloads/ABC.csv")
2条答案
按热度按时间ygya80vv1#
示例代码段。请根据输入文件进行修改。
mbyulnm02#
可以像这样使用Python检查文件夹是否为空,
或者如果你只想搜索 parquet 文件是否存在于文件夹中,那么就这样做,