在pyspark的输出文本文件中用multilpe行追加列名

ulydmbyx 于 2021-07-13 发布在 Spark

关注(0)|答案(0)|浏览(180)

使用pyspark读取一个空白文本文件。我必须用列名[开始时间，结束时间]附加开始时间和结束时间。每次代码运行时，它都会附加新行，列名将保持在文本文件中，所有这些都使用pyspark。现在我已经试过了。它不是添加一个标题到输出文本文件事件我已使标题=真。这个想法是在非常20分钟以下的命令将运行和更新的开始时间和结束时间将作为行添加到文本文件。

now = datetime.now()
end_time_lo = now.strftime("%d/%m/%Y %H:%M:%S")
print(end_time_lo)

path = r'C:\Users\320108174\chtn\matc\costa_factory\con_chart\Wallingford Project\start_end_time.txt'
start_end_time = [start_time_lo + " <----> " +end_time_lo]
df_l0 = spark.createDataFrame(start_end_time,StringType())
df_l0_txt_file = spark.read.format('text').option('header',False).load(path)
df_l0_txt_file = df_l0_txt_file.union(df_l0)
df_l0_txt_file = df_l0_txt_file.withColumnRenamed('value','L0_Notebook_Start_time----- 
L0_Notebook_End_time')
df_l0_txt_file.show(truncate=0)

df_l0_txt_file.coalesce(1).write.format('text').option('header',True).mode('overwrite').save(path)

Expected Output (text file):
Start Time                 End Time
12/02/2021 03:15:55 <----> 12/02/2021 07:14:46
12/02/2021 03:15:55 <----> 12/02/2021 07:14:46

apache-spark pyspark real-time

来源：https://stackoverflow.com/questions/66167804/append-column-names-with-multilpe-rows-in-output-text-file-in-pyspark

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

在pyspark的输出文本文件中用multilpe行追加列名

暂无答案！

相关问题

热门标签

最新问答