如何在pyspark中将带有日期(字符串)的列转换为只包含日期的列

ddrv8njm  于 2021-07-26  发布在  Java
关注(0)|答案(1)|浏览(452)

我有一个带有“created\u at”列的数据框,其中包含如下日期:

Mon Jan 27 17:16:46 +0000 2020

我想将此列日期转换为:

2020-01-27

我在Pypark怎么做?

jtw3ybtb

jtw3ybtb1#

有关日期时间字符的更多详细信息,请参阅jave simpledate格式。

df.show(truncate=False) #sample dataframe

# +------------------------------+

# |created_at                    |

# +------------------------------+

# |Mon Jan 27 17:16:46 +0000 2020|

# +------------------------------+

from pyspark.sql import functions as F

df.withColumn("created_at", F.to_date("created_at","EEE MMM dd HH:mm:ss +SSSS yyyy")).show()

# +----------+

# |created_at|

# +----------+

# |2020-01-27|

# +----------+

相关问题