这个问题在这里已经有答案了:
将pyspark字符串转换为日期格式(6个答案)
spark dataframe列字符串到日期[重复](1个答案)
5个月前关门了。
我在pyspark dataframe中有一个字段,由时间(数据类型:sting)组成,格式为mm dd yy,hr mm ss。它看起来像:
+--------------------+
|timestamp |
+--------------------
| 04-04-2019,18:34:38|
| 04-05-2019,14:02:56|
| 04-06-2019,01:06:08|
| 04-06-2019,17:20:25|
| 04-12-2019,23:33:46|
如何将此字段转换为类似yyyy-mm-dd的字符串,如“2019-04-04”?
1条答案
按热度按时间bihw5rsg1#
使用
to_date()
格式为的函数MM-dd-yyyy
Example:
```df.show()
+-------------------+
| timestamp|
+-------------------+
|04-04-2019,18:34:38|
+-------------------+
from pyspark.sql.functions import *
df.withColumn("date",to_date(col("timestamp"),"MM-dd-yyyy")).show()
+-------------------+----------+
| timestamp| date|
+-------------------+----------+
|04-04-2019,18:34:38|2019-04-04|
+-------------------+----------+