我有一个pyspark Dataframe 列,其值如下:
+----------------------------+
| date_string|
+----------------------------+
| 22JUL2020:20:35:36.009269|
| 22JUL2020:20:41:45.483747|
我想把这个字符串列转换成时间戳,所以我使用了下面的代码:
第一个
我应该使用什么格式才不会丢失秒后的数字?我尝试了以下格式,但总是得到null:
第一个
2条答案
按热度按时间3pvhb19x1#
使用
SSSSSS
,即S
重复的次数与字符串中毫秒的位数相同:完整的工作示例:
6pp0gazn2#
您还需要指定每个
microsecond
的精度,以便完全解析作为TO_TIMESTAMP
中的输入的日期格式有关可用解析选项的详细列表,请参阅-DateTime Patters
至时间戳