这里我的数据框如下所示:
+----------------+-------------+
| Business_Date| Code|
+----------------+-------------+
|1539129600000000| BSD|
|1539129600000000| BTN|
|1539129600000000| BVI|
|1539129600000000| BWP|
|1539129600000000| BYB|
+----------------+-------------+
我想把 Business_Date
列自 bigint
至 timestamp
将数据加载到配置单元表时的值。
我该怎么做?
1条答案
按热度按时间5w9g7ksd1#
你可以用
pyspark.sql.functions.from_unixtime()
哪个会将unix epoch(1970-01-01 00:00:00 utc)中的秒数转换为表示当前系统时区中该时刻的时间戳的字符串,格式为给定格式。
看来你的
Business_Date
需要除以1米才能转换为秒。例如:
df.printSchema()
root
|-- Business_Date: timestamp (nullable = true)
|-- Code: string (nullable = true)