我在scala中使用sparksql来计算两列之间的差异
writingTime,time
2020-06-25T13:29:34.415Z,2020-06-25T13:29:33.190Z
我希望这两列之间的差值是1秒。
我使用了以下代码:
import org.apache.spark.sql.functions._
val df = spark.read.format("csv").option("header","true").load("path")
val diff_secs_col = col("time").cast("long") - col("writingTime").cast("long")
val resultDf = df.withColumn("date_diff_seconds", datediff(col("writingTime"), col("time"))).show()
有什么需要帮忙的吗
1条答案
按热度按时间3vpjnl9f1#
试试这个-