我在Pyspark中有一个 Dataframe ,其中包含一个名为"report_date"的日期列。
我想创建一个名为"report_date_10"的新列,该列将在原始report_date列的基础上添加10天。
下面是我尝试的代码:
df_dc["report_date_10"] = df_dc["report_date"] + timedelta(days=10)
这是我得到的错误:
属性错误:"datetime. timedelta"对象没有属性"_get_object_id"
救命!谢谢
1条答案
按热度按时间l5tcr1uw1#
您似乎使用了
pandas
语法来添加列;对于spark,您需要使用withColumn
添加一个新列;为了添加日期,有内置的date_add
函数: