我得到了以下Dataframe:
+--------+---------------+--------------------+---------+
|province| city| infection_case|confirmed|
+--------+---------------+--------------------+---------+
| Seoul| Yongsan-gu| Itaewon Clubs| 139|
| Seoul| Gwanak-gu| Richway| 119|
| Seoul| Guro-gu| Guro-gu Call Center| 95|
| Seoul| Yangcheon-gu|Yangcheon Table T...| 43|
| Seoul| Dobong-gu| Day Care Center| 43|
现在我想根据csv文件更改列名(第一行),如下所示:
province,any_other__name
city,any_other__name
infection_case,any_other__name
confirmed,any_other__name
这是我的密码:
cases = spark.read.load("/home/tool/Desktop/database/TEST/archive/Case.csv",format="csv", sep=",", inferSchema="true", header="true")
cases = cases.select('province','city','infection_case','confirmed')
cases \
.write \
.mode('overwrite') \
.option('header', 'true') \
.csv('8.csv')
3条答案
按热度按时间voase2hg1#
这里的解决方案rename在pyspark中使用selectexpr()使用“as”关键字将列“old\u name”重命名为“new\u name”。
nbewdwxp2#
最好的解决办法是使用
withColumnRenamed
方法。xmd2e60i3#