如何在python或PySpark中将一列拆分为3列

vlju58qv 于 2022-11-01 发布在 Spark

关注(0)|答案(3)|浏览(209)

我有：

Customerkeycode
B01:B14:110083

我希望：

PlanningCustomerSuperGroupCode, DPGCode, APGCode
BO1,                            B14,     110083

pyspark

来源：https://stackoverflow.com/questions/74134988/how-to-split-one-column-into-3-columns-in-python-or-pyspark

3条答案

按热度按时间

lrl1mhuk1#

import pandas as pd

df = pd.DataFrame(
    {
        "Customerkeycode": [
            "B01:B14:110083",
            "B02:B15:110084"
        ]
    }
)

df['PlanningCustomerSuperGroupCode'] = df['Customerkeycode'].apply(lambda x: x.split(":")[0])
df['DPGCode'] = df['Customerkeycode'].apply(lambda x: x.split(":")[1])
df['APGCode'] = df['Customerkeycode'].apply(lambda x: x.split(":")[2])

df_rep = df.drop("Customerkeycode", axis = 1)

print(df_rep)

   PlanningCustomerSuperGroupCode DPGCode APGCode
0                            B01     B14  110083
1                            B02     B15  110084

赞(0）回复(0）举报 2022-11-01

cidc1ykv2#

按“：”拆分为3列，列名称为[“计划客户超级组代码”、“DPGCode”、“APGCode”]

import pyspark.sql.functions as F

df.withColumn('PlanningCustomerSuperGroupCode', F.split(F.col('Customerkeycode'), ':')[0]) \
    .withColumn('DPGCode', F.split(F.col('Customerkeycode'), ':')[1]) \
    .withColumn('APGCode', F.split(F.col('Customerkeycode'), ':')[2]) \
    .drop('Customerkeycode') \
    .show()

赞(0）回复(0）举报 2022-11-01

我来回答

如何在python或PySpark中将一列拆分为3列

3条答案

相关问题

热门标签

最新问答