我有一个类似productusage
的框架:
| featureSk|个人号码|
| --|--|
| 一| 1001 |
| B| 1001 |
| C| 1003 |
| C| 1004 |
| 一| 1002 |
| B| 1005 |
我需要创建一个python函数,它有一个人的号码列表作为输入,并输出一个dateframe,其中有featureSk
列的值从productusage
作为列。基本上应该有一个列的每个featureSk
值和一个0的行,如果PersonNumber
不存在于productusage
和1,如果它确实存在于productusage
输出应该是一个pandas框架,如:
| 个人号码|一|B| C|
| --|--|--|--|
| 1001 | 1 | 1 | 0 |
| 1002 | 0 | 0 | 0 |
| 1003 | 0 | 0 | 1 |
这就是我所尝试的
def add_featureSk_to_dataframe(Person_list):
Person_list = pd.DataFrame(Person_list)
df = productusage
unique_values = df[featureSk].unique()
for value in unique_vaues:
for person in Persons_list:
df = df.withColumn(value, lambda person: 1 if person in Persons_list else 0)
return df
person_test = [1001,1002,1003]
add_featureSk_to_dataframe(person_test)
字符串
得到一个错误,即使定义了productusage
,也没有定义featureSk
2条答案
按热度按时间9q78igpj1#
使用
pd.crosstab
:字符串
印刷品:
型
zazmityj2#
字符串