python 机器学习:在预处理中使用对象数组

kknvjkwl  于 2023-04-19  发布在  Python
关注(0)|答案(1)|浏览(114)

我们一直面临着一个问题,在预处理我们的项目,有些列包含一个数组的对象(字典)一样
| 色谱柱A|B栏|
| --------------|--------------|
| 电影1|[{“iso_639_1”:“en”,“name”:“英语”},{“iso_639_1”:“zh”,“name”:“\u666e\u901a\u8bdd”}|
| 电影2|[{“iso_639_1”:“da”,“name”:“Dansk”},{“iso_639_1”:“en”,“name”:“英语”},{“iso_639_1”:“否”,“名称”:“Norsk”},{“iso_639_1”:“ru”,“name”:”}]|
所以给我们提出一个解决这个问题想法可能会有所帮助
我不知道如何处理这样的问题

e0uiprwp

e0uiprwp1#

尝试:

from ast import literal_eval

# optional: apply literal_eval if values in "Column B" are strings
#df['Column B'] = df['Column B'].apply(literal_eval)

df = df.explode('Column B')
df = pd.concat([df, df.pop('Column B').apply(pd.Series)], axis=1)
print(df)

图纸:

Column A iso_639_1     name
0   movie1        en  English
0   movie1        zh      普通话
1   movie2        da    Dansk
1   movie2        en  English
1   movie2        no    Norsk
1   movie2        ru  Pусский

相关问题