pandas 使用元组保存文档

f4t66c6m  于 2022-12-09  发布在  其他
关注(0)|答案(1)|浏览(117)

我有一个包含多个列的数据集,每个列都包含元组数据。我想保存这些数据,这样我就可以在不同的python笔记本中调用它,而不必再次运行所有的东西。任何格式都可以(csv,JSON等)。
| 标识符|位置标签|干净数据|
| - -|- -|- -|
| 一个|[(桑加特,RB),(拜克,JJ)]|[白]|
| 2个|[(sangat,RB),(membantu,VB)]|[曼班图]|
| 三个|[(肯尼亚,WH),(肯尼亚,NN),(肯尼亚,NN),(系统,NN),(巴亚尔,VB),(比萨,MD)]|[参数、系统、参数]|
这是我目前发现的...

df.to_pickle('test.pkl')
new_df = pd.read_pickle('test.pkl')

还需要有关如何调用数据的帮助。

deikduxw

deikduxw1#

为了防止您希望将数据写入csv并将其检索回来,我有一个示例:

# Sample dataframe written to csv file and read back
d = {'id': [1, 2], 'pos_tag': [(1, 2), ("a", "b", "c")]}
df1 = pd.DataFrame(d)
df1.to_csv("/content/df1.csv", sep="|", index=False)
df2 = pd.read_csv("/content/df1.csv", sep="|", )
df2.head()

我用管道分隔符将其保存为csv,只是为了确保它与其他文字(如逗号、分号等)不同。

# Retrieve tuple values
df2['pos_tag'] = [eval(s) for s in df2['pos_tag']] 
df2.head()

相关问题