Pandas数据框架-强制数据属性

3qpi33ja  于 2023-01-24  发布在  其他
关注(0)|答案(1)|浏览(117)

我想加强Pandas数据表的属性。大多数情况下,表中“主键”的“唯一性”会很有趣。
有没有办法在不调用验证函数的情况下确保这些属性?如果对表的任何修改违反了定义的规则,panda最好抛出一个错误。
我已经找到了一个pandera包,它只在验证函数被调用时才起作用。任何时候都不会对表强制执行检查。

9udxz4iz

9udxz4iz1#

可以使用set_index()函数将一列或一组列设置为DataFrame的索引。
您应该注意到,如果列不是唯一的(有重复),那么Pandas将引发KeyError
这个问题没有实际的代码需要调试,所以我发布了一个锅炉板的例子,我可能看起来像:

import pandas as pd
df = pd.read_csv("data.csv")
df = df.set_index("id")

这有不同的变体。

相关问题