我想加强Pandas数据表的属性。大多数情况下,表中“主键”的“唯一性”会很有趣。有没有办法在不调用验证函数的情况下确保这些属性?如果对表的任何修改违反了定义的规则,panda最好抛出一个错误。我已经找到了一个pandera包,它只在验证函数被调用时才起作用。任何时候都不会对表强制执行检查。
9udxz4iz1#
可以使用set_index()函数将一列或一组列设置为DataFrame的索引。您应该注意到,如果列不是唯一的(有重复),那么Pandas将引发KeyError。这个问题没有实际的代码需要调试,所以我发布了一个锅炉板的例子,我可能看起来像:
set_index()
KeyError
import pandas as pd df = pd.read_csv("data.csv") df = df.set_index("id")
这有不同的变体。
1条答案
按热度按时间9udxz4iz1#
可以使用
set_index()
函数将一列或一组列设置为DataFrame的索引。您应该注意到,如果列不是唯一的(有重复),那么Pandas将引发
KeyError
。这个问题没有实际的代码需要调试,所以我发布了一个锅炉板的例子,我可能看起来像:
这有不同的变体。