Kaggle文件汇总错误(桑坦德价值预测挑战)

9wbgstp7  于 2022-10-23  发布在  其他
关注(0)|答案(2)|浏览(325)

获取提交错误:

ERROR: The value '7.63E+15' in the key column 'ID' has already been defined (Line 23029, Column 1).

挑战链接:https://www.kaggle.com/c/santander-value-prediction-challenge
提交文件负责人:

ID         target
0      000137c73  5.944923e+06
1      00021489f  5.944923e+06
2      0004d7953  5.944923e+06
3      00056a333  5.944923e+06
4      00056d8eb  5.944923e+06
oxosxuxt

oxosxuxt1#

我猜你已经使用了excel或LibreOffice Calc。在excel中打开文件以查看输出将折叠你的格式。通常,最好的做法是完全避免使用Excel。你在使用Python吗?最简单的方法是加载样本提交,替换目标列,然后保存:

ss = pd.read_csv('sample_submission.csv')
ss.loc[:, 'target'] = preds

ss.to_csv('sub.csv',
      index=False)
idv4meu8

idv4meu82#

发生此错误是因为文件中必须有冗余值。查看提交信息以检查提交文件的形状,然后验证您的文件是否具有相同数量的维度(它应该是额外的一行,即第23029行,其中“Id”列具有冗余值)。尝试删除重复值。为我工作。

相关问题