因此,我有Excel数据表,其中有20列的东西,客户有要求,他们想知道,如果任何列是从Excel中丢失的,我使用Pandas转换数据到数据框,我使用如果语句的几列,但作为其刚性的解决方案,他们想要更好的任何建议?有任何库吗?谢谢我想检查文件是否有所有必需的列,并显示检查文件,如果有一些错误
z9smfwbn1#
这里我创建了一个 Dataframe ,但您将使用df = pd.read_excel('myfile.xlsx)'我的数据框只有以下三列
df = pd.read_excel('myfile.xlsx
data = {'Name':['Tom', 'Nick', 'Sarah', 'Jack'], 'Age':[20, 21, 19, 18], 'Sex':['M', 'M', 'F', 'M']} df = pd.DataFrame(data)
我会列一张所需科目的清单
REQUIRED_COLUMNS = [ 'Name', 'Age', 'Occupation', 'Sex' ] # I'll make the columns a set to avoid O^2 looping. dfColumns = set(df.columns) for col in REQUIRED_COLUMNS: if col not in dfColumns: print(f"Column '{col}' is missing.")
就是这样
>>> Column 'Occupation' is missing.
1条答案
按热度按时间z9smfwbn1#
这里我创建了一个 Dataframe ,但您将使用
df = pd.read_excel('myfile.xlsx
)'我的数据框只有以下三列
我会列一张所需科目的清单
就是这样