我拥有的数据格式如下:
col_1 col_2 col_3
NaN NaN NaN
Date 21-04-2022 NaN
Id Name status
01 A11 Pass
02 A22 F_1
03 A33 P_2
SUMMARY 'Total :$20 Approved $ 10' NaN
NaN NaN NaN
Date 22-04-2022 NaN
Id Name status
04 A12 P_2
05 A23 F_1
06 A34 P_2
SUMMARY 'Total :$30 Approved $ 20' NaN
预期输出:df_1-
Id Name status
01 A11 Pass
02 A22 F_1
03 A33 P_2
SUMMARY 'Total :$20 Approved $ 10' NaN
二氟甲烷
Id Name status
04 A12 P_2
05 A23 F_1
06 A34 P_2
SUMMARY 'Total :$30 Approved $ 20' NaN
以上只是样本数据。实际的列数,我有大约24K。因此,许多df的将创建如何才能接近...?
4条答案
按热度按时间bq3bfh9z1#
您可以用途:
输出:
更新:导出到excel:
but5z9lq2#
您可以创建一个辅助的布尔列,并使用它将 Dataframe 分割成更小的部分:
jyztefdp3#
受piRSquared的答案here的启发,您可以像这样接近您的目标:
NB:我们使用
globals
动态创建变量/子 Dataframe 。#输出:
oewdyzsn4#
使用下面的代码,可以选择所需的行作为列名,并将所需的行作为新数据框行。
输出df_1:
输出df_2: