我有一个Excel电子表格,其中包含每月每一天的记录。不幸的是,数据集的格式很笨拙,很难进行分析。我想将数据重组成表格格式,每个标题下的日期、地点和相应数量列。我已经附上了当前格式的图像以及所需的输出。
当前格式
0 1 2 3 4 5 6 7 8 9
0 01/01/2023 NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 Venue1 QTY Venue2 QTY Venue3 QTY Venue4 QTY Venue5 QTY
2 A 0 A 0 A 1 A 0 A 0
3 B 17 B 3 B 11 B 3 B 0
4 C 0 C 0 C 1 C 0 C 0
5 D 0 D 0 D 29 D 0 D 0
6 E 0 E 0 E 0 E 0 E 0
7 F 0 F 0 F 0 F 0 F 0
8 G 0 G 0 G 0 G 0 G 0
9 H 0 H 0 H 0 H 0 H 0
10 02/01/2023 NaN NaN NaN NaN NaN NaN NaN NaN NaN
11 Venue1 QTY Venue2 QTY Venue3 QTY Venue4 QTY Venue5 QTY
12 A 0 A 0 A 1 A 0 A 0
13 B 11 B 3 B 0 B 6 B 2
14 C 0 C 0 C 0 C 0 C 0
15 D 20 D 0 D 28 D 0 D 24
16 E 0 E 0 E 0 E 0 E 0
17 F 0 F 0 F 0 F 0 F 0
18 G 0 G 0 G 0 G 0 G 0
19 H 0 H 0 H 0 H 0 H 0
必填格式
我试过在pandas中进行操作,但我不确定如何准确地进行操作以获得预期的结果。任何建议或示例代码将不胜感激。谢谢你!
1条答案
按热度按时间lskq00tm1#
下面是使用pandas reshaping的一种方法:
输出: