在Python中,我使用纵向学校数据,有6个数据子集,每个子集都有相同的4年学校数据(4个文件)和相同的学生。每个子集代表不同的东西,如标准化考试成绩,出勤数据等。
我想做的是将它们合并到一个大文件中,其中每个学生ID最好按年份堆叠,并具有来自所有子集的列。例如,假设学生ID号为123456,我希望大数据集看起来像这样:
学生证年考试成绩缺课天数...
123456 2016 97 10
123456 2017 91 14
123456 2018 94 16
假设其中一个子集被称为“考试成绩”,其中有4个文件名为2016,2017,2018和2019。我如何将这4个文件合并在一起,以便它们根据每个学年的学生ID号堆叠,就像上面一样?
在我合并了这个子集的文件之后,假设还有一个子集叫做“成就”,它是教师对学生的评价。其中一个变量是相同的学生id,另一个变量叫做等级。我该如何将基于学生ID号的年级列合并到合并的考试成绩文件中,以便考试成绩合并数据集中的学生现在具有与之相关的等级
谢谢!
1条答案
按热度按时间46scxncf1#
IIUC,您需要组合
concat
/merge
:输出: