我有一个供应商提供的文件,它将n
药物存储在由;
分隔的单列中。我正在努力尝试melt
,然后groupby
dateframe。
meds = meds.melt(id_vars=['Vendor', 'patientid'], value_name='Medication')
meds = meds.loc[meds['Medication'].notnull()]
我希望它看起来像这样:
但由于 'variable' 发生了变化,因此聚合将出错。
meds_final = meds.groupby(['Vendor', 'patientid', 'Medication']).count()
1条答案
按热度按时间toiithl61#
原来在我分开列后我忘记了剥离它,所以“药物A”是“药物A”或“药物A”,因此groupby没有做我希望的事情:-)