好吧,我已经在这方面工作了几个小时,并试图搜索多个其他答案,但似乎无法找到我所需要的。我有一个员工的数据框架,他们在一个 *.csv文件上有可变数量的时钟和时钟,我正在导入到Pandas数据框架中。例如:
| 姓名|输入|出局|输入|出局|输入|出局|输入|出局|输入|出局|
| - -----|- -----|- -----|- -----|- -----|- -----|- -----|- -----|- -----|- -----|- -----|
| 汤姆|2023年6月12日12:05:00下午|2023年12月6日12:15:00|||||||||
| 史蒂夫|2023年12月6日下午1时00分|2023年12月6日下午5时|2023年6月13日上午9时|2023年6月13日:下午五点|||||||
| 乔恩|2023年12月6日上午9时15分|203年6月12日下午6时35分37秒|2023年6月13日上午9时01分14秒|2023年6月13日下午4时15分37秒|2023年6月24日上午11时|2023年6月24日下午7:00:15|||||
时钟输入和时钟输出的数量可以在Excel电子表格中一直进行,因此,每个名称可能有数百列。
我如何计算所有的输出与按时间戳计算,并得出总工作小时数,按人分列?在Excel中,我可以使用sumproduct并将所有的Outs相加,然后减去所有的Ins,并得出正确的答案。然而,当将该公式添加到电子表格时,速度非常慢,所以我希望将Excel中的数据导入到dataframe中,并使用Pandas计算答案。然而,我无法为我的生活弄清楚如何做到这一点。
任何建议或帮助将不胜感激。
谢谢!
克莱尔
1条答案
按热度按时间t5zmwmid1#
你的例子中有很多错别字。所以我把它修好了
示例代码
步骤1
生成输入和输出序列并转换为日期时间
s
第二步
计算进出差和
输出: