如何在pyspark中计算重叠日期

kqlmhetl  于 2021-05-27  发布在  Spark
关注(0)|答案(0)|浏览(328)

我有与在多个公司工作的用户的数据。有些用户同时在多个公司工作。如何在不考虑重叠经验的情况下对总体经验进行汇总。我已经通过一些链接可以得到正确的解决方案。任何帮助将不胜感激。
emp csv数据

fullName,Experience_datesEmployeed,Experience_expcompany,Experience_expduraation, Experience_position
David,Feb 1999 - Sep 2001, Foothill,2 yrs 8 mos, Marketing Assoicate
David,1994 - 1997, abc,3 yrs,Senior Auditor
David,Jun 2020 - Present,   Fellows INC,3 mos,Director Board
David,2017 - Jun 2019,     Fellows INC ,2 yrs,Fellow - Class 22
David,Sep 2001 - Present, The John D.,19 yrs, Manager

预期产量:

FullName,Total_Experience

David,24.8 yrs

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题