我有一个数据集,代表几个车辆的交货,每个车辆可以在不同的地点装货和卸货。我试图找出有多少车辆,它采取了所有的交付,而分组/合并所有旅行,装载在+-x天。例如:
车辆v1可在a区(日期x)和b区(日期x+2)装载,并在c区和d区排放,这将算作1辆车/次,因为它在2天内装载。
v1也可以简单地从a区(日期y)到c区,也可以算一次行程
原始数据如下所示:
Id LoadArea LoadDate Vehicle Discharge Area Qty
456559 Zone A 15/07/2019 V1 Zone Z 64
408481 Zone B 13/07/2019 V1 Zone X 70
365566 Zone A 12/07/2019 V1 Zone Y 26
244634 Zone C 12/07/2019 V2 Zone X 10
453409 Zone D 10/07/2019 V2 Zone Z 53
183776 Zone A 20/04/2019 V1 Zone Y 13
379698 Zone A 20/04/2019 V1 Zone Z 21
370324 Zone D 28/02/2019 V3 Zone W 39
这就是我的目标:
LoadArea LoadDate Vehicle Qty
Zone A;Zone B 12/07/2019 V1 160
Zone C;ZoneD 10/07/2019 V2 63
Zone A;Zone B 20/04/2019 V1 34
Zone D 28/02/2019 V3 39
在合并不到+-x天的记录时返回的loaddate最好是合并的记录中最早的一个。
有人知道怎么做吗-我已经被困在这几天了。。。。谢谢你的帮助!
暂无答案!
目前还没有任何答案,快来回答吧!