这是我的数据集的一个例子
Date Time(GMT)Depth Temp Salinity Density Phosphate
24/06/2002 1000 1 33.855 0.01
24/06/2002 1000 45 33.827 0.01
01/07/2002 1000 10 13.26 33.104 24.873 0.06
01/07/2002 1000 30 12.01 33.787 25.646 0.13
08/07/2002 1000 5 13.34 33.609 25.248 0.01
08/07/2002 1000 40 12.01 34.258 26.011 1.33
15/07/2002 1000 30 12.04 34.507 26.199 0.01
22/07/2002 1000 5 13.93 33.792 25.269 0.01
22/07/2002 1000 30 11.9 34.438 26.172 0.08
29/07/2002 1000 5 13.23 34.09 25.642 0.01
我想删除重复的行,这样我只有一个日期行,我想这样做的基础上的深度,我想保留行与最大(最深)的深度。任何想法?
7条答案
按热度按时间nqwrtyyt1#
假设您有df格式的数据
3bygqnnd2#
这里有一种方法可以在一个dplyr调用中实现:
30byixjq3#
引入
data.table
解决方案,这将是解决此问题的最快方法(假设data
是您的数据集)只是另一种方式:
yqlxgs2m4#
如果你的数据框很大,这可能不是最快的方法,但是一个相当直接的方法。这可能会改变你的数据框的顺序,你可能需要重新排序,例如日期。我们不是删除,而是按日期分割数据,在每个块中选择一行最大的日期,最后将结果加入到数据框中
yacmzcpb5#
你也可以用dplyr的
arrange()
来代替order(我觉得这样更直观):ca1c2owp6#
这对你有用吗?
pftdvrlh7#
使用dplyr的
distinct
函数的替代方法: