我有一个简单的 Dataframe ,如下所示:
Observation X1 X2 Group
1 2 4 1
2 6 3 2
3 8 4 2
4 1 3 3
5 2 8 4
6 7 5 5
7 2 4 5
如何对group
变量重新编码,使所有非重现观测都重新编码为“无关联”?
预期产出如下:
Observation X1 X2 Group
1 2 4 Unaffiliated
2 6 3 2
3 8 4 2
4 1 3 Unaffiliated
5 2 8 Unaffiliated
6 7 5 5
7 2 4 5
3条答案
按热度按时间aiqt4smr1#
我们可以使用
duplicated
为非重复项创建一个逻辑向量,并为这些非重复项将"Group"分配给Unaffiliated
数据
aydmsdu92#
unfaffil
取一个Group编号的向量,如果它有一个元素,则返回"Unaffiliated"
,否则返回输入。然后我们可以使用ave
按Group应用它。这不会覆盖输入。没有使用包,但如果您使用dplyr,则transform
可以替换为mutate
。给予
注解
b09cbbtk3#
一种方法是首先分组,然后检查最大行数,最后以
ifelse
: