假设我们有一个包含变量分组及其频率的表:
在R中:
> df
# A tibble: 3 x 3
Cough Fever cases
<lgl> <lgl> <dbl>
1 TRUE FALSE 1
2 FALSE FALSE 2
3 TRUE TRUE 3
然后,我们可以使用tidyr::uncount
来获得一个包含各个案例的 Dataframe :
> uncount(df, cases)
# A tibble: 6 x 2
Cough Fever
<lgl> <lgl>
1 TRUE FALSE
2 FALSE FALSE
3 FALSE FALSE
4 TRUE TRUE
5 TRUE TRUE
6 TRUE TRUE
在Python/Pandas中是否有等价物?
4条答案
按热度按时间z0qdvdin1#
除了其他解决方案之外,您还可以合并
take
、repeat
和drop
:您也可以在对头寸编制索引之前预先选择列:
ymdaylpp2#
你有一个行索引,并根据计数重复它,例如在R中你可以这样做:
第一个获得像您这样的数据:
然后:
von4xj4u3#
我还没有在Python中找到一个等效的函数,但这个函数可以工作
df['cases']
被传递给df2
,然后创建一个新的DataFrame,根据df2
中的计数重复原始DataFrame中的元素。如果有帮助,请告诉我。wztqucjr4#
就像在
datar
中使用tidyr
的API一样简单:我是软件包的作者。如果您有任何问题,请随时提交问题。