我有一个数据集,看起来像这样:
| 客户端ID|开始日期月份|提供者|
| --------------|--------------|--------------|
| 11234|2020年1月1日|A|
| 一三四五|2020年1月1日|B|
| 1567年|2020年1月1日|C|
| 一九八六年|2020年2月1日|A|
| 15076|2020年2月1日|B|
| 一七四五五六|2020年2月1日|C|
我想创建一个表,看起来像这样:
| 提供者|开始日期月份|N_不同|中位数|
| --------------|--------------|--------------|--------------|
| A|2020年1月1日|一百|10个|
| B|2020年1月1日|七十|六|
| C|2020年1月1日|九十|八|
我已经尝试了几种方法来实现它使用以下2 r脚本然而,我得到一个错误:
图书馆(dplyr)
starts <- intake_data %>%
filter(state == "ALS") %>%
mutate(start_date_month=as.Date(start_date_month)) %>%
summarize(group_by(provider, start_date_month),
intakeA = n_distinct(client_id),
medianA = median(client_id))
我也有这个版本:
starts <- intake_data %>%
filter(state == "ALS") %>%
mutate(start_date_month=as.Date(start_date_month)) %>%
group_by(provider, start_date_month) %>%
summarize(intakeA = n_distinct(client_id),
medianA = median(client_id))
但是两个版本都不工作。如果有人能帮我修复这个代码,那将是非常感激的
1条答案
按热度按时间ctehm74n1#
您的代码尝试表明,您希望同时按提供程序和月份对数据进行分组-在这种情况下,您最终不会得到所描述的输出(在这种情况下,您会默默地删除其中一个月份)。
创建于2023-03-21带有reprex v2.0.2