我有几个列,每一列都有案例数,另一列有累积案例数,另一列对应分组变量。我想要创建一个额外的列,在连续增加两个案例之后开始计数。
示例链接:http://www.filedropper.com/teste_6
从档案来看,甲医院的柜位应在第60排开始,累积个案为5,7及10宗,个案3、2及3宗;而B医院的柜位则应在第223行及C 377号医院开始。
我不知道如何在连续两次增加后创建计数器。我应该创建一个循环并比较以前的值,还是有一个更简单的方法来实现这一点?
我创建了一个计数器,从1开始,但不是在连续两次增加之后:
cumulative <- dataset %>%
group_by(hosp) %>%
mutate(cum_cases = cumsum(cases)) %>%
mutate(counter_cases = cumsum(cummax(cases > 0)))发布于 2020-06-07 17:01:53
这个例子不符合你的描述,但也许这是你想要的,根据你的文字,而不是你的例子?
library(dplyr)
df %>%
group_by(hosp) %>%
mutate(counter = sign(cumsum(cases) * cases),
counter = counter + lead(counter),
counter = cumsum(ifelse(is.na(counter), lag(counter), counter) == 2))发布于 2020-06-07 17:46:23
我们可以使用data.table
library(data.table)
setDT(df)[, counter := cumsum(cumsum(sign(c(0, diff(cases)))) > 1), hosp]https://stackoverflow.com/questions/62248288
复制相似问题