首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在R data.table中对diff进行筛选

在R data.table中对diff进行筛选
EN

Stack Overflow用户
提问于 2018-08-03 15:56:38
回答 1查看 85关注 0票数 0

我想根据diff()函数的结果进行过滤,并使用data.table的效率。

代码语言:javascript
复制
DT[diff(timestamp) > 10]

不会做这项工作,因为结果集比源文件短。即使创建一个筛选器和一个子设置,也至少会创建一个警告(我想防止)。

代码语言:javascript
复制
DT[, filter := diff(timestamp) > 10]

我可以使用dplyr或其他工具,但我想要data.table的效率。有什么建议吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-03 16:24:15

正如罗兰指出的那样,错误源于diff()的性质。当应用于长度为n的向量时,它将返回长度为n-1的向量。

示例:

代码语言:javascript
复制
diff(c(2, 4, 9))
[1] 2 5

当使用逻辑向量设置data.table子集时,它的行数必须等于向量的长度。因此,可能的解决方案包括:

代码语言:javascript
复制
DT[-1][diff(DT$timestamp) > 10]
DT[c(FALSE, diff(timestamp) > 10)]

我可能会这样做:

代码语言:javascript
复制
DT[timestamp - shift(timestamp) > 10]
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51667855

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档