首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在R中的多个文本文件中运行korPus文本挖掘函数

在R中的多个文本文件中运行korPus文本挖掘函数
EN

Stack Overflow用户
提问于 2015-01-30 09:04:02
回答 1查看 272关注 0票数 0

我想在一堆korPus文件上从库txt中运行两个R函数。首先,我希望对这些文本进行tokenizetreetag,然后对输出运行MTLD并将结果保存在一个文档中。我正在尝试使用lapplyfor loop来完成这个任务。这两个命令的基本语法都很简单:

代码语言:javascript
复制
tokenized_1 <- tokenize("txt", lang="en")
MLTD(tokenized_1)

我试过以下几种方法

代码语言:javascript
复制
files <- list.files(path="path/to/dir", pattern="*.txt", full.names=T, recursive=FALSE)
tokenized<-(lapply(files, tokenize, lang='en'))

但是,这会将所有结果合并到一个文件中,而我则希望单独查看所有文件。此外,它还为MTLD函数创建了一个无效类。

我熟悉来自shell scriptingshell scripting,我认为这能做我想做的事情,但是

代码语言:javascript
复制
for (i in files){tokenize(i, lang='en')}

什么都不做。我知道这是一种非常天真和简单的方法,但我不是一个非常有经验的R用户。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-25 11:49:51

使用lapply

代码语言:javascript
复制
filenames <- list.files(pattern="*.txt")
text.tagged <- lapply(filenames, function(x) treetag(x, treetagger="manual", lang="en",
                                                     TT.options=list(path=filepath, preset="en")))

text.tagged[1]
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28232423

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档