我想在一堆korPus文件上从库txt中运行两个R函数。首先,我希望对这些文本进行tokenize或treetag,然后对输出运行MTLD并将结果保存在一个文档中。我正在尝试使用lapply或for loop来完成这个任务。这两个命令的基本语法都很简单:
tokenized_1 <- tokenize("txt", lang="en")
MLTD(tokenized_1)我试过以下几种方法
files <- list.files(path="path/to/dir", pattern="*.txt", full.names=T, recursive=FALSE)
tokenized<-(lapply(files, tokenize, lang='en'))但是,这会将所有结果合并到一个文件中,而我则希望单独查看所有文件。此外,它还为MTLD函数创建了一个无效类。
我熟悉来自shell scripting的shell scripting,我认为这能做我想做的事情,但是
for (i in files){tokenize(i, lang='en')}什么都不做。我知道这是一种非常天真和简单的方法,但我不是一个非常有经验的R用户。
发布于 2016-05-25 11:49:51
使用lapply
filenames <- list.files(pattern="*.txt")
text.tagged <- lapply(filenames, function(x) treetag(x, treetagger="manual", lang="en",
TT.options=list(path=filepath, preset="en")))
text.tagged[1]https://stackoverflow.com/questions/28232423
复制相似问题