首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中包含tm包的精化订购文件

R中包含tm包的精化订购文件
EN

Stack Overflow用户
提问于 2015-07-21 01:08:35
回答 1查看 65关注 0票数 0

我在R中为测试文档(000_1.txt,000_2.txt,000_11.txt)中的单词频率创建了一个脚本,我希望文件的精化顺序为数字结尾(1,2,11)。

SO是Windows 7。目录"E:\testR“包含这些文件。

这是代码

代码语言:javascript
复制
library("tm")

pathElaboration <- "E:/testR"
setwd(pathElaboration)
dirSource <- DirSource(pathElaboration, encoding =   "ISO-8859-2",pattern="*.txt")
vCorpusFiles <- VCorpus(dirSource, readerControl = list(language = "en"))
for (i in seq(from= 1, to=length(vCorpusFiles), by=1))
{
  dtm <- DocumentTermMatrix(vCorpusFiles[i])
  vectorFrequencyWord <- as.matrix(dtm)
  print(vectorFrequencyWord)
}

但结果是

代码语言:javascript
复制
           Terms
Docs        file1
  000_1.txt     1
           Terms
Docs         wordinfile11
  000_11.txt            1
          Terms
Docs        wordinfile2
  000_2.txt           1

我会详细介绍序列000_1.txt,000_2.txt,000_11.txt

我该如何解决这个问题呢?

EN

回答 1

Stack Overflow用户

发布于 2015-07-21 09:30:44

这是一个文本排序顺序,所以这应该是可行的:

代码语言:javascript
复制
dtm <- dtm[order(Docs(dtm)), ]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31522315

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档