首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >LDA主题模型问题

LDA主题模型问题
EN

Stack Overflow用户
提问于 2017-07-11 19:44:19
回答 1查看 126关注 0票数 0

我对twitter数据做了一些文本挖掘练习。最初的dataframe有1280行。为避免:

LDA中的错误(dtm_cea,k= 8):输入矩阵的每一行至少需要包含一个非零项。

我在稀疏矩阵中消除了没有条目的任何行:

代码语言:javascript
复制
rowTotals <- apply(dtm , 1, sum) 
dtm.new   <- dtm[rowTotals_cea> 0, ] 
lda <- LDA(dtm.new, k = 8)
topic <- topics(lda, 1)

因此,我的dtm.new丢失了几行;实际上,行数减少到1273行。

事实上,现在我需要从原始的dataframe (1280行)中检索另一列,并使用topic (1273行)重新绑定,以生成一个图表。如何在原始数据中,由于对DTM所做的更改,应该删除哪些行?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-11 19:51:10

您需要跟踪正在删除的索引,或者重构用于删除它们的索引。

代码语言:javascript
复制
rowstokeep <- rowTotals > 0
newdataframe <- originaldataframe[rowstokeep, ]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45043296

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档