首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >极稀疏矩阵的推荐系统

极稀疏矩阵的推荐系统
EN

Data Science用户
提问于 2017-09-11 19:21:42
回答 1查看 517关注 0票数 0

我正试图建立一个基于大型和非常稀疏矩阵的推荐系统。该矩阵的维数大约为12000×37000,甚至可能会有更多的行数到100000行。然而,这个矩阵是非常稀疏的。在12000x37000版本中,大约0.053%的矩阵是非NA的.我试过SVD了,但是没有用。为了确保我在审理过程中没有造成任何错误:

  1. 我创建了一个具有独特三胞胎“用户”-“项目”-“评级”的data.table。我应该提到“评级”可以延伸到任何地方从0到大约150。
  2. 现在,我将dcast.data.table应用到triplet表中,纠正了这个问题,将第一个值转化为一个列,转换为一个矩阵。现在,我有一个矩阵,用户作为行,项作为列,评级为单元格内容。

拆分成测试和验证集,将"NA“替换为0,减去每一行的行表示,将"svd”包中的propack.svd应用到该矩阵中,乘以propack交付的三个矩阵,并将行表示添加到其中。(用户-手段)。

之后,我将验证集中的值与预测矩阵中的相应值进行了比较。不足为奇的是,均方根误差非常高,约为6-7(非NA值的平均值约为4.5)。我也尝试过多种形式的正常化,但我只是无法让RMSE降到5.8以下。

是否有任何方法为此数据集构建可行的项目推荐系统?可能是通过管状或聚类?

EN

回答 1

Data Science用户

回答已采纳

发布于 2017-09-11 23:16:46

我将研究具有R中的实施的软计算方法。它使用迭代软阈值来计算缺失值。计算使用一个名为“不完全”的矩阵类来处理大型稀疏矩阵,并允许快速计算缩放/对中行和列。

我已经成功地使用它完成了一个10,000×10,000个非常稀疏的矩阵,所以我想它应该在您的数据集中做得相当好。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/22960

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档