文章/答案/技术大牛

发布

社区首页 >问答首页 >如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR)，是否真的忽略了项目评级？

问如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR)，是否真的忽略了项目评级？
EN

Stack Overflow用户

提问于 2015-02-07 08:35:43

回答 1查看 647关注 0票数 0

我使用的电影镜头数据文件(ml-100k.zip) u.data没有变化，所以它有列: userID、MovieID和用户评级。

我用了LLR：

hadoop jar C:\hdp\mahout-0.9.0.2.1.3.0-1981\core\target\mahout-core-0.9.0.2.1.3.0-1981-job.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_LOGLIKELIHOOD --输入u.data -output udata_output

当我查看udata_output文件时，我看到推荐的电影ID后面跟着推荐分数，比如：

1226:5.0和896:4.798878

推荐分数似乎从5.0到4.x不等。

但是，当我从文件中删除用户评等列并重新运行上面相同的命令行时，我收到的结果如下：

615:1.0

所有推荐分数都是1.0分。

2个问题：

1)如果LLR忽略了用户的评分，而唯一的输入就是是否提供用户评分，为什么推荐分数会改变？

2)总的来说，我试图确定推荐排名，所以我使用的是LLR。此外，我是否应该忽略推荐分数，只关注推荐项目的顺序(例如:第一项排名高于第二项)？

提前谢谢。

hadoop

mahout-recommender

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-02-07 16:24:45

LLR不使用强项。其理论是，如果用户实际与某一项交互，这就是所需的全部指示。LLR将根据一种称为对数似然比的概率计算，将这种交互与其他用户的交互和评分联系起来。它确实创造了优势，但只使用交互的数量。

应答

这可能是一个bug，也可能是因为您在一种情况下使用布尔推荐器，而在另一种情况下使用非布尔型。我可能认为，推荐者正试图通过考虑到这些值来提供评级。但是，如果您试图优化排名，那么这一切都不重要。
你真的不需要看推荐权重，除非你试图预测评级，这种情况现在很少发生。相信recs的排名。

顺便说一句，马赫特现在有了一个全新的新一代推荐人，其基础是使用搜索引擎来提供推荐服务，使用Mahout来计算模型。与较早的Hadoop版本相比，它有许多优点，包括：

多模:它可以在许多不同的项目集上摄取许多不同的用户操作。这允许您使用大部分用户的点击流来推荐。
实时结果:它在Solr或弹性搜索中有一个非常快速的可伸缩服务器。
由于实时性，它可以推荐给新用户或有很近历史的用户。较老的Hadoop推荐者只向培训数据中的用户和项目推荐--他们无法对没有用于培训的历史做出反应。新推荐者可以使用实时收集的数据，甚至对新用户也是如此。

在Mahout1.0-快照或更高版本中的新的多模式推荐器在这里描述：

马赫特遗址
一本免费的电子书，它谈到了一般的想法：实用机器学习
幻灯片板，它讨论混合操作或其他指示符:创建统一多模推荐器
两篇博客文章：推荐人中的新事物:第一部分和推荐人中的新事物:第二部分
一篇描述日志似然比的文章：惊喜与巧合 LLR用于降低数据中的噪声，同时保持计算的O(n)复杂度。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28380144

复制

相似问题

问如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR)，是否真的忽略了项目评级？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR)，是否真的忽略了项目评级？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR)，是否真的忽略了项目评级？
EN