首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR),是否真的忽略了项目评级?

如果我使用的是SIMILARITY_LOGLIKELIHOOD (LLR),是否真的忽略了项目评级?
EN

Stack Overflow用户
提问于 2015-02-07 08:35:43
回答 1查看 647关注 0票数 0

我使用的电影镜头数据文件(ml-100k.zip) u.data没有变化,所以它有列: userID、MovieID和用户评级。

我用了LLR:

hadoop jar C:\hdp\mahout-0.9.0.2.1.3.0-1981\core\target\mahout-core-0.9.0.2.1.3.0-1981-job.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_LOGLIKELIHOOD --输入u.data -output udata_output

当我查看udata_output文件时,我看到推荐的电影ID后面跟着推荐分数,比如:

1226:5.0和896:4.798878

推荐分数似乎从5.0到4.x不等。

但是,当我文件中删除用户评等列并重新运行上面相同的命令行时,我收到的结果如下:

615:1.0

所有推荐分数都是1.0分。

2个问题:

1)如果LLR忽略了用户的评分,而唯一的输入就是是否提供用户评分,为什么推荐分数会改变?

2)总的来说,我试图确定推荐排名,所以我使用的是LLR。此外,我是否应该忽略推荐分数,只关注推荐项目的顺序(例如:第一项排名高于第二项)?

提前谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-02-07 16:24:45

LLR不使用强项。其理论是,如果用户实际与某一项交互,这就是所需的全部指示。LLR将根据一种称为对数似然比的概率计算,将这种交互与其他用户的交互和评分联系起来。它确实创造了优势,但只使用交互的数量。

应答

  1. 这可能是一个bug,也可能是因为您在一种情况下使用布尔推荐器,而在另一种情况下使用非布尔型。我可能认为,推荐者正试图通过考虑到这些值来提供评级。但是,如果您试图优化排名,那么这一切都不重要。
  2. 你真的不需要看推荐权重,除非你试图预测评级,这种情况现在很少发生。相信recs的排名。

顺便说一句,马赫特现在有了一个全新的新一代推荐人,其基础是使用搜索引擎来提供推荐服务,使用Mahout来计算模型。与较早的Hadoop版本相比,它有许多优点,包括:

  1. 多模:它可以在许多不同的项目集上摄取许多不同的用户操作。这允许您使用大部分用户的点击流来推荐。
  2. 实时结果:它在Solr或弹性搜索中有一个非常快速的可伸缩服务器。
  3. 由于实时性,它可以推荐给新用户或有很近历史的用户。较老的Hadoop推荐者只向培训数据中的用户和项目推荐--他们无法对没有用于培训的历史做出反应。新推荐者可以使用实时收集的数据,甚至对新用户也是如此。

在Mahout1.0-快照或更高版本中的新的多模式推荐器在这里描述:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28380144

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档