首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >根据查询词的文档频率排除查询词

根据查询词的文档频率排除查询词
EN

Stack Overflow用户
提问于 2015-02-24 19:38:57
回答 1查看 84关注 0票数 0

我们如何配置弹性搜索,以消除基于文档频率阈值的特定于字段的查询术语?

对于例如:对于查询"title:test AND title:west AND desc:world and desc:hello“,假设文档频率阈值被设置为10,并且查询中的少数项,即desc:world和title:test具有大于10的文档频率,即查询应该被改变为"title:west and desc:hello”。

一种方法是对中的每个术语进行查询,并基于检索到的文档计数消除超过给定文档频率阈值的这些术语,但这并不有效,因为它会急剧增加搜索数量!

EN

回答 1

Stack Overflow用户

发布于 2015-02-24 19:56:16

不知道如何在elasticsearch中做到这一点,但是Lucene提供了QueryAutoStopWordAnalyzer,它做了一些非常接近的事情。

看一看http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/query/QueryAutoStopWordAnalyzer.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28694815

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档