我们如何配置弹性搜索,以消除基于文档频率阈值的特定于字段的查询术语?
对于例如:对于查询"title:test AND title:west AND desc:world and desc:hello“,假设文档频率阈值被设置为10,并且查询中的少数项,即desc:world和title:test具有大于10的文档频率,即查询应该被改变为"title:west and desc:hello”。
一种方法是对中的每个术语进行查询,并基于检索到的文档计数消除超过给定文档频率阈值的这些术语,但这并不有效,因为它会急剧增加搜索数量!
发布于 2015-02-24 19:56:16
不知道如何在elasticsearch中做到这一点,但是Lucene提供了QueryAutoStopWordAnalyzer,它做了一些非常接近的事情。
看一看http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/query/QueryAutoStopWordAnalyzer.html
https://stackoverflow.com/questions/28694815
复制相似问题