首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在elasticsearch中使用边ngram索引数据,其中也包括空格?

如何在elasticsearch中使用边ngram索引数据,其中也包括空格?
EN

Stack Overflow用户
提问于 2016-08-08 16:28:07
回答 1查看 650关注 0票数 0

我正在使用edge ngram分析器。在检查字段的分析API时,我得到了以下结果。

例如,对于查询"galaxy j7",它被分析为。

代码语言:javascript
复制
["g","ga","gal","gala","galax","galaxy","j","j7"]

我希望数据分析如下。

代码语言:javascript
复制
["g","ga","gal","gala","galax","galaxy","galaxy j","galaxy j7"]

这怎么可能呢?

index中的设置如下。

代码语言:javascript
复制
{
  "analysis": {
    "filter": {
        "autocomplete_filter": {
            "type": "edge_ngram",
            "min_gram": "1",
            "max_gram": "20"
        }
    },
    "analyzer": {
        "autocomplete_analyzer": {
            "filter": ["lowercase", "autocomplete_filter"],
            "type": "custom",
            "tokenizer": "standard"
        }
    }
  }
}

字段的映射如下所示。

代码语言:javascript
复制
{
    "title_suggest": {
        "type": "string",
        "index_analyzer": "autocomplete_analyzer",
        "search_analyzer": "standard",
        "search_quote_analyzer": "autocomplete_analyzer"
    }
}
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-08 16:29:36

您需要使用edgeNGram tokenizer,而不是edge_ngram过滤器:

代码语言:javascript
复制
{
  "analysis": {
    "tokenizer": {
        "autocomplete_tokenizer": {
            "type": "edgeNGram",
            "min_gram": "1",
            "max_gram": "20"
        }
    },
    "analyzer": {
        "autocomplete_analyzer": {
            "filter": ["lowercase"],
            "type": "custom",
            "tokenizer": "autocomplete_tokenizer"
        }
    }
  }
}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38824469

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档