首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Lucene Tokenizer -包含空格

Lucene Tokenizer -包含空格
EN

Stack Overflow用户
提问于 2017-02-13 22:16:05
回答 1查看 194关注 0票数 1

我们有一个应用程序,可以对某些数据进行标记。我的问题是我有一个逗号分隔的字段,我需要标记化,但不是在空格上。例如:

代码语言:javascript
复制
"Age 6, Age 7, Age 8"

变成了

代码语言:javascript
复制
Age
6
Age
7
Age
8

我需要

代码语言:javascript
复制
Age 6
Age 7
Age 8

有没有办法让我只更改某些字段的默认行为?

我目前拥有的配置设置:

代码语言:javascript
复制
<field fieldName="SizeGroup" storageType="YES" indexType="TOKENIZED" vectorType="NO" 
boost="1f" type="System.String" 
settingType="Sitecore.ContentSearch.LuceneProvider.LuceneSearchFieldConfiguration, 
Sitecore.ContentSearch.LuceneProvider" />
EN

回答 1

Stack Overflow用户

发布于 2017-02-14 19:10:49

不幸的是,我不认识C#,但我认识Lucene。因此,对于所需的行为,您需要使用PatternAnalyzer,它允许您指定一个正则表达式,它将用于标记化。在您的例子中,像\\,这样的模式应该适用于逗号拆分。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42206212

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档