首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据,这在solr 6中是不会发生的

SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据,这在solr 6中是不会发生的
EN

Stack Overflow用户
提问于 2017-10-24 12:00:39
回答 1查看 37关注 0票数 0

1.SOLR 7提取pdf将添加许多模式列( pdf meta)和额外的meta pdf数据

2.在solr 6中,这种情况不会发生

4.如何关闭它

EN

回答 1

Stack Overflow用户

发布于 2017-10-24 15:43:40

我的猜测是,您在7中使用的是“无模式”更新处理器,因此任何未知字段都会被更新处理器添加到模式中。如果您关闭它并使用显式模式,就像您在6中所做的那样,您应该再次看到旧的行为。

您可能需要切换到ClassicIndexSchemaFactory才能让Solr读取旧的schema.xml。

  1. 将托管架构文件重命名为schema.xml。

  1. 修改solrconfig.xml以替换schemaFactory类。

  1. 删除任何存在的ManagedIndexSchemaFactory定义。

  1. 添加如上所示的ClassicIndexSchemaFactory定义

  1. 重新加载核心。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46901966

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档