文章/答案/技术大牛

发布

社区首页 >问答首页 >SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据，这在solr 6中是不会发生的

问SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据，这在solr 6中是不会发生的
EN

Stack Overflow用户

提问于 2017-10-24 12:00:39

回答 1查看 37关注 0票数 0

1.SOLR 7提取pdf将添加许多模式列( pdf meta)和额外的meta pdf数据

2.在solr 6中，这种情况不会发生

4.如何关闭它

extract

pdf

solr

回答 1

Stack Overflow用户

发布于 2017-10-24 15:43:40

我的猜测是，您在7中使用的是“无模式”更新处理器，因此任何未知字段都会被更新处理器添加到模式中。如果您关闭它并使用显式模式，就像您在6中所做的那样，您应该再次看到旧的行为。

您可能需要切换到ClassicIndexSchemaFactory才能让Solr读取旧的schema.xml。

将托管架构文件重命名为schema.xml。

修改solrconfig.xml以替换schemaFactory类。

删除任何存在的ManagedIndexSchemaFactory定义。

添加如上所示的ClassicIndexSchemaFactory定义

重新加载核心。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46901966

复制

相似问题

问SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据，这在solr 6中是不会发生的
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据，这在solr 6中是不会发生的EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SOLR 7.1 Extracthandler Extracthandler extract PDF会添加很多我不想要的额外元数据，这在solr 6中是不会发生的
EN