尝试对PDF文件使用更新/提取时出现异常
我的设置是:- Ubuntu Server 11.10 Tomcat 6 Solr 3.5.0.2011.11.22.15.54.38
我可以浏览到solr/admin OK
我已经将所有contrib/extract和apache-solr-cell3.5.0.jar库放到tomcat文件夹webapps/solr/WEB-INF/lib中
我调用extract时使用:-
curl "http://localhost:8080/solr/update/extract?uprefix=attr_&fmap.content=attr_content&commit=true" -F "file=/path/to/my.pdf"错误是
java.lang.NoClassDefFoundError: org/apache/tika/mime/MimeTypeException
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:264)
at org.apache.solr.core.SolrResourceLoader.findClass(SolrResourceLoader.java:383)
at org.apache.solr.core.SolrCore.createInstance(SolrCore.java:425)
at org.apache.solr.core.SolrCore.createRequestHandler(SolrCore.java:461)
at org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.getWrappedHandler(RequestHandlers.java:248)
at org.apache.solr.core.RequestHandlers$LazyRequestHandlerWrapper.handleRequest(RequestHandlers.java:239)
at org.apache.solr.core.SolrCore.execute(SolrCore.java:1372)感谢任何人的指点--这个错误唯一出现在别处的时候是Nutch和缓存的结果。
我尝试在查询字符串和*.doc文件中发送file类型,但得到了相同的错误。
发布于 2011-12-16 00:57:21
这是由于复制必要的tika库(复制到tomcat6/webapps/solr/WEB-INF/lib)的基本错误造成的,但将jar文件的所有权保留为根目录,而不是将它们保留给TOMCAT6。在设置了正确的权限并重新启动Tomcat后,它开始正常工作
发布于 2011-12-09 19:56:22
根据错误消息,您得到的不是MimeTypeException异常:问题是NoClassDefFoundError,因为Solr无法装入类MimeTypeException。
通常,这个类存在于tika-core.jar中。
确保您确实拥有该文件,并检查solrconfig.xml中是否有指向正确目录的lib语句。
发布于 2012-04-02 00:57:56
找到了这个问题的解决方案,我使用SolrJ来更新我的pdf索引。
在将solr部署到tomcat之后,我没有将以下库包含到tomcat/webapp中
我得到了所有的懒惰加载问题,等等,我甚至试图获得apache tika…在我这么做之前。
关闭tomcat
\apache-solr-3.5.0\contrib\extraction
将上面的库复制到下面
\apache-tomcat-7.0.26\webapps\solr\WEB-INF\lib
启动tomcat
干杯
https://stackoverflow.com/questions/8444943
复制相似问题