问NLTK TweetTokenizer不工作(Python)
EN

Stack Overflow用户

提问于 2016-11-30 00:29:37

回答 1查看 931关注 0票数 0

我目前已经安装了NLTK，并运行了命令nltk.download()。然而，并不是所有的库都安装好了(它会卡在panlex_lite上)。

问题是，当我试图导入Tokenizer时，会得到以下错误：

文件"create_docs.py"，第7行从nltk.tokenize导入TweetTokenizer ImportError:无法导入名称TweetTokenizer

我该怎么处理呢？干杯!

python

nltk

回答 1

Stack Overflow用户

发布于 2016-12-01 00:27:52

这是因为没有正确安装库，所以需要跳过"panlex_lite“库并且应该工作。

目前这方面的问题尚未解决，解决办法如下：

I guess, we could add something like if id != 'panlex_lite' to the code...

But, as for me, the easiest way looks like this:

get https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml
remove panlex from it
upload it to a public Gist
pass the gist's url to the downloader: python -m nltk.downloader -d /usr/local/share/nltk_data -u https://gist.githubusercontent.com/demidovakatya/61dab385d74065ae825c80496a197980/raw/c6ff7fbf44265c7f8c9e961e3e1158cd812d6af1/index.xml all

下面是要发布的链接：看最后两次对话

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40878267

复制

相似问题

问NLTK TweetTokenizer不工作(Python)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问NLTK TweetTokenizer不工作(Python)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问NLTK TweetTokenizer不工作(Python)
EN