首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用nltk.corpus.gutenberg.fileids()解码路径中的错误

使用nltk.corpus.gutenberg.fileids()解码路径中的错误
EN

Stack Overflow用户
提问于 2015-07-17 18:43:12
回答 1查看 313关注 0票数 1

当我使用Python2.7 (Anaconda,nltk.corpus.gutenberg.fileids() )运行时,我得到以下错误:

代码语言:javascript
复制
File "C:\Anaconda\lib\ntpath.py", line 85, in join
    result_path = result_path + '\\'

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 9:
ordinal not in range(128)

当我使用Python3.4时,没有这个错误。也许我错了,但我怀疑包含一个重音的路径(因为我的Windows用户名中有一个重音)。

当我在print中添加ntpath.py时,没有打印任何内容--我不知道为什么(?)所以我无法自己调试。

编辑: import nltk就足以获得错误。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-07-21 19:37:33

我猜Python2nltk在非ASCII路径方面有一些问题。在这里,使用Python 3可能是最简单的修复方法,至少假设您没有太多的代码不能在其中工作。很难说,因为您没有包含完整的跟踪,但是nltk可能需要修补Python 2的这个问题,否则,您需要避免使用非ASCII字符的路径(意思是避免用户目录或更改用户名)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31482620

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档