当我使用Python2.7 (Anaconda,nltk.corpus.gutenberg.fileids() )运行时,我得到以下错误:
File "C:\Anaconda\lib\ntpath.py", line 85, in join
result_path = result_path + '\\'
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 9:
ordinal not in range(128)当我使用Python3.4时,没有这个错误。也许我错了,但我怀疑包含一个重音的路径(因为我的Windows用户名中有一个重音)。
当我在print中添加ntpath.py时,没有打印任何内容--我不知道为什么(?)所以我无法自己调试。
编辑: import nltk就足以获得错误。
发布于 2015-07-21 19:37:33
我猜Python2nltk在非ASCII路径方面有一些问题。在这里,使用Python 3可能是最简单的修复方法,至少假设您没有太多的代码不能在其中工作。很难说,因为您没有包含完整的跟踪,但是nltk可能需要修补Python 2的这个问题,否则,您需要避免使用非ASCII字符的路径(意思是避免用户目录或更改用户名)。
https://stackoverflow.com/questions/31482620
复制相似问题