如何将新的语料库‘保存’到NLTK语料库数据?
在我的例子中,当我在NLTK中创建了一个新的自定义分类语料库后,就像这个页面上说的那样:Creating a custom categorized corpus in NLTK and Python
我想使用它就像一个已经安装在NLTK中的语料库(比如movie_reviews)。我该怎么做呢?换句话说,我读到的新语料库(比如movie_reviews_0)怎么能这样命名呢?
>>> import nltk
>>> from nltk.corpus import movie_reviews_0发布于 2013-03-25 17:40:01
您可以将其添加到您自己的nltk_data/corpora文件夹中,该文件夹应该位于您的主目录中的某个位置。例如,如果你使用的是Mac,那么它应该是~/nltk_data/corpora。而且看起来您还必须将您的新语料库附加到.../site-packages/nltk/corpus/中的__init__.py。
https://stackoverflow.com/questions/15611328
复制相似问题