文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从原始语料库中提取特定的范围词？

问如何从原始语料库中提取特定的范围词？
EN

Stack Overflow用户

提问于 2016-03-26 16:07:53

回答 1查看 165关注 0票数 0

import nltk   
import nltk.data    

nltk.corpus.brown    
y= nltk.corpus.brown.raw()  
print(y)

当我做print(y)时，它会显示这个语料库中的所有原始数据，但是我只想从这个原始语料库中获取10,000单词。我怎样才能做到这一点？

回答已采纳

发布于 2016-03-26 16:45:03

你可以这样做：

import random
words = nltk.corpus.brown.words()
random_words = random.sample(words, 10000)

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36237539

复制

相似问题

问如何从原始语料库中提取特定的范围词？EN