首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从原始语料库中提取特定的范围词?

如何从原始语料库中提取特定的范围词?
EN

Stack Overflow用户
提问于 2016-03-26 16:07:53
回答 1查看 165关注 0票数 0
代码语言:javascript
复制
import nltk   
import nltk.data    

nltk.corpus.brown    
y= nltk.corpus.brown.raw()  
print(y)

当我做print(y)时,它会显示这个语料库中的所有原始数据,但是我只想从这个原始语料库中获取10,000单词。我怎样才能做到这一点?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-26 16:45:03

你可以这样做:

代码语言:javascript
复制
import random
words = nltk.corpus.brown.words()
random_words = random.sample(words, 10000)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36237539

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档