首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用R库koRpus用TreeTagger抑制apostophe‘

使用R库koRpus用TreeTagger抑制apostophe‘
EN

Stack Overflow用户
提问于 2014-06-14 16:33:52
回答 1查看 332关注 0票数 0

我使用的是koRpus,它是NLP库TreeTagger的R包装器。我正在处理法语和寻找引理。问题:标记器阶段没有输出我想要的内容,撇号有问题,它们被分组到下面的单词中

例如,它输出"l'oiseau“作为术语(而不是"oiseau")。

这是我当前的函数调用:

代码语言:javascript
复制
treetag("mytext.txt", treetagger="manual", lang="fr", 
        sentc.end = c(".", "!", "?", ";", ":","'"), 
        TT.options=list(path="TreeTagger", preset="fr"))

预先使用字符串对文本进行预处理(去掉'),并将结果字符串传递给treetag几乎不是一个可行的选择,因为treetag只能接受文件,而不能接受字符串作为其输入。

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2016-11-21 21:40:31

我的法语也有同样的问题。添加记号赋予器选项"-f“对我有效。尝试:

代码语言:javascript
复制
treetag("mytext.txt", treetagger="manual", lang="fr", 
    sentc.end = c(".", "!", "?", ";", ":","'"), 
    TT.options=list(path="TreeTagger", preset="fr",tknz.opts="-f"))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24218104

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档