腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(7971)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Tokenizer
与尼采
现在我正在尝试使用
Tokenizer
。
浏览 15
提问于2019-05-12
得票数 0
回答已采纳
1
回答
呈现相同输出的Bigram
Tokenizer
和Unigram
Tokenizer
我的n-gram标记器无法正常工作。unigram似乎工作得很好,但只要我将二元语法分词器应用于语料库,它就会返回与unigram分词器相同的单词列表。代码如下。blogs <- readLines("en_US.blogs.txt", news <- readLines("en_US.news.txt", enc
浏览 16
提问于2017-07-24
得票数 0
1
回答
PHP
Tokenizer
多行问题
我正在使用token_get_all开发一个工具。我遇到了在php代码中有以下查询的情况 `Value_Content` = '" . $this->db->escape($revisionValues['value']) . "', `Comments` = '" . $this->db->escape($revisionValues['comment']
浏览 3
提问于2012-12-18
得票数 0
3
回答
如何为boost::
tokenizer
实现
tokenizer
.rbegin()和rend()?
我在玩boost::
tokenizer
,但是我意识到它不支持rbegin()和rend()。我想问一下,如何将这两个函数添加到现有的类中?这是来自boost站点的:#include <string>using namespace boost; string str( "12/12/1986" );
浏览 2
修改于2011-06-06
得票数 3
回答已采纳
1
回答
Lucene
Tokenizer
-包含空格
我们有一个应用程序,可以对某些数据进行标记。我的问题是我有一个逗号分隔的字段,我需要标记化,但不是在空格上。例如:变成了678Age 6Age 8我目前拥有的配置设置:boost="1f&
浏览 5
修改于2017-02-15
得票数 1
1
回答
Solr Facet和
Tokenizer
"myLower" class="solr.TextField" positionIncrementGap="100"> <
tokenizer
class="solr.LowerCaseFilterFactory"/> <analyzer type="query">
浏览 15
提问于2017-01-05
得票数 0
回答已采纳
4
回答
java
Tokenizer
slip
我想将字符串行转换为标记(存储在字符串表中),并且我只能使用java.io.*这是为了实现一个计算器。到表{“1”,"+","2","+","3"}
浏览 0
修改于2011-04-13
得票数 0
1
回答
Elasticsearch -
Tokenizer
配置
有人知道要使用什么标记器以及如何启用以下规则,输出(预期):
浏览 3
提问于2015-07-02
得票数 0
1
回答
Solr
Tokenizer
问题
我有一个我认为是简单的solr练习,但我不确定要使用什么。我也喜欢它,以便优先考虑名字。编辑:对搜索能力进行两次编辑。1.类似
浏览 1
修改于2012-04-30
得票数 2
回答已采纳
0
回答
Python
Tokenizer
:字数限制
我用python为我的语言编写了一个标记器,但是当我试图标记化一个文件时,它只对它进行标记化。It标记器只能标记大约90个标记(单词和符号分开),而它应该标记所有文件。代码如下:data=myfile.read().replace('\n', '') (r"[0-9]+", lamb
浏览 1
提问于2017-11-26
得票数 1
1
回答
无法查看keras
Tokenizer
方法
我正在尝试查看github上的keras
Tokenizer
代码、类及其方法。
浏览 12
提问于2019-06-24
得票数 0
回答已采纳
1
回答
Lucene
Tokenizer
不推荐
下面的Analyzer扩展有许多不推荐的子类。非反对的替代者是什么?用于StandardTokenizer、StandardFilter、LowerCaseFilter和StopFilter --如下所示。 this.version = version; @SuppressWarnings("r
浏览 1
提问于2015-05-28
得票数 1
回答已采纳
1
回答
无法从Keras导入
Tokenizer
目前正在处理一个深度学习示例,他们正在使用
Tokenizer
包。我收到以下错误:下面是我的代码:
tokenizer
.fit_on_sequence
浏览 1
提问于2018-02-03
得票数 2
回答已采纳
1
回答
AttributeError: spacy.
tokenizer
.
Tokenizer
对象没有属性“tokens_from_list”
'spacy.
tokenizer
.
Tokenizer
‘对象没有属性'tokens_from_list'en_nlp = spacy.load("en_core_web_sm", disable=['parser', 'ner']) old_
tokenizer
= en_nlp.
tokenizer
en_nlp.
tokenizer
= lambda stri
浏览 11
提问于2022-02-25
得票数 0
1
回答
tf.keras.preprocessing.text.
Tokenizer
()和tfds.features.text.
Tokenizer
()的比较
我的困惑源于
Tokenizer
类的各种实现,这些实现可以在Tensorflow生态系统中找到。
Tokenizer
类既存在于Tensorflow Datasets (tfds)中,也存在于Tensorflow本身中:tfds.features.text.
Tokenizer
() & tf.keras.preprocessing.text.
Tokenizer
TF在实践中使用tf.Keras.preprocessing.text.
Tokenizer
()实现,文本加载教程使用tfds.features.te
浏览 3
修改于2020-05-07
得票数 3
回答已采纳
2
回答
使用Regex
Tokenizer
进行标记
我想用正则表达式标记器对下面的句子进行标记化当我将记号赋予器定义为
tokenizer
= RegexpTokenizer(r'\w+')
浏览 10
修改于2017-12-19
得票数 1
回答已采纳
4
回答
boost::
tokenizer
vs boost::split
boost::split(tokens, message, boost::is_any_of("^"));boost::char_separator<char> sep("^"); boost::
tokenizer
浏览 4
修改于2018-03-19
得票数 32
回答已采纳
2
回答
Java
Tokenizer
,分隔字符串
我不知道为什么我在这件事上挣扎得这么厉害,但任何帮助都会非常感谢。输入:AND 3, 4, 5 ; some commentsAND --- command, --- delimiter, --- delimiter我现在让它在我输出的地方工作:但我需要进一步分析它。ArrayList<Token
浏览 3
修改于2012-10-26
得票数 4
回答已采纳
3
回答
Keras‘
Tokenizer
vs sklearn的CountVectorizer
我不确定是使用keras.text_preprocessing.
Tokenizer
还是sklearn.feature_extraction.text.CountVectorizer.有什么建议吗?
浏览 3
提问于2020-01-23
得票数 3
1
回答
tokenizer
.encode和
tokenizer
.encode_plus在拥抱脸上有什么不同
你能帮我解释一下为什么
tokenizer
.encode和
tokenizer
.encode_plus给出不同的结果吗?示例1(使用.encode_plus()):not_paraphrase =
tokenizer
.encode_plus(sequence_0, sequence_1, return_tensors="pt")
浏览 1
修改于2020-05-10
得票数 19
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券