搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Tokenizer与尼采

现在我正在尝试使用Tokenizer。

浏览 15提问于2019-05-12得票数 0

回答已采纳

1回答

呈现相同输出的Bigram Tokenizer和Unigram Tokenizer

我的n-gram标记器无法正常工作。unigram似乎工作得很好，但只要我将二元语法分词器应用于语料库，它就会返回与unigram分词器相同的单词列表。代码如下。blogs <- readLines("en_US.blogs.txt", news <- readLines("en_US.news.txt", enc

浏览 16提问于2017-07-24得票数 0

1回答

PHP Tokenizer多行问题

我正在使用token_get_all开发一个工具。我遇到了在php代码中有以下查询的情况 `Value_Content` = '" . $this->db->escape($revisionValues['value']) . "', `Comments` = '" . $this->db->escape($revisionValues['comment']

浏览 3提问于2012-12-18得票数 0

3回答

如何为boost::tokenizer实现tokenizer.rbegin()和rend()？

我在玩boost::tokenizer，但是我意识到它不支持rbegin()和rend()。我想问一下，如何将这两个函数添加到现有的类中？这是来自boost站点的：#include <string>using namespace boost; string str( "12/12/1986" );

浏览 2修改于2011-06-06得票数 3

回答已采纳

1回答

Lucene Tokenizer -包含空格

我们有一个应用程序，可以对某些数据进行标记。我的问题是我有一个逗号分隔的字段，我需要标记化，但不是在空格上。例如：变成了678Age 6Age 8我目前拥有的配置设置：boost="1f&

浏览 5修改于2017-02-15得票数 1

1回答

Solr Facet和Tokenizer

"myLower" class="solr.TextField" positionIncrementGap="100"> <tokenizerclass="solr.LowerCaseFilterFactory"/> <analyzer type="query">

浏览 15提问于2017-01-05得票数 0

回答已采纳

4回答

java Tokenizer slip

我想将字符串行转换为标记(存储在字符串表中)，并且我只能使用java.io.*这是为了实现一个计算器。到表{“1”，"+"，"2"，"+"，"3"}

浏览 0修改于2011-04-13得票数 0

1回答

Elasticsearch - Tokenizer配置

有人知道要使用什么标记器以及如何启用以下规则，输出(预期)：

浏览 3提问于2015-07-02得票数 0

1回答

Solr Tokenizer问题

我有一个我认为是简单的solr练习，但我不确定要使用什么。我也喜欢它，以便优先考虑名字。编辑:对搜索能力进行两次编辑。1.类似&#

浏览 1修改于2012-04-30得票数 2

回答已采纳

0回答

Python Tokenizer:字数限制

我用python为我的语言编写了一个标记器，但是当我试图标记化一个文件时，它只对它进行标记化。It标记器只能标记大约90个标记(单词和符号分开)，而它应该标记所有文件。代码如下：data=myfile.read().replace('\n', '') (r"[0-9]+", lamb

浏览 1提问于2017-11-26得票数 1

1回答

无法查看keras Tokenizer方法

我正在尝试查看github上的keras Tokenizer代码、类及其方法。

浏览 12提问于2019-06-24得票数 0

回答已采纳

1回答

Lucene Tokenizer不推荐

下面的Analyzer扩展有许多不推荐的子类。非反对的替代者是什么？用于StandardTokenizer、StandardFilter、LowerCaseFilter和StopFilter --如下所示。 this.version = version; @SuppressWarnings("r

浏览 1提问于2015-05-28得票数 1

回答已采纳

1回答

无法从Keras导入Tokenizer

目前正在处理一个深度学习示例，他们正在使用Tokenizer包。我收到以下错误：下面是我的代码：tokenizer.fit_on_sequence

浏览 1提问于2018-02-03得票数 2

回答已采纳

1回答

AttributeError: spacy.tokenizer.Tokenizer对象没有属性“tokens_from_list”

'spacy.tokenizer.Tokenizer‘对象没有属性'tokens_from_list'en_nlp = spacy.load("en_core_web_sm", disable=['parser', 'ner']) old_tokenizer = en_nlp.tokenizeren_nlp.tokenizer = lambda stri

浏览 11提问于2022-02-25得票数 0

1回答

tf.keras.preprocessing.text.Tokenizer()和tfds.features.text.Tokenizer()的比较

我的困惑源于Tokenizer类的各种实现，这些实现可以在Tensorflow生态系统中找到。Tokenizer类既存在于Tensorflow Datasets (tfds)中，也存在于Tensorflow本身中：tfds.features.text.Tokenizer() & tf.keras.preprocessing.text.TokenizerTF在实践中使用tf.Keras.preprocessing.text.Tokenizer()实现，文本加载教程使用tfds.features.te

浏览 3修改于2020-05-07得票数 3

回答已采纳

2回答

使用Regex Tokenizer进行标记

我想用正则表达式标记器对下面的句子进行标记化当我将记号赋予器定义为 tokenizer = RegexpTokenizer(r'\w+')

浏览 10修改于2017-12-19得票数 1

回答已采纳

4回答

boost::tokenizer vs boost::split

boost::split(tokens, message, boost::is_any_of("^"));boost::char_separator<char> sep("^"); boost::tokenizer

浏览 4修改于2018-03-19得票数 32

回答已采纳

2回答

Java Tokenizer，分隔字符串

我不知道为什么我在这件事上挣扎得这么厉害，但任何帮助都会非常感谢。输入：AND 3, 4, 5 ; some commentsAND --- command, --- delimiter, --- delimiter我现在让它在我输出的地方工作：但我需要进一步分析它。ArrayList<Token

浏览 3修改于2012-10-26得票数 4

回答已采纳

3回答

Keras‘Tokenizer vs sklearn的CountVectorizer

我不确定是使用keras.text_preprocessing.Tokenizer还是sklearn.feature_extraction.text.CountVectorizer.有什么建议吗？

浏览 3提问于2020-01-23得票数 3

1回答

tokenizer.encode和tokenizer.encode_plus在拥抱脸上有什么不同

你能帮我解释一下为什么tokenizer.encode和tokenizer.encode_plus给出不同的结果吗？示例1(使用.encode_plus())：not_paraphrase = tokenizer.encode_plus(sequence_0, sequence_1, return_tensors="pt")

浏览 1修改于2020-05-10得票数 19

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Tokenizer与尼采

呈现相同输出的Bigram Tokenizer和Unigram Tokenizer

PHP Tokenizer多行问题

如何为boost::tokenizer实现tokenizer.rbegin()和rend()？

Lucene Tokenizer -包含空格

Solr Facet和Tokenizer

java Tokenizer slip

Elasticsearch - Tokenizer配置

Solr Tokenizer问题

Python Tokenizer:字数限制

无法查看keras Tokenizer方法

Lucene Tokenizer不推荐

无法从Keras导入Tokenizer

AttributeError: spacy.tokenizer.Tokenizer对象没有属性“tokens_from_list”

tf.keras.preprocessing.text.Tokenizer()和tfds.features.text.Tokenizer()的比较

使用Regex Tokenizer进行标记

boost::tokenizer vs boost::split

Java Tokenizer，分隔字符串

Keras‘Tokenizer vs sklearn的CountVectorizer

tokenizer.encode和tokenizer.encode_plus在拥抱脸上有什么不同

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐