我想在这个比较教程的基础上比较word2vec和快速文本模型。Comparison.ipynb
在此基础上,将fastText模型的最大长度n-g设置为零,从而使fastText模型的语义精度提高,使得fastText的行为几乎与word2vec相似。它忽略了纳克。
但是,在加载fastText模型时,我无法找到如何设置此参数的任何形式。对怎么做有什么想法吗?
发布于 2017-08-08 17:59:02
在训练时间设置参数,然后使用该参数建立模型,并依赖于该参数进行解释。所以您通常不会在加载经过训练的模型时更改它,而gensim (或原始FastText)中也没有API来更改已经训练过的模型上的设置。
(通过直接查看源代码和篡改加载的模型状态,您可能可以近似地忽略经过训练的char ngram,但这将是一种新的模式,根本不像在您链接的笔记本中评估的非ngram训练模式。它可能会产生有趣的,或可怕的结果--不尝试是无法判断的。
https://stackoverflow.com/questions/45569142
复制相似问题