文章/答案/技术大牛

发布

社区首页 >问答首页 >Fuzzywuzzy没有给出适当的结果

问Fuzzywuzzy没有给出适当的结果
EN

Stack Overflow用户

提问于 2022-10-01 11:10:47

回答 1查看 62关注 0票数 0

我想检查一下--用户=‘Jefferey Roberts'，而fuzzywuzzy给出了这个结果-- result=('Jeremiah James Roberts Jr'，86岁)，(Jeffrey Scott Roberts，81岁)，(Jeremiah J Roberts，71岁)

密码-

from fuzzywuzzy import process
user='Jefferey Roberts'
result=['Jeremiah James Roberts Jr', 'Jeffrey Scott Roberts', 'Jeremiah J Roberts']
output=process.extract(user,result)
print(output)

它应该给结果列表中的第二个元素更多的分数。

类似地，如果我在这个列表“Gary”、“Zayn Waller”、“Debra”中搜索“Gary”，并搜索“Gary”，它将返回Zayn Waller，而不是Gary第一个索引。

密码-

from difflib import get_close_matches
user='Gary Waller'
result= ['Gary Wayne Waller', 'Zayn Waller', 'Debra Kay Waller']
output=get_close_matches(user,result)
print(output)

请帮助解决任何解决方案或任何更好的准确模块，除了模糊和get_close_matches。

python

回答 1

Stack Overflow用户

发布于 2022-10-01 11:19:44

你可以使用"SequenceMatcher“

from difflib import SequenceMatcher

b = "Jefferey Roberts"
a_lst = ['Jeremiah James Roberts Jr', 'Jeffrey Scott Roberts', 'Jeremiah J Roberts']

for a in a_lst:
    print(a,SequenceMatcher(None, a, b).ratio())

产出；

Jeremiah James Roberts Jr 0.5853658536585366
Jeffrey Scott Roberts 0.8108108108108109
Jeremiah J Roberts 0.7058823529411765

编辑：

检查这个类似的匹配b/w字符串的文章，以查看所有可用于匹配的算法/包。Find the similarity metric between two strings

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73917834

复制

相似问题

问Fuzzywuzzy没有给出适当的结果
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Fuzzywuzzy没有给出适当的结果EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Fuzzywuzzy没有给出适当的结果
EN