文章/答案/技术大牛

发布

社区首页 >问答首页 >用于Python regex的unicode文本中的Word边界

问用于Python regex的unicode文本中的Word边界
EN

Stack Overflow用户

提问于 2013-10-15 07:38:23

回答 3查看 1.5K关注 0票数 6

我希望在正则表达式中使用word边界来匹配某些unicode文本。在Python中，Unicode字母被检测为单词边界，如下所示：

>>> re.search(r"\by\b","üyü")
<_sre.SRE_Match object at 0x02819E58>

>>> re.search(r"\by\b","ğyğ")
<_sre.SRE_Match object at 0x028250C8>

>>> re.search(r"\by\b","uyu")
>>>

我应该怎么做才能使单词边界符号与unicode字母不匹配？

regex

unicode

python

回答 3

Stack Overflow用户

回答已采纳

发布于 2013-10-15 09:22:20

您可以通过以下方式使用它：

re.search(r'(?u)\by\b', 'üyü')

若要熟悉旗标实验，请使用以下内容：(?iLmsux)

作为一个很好的读物，查看3 edition..There是关于Regex‘in的一个很好的章节。

票数 5

Stack Overflow用户

发布于 2013-10-15 07:45:20

使用re.UNICODE

>>> re.search(r"\by\b","üyü", re.UNICODE)
>>>

票数 9

Stack Overflow用户

发布于 2017-12-06 08:27:03

#!/usr/bin/python
# -*- coding: utf-8 -*-

s = ur"abcd ААБВ"
import re
rx1 = re.compile(ur"(?u)АБВ")
rx2 = re.compile(ur"(?u)АБВ\b")
rx3 = re.compile(ur"(?u)\bАБВ\b")
print rx1.findall(s)
print rx2.findall(s)
print rx3.findall(s)

print re.search(ur'(?u)ривет\b', ur'Привет')
print re.search(ur'(?u)\bривет\b', ur'Привет')

输出：

[u'\u0410\u0411\u0412']
[u'\u0410\u0411\u0412']
[]
<_sre.SRE_Match object at 0x01F056B0>
None

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/19375666

复制

相似问题

问用于Python regex的unicode文本中的Word边界
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于Python regex的unicode文本中的Word边界EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于Python regex的unicode文本中的Word边界
EN