首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >删除字符串中除智能引号以外的所有非ASCII字符

删除字符串中除智能引号以外的所有非ASCII字符
EN

Stack Overflow用户
提问于 2019-08-04 03:44:14
回答 2查看 297关注 0票数 2

我使用这个正则表达式从字符串中删除所有非ascii字符,包括所有智能引号:

代码语言:javascript
复制
str.replace(/[\u{0080}-\u{FFFF}]/gu,"");

但我需要保留智能引号

用于删除智能单引号的正则表达式为:[\u2018\u2019\u201A\u201B\u2032\u2035],用于智能双引号的正则表达式为:[\u201C\u201D\u201E\u201F\u2033\u2036]

我需要一个组合正则表达式,删除所有非ASCII码([\u{0080}-\u{FFFF}]),除了智能引号([\u2018\u2019\u201A\u201B\u2032\u2035][\u201C\u201D\u201E\u201F\u2033\u2036])。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-08-04 04:46:00

请注意,您需要在带有u修饰符的正则表达式中使用\u{XXXX}表示法,并且要构建所需的正则表达式,您需要将具有异常的字符类放入位于更通用模式之前的负值前视中:

代码语言:javascript
复制
/(?![\u{2018}\u{2019}\u{201A}\u{201B}\u{2032}\u{2035}\u{201C}\u{201D}\u{201E}\u{201F}\u{2033}\u{2036}])[\u{0080}-\u{FFFF}]/gu

请参阅regex demo

请注意,Unicode表中的一些字符一个接一个地出现,因此我们可以使用范围来缩短模式:

代码语言:javascript
复制
/(?![\u{2018}-\u{201F}\u{2032}\u{2033}\u{2035}\u{2036}])[\u{0080}-\u{FFFF}]/gu

参见this demo

票数 1
EN

Stack Overflow用户

发布于 2019-08-04 03:56:50

不是匹配非ascii,而是匹配ascii+所需的字符,并对表达式求反。示例:

代码语言:javascript
复制
str.replace(/[^\x00-\x7F\u2018\u2019\u201A\u201B\u2032\u2035\u201C\u201D\u201E\u201F\u2033\u2036]/gu,"");
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57341596

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档