正则表达式匹配货币 (如人民币符号 ¥)

2017/11/28 ➞2017/11/29

UPDATE 2017-11-29 : 之前是我搞错了, ¥ 的 unicode 编码应该是\uffe5, 用了这个就能成功匹配了, 我使用的转换工具是这个网站


初衷是觉得淘口令太冗余了, 想提取一下其中的有效信息, 本来应该很简单的, 却始终无法匹配 ¥ 这个符号.

后来得知 ¥ 是一个特殊的 unicode 符号, 不能简单地匹配. 尝试了 unicode 的通用表达式 (\uxxxx, 对 ¥ 就是\u05aa) 发现无效, 所幸用 \p{Sc} 成功了, 它可以匹配 unicode 中各货币符号 ($ ¥ €…), 缺点就是没有针对性了.

参考: xml schema 正则表达式高级用法