正则表达式的元字符

正则表达式的元字符是具有特殊含义的字符,用于定义匹配规则。

第1点:元字符

d 匹配所有单个数字(可以取代[0-9],但不能取代)

D 匹配单个数字以外的字符(包括字母,汉字,空格,下划线,各类符号。可以替代[a-zA-Z],但不能取代)

[一-龥]或[u4E00-U9FA5]只匹配汉字

w 区配单个字母,汉字,数字,和_

W 匹配任何非单词字符(包括空格,各类符号,但不能识别下划线)

s 匹配任何空白字符(空格,制表符,换行符等,眼睛看不到的)

S 匹配任何非字白字符(眼睛能看到的)

匹配一个换行符

匹配一个回车符

匹配一个制表符(tab键)

. 匹配除”
“之外的任何单个字符

匹配一个字母和空格的位置(不支持汉字)

第2点:案例说明

将表格中的数字用正则表达式提取出来

正则表达式的元字符

表格

Sub yzf()
Dim s As Range, sj, n
'导入正则表达式
Set regx = CreateObject("vbscript.regexp")

With regx
    .Global = True
    'd表明匹配数字
    .Pattern = "d+"
    For Each s In Range("a1", Cells(Rows.Count, 1).End(xlUp))
        Set sj = .Execute(s)
        For Each ssl In sj
            n = n + 1
            s.Offset(0, n) = ssl
    Next ssl
    n = 0
   Next s
End With
Set regx = Nothing
End Sub

第3点:学习要点

先掌握核心元字符:从 . * + [] d 等基础开始,不要急于学习复杂规则。

结合场景练习:列如用正则提取文本中的手机号、邮箱,或清洗 Excel 数据.

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容