python常用的正则表达式及作用 python 正则 _s

python常用的正则表达式及作用 python 正则 \s

目录
  • Python常用正则表达式及影响
    • 基本匹配模式
    • 常用正则表达式示例
    • 常用量词
    • 边界匹配
    • 分组和捕获
    • 常用re模块技巧
    • 示例代码

Python常用正则表达式及影响

正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持:

基本匹配模式

  1. 匹配数字

    • d:匹配任意数字,等价于[0-9]
    • D:匹配任意非数字,等价于[^0-9]
    • 示例:r&039;d+&039;匹配一个或多个连续数字
  2. 匹配字母和数字

    • w:匹配字母、数字或下划线,等价于[a-zA-Z0-9_]
    • W:匹配非字母、数字、下划线,等价于[^a-zA-Z0-9_]
  3. 匹配空白字符

    • s:匹配任意空白字符(空格、制表符、换行等)
    • S:匹配任意非空白字符
  4. 匹配任意字符

    • .:匹配除换行符外的任意单个字符

常用正则表达式示例

  1. 匹配邮箱地址

    r'[w.-]+@[w.-]+.w+’

  2. 匹配URL

    r’https?://(?:[-w.]|(?:%[da-fA-F]2}))+’

  3. 匹配IP地址

    r’b(?:d1,3}.)3}d1,3}b’

  4. 匹配中文

    r'[u4e00-u9fa5]’

  5. 匹配日期(YYYY-MM-DD格式)

    r’d4}-d1,2}-d1,2}’

  6. 匹配手机号码(中国大陆)

    r’1[3-9]d9}’

  7. 匹配HTML标签

    r'<[^>]+>’

  8. 匹配身份证号(18位)

    r'[1-9]d5}(18|19|20)d2}(0[1-9]|1[0-2])(0[1-9]|[12]d|3[01])d3}[dXx]’

常用量词

  1. :匹配前一个字符0次或多次
  2. +:匹配前一个字符1次或多次
  3. ?:匹配前一个字符0次或1次
  4. n}:匹配前一个字符恰好n次
  5. n,}:匹配前一个字符至少n次
  6. n,m}:匹配前一个字符n到m次

边界匹配

  1. ^:匹配字符串开头
  2. $:匹配字符串小编觉得
  3. b:匹配单词边界
  4. B:匹配非单词边界

分组和捕获

  1. ():创建捕获组
  2. (?:):创建非捕获组
  3. (?P<name>):命名捕获组

常用re模块技巧

  1. re.match():从字符串开头匹配
  2. re.search():搜索整个字符串
  3. re.findall():返回所有匹配结局
  4. re.finditer():返回匹配结局的迭代器
  5. re.sub():替换匹配的字符串
  6. re.split():根据模式分割字符串

示例代码

import re 查找所有数字text = “我有3个苹果和5个橙子”numbers = re.findall(r’d+’, text) [‘3’, ‘5’] 验证邮箱格式email = “test@example.com”if re.match(r'[w.-]+@[w.-]+.w+’, email): print(“邮箱格式正确”) 提取URLhtml = ‘<a href=”https://www.example.com” rel=”external nofollow” >链接</a>’url = re.search(r’href=”(https?://[^” rel=”external nofollow” ]+)”‘, html).group(1)

到此这篇关于python常用的正则表达式及影响的文章就介绍到这了,更多相关python正则表达式内容请搜索风君子博客以前的文章或继续浏览下面的相关文章希望大家以后多多支持风君子博客!

无论兄弟们可能感兴趣的文章:

  • Python正则表达式中的re.S的影响详解
  • Python正则表达式以及常用匹配实例
  • python常用的正则表达式大全
  • Python正则表达式常用函数拓展资料
  • Python常用正则表达式符号浅析
  • python的正则表达式re模块的常用技巧