第七章 正则表达式 更新中
1.re模块
Python标准库中的正则表达式模块,用于查找相关标准文本模式
正则表达式字符分类与符号作用
字符 | 描述 |
---|---|
\d | 0~9中任意数字 |
\D | 除0~9之外任何字符 |
\w | 任何字母、数字或下划线字符 |
\W | 除字母、数字与下划线外的其他字符 |
\s | 空格、制表符或换行符 |
\S | 除空格、制表符或换行符外的其他字符 |
| | 称为“管道”,表示可以匹配许多表达式中的一个 |
. | 除换行符之外的所有字符 |
[abc] | 匹配方括号里的所有字符 |
[^abc] | 匹配不在方括号里的所有字符 |
?/*/+ | 匹配 零次或一次/零次或多次/一次或多次 前面的分组 |
{n,m} | 匹配n~m次前面的分组(n默认为0,m默认为无数) |
{n,m}? | 惰性(非贪心)匹配,表示尽可能匹配最短的字符串 |
^spam | 意味着字符串必须以spam开始 |
spam$ | 意味着字符串必须以spam结束 |
\ | 转义正则中有特殊含义的字符,如:. ^ $ * + ? { } [ ] \ | ( ) |