Skip to content

第七章 正则表达式 更新中

1.re模块

Python标准库中的正则表达式模块,用于查找相关标准文本模式

正则表达式字符分类与符号作用
字符描述
\d0~9中任意数字
\D除0~9之外任何字符
\w任何字母、数字或下划线字符
\W除字母、数字与下划线外的其他字符
\s空格、制表符或换行符
\S除空格、制表符或换行符外的其他字符
|称为“管道”,表示可以匹配许多表达式中的一个
.除换行符之外的所有字符
[abc]匹配方括号里的所有字符
[^abc]匹配不在方括号里的所有字符
?/*/+匹配 零次或一次/零次或多次/一次或多次 前面的分组
{n,m}匹配n~m次前面的分组(n默认为0,m默认为无数)
{n,m}?惰性(非贪心)匹配,表示尽可能匹配最短的字符串
^spam意味着字符串必须以spam开始
spam$意味着字符串必须以spam结束
\转义正则中有特殊含义的字符,如:. ^ $ * + ? { } [ ] \ | ( )