扩展正则表达式

问号

问号表明前面字符可以出现0次或1次

可以和字符组一起使用

加号

加号表明前面的字符可以出现1次或多次,但必须至少出现1次

加号同样适用于字符组

花括号

花括号允许为正则表达式指定具体的可重复次数,这通常称为区间

  • {m}
  • {m,n}

在默认的情况下,gawk不识别正则表达式区间,必须指定gawk的命令行选项 –re-interval 才行

区间也适用于字符组

竖线符号

逻辑 OR 方式指定正则表达式引擎要使用的两个或多个模式

正则表达式和竖线符合之间不能有空格,否则竖线符号会被认为是正则表达式模式的一部分

表达式分组

可以用圆括号对正则表达式进行分组。分组之后,每一组会被视为一个整体,可以像对普通字符一样对该组应用特殊字符

将分组和竖线符号结合起来创建可选的模式匹配组是很常见的做法