小结

如果要在 shell 脚本中处理数据文件,则必须熟悉正则表达式。正则表达式在 linux 实用工具、编程语言以及采用了正则表达式引擎的应用程序中均有实现。linux 中有一些不同的正则表达式引擎,其中最流行的两种是 POSIX 基础正则表达式(BRE)引擎和 POSIX 扩展正则表达式(ERE)引擎。sed 基本符合 BRE 引擎,而 gawk 则能够使用 ERE 引擎中的大多数特性

正则表达式定义了用于过滤文本的模式。模式由普通字符和特殊字符组成。 正则表达式引擎用特殊字符来匹配一系列单个或多个字符, 这类似于其他应用程序中通配符的工作方式

结合普通字符和特殊字符,可以定义出几乎能够匹配所有种类数据的模式,然后通过 sed 或 gawk 从数据流中过滤特定数据,或者验证应用程序的输入数据