从一个文件或命令输出中抽取或过滤文本时。可使用正则表达式(RE),正则表达式是一些特殊或不很特殊的字符串模式的集合。
基本的元字符集:
^ 只匹配行首。
$ 只匹配行尾。
* 一个单字符后紧跟*,匹配0个或多个此单字符。
[] 匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用-来表示[]内范围,如[1-5]等价于[1,2,3,4,5]。
屏蔽一个元字符的特殊含义,如$表示字符$,而不表示匹配行尾。
. 匹配任意单字符。
pattern{n} 匹配pattern出现的次数n
pattern{n,}m匹配pattern出现的次数,但表示次数最少为n
pattern{n,m} 匹配pattern出现的次数在n与m之间(n,m为0-255)
常见例子:
显示可执行的文件:ls –l | grep …x...x..x
只显示文件夹:ls –l | grep ^d
匹配所有的空行:^$
匹配所有的单词:[A-Z a-z]*
匹配任一非字母型字符:[^A-Z a-z]
包含八个字符的行:^……..$(8个.)
更多内容,请查阅正则表达式的详细资料加深学习。