grep命令的使用

前言

grep命令是Linux中非常重要的一个命令,主要用于文本查找,也就是在一个文本中提取出我们所需要的信息,grep可以使用正则表达式来辅助匹配,极大地提高了匹配的效率。

基本的正则表达式

元字符

所谓的元字符,就是正则表达式中用与代表其他字符的字符,比较常使用到的内容如下所示:

[a-z]、[0-9]、[A-Z]、[a-zA-Z]
[:space:]:空白字符集、[[:space:]]:空白字符集中的一个
[:punct:]:标点
[:lower:]:小写字母
[:upper:]:大写字母
[:alpha:]:大小写字母
[:digit:]:数字
[:alnum:]:数字和大小写字母
.:任意字符
[ABC]:代表中括号中的任意一个字符(这里是ABC中任意一个)

匹配次数

*:匹配前面字符任意次
  .*:则可以代表任意字符任意次
?:匹配前面字符1次或0次
+:匹配前面字符至少一次
{m,n}:匹配前面字符至少m次,至多n次
  {1,}:匹配前面字符至少一次
  {1,3}:匹配前面字符1-3次
  这里使用的时候需要注意,逗号前后不能加空格

位置锚定

^:锚定行首
$:锚定行尾
\bWORD 或者 \<WORD:锚定词首
WORD\b 或者 WORD\>:锚定词尾

特殊字符

():小括号用于分组,主要用于实现后向引用
\1、\2、\3 ...:后向引用
| :或者,用于实现多选一,类似于[]的作用
  C|cat:匹配的是C或者cat
  (c|C)at:匹配的是cat或者cat

grep命令的使用

grep的语法

grep命令的用法如下所示
# grep [OPTION] PATTERN FILE

选项的内容可以有:
  -i:忽略大小写
  --color:高亮显示匹配到的文本
  -v:反向查找,显示没有被匹配到的文本
  -o:只显示匹配到的文本
  -E:使用扩展的正则表达式,一般均使用扩展的正则表达式
  -A n:显示匹配到的行以及前n行
  -B n:显示匹配到的行以及后n行
  -C n:显示匹配到的行以及前后各n行

PATTERN则为需要匹配的正则表达式
FILE为所需要匹配的文本

典型查找例子

为了更好地演示效果,这里新建一个文件 testGrep,内容如下所示

a
ab
aab
hello
world
cccccccccccccccc
123aaaa1223
aaa22233aaaa
bbb 222 sss -- --
aa*888dad--6$#

简单匹配以及匹配的结果如下所示

1、匹配含有a
  # grep a grepText
  匹配结果:
    a
    ab
    aab
    123aaaa1223
    aaa22233aaaa
    aaa 222 sss -- --
    aa*888dad--6$#
2、匹配至少含有两个a
  # grep -E a\{2,\} grepText
    ! 这里使用反斜线主要是花括号在shell中有特殊含义,所以这里需要对其进行转义
  匹配结果:
    aab
    123aaaa1223
    aaa22233aaaa
    aaa 222 sss -- --
    aa*888dad--6$#
3、匹配含有空格的内容
  # grep -E .*[[:space:]].* grepText
  匹配结果:
    aaa 222 sss -- --
4、匹配以a开头并且以a结尾的行
  # grep -E ^a.*a$ grepText
  匹配结果:
    aaa22233aaaa

总结

本小节主要学习了grep命令的使用,包含了常见的正则表达式的元字符等,需要注意的是,grep命令有两个兄弟命令,分别是egrep,fgrep,其中egrep等价于grep -E,fgrep则是不使用正则表达式来提高效率,Linux的学习之路还在继续