Linux系统的学习过程中,会认识很多命令,记住这些命令会对你学习Linux系统,有很好的提高。你可能会看到grep命令,这里将介绍grep命令的知识。
1.作用
Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。
2.格式
grep [options]
3.主要参数
[options]主要参数:
-c:只输出匹配行的计数。
-I:不区分大小写(只适用于单字符)。
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。
pattern正则表达式主要参数:
\:忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达式的行开始。
\>:到匹配正则表达式的行结束。
[ ]:单个字符,如[A]即A符合要求 。
[ - ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
。:所有的单个字符。
* :有字符,长度可以为0。
4.grep命令使用简单实例
$ grep ‘test’ d*
显示所有以d开头的文件中包含test的行。
$ grep ‘test’ aa bb cc
显示在aa,bb,cc文件中匹配test的行。
$ grep ‘[a-z]\{5\}’ aa
显示所有包含每个字符串至少有5个连续小写字符的字符串的行。
$ grep ‘w\(es\)t.*\1′ aa
如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这些字符后面紧跟着另外一个es(\1),找到就显示该行。如果用egrep或grep -E,就不用”\”号进行转义,直接写成’w(es)t.*\1′就可以了。
5.grep命令使用复杂实例
假设您正在’/usr/src/Linux/Doc’目录下搜索带字符串’magic’的文件:
$ grep magic /usr/src/Linux/Doc/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?
其中文件’sysrp.txt’包含该字符串,讨论的是 SysRQ 的功能。
默认情况下,’grep’只搜索当前目录。如果此目录下有许多子目录,’grep’会以如下形式列出:
grep: sound: Is a directory
这可能会使’grep’的输出难于阅读。这里有两种解决的办法:
明确要求搜索子目录:grep -r
或忽略子目录:grep -d skip
如果有很多输出时,您可以通过管道将其转到’less’上阅读:
$ grep magic /usr/src/Linux/Documentation/* | less
这样,您就可以更方便地阅读。
有一点要注意,您必需提供一个文件过滤方式(搜索全部文件的话用 *)。如果您忘了,’grep’会一直等着,直到该程序被中断。如果您遇到了这样的情况,按 <CTRL c> ,然后再试。
下面还有一些有意思的命令行参数:
grep -i pattern files :不区分大小写地搜索。默认情况区分大小写,
grep -l pattern files :只列出匹配的文件名,
grep -L pattern files :列出不匹配的文件名,
grep -w pattern files :只匹配整个单词,而不是字符串的一部分(如匹配’magic’,而不是’magical’),
grep -C number pattern files :匹配的上下文分别显示[number]行,
grep pattern1 | pattern2 files :显示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 :显示既匹配 pattern1 又匹配 pattern2 的行。
这里还有些用于搜索的特殊符号:
\< 和 \> 分别标注单词的开始与结尾。
例如:
grep man * 会匹配 ‘Batman’、’manic’、’man’等,
grep ‘\<man’ * 匹配’manic’和’man’,但不是’Batman’,
grep ‘\<man\>’ 只匹配’man’,而不是’Batman’或’manic’等其他的字符串。
‘^’:指匹配的字符串在行首,
‘$’:指匹配的字符串在行尾,
1. grep简介
grep (global search regular expression_r(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。Linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。
grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。
2. POSIX字符类
为了在不同国家的字符编码中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符类,如[:alnum:]是A-Za-z0-9的另一个写法。要把它们放到[]号内才能成为正则表达式,如[A- Za-z0-9]或[[:alnum:]]。在Linux下的grep除fgrep外,都支持POSIX的字符类。
[:alnum:]
文字数字字符
[:alpha:]
文字字符
[:digit:]
数字字符
[:graph:]
非空字符(非空格、控制字符)
[:lower:]
小写字符
[:cntrl:]
控制字符
[:print:]
非空字符(包括空格)
[:punct:]
[:space:]
[:upper:]
大写字符
[:xdigit:]
十六进制数字(0-9,a-f,A-F)
3.Grep命令选项
-?
同时显示匹配行上下的?行,如:grep -2 pattern filename同时显示匹配行的上下2行。
-b,--byte-offset
打印匹配行前面打印该行所在的块号码。
-c,--count
只打印匹配的行数,不显示匹配的内容。
-f File,--file=File
从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。
-h,--no-filename
当搜索多个文件时,不显示匹配文件名前缀。
-i,--ignore-case
忽略大小写差别。
-q,--quiet
取消显示,只返回退出状态。0则表示找到了匹配的行。
-l,--files-with-matches
打印匹配模板的文件清单。
-L,--files-without-match
打印不匹配模板的文件清单。
-n,--line-number
在匹配的行前面打印行号。
-s,--silent
不显示关于不存在或者无法读取文件的错误信息。
-v,--revert-match
反检索,只显示不匹配的行。
-w,--word-regexp
如果被<和>引用,就把表达式做为一个单词搜索。
-V,--version
显示软件版本信息。
4.实例
要用好grep这个工具,其实就是要写好正则表达式,所以这里不对grep的所有功能进行实例讲解,只列几个例子,讲解一个正则表达式的写法。
$ ls -l | grep '^a'
通过管道过滤ls -l输出的内容,只显示以a开头的行。
$ grep 'test' d*
显示所有以d开头的文件中包含test的行。
$ grep 'test' aa bb cc
显示在aa,bb,cc文件中匹配test的行。
$ grep '[a-z]' aa
显示所有包含每个字符串至少有5个连续小写字符的字符串的行。
$ grep 'w(es)t.*' aa
如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这些字符后面紧跟着另外一个es(),找到就显示该行。如果用egrep或grep -E,就不用""号进行转义,直接写成'w(es)t.*'就可以了。
find - 在目录层次中寻找文件
概要
find [path...] [expression]
路径 表达式
描述
这个文档是GNU版本find命令的使用手册。find搜索目录树上的每一个文件名,它从左至右鉴定给定的表达式,按照优先规则(见运算符一节)进行匹配,直到知道结果(运算符左边值为假则进行与操作,为真则进行或操作),然后find移向下一个文件名。第一个开头带有'-','(',')',',',或 '!'这些字符的参数将是表达式的开始;在它之前的一些参数是要搜索的路径,在它之后的一些参数是测试类型的表达式。缺省路径用当前目录,缺省表达式用' -print'.假如所有文件都能成功进行检索,find将返回一个 状态值0,有错误发生则返回一个大于0的值。
表达式
这个表达式是由选项(其总是影响所有的操作,而不仅仅是一个指定的文件,而且总是返回真值),测试(其返回一个真值或一个假值),和事件()组成,它们都有运算符分开.-and用在运算符忽略的地方.若表达式没有包含事件,这个表达式为真值,则 -prune, -print这两个事件将用于搜索所有的文件时缺省使用。
选项
所有的选项都能返回真值,它们总能被执行,除非放在表达式中执行不到的地方。因此,通常把它们放在表达式的开头部分。
-daystart
从今天也不从24小时之前开始计量时间(对 -amin,-atime, -cmin, -ctime, -mmin, 和-mtime有效)。
-depth
先搜索目录的内容再搜索目录本身。
-follow
不检索符号链接。意即 -noleaf。
-help, --help
列出find的命令行用法的概要,然后返回
-maxdepth levels
在命令行下目录的最大深度级别(非负整数),'-maxdepth 0'意味着只在命令行参数中应用检测和事件。
-mindepth levels
小于指定数字(非负整数)的深度级别的目录层次将不应用检测和事件。'-mindepth 1'意味着除了当前的命令行参数外将搜索所有的文件。
-mount
在其它文件系统中不进入目录。
-noleaf
不优化假如某一个目录里包含少于两个以下的子目录。这个选项在那些不遵循UNIX文件系统链界约定的文件系统中用,像CD-ROM,MS-DOS或AFS卷加载点上。在UNIX文件系统中,每个目录有至少两个硬链接,它的名字和'.'。它的子目录(假如有)各自有一个'..'链接到它本身。在FIND检索一个目录时,在统计其子目录少于两个,意味着将不需要在进行下去了。只需要检索一下这个目录名;这在检索速度上是个有意义的提高。
-version, --version
显示FIND的版本号,终止程序。
-xdev 在其它文件系统中不进入目录。
测试
用下边的格式可以指定数字参数
+n 比n大。
-n 比n小。
n 恰好是n。
-amin n
文件最后一次访问是在n分钟前。
-anewer file
文件最后访问时间比指定的file修改时间更晚。 -anewer会受到-follow的影响当在命令行中-follow在-anewer之前时。
-atime n
文件最后一次访问是n*24小时前。
-cmin n
文件的状态的改变是在n分钟前。
-cnewer file
文件状态的改变比指定的file状态的改变时间更晚。-cnewer会受到-follow的影响当命令行中-follow在-cnewer之前时。
-ctime n
文件状态的改变时间是在n*24小时前。
-empty 文件是空的,它是一个正规的文件或目录。
-false 总是假。
-fstype type
文件是type类型。在不同的unix系统中有多种不同的文件系统类型。在一些不同版本的unix中有效的文件类型有:ufs,4.2, 4.3, nfs, tmp, mfs, S51k, S52k.你可以用-printf加上%F指示来看你的文件系统的类型。
-gid n 文件的数字型组ID是n.
-group gname
文件属于组gname(允许数字型的gname).
-ilname pattern
同-lname, 但是匹配是大小些不区分的.
-iname pattern
同-name,但是匹配是大小些不区分的。举个例子,这个通配符'fo*'和'f??'匹配文件名'Foo', 'FOO', 'foo', 'fOo',等等。
-inum n
文件的i结点数是n.
-ipath pattern
同 -path, 但是匹配大小写不区分。
-iregex pattern
同 -regex, 但是匹配大小写不区分.
-links n
文件有n个链结。
-lname pattern
文件是个符号链结内容匹配shell通配符pattern。元字符'/'或'.'不能区别对待。
-mmin n
文件的数据最后一次被编辑是在n分钟前.
-mtime n
文件的数据最后一次被编辑是在n*24小时前.
-name pattern
基本的文件名(起始的目录已经检测过了)匹配shell通配符pattern.元字符('*', '?', 和'[]')不能匹配一个以'.'开头的文件名。忽略在它下边的目录或文件,用-prune;参看-path描述中的例子。
-newer file
文件最后编辑时间比指定的file晚
-newer会受到-follow的影响当在命令行中-follow在-newer之前时。
-nouser
没有用户符合文件的数字型用户ID.
-nogroup
没有组符合文件的数字型组ID.
-path pattern
文 件名匹配shell通配符pattern.元字符不能区分'/'和'.';因此,像例子find . -path './sr*sc'将列出一个目录条目'./src/misc'(假如它存在的话).忽略整个目录树,用-prune比检测树中的每一个文件要好一些。举个例子,跳过'src/emacs'和它下边的所有文件,列出其它发现的文件,执行下边的命令: find . -path './src/emacs' -prune -o -print
-perm mode
文件的访问权限位恰好是mode(八进制或符号).符号模式用模式0做为开始。
-perm -mode
文件的所有访问权限位mode都设了。
-perm +mode
文件的一些访问权限位mode设了。
-regex pattern
文件匹配规则的表达式通配符。这是一个在整个路径中的匹配,而不是一个检索。举个例子,匹配一个'./fubar3'文件名的文件,你应该用规则的表达式'.*bar.'或'.*b.*3',而不是'b.*r3'.
-size n[bckw]
文件占用n个单元空间。在缺省时或n后边跟着字符b时,这个单元是512字节的块,n后边跟着c是字节,n后边跟着k是千字节,n后边跟着w是两个字节的词.文件大小不能计算间接的块,但是能计算很少的没能实际分配大小的文件。
-true 总是真
-type c
文件是类型c:
b 块(缓冲)设备.
c 字符设备.
d 目录.
p 有名管道(FIFO).
f 规则文件.
l 符号链结.
s 插座.
-uid n 文件的数字型用户ID是n.
-used n
文件的最后访问时间是在它的状态改变时间的n天前.
-user uname
文件是属于名为uname(数字型ID也可)的用户。
-xtype c
这一项是和-type相同的除非文件是一个符号链结。
若是符号链结:假如 -follow 没有给出,若这个文件链结的是类型为c的文件,则返回真;假如给了-follow选项,若c为'l',则返回真.对于符号链结, -xtype检测链结的文件类型,-type不做这样的检测。
事件
-exec command ;
执行命令;返回的状态值为零则为真。所有在这之后的参数都是command的参数,直到遇到';'.字符串'{}'将被当前的文件名代替,作为当前命令的参数,并不是象一些版本FIND一样是个单独存在的一个参数,这些语句应该被转义(用'')或被引用,以此来保护他们被SHELL展开。这个命令将在起始目录被执行。
-fls file
值为真;同 -ls 但像 -fprint一样将输出写向文件file
-fprint file
值为真;输出整个文件名到文件file中.当find运行时file不存在,它将被建立;若存在,原来的文件内容将被删掉。也可以用名为"/dev/stdout"和"/dev/stderr"的文件,它们分别指的时是标准输出和标准错误。
-fprint0 file
值为真;同 -printf 但是将像 -fprint 一样将输出写像文件file.
-ok command
同 -exec但是先问用户(在标准输入);假如应答不是以'y'或'Y'开头,将不执行command,返回假。
-print 值为真;在标准输出上输出整个文件名,并加一个新行。
-print0
值为真;在标准输出上输出整个文件名,并加一个空字符。这将允许其它程序能正确的处理在FIND输出中包含新行的文件名。
-printf format
值为真。通过解释转义字符''和指示字符'%',格式化输出到标准输出上.空间宽度和精度能像c函数'printf'一样被指定。不像 -print, -printf不能在字符串的末尾自动加一个新行。这些转义和指示字符是:
a 鸣声.
b 退格键.
c 马上停止格式输出,输出到标准输出上。
f 换页符.
n 行符.
r 回车符.
t 水平制表符.
v 竖直制表符.
反斜线.
一个''字符后跟着其它字符将被视为普通字符,它们都将被输出。
%% 符号'%'.
%a 在格式输出中通过调用c函数'ctime'返回文件的最后访问时间。
%AK 用K指定的格式输出文件的最后访问时间。K可以是'@'或者C函数 'strftime' 函数的一个指示。有效的K值列在下边;它们不一定在所有的系统中都有效,主要取决于这些系统中'strftime'函数的异同。
@ 从Jan. 1, 1970, 00:00 GMT到现在的秒数。
时间域:
H 点钟 (00..23).
I 点钟 (01..12).
k 点种 ( 0..23).
l 点钟 ( 1..12).
M 分钟 ( 00.59).
p 本地的上午或下午.
r 时间,12小时格式 (hh:mm:ss[AP]M).
S 秒钟 (00.61).
T 时间,24小时格式 (hh:mm:ss).
X 本地的时间表示 (H:M:S).
Z 时区 (举例来说,EDT(美国东部时区)),或没有表示没有可决定的时区。
日期域:
a 本地缩写的星期名 (Sun..Sat).
A 本地完全的星期名,不定长 (Sunday..Saturday).
b 本地缩写的月份名 (Jan...Dec).
B 本地完全的月份名,不定长 (January...December).
c 本地的日期和时间 (Sat Nov 04 12:02:33 EST 1989).
d 当月的哪一天 (01..31).
D 日期 (mm/dd/yy).
h 同 b.
j 当年的哪一天 (001..366).
m 月份 (01..12).
U 当年的星期数,用星期日做为一星期的第一天 (00..53).
w 星期的哪一天
W 当年的星期数,用星期一做为一星期的第一天 (00..53).
x 本地的日期表示法 (mm/dd/yy).
y 当年的最后两位数 (00..99).
Y 年份 (1970...).
%b 用512字节的块计算的文件的大小(上舍入)。
%c 用C函数'ctime'返回的文件状态的最后改变时间。
%Ck 被k指定的文件状态的最后改变时间,k与%A后的k相同.
%d 文件在目录树中的深度;0意味着文件在命令行参数中.
%f 不带目录的文件名(只有最后的元素).
%F 这个文件所在的文件系统类型名;这个值能被 -fstype用。
%g 文件的组名,若组无名则是组ID.
%G 文件的数字组ID.
%h 文件的主目录 (除了最后的元素).
%H 命令行参数若文件在命令行参数中找到.
%i 文件的i节点数 (10进制格式).
%k 用1K字节的块计算文件的大小(上舍入)。
%l 符号链接的目标(假如文件不是一个符号链接则返回一个空字符串).
%m 文件的访问权限位 (八进制)
%n 文件的硬链接数
%p 文件名.
%P 用在命令行参数之下发现的文件名代替文件名.
%s 用字节计算的文件大小.
%t 用C函数'ctime'返回的文件的最后编辑时间。
%Tk 被k指定格式的文件的最后编辑时间,k与%A后的k相同.
%u 文件的用户名,若没有则输出用户数字ID.
%U 文件的数字ID.
字符'%'后跟着另外的字符将被丢弃(但是其它的字符将输出).
-prune 假如 -depth 没指定,值为真;不进入当前的目录。
若 -depth 给定,值为假;没作用.
-ls 值为真;用 'ls -dils'格式在标准输出中列出当前目录的文件。
块记数单位是1k字节,除非 设定了POSIXLY_CORRECT环境变量,将用512字节作为单位。
操作符
列出优先级顺序
( expr )
强制优先.
! expr 假如expr为假则为真.
-not expr
同 ! expr.
expr1 expr2
和操作(默认); 假如expr1值是假expr2不能鉴定。
expr1 -a expr2
同 expr1 expr2.
expr1 -o expr2
与操作;假如expr1值是真expr2不能鉴定。
expr1 -or expr2
同 expr1 -o expr2.
expr1, expr2
序列;expr1,expr2都能被执行,expr1的值舍弃;
序列的值是expr2的值。
参见
locate(1L), locatedb(5L), updatedb(1L), xargs(1L)