一、sed的概念:
sed意为流编辑器(Stream Editor),在Shell脚本和Makefile中作为过滤器使用非常普遍,也就是 把前一个程序的输出引入sed的输入,经过一系列编辑命令转换为另一种格式输出。sed和vi都源于早期UNIX的ed工具,所以很多sed命令和vi的末行命令是相同的。
sed命令行的基本格式为:
sed option 'script' file1 file2 ...
sed option -f scriptfile file1 file2 ...
sed处理的文件既可以由标准输入重定向得到,也可以当命令行参数传入,命令行参数可以一次传入多个文件,sed会依次处理。 sed的编辑命令可以直接当命令行参数传入,也可以写成一个脚本文件然后用-f参数指定,编辑命令的格式为
/pattern/action
其中pattern是正则表达式,action是编辑操作。sed程序一行一行读出待处理文件,如果某一行与pattern匹配,则执相应的action,如果一条命令没有pattern只有action,这个action将作用于待处理文件的每一行。
sed是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”( pattern space),接着sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。sed主要用来自动编辑一个或多个文件:简化对文件的反复操作。
二、命令和选项:
sed命令告诉sed如何处理由地址指定的各输入行,如果没有指定地址则处理所有的输入行。
命令
a\ : 在当前行后添加一行或多行。多行时除最后一行外,每行末尾需用“\”续行
c\ :用此符号后的新文本替换当前行中的文本。多行时除最后一行外,每行末尾需用”\"续行
i\ :在当前行之前插入文本。多行时除最后一行外,每行末尾需用”\"续行 d删除行
h : 把模式空间的内容复制到暂存缓冲区
H : 把模式空间的内容追加到暂存缓冲区
g : 把暂存缓冲区的内容复制到模式空间,覆盖原有的内容
G: 把暂存缓冲区的内容追加到模式空间里,追加在原有内容的后面
l : 列出非打印字符
p : 打印行
n : 读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理
q : 结束或退出sed
r : 从文件中读取输入行
! : 对所选行以外的所有行应用命令
s : 用一个字符串替换另一个
g : 在行内进行全局替换
w : 将所选的行写入文件
x : 交换暂存缓冲区与模式空间的内容
y : 将字符替换为另一字符(不能对正则表达式使用y命令)
选项
-e : 进多项编辑,即对输入行应用多条sed命令时使用
-n : 取消默认的输出
-f :指定sed脚本的文件名
8. 退出状态
sed不像grep样,不管是否找到指定的模式,它的退出状态都是0。只有当命令存在语法错误时, sed的退出状态才不是0。
sed在正常情况下,将处理的行读入模式空间( pattern space),脚本中的“sedcommand( sed命令) ”就一条接着一条进行处理,直到脚本执完毕。然后该行被输出,模式( pattern space)被清空;接着,再重复执刚才的动作,件中的新的一行被读入,直到文件处理完毕。
一般情况下,数据的处理只使用模式空间( pattern space),按照如上的逻辑即可完成主要任务。但是某些时候,使用通过使用保持空间( hold space),还可以带来意想不到的效果。
模式空间:可以想成工程里面的流水线,数据之间在它上面进行处理。
保持空间:可以想象成仓库,我们在进行数据处理的时候,作为数据的暂存区域。
正常情况下,如果不显示使用某些高级命令,保持空间不会使用到!
sed命令:
+ g: [address[,address]]g 将hold space中的内容拷贝到pattern space中,原来pattern space里的内容清除
+ G: [address[,address]]G 将hold space中的内容append到pattern
space\n后
+ h: [address[,address]]h 将pattern space中的内容拷贝到hold space中,原来的hold space里的内容被清除
+ H: [address[,address]]H 将pattern space中的内容append到holdspace\n后
+ d: [address[,address]]d 删除pattern中的所有行,并读入下一新行到pattern中
+ D: [address[,address]]D 删除multiline pattern中的第一行,不读入下一行
+ x: 交换保持空间和模式空间的内容
有如下例子:
1. 给每行结尾添加空行
2. sed模拟出tac的功能(倒序输出)
1!G第1不执“G”命令,从第2行开始执。 $!d,最后一行不删除(保留最后1行)
3. 追加匹配行到文件结尾
4.行列转化
H表把pattern space 的内容追加到hold space中去, H可以带一个地址,这里用的是$,表到文件的末尾,然后用x将之取到pattern space中,把\n替换成空格再打印即可。
5.求1-100的和
7.再求1-100的和
:a表标签a, ba表跳转到a标签, $表最后一行,!表示不做后续操作,所以, $!ba表示最后一行不跳转到a标签,结束此次操作。