[ sed简介: ]
sed是一个很好的文件处理工具, 它本身是一个管道命令, 以行为单位进行处理, 可以用于对数据行进行新增、选取、替换、删除等操作。
sed命令行格式:sed [-nefri] 'range command' file
如: sed '2d' aaa.txt # 删除文件aaa.txt中第二行
[ sed工作流程: ]
使用vim这种屏幕编辑器编辑一个文件的时候, 我们需要把这个文件打开, 这里存在两个问题:
1. 打开一个比较大的文件会消耗很多内存。
2. 我们无法写脚本调用vim来编辑文件, 但是sed可以通过写脚本编辑文件。
sed属于流编辑器, 它在编辑文件的时候, 首先会把文件的一行内容读入内存,读入内存的部分, 称为模式空间; 然后根据我们的需要进行编辑,
编辑完后会把模式空间的内容输出到屏幕, 并把它里面的内容清空, 再读取下一行到模式空间, 这样的话就避免了一次性读取整个文件。
[ sed常用选项: ]
-n: 只会显示模式空间里的内容, 而不会显示没有编辑过的内容。
-e: 直接在指令列模式上进行 sed 的动作编辑;
-f: 直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内的sed 动作;
-r: sed 的动作支援的是延伸型正规表示法的语法。( 预设是基础正规表示法语法 )
-i: 直接修改读取的档案内容, 而不是由屏幕输出。
[ sed常用命令: ]
d: 删除, 因为是删除, 所以 d 后面通常不接任何东西;
s: 替代, 可以直接进行替换的工作, 通常这个 s 的动作可以搭配正规表示法;
a: 追加, a 的后面可以接字符串, 而这些字符串会在新的一行出现(目前的下一行);
i: 插入, i 的后面可以接字符串, 而这些字符串会在新的一行出现(目前的上一行);
c: 取代, c 的后面可以接字符串, 这些字符串可以取代一行内容;
[ 常用命令举例: ]
## 删除操作 d :
range是范围, 删除操作有两种方法表示:
① 直接写一个数字, 表示对多少行进行操作. sed '2d' aaa.txt #表示删除文件aaa.txt中第二行
② 使用正则表达式, 此时必须要使用两个反斜杠 // 隔开. sed '/^Tom/d' aaa.txt # 表示删除aaa.txt中以Tom开头的行
* 如果没有指定范围, 则会对全文进行操纵. sed 'd' aaa.txt # 表示删除aaa.txt中所有的行
1. sed '$d' aaa.txt # 删除aaa.txt中最后一行 (对单行进行操作)
2. sed '7,9d' aaa.txt # 删除文件aaa.txt中第七行到第九行 (对多行进行操作)
3. sed '/aaa/,/bbb/d' aaa.txt # 删除文件aaa.txt中含有aaa至含有bbb之间所有的行 (对多行进行操作)
## 替代操作 s :
替换格式: sed 'range s/orig/new/sign' file # 如果没有指定范围的话, 将会对全文进行操作.
1. sed 's/aaa/bbb/' ccc.txt # 将ccc.txt全文中每行的第一个关键字 aaa 替换成 bbb, 因为我们没有指定任何模式
2. sed 's/aaa/bbb/g' ccc.txt # 将ccc.txt全文中所有 aaa 替换成 bbb, 因为我们加了sign: g
3. sed 's/aaa/bbb/2' ccc.txt # 将ccc.txt全文中每行第二个 aaa 替换成 bbb, 因为我们加了sign: 2
4. sed '1s/aaa/bbb/g' ccc.txt # 将ccc.txt全文中第一行所有 aaa 替换成 bbb, 因为我们加了range: 1, 加了sign: g
5. 上面示例也可以用其他字符隔开(只有替换有): sed 's#aaa#bbb#' ccc.txt
6. old位置支持正则, 但在new位置不支持正则, 除了字符 n &
sed '1s/a/N&N/2' ccc.txt # 将ccc.txt全文中第一行第二个 a 替换成NaN, & 相当于对前面 a 的引用
7. 对特定的范围做多个操作, 那么我们要把多个操作用 { } 括起来, 用 ; 隔开多个命令.
sed '1{s/a/b/g; s/b/c/}' ccc.txt # 先将ccc.txt全文中第一行所有 a 替换成 b, 再将第一行第一个关键字 b 替换成 c
8. 上面所讲都是替换一个单词, 如果我们想替换某个字符, 那么可以使用 y 命令
sed '1y/abc/xyz/' ccc.txt # 将ccc.txt中全文第一行所有 a 替换成 x, b 替换成 y, c 替换成 z
## 追加操作 a :
1. sed '/ab/axxx' ccc.txt # 将ccc.txt中含有 ab 的行下面再插入一行字符串xxx
2. sed '1a zhangnjim' ccc.txt # 在ccc.txt中第一行下面插入zhang再在下一行插入jim, n 起换行作用
## 插入操作 i :
1. sed '/ab/ixxx' ccc.txt # 将ccc.txt中含有 ab 的行上面再插入一行字符串xxx
2. sed '$a abc' ccc.txt # 在ccc.txt中最后一行插入abc
## 取代操作 c :
1. sed '/ab/cAB=AB' ccc.txt # 将ccc.txt中含有 ab 的行整行替换成AB=AB
2. sed '1c ab' ccc.txt # 将ccc.txt中第一行整行替换成ab
## 显示模式空间 p :
1. sed '$a abc p' ccc.txt # 将模式空间和文件中的内容都显示在屏幕上
[ sed其他命令: ]
1. = 为显示行号
sed '/^abc/{=}' ccc.txt # 以abc开头的关键词所在的行号
2. n 为获取下一行 (当前行从模式空间删除, 下一行读入模式空间)
sed '/^a/ {n;s/b/B/g}' ccc.txt # 匹配以a开头的下一行整行, 使用 B 替换 b.
3. N 为读取多行内容到模式空间: (当前行和下一行都在模式空间中)
sed '/^A/{s/tb/TB/; N; s/tnb/TB n/}' ccc.txt # 匹配以 A 开头的行, 将tb替换成TB; 再读取下一行, 将当前行的t和下一行的b替换成TB
4. 使用多行模式空间的话, ^ 就不是行的开头, 而是模式空间的开头; $ 就不是行的结尾, 而是模式空间的结束.
替换前:a b c d e 替换后:A b c d e
a b c d e a b c d e
sed 'N; s/^a/A/' ddd.txt # 第一行和第二行都会被读入模式空间, 但只有第一行的 a 会被替换成 A, 第二行的 a 并不会被替换.
替换前:a b c d e 替换后: a b c d e
a b c d e a b c d E
sed 'N; s/e$/E/' ddd.txt # 第一行和第二行都会被读入模式空间, 但只有第二行的 e 会被替换成 E, 第一行的 e 并不会被替换.
5. 除了模式空间, 还有保持空间, 我们可以把它理解成一个缓存. 保持空间的内容和模式空间的内容可以互换
h : 把模式空间内容存储到保持空间; G : 把保持空间里面的内容存储到模式空间;
替换前:a 替换后:b
b a
aabb
bbaa
sed '/a/{h; d}; /b/{G}' eee.txt # 匹配含有 a 的那一行,把它们保存在保持空间并从模式空间删除;匹配含有b的那一行,把保持空间内容放到模式空间;
6. set里面没有循环, 如果想实现循环的效果, 可以借助标签