sed命令例解

发布时间:2020-10-14编辑:脚本学堂
sed命令例解 4 个空间 :input stream, pattern buffer, output stream 和 hold buffer

4 个空间 :input stream, pattern buffer, output stream 和 hold buffer
基本操作过程是 :
(1). 将 input stream 的当前行放入 pattern buffer, 然后 input stream 的指针指向下一行 ;
(2). 对 pattern buffer 中的行进行处理 ;
(3). 将 2 的处理结果放入 output stream. 然后循环这个过程。

hold buffer 是另一个空间 , 可以通过命令和 pattern buffer 进行交互。

sed 命令介绍

1. 基本命令 ---" 替换 ": s

  1.1 基本用法
  e.g. sed 's/day/night/' <old >new
  该例子将文件 old 中的每一行第一次出现的 day 替换成 night, 将结果输出到文件 new
  s            " 替换 " 命令
  /../../      分割符 (Delimiter)
  day          搜索字符串
  night        替换字符串

  其实 , 分割符 "/" 可以用别的符号代替 , 比如 ",", "|" 等 .
  e.g. sed 's//usr/local/bin//common/bin/'<old >new
  等价于 sed 's_/usr/local/bin_/common/bin_' <old >new
  显然 , 此时用 "_" 作分割符比 "/" 好得多 .

  1.2 用 & 表示匹配的字符串

  有时可能会想在匹配到的字符串周围或附近加上一些字符 .
  e.g. sed 's/abc/(abc)/' <old >new
  该例子在找到的 abc 前后加上括号 .
  该例子还可以写成 sed 's/abc/(&)/' <old >new
  下面是更复杂的例子 :
  sed 's/[a-z]*/(&)/' <old >new
  sed 's/[0-9]*/& &/' <old >new

  1.3 用 1, 2, ..., 9 来表示匹配的字符串

  e.g. sed 's/([a-z]*)[0-9]*/1/' <old >new
  本例中 1 就是指前面的 ([a-z]*)

  sed 's/([a-z]*) ([0-9]*)/2 1/' <old >new
  本例中 2 和 1 分别代表前面的 ([0-9]*) 和 ([a-z]*)

  1, 2, ..., 9 也可以出现在搜索字符串中
  e.g. sed 's/([a-z]*) 1/1/' <old >new
  本例可以去除重复的由字母组成的词

  1.4 " 替换 " 选项
      1.4.1 /g 替换所有的
      sed 默认只替换搜索字符串的第一次出现 , 利用 /g 可以替换搜索字符串所有出现的地方 . 例如 ,
      sed 's/([^ ]*)/(&)/g' <old >new

      1.4.2 用 /1, /2, ... 来表明替换哪一次出现
      e.g. sed 's/[^ ]*//2' <old >new
      可以从 /1 用到 /512

      1.4.3 /p print 选项
      当 sed 命令有 -n 选项时 , 该命令没用输出 .
      -n 配合 /p 选项后 , 如果该行确实发生了替换 , 则输出该行 , 否则不输出 .

      1.4.4 /w filename 写到文件 filename 中
      e.g. sed 's/([0-9]*) ([a-z]*)/2/w new' <old
      该例子把输出放入文件 new 中

  1.5 替换和插入换行符号
  替换 (echo a;echo x;echo y) | sed '/x$/ {
       N
       s:xn:x:
       }'

  插入
       (echo a;echo x;echo y) | sed 's:x:X
       :'

2. 只对特定行的处理

  2.1 通过行号限定
  sed '3 s/[0-9][0-9]*//' <old >new 只处理第 3 行
  sed '1,100 s/A/a/' <old >new 只处理 1 到 100 行
  sed '101,$ s/A/a/' <old >new 处理 101 到文件的最后一行
  sed '101,$ !s/A/a/' <old >new 这里 ! 表示只对 1 到 100 行进行替换 ,! 的作用是取反

  2.2 通过正规表达式限定
  sed '/start/,/stop/ s/#.*//' <old >new
  本例中 ,sed 先找到有 start 的行作为开始 , 找到最近的有 stop 的行作为结束 , 对之间的行进行操作 .
  重复上述过程 , 直到文件结束

  下面这个例子是行号和正规表达式配合来限定
  sed '1,/start/ s/#.*//' <old >new 对第 1 行到含有 start 的行进行处理

3. 其他的简单命令
  3.1 删除命令 d
  sed '11,$ d' <old >new 删除从 11 行到文件末尾
  sed '/^#/ d' <old >new 删除所有以 # 开始的行

  3.2 print 命令 p ( 注意 与 s 命令的 /p 选项的区别 )
  sed 'p' <old    每一行将会被输出两次
  sed -n 'p' <old 每一行将会输出一次 (-n 屏蔽掉一次 )
  sed '/^$/ p' <old 只对空行输出两次 , 其他只输出一次
  sed -n '1,10 p' <old 输出前 10 行
  sed -n '/match/ p' <old 输出含有 match 的行

  3.3 quit 命令 q
  sed '11 q'<old    输出前 10 行 ( 在第 11 行退出 )
  注意 :q 命令不能接收多行 , 例如
  sed '2,5 q'<old 是不正确的

  3.4 写入文件命令 w filename( 注意与 s 命令的 /w 选项的区别 )
  把某些行写入文件 filename
  sed -n '/^[0-9]*[02468]/ w even' <old    将以偶数开始的行写入文件 even

  3.5 输出行号命令 =
  sed -n '/PATTERN/ =' <old 遇到含有 PATTERN 的行时 , 同时输出行号

  3.6 追加 , 改变 , 插入新行
  追加命令 a
  #!/bin/sh
  sed '
  /WORD/ a
  Add this line after every line with WORD
  '
  改变命令 c
  #!/bin/sh
  sed '
  /WORD/ c
  Replace the current line with the line
  '
  插入命令 i
  #!/bin/sh
  sed '
  /WORD/ i
  Add this line before every line with WORD
  '

  3.7 变换命令 y
  sed 'y/abcdef/ABCDEF/' <old  该例将字符 abcdef 分别变成大写

  3.8 将本行的控制符也显示出来的命令 l
  sed '1,10 l' <old

  3.9 d 命令和 D 命令
  d 命令删除 pattern buffer 中的内容进入下一次操作循环
  D 命令删除 pattern buffer 中第一个换行符之前的内容进入下一次操作循环, 如果 pattern buffer 中还有内容 , 则不用从 input stream 中读入

  3.10 p 命令和 P 命令
  p 命令输出 pattern buffer 中的内容
  P 命令输出 pattern buffer 中第一个换行符之前的内容

  3.11 n 命令和 N 命令
  n 命令把下一行读入 pattern buffer 中 ( 如果没用 -n 选项 , 将原来行输出 )
  N 命令把下一行追加到 pattern buffer 中

 3.12 流程控制命令
  b label 命令 : 在指定行跳到 label
  t label 命令 : 如果在某行发生了替换 , 跳到 label
  T label 命令 : 如果在某行没有发生了替换 , 跳到 label

4. 调用 sed 时的参数

  4.1 -e script 执行 script 这个脚本
  e.g. sed -e 's/a/A/' -e 's/b/B/' <old >new
  对每一行分别执行 's/a/A/' 和 's/b/B/'

  4.2 -n     禁止输出
  这里的 -n 与前面的 /p 配合 , 可以只输出被修改了的行 .

  4.3 -f scriptname 把 scriptname 文件中的 sed 命令加入本次 sed 的调用中
  e.g. sed -f sedscript <old >new

  sedscript 的内容可能是这样的 :
  # sed comment - This script changes lower case vowels to upper case
  s/a/A/g
  s/e/E/g
  s/i/I/g
  s/o/O/g
  s/u/U/g

5. Hold Buffer

  x 命令 : 将 pattern buffer 放入 hold buffer, 而将 hold buffer 的内容输出 ,pattern
  buffer 的内容变成下一行
  h 命令 : 将 pattern buffer 放入 hold buffer, 并将 pattern buffer 的内容输出,
  pattern buffer 的内容变成下一行
  H 命令 : 将 pattern buffer 追加到 hold buffer
  g 和 G 命令 :g 用 hold buffer 的内容替换 pattern buffer 的内容 , 而 G 将 hold buffer 内容追加到 pattern buffer。