tr命令替换字符串的方法详解

发布时间:2020-10-11编辑:脚本学堂
本文介绍下,在linux中用tar命令替换字符串的一些方法,有需要的朋友,作个参考。

linux中,tr命令用来从标准输入中通过替换或删除操作,进行字符转换。
tr主要用于删除文件中控制字符或进行字符转换。
使用tr时要转换两个字符串:字符串1用于查询,字符串2用于处理各种转换,tr刚执行时,字符串1中的字符被映射到字符串2中的字符,然后转换操作开始。

1、用法和选项
用法:
tr [选项]… SET1 [SET2]

说明:
tr命令用于从标准输入中替换、缩减和/或删除字符,并将结果写到标准输出。

选项:
-c, -C, –complement          首先补足SET1
-d, –delete                    删除匹配SET1 的内容,并不作替换
-s, –squeeze-repeats   如果匹配于SET1 的字符在输入序列中存在连续的重复,在替换时会被统一缩为一个字符的长度
-t, –truncate-set1       先将SET1 的长度截为和SET2 相等
--help                            显示此帮助信息并退出
–version                       显示版本信息并退出

2、SET字符串
SET 是一组字符串,一般都可按照字面含义理解。
解析序列如下:
 

NNN          #八进制值为NNN 的字符(1 至3 个数位)  
            #反斜杠  
a            #终端鸣响  
b            #退格  
f            #换页  
n            #换行  
r            #回车  
t            #水平制表符  
v            #垂直制表符  
字符1-字符2    #从字符1 到字符2 的升序递增过程中经历的所有字符  
[字符*]       #在SET2 中适用,指定字符会被连续复制直到吻合设置1 的长度  
[字符*次数]    #对字符执行指定次数的复制,若次数以 0 开头则被视为八进制数  
[:alnum:]     #所有的字母和数字  
[:alpha:]     #所有的字母  
[:blank:]     #所有呈水平排列的空白字符  
[:cntrl:]     #所有的控制字符  
[:digit:]     #所有的数字  
[:graph:]     #所有的可打印字符,不包括空格  
[:lower:]     #所有的小写字母  
[:print:]     #所有的可打印字符,包括空格  
[:punct:]     #所有的标点字符  
[:space:]     #所有呈水平或垂直排列的空白字符  
[:upper:]     #所有的大写字母  
[:xdigit:]    #所有的十六进制数  
[=字符=]       #所有和指定字符相等的字符 

注意:
1、仅在SET1 和SET2 都给出,同时没有-d 选项的时候才会进行替换。
2、仅在替换时才可能用到-t 选项。如果需要SET2 将被通过在末尾添加原来的末字符的方式补充到同SET1 等长。SET2 中多余的字符将被省略。
3、只有[:lower:] 和[:upper:]以升序展开字符;在用于替换时的SET2 中以成对表示大小写转换
4、-s 作用于SET1,既不替换也不删除,否则在替换或展开后使用SET2 缩减。

3、示例
(1)删除空行
 

复制代码 代码示例:
[root@jbxue ~]# tr -s "[12]" < plan.txt 或 tr -s ["n"] < plan.txt
 

(2)去除test.txt里面的重复的小写字符
 

复制代码 代码示例:
[root@jbxue ~]# tr -s "[a-z]"<test.txt >result.txt
 

(3)有时需要删除文件中的^M,并代之以换行
 

复制代码 代码示例:
[root@jbxue ~]# tr -s "[15]" "[n]" < file

[root@jbxue ~]# tr -s "[r]" "[n]" < file
 

(4)大写到小写
 

复制代码 代码示例:
[root@jbxue ~]# cat a.txt |tr "[a-z]" "[A-Z]" >b.txt
 

(5)删除指定字符
一个星期的日程表任务是从其中删除所有数字,只保留日期日期有大写,也有小写格式因此需指定两个字符范围[a-z]和[A-Z],命令tr -cs “[a-z][A-Z]” “[12*]” 将文件每行所有不包含在[a-z]或[A-Z](所有希腊字母)的字符串放在字符串1中并转换为一新行-s选项表明压缩所有新行, -c表明保留所有字母不动原文件如下,后跟tr命令:
 

复制代码 代码示例:
[root@jbxue ~]# tr -cs "[a-z][A-Z]" "[12*]" <diary.txt
 

(6)替换passwd文件中所有冒号,代之以tab键,可以增加可读性
 

复制代码 代码示例:
[root@jbxue ~]# tr -s "[:]" "[11]" < /etc/passwd
或[root@jbxue ~]# tr -s "[:]" "[t]" < /etc/passwd
 

(7)使路径具有可读性
如果用 echo $PATH 或者 echo $LD_LIBRARY_PATH 等类似的命令来显示路径信息的话,看到的将会是一大堆用冒号连接在一起的路径, tr命令可以把这些冒号转换为回车,这样,这些路径就具有很好的可读性:
 

复制代码 代码示例:
[root@jbxue ~]# echo $PATH | tr ":" "n"
 

(8)可以在vim内使用所有这些命令!在tr命令前要加上您希望处理的行范围和感叹号 (!),如:$!tr -d 't'(美元符号表示最后一行)
(9)转换控制字符
tr的第一个功能就是转换控制字符,特别是从dos向UNIX下载文件时,忘记设置ftp关于回车换行转换的选项时更是如此cat -v filename 显示控制字符:
 

复制代码 代码示例:
[root@jbxue ~]# cat -v Lstat.txt
box aa^^^^^12^M
apple bbas^^^^23^M
^Z
 

猜想^ ^ ^ ^ ^ ^是tab键每一行以Ctrl-M结尾,文件结尾Ctrl-Z。

以下是改动方法:
使用-s选项,查看ASCII表^的八进制代码是136,^M是015,tab键是011,^Z是032。

下面将按步骤完成最终功能:
用tab键替换^ ^ ^ ^ ^ ^,命令为”136″ “[11*]“将结果重定向到临时工作文件Lstat.tmp
 

复制代码 代码示例:
[root@jbxue ~]# tr -s “[136]” “[11*]” <stat.txt >Lstat.tmp
 

用新行替换每行末尾的^M,并用n去除^Z,输入要来自于临时工作文件Lstat.tmp:
 

复制代码 代码示例:
[root@jbxue ~]# tr -s "[15][32]" "n" <Lstat.tmp
 

要删除所有的tab键,代之以空格,使用命令:
 

复制代码 代码示例:
[root@jbxue ~]# tr -s "[11]" "[40*]" <input.txt