linux去掉文件重复数据行的方法_linux文件系统

本文介绍了linux系统中去掉一个文件中重复的数据行的方法，有需要的朋友参考学习下。

一、去掉相邻重复的数据行

复制代码代码示例:

$cat data1.txt | uniq

输出：
beijing
wuhan
beijing
wuhan

二、去掉所有重复的数据行

复制代码代码示例:

$cat data1.txt | sort | uniq

注：
只有uniq命令的话，只是把相邻的重复的数据行去掉。
如果先 sort 的话，就会把所有重复的数据行变成相邻的数据行，再 uniq 的话，就去掉所有重复的数据行了。

输出：
beijing
wuhan

附：data1.txt

复制代码代码示例:

[root@syy ~]# cat data1.txt  

beijing  

beijing  

wuhan  

wuhan  

wuhan  

beijing  

beijing  

beijing  

wuhan  

wuhan

注：在过滤日志中的IP地址很有用。

linux去掉文件重复数据行的方法