在linux操作系统中,经常会将2个有关联文本文件进行合并处理。
分别从不同文件获取需要的列,然后,整体输出到一起。
awk进行多文件处理时候,常常会遇到2个方面问题,第一个是怎么样合并多个文件为一个文件。
第二个问题就是怎么样将多行合并为一行显示
本文分享二种处理办法,以实现awk对多个文件的操作,供大家学习参考。
实例文本:
[root@jb200.com shell]$ awk 'FNR==1{print "rn"FILENAME}{print $0}' a.txt b.txt
a.txt
100 wang man
200 wangsan woman
300 wangming man
400 wangzheng man
b.txt
100 90 80
200 80 70
300 60 50
400 70 20
合并后的结果:
1,awk多文件操作方法一:
实现思路:
通过外部命令合并文件,然后通过排序,然后通过awk进行合并操作。
首先:
现在需要把:第一列相同的处理合并到一行,需要例用“next”语句。
有关awk合并行的操作,可以参考文章:awk 多行合并【next 使用介绍】(常见应用4)
继续:
需要把几行合并,经常用到方法是:NR%num 然后将行值保存下来,next该行。在输出时候打印出来。
二,awk多文件操作方法二
实现思路:
不借助第3放工具打开,直接通过awk 打开多个文件。
然后,通过:FILENAME获得当前处理文件名。NR总记录 FNR当前文件记录,以及ARGC传入参数总数,ARGV是数组,各个参数值。
实例:
代码:
[root@jb200.com shell]$ awk '
BEGIN{
if(ARGC<3)
{
exit 1;
}
file="";
}
{
aData[FILENAME,$1]=ARGV[1]==FILENAME?$0:$2"t"$3;
}
END{
for(k in aData)
{
split(k,idx,SUBSEP);
if(idx[1]==ARGV[1] && (ARGV[2],idx[2]) in aData)
{
print aData[ARGV[1],idx[2]],aData[ARGV[2],idx[2]] | "sort -n -k1";
}
}
}' a.txt b.txt
代码说明:
这里用到2维数组,aData[文件名,关联列对应值] ,这种方法可以将多个文件内容。
放入一个统一二维数组。然后循环数组,通过if((i,j} in array) 查找对应列值,在其它文件中是否存在。