Python合并多个日志文件_python文件目录

当前位置：首页 > 脚本编程 > python > python文件目录 > 正文

Python合并多个日志文件: 发布时间：2020-09-01编辑：脚本学堂

分享一个python合并多个日志文件的实例代码，基于python2.7，开发工具是eclipse+pydev，有需要的朋友参考学习下。

项目架构发生了变化，原来的单机单应用要部署成集群了。这样在排查问题看日志的时候就不太方便了。最近想起来可以将日志按用户打印，也就是每个用户一个日志文件（整个系统最多一万个用户整个还是没得问题的）通过一个程序将分布在多台上的日志文件下载到本地然后在做一个按日志内容（每一行有个时间戳）的排序。

本地的环境是python2.7 ，开发工具是eclipse+pydev ，习惯了使用eclipse 使用这个开发工具调试python很方便。

第一次写python程序，代码不太优美：

复制代码代码示例:

#!/bin/env python
#coding=gbk
#
import sys
import os
import re
import datetime
from ftplib import FTP

'''''将一个用户的多个日志进行排序，排序后输出一个日志'''
'''''运行方式 python getUserLog TNT3.TNT301
及：ptyhon命令程序文件名机构用户号'''

#ftp下载目标用户日志
def ftp_down():

    ftp = FTP()
    ftp.set_debuglevel(0)
    ftp.connect(ftpip,21)
    ftp.login(userid,pswd)
    #ftp.login()
    #print ftp.getwelcome()
    #print ftp.pwd()

    print ftp.dir()
    filename = bankuserid+'.log'
    with open(filename,'wb') as file_handler:
        ftp.retrbinary('RETR '+filename, file_handler.write)

    file_handler.close()
    ftp.quit()
    print '从 '+ftpip+'下载 '+filename+' 成功'

#将配置的路径下的用户日志加载到字典和列表
def loadFiles(logPath,logFilesList):
    userLogFileName = []
    #字典
    userLogMap = {}
    for userFilePath in logFilesList:
        if os.path.isfile(logPath+userFilePath) and bankuserid in userFilePath:
            userLogFileName.append(logPath+userFilePath)
            print '将'+userFilePath+'放入了列表'
    #循环读取日志文件的内容
    for ulfn in userLogFileName:
        #open函数文件名不支持“-”不知道是位什么
        with open(ulfn,'rb') as tempFile:
            row_key = ''
            row_value= ''
            last_row_key=''
            last_row_value=''
            row_key_count = 0
            while True:
                line = tempFile.readline()
                if not line:
                    break
                #匹配日期
                r1 = re.compile('^([0-9]{4}-[0-9]{2}-[0-9]{2}[ tnrrv][0-9]{2}[:][0-9]{2}[:][0-9]{2}[.][0-9]{3})')
                #如果匹配先将上一轮的key和value写到列表和字典
                if r1.match(line):
                    row_key_count = row_key_count+1
                    row_key_count_str = seq(str(row_key_count),7)
                    if not last_row_key.__eq__(''):
                        last_rwo_key = last_row_key+'.'+row_key_count_str
                        userLogMap[last_rwo_key] = last_row_value
                        #print '字典中增加：key:'+last_rwo_key+' value'
                        row_key =''
                        row_value = ''
                        last_row_key = ''
                        last_row_value = ''
                    #又定义新的
                    row_key = re.findall(r1,line)
                    row_value = line
                    last_row_key = row_key[0]
                    last_row_value = row_value

                else:
                    last_row_value =last_row_value+line
            #最后要写一次
            if not last_row_key.__eq__(''):
                #print '字典中增加：'+last_row_value
                userLogMap[last_row_key] = last_row_value
            tempFile.close()
    print('加载日志内容到dic成功。一共有'),
    print(len(userLogMap)),
    print('个时间戳')
    return userLogMap

#对元组内的数据进行升序排序
def sortColl(arg1):
    m = sorted(arg1.iteritems(), key=lambda d:d[0], reverse = False)
    return m

#arg1是map容器；arg2是产生的结果文件路径
def write2file(arg1,arg2):
    with open(arg2,'wb+') as tempFile:
        for row in arg1:
            #print row
            tempFile.write(row[1])
        print('生成'+arg2+'成功')
        tempFile.close
#将str的长度补到len位（不足时前面加0）
def seq(seqStr,seqLen):
    if len(seqStr)>seqLen:
        return seqStr
    else:
        return seq('0'+seqStr,seqLen)

#定义初始化的日志文件路径
logPath = r'E:/python code/'
ftpip = '192.168.1.100'#ftp的ip
userid = 'Feng'#ftp用户名
pswd = 'soft'#ftp密码
bankuserid = 'TNT3.TNT301'#目标用户的   机构号用户编号如TNT3.TNT301
'''''argCount = len(sys.argv)

#如果未传用户名则退出
if argCount<2:
    print('请输入用户编号')
    sys.exit()
else:
    bankuserid = sys.argv[1]
    print(bankuserid)'''
logFilesList = os.listdir(logPath)
print logPath,'目录下的文件有：共',len(logFilesList),'个'
#开始调用
time_ftp_start = datetime.datetime.now().microsecond
print '开始用ftp下载'
#ftp_down()
time_ftp_end = datetime.datetime.now().microsecond
print 'ftp下载结束,耗时',(time_ftp_end-time_ftp_start)/1000,'ms。开始加载到dic'
userLogMap = loadFiles(logPath,logFilesList)
time_load_end = datetime.datetime.now().microsecond
print '加载到dic结束,耗时',(time_load_end-time_ftp_end)/1000,'ms。开始排序'
userLogMap = sortColl(userLogMap)
time_sort_end = datetime.datetime.now().microsecond
print '排序结束,耗时',(time_sort_end-time_load_end)/1000,'ms。开始输出到磁盘'
write2file(userLogMap,r'c:result.log')
time_write_end = datetime.datetime.now().microsecond
print '输出到磁盘结束,耗时',(time_sort_end-time_load_end)/1000,'ms'

上一篇：python备份文件示例代码
下一篇：python实例之批量复制文件

与 Python合并多个日志文件有关的文章

本文标题：Python合并多个日志文件
本页链接：http://www.jb200.com/article/python/20925.html

浏览排行

栏目分类

热点文章

Python合并多个日志文件