两个应用场景:
如果不是在某个文件夹里面则将文件夹名称插入前面。
所有的文件名名称加上一个前缀。
代码:
#!/usr/bin/env python
# encoding: UTF-8
import re
# 将正则表达式编译成Pattern对象
p = re.compile(r'(?P<folder>(w+/)*)(?P<filename>w+.png)')
# 使用Pattern匹配文本,获得匹配结果,无法匹配时将返回None
#match = pattern.match('<key>xxx/duobaojiemian_L/yangpizi.png</key>')
the_str = """<key>XXXX/duobaojiemian2222_L/duobaojiemian_L/yangpizi.png</key>
<key>yangpizi2.png</key>
<key>yangpizi3.png</key> """
for m in p.finditer(the_str):
# 使用Match获得分组信息
print m.groupdict()
print '-------------------------------'
#f = lambda m: m.group().find('XXXX/') == -1 and 'XXXX/'+m.group() or m.group()
def f(m):
s = m.group()
return s.find('XXXX/') == -1 and 'XXXX/'+s or s
def f2(m2):
d = m2.groupdict()
return d['folder']+'the_'+d['filename']
print p.sub(f2, the_str)
正则表达式:
python的正则表达式如果捕获需要分组则使用这个语法(?P<命名>匹配的正则表达式)
re.compile用于编译正则表达式并返回对象
p.finditer返回所有匹配的迭代器
p.sub将匹配项传入回调函数,并且用返回值替换文本
m.groupdict,可以使用则的分组命名取相应的值