python解析HTML文件的二个例子

发布时间:2019-09-11编辑:脚本学堂
本文分享两个python解析Html文件的例子,包括解析本地文件与远程html文件二种方式,有需要的朋友参考下吧。

本节内容:
python解析Html文件

1,解析HTML文件
 

复制代码 代码示例:

#!/usr/bin/python
#
# site: WWW.jb200.com

import re
filename = "index.html"

newContent = "Hello Python World"

filehandle = open(filename, "r")

data = filehandle.read()    
filehandle.close()

matching = re.subn("test", newContent, data)

if matching[1] == 0:
    raise "Error while parsing HTML template"
print "Content-Type: text/htmlnn"
print matching[0]

2,解析HTML Web页面
 

复制代码 代码示例:

#!/usr/bin/python
#
#site: www.jb200.com
import htmllib, urllib, formatter, sys

def parse(url, formatter):
    f = urllib.urlopen(url)
    data = f.read()
    f.close()
    p = htmllib.HTMLParser(formatter)
    p.feed(data)
    p.close()

fmt = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout))
parse("index.htm", fmt)