python解析html的简单实例

发布时间:2020-06-02编辑:脚本学堂
分享一例python解析html页面的代码,很简单,适合初学python的朋友参考下。

本节内容:
python解析html的例子。

>>> 小编推荐:python解析HTML文件的二个例子

代码:
 

复制代码 代码示例:

#!/usr/bin/python
#
#site: WWW.jb200.com

import urllib
import sys
from sgmllib import SGMLParser
class URLLister(SGMLParser):
    urls = []
    def start_a(self, attrs):
        href = [v for k, v in attrs if k=='href']
        if href:
            self.urls.extend(href)
            print href
if __name__=="__main__":
    opener = urllib.FancyURLopener({})
    f = opener.open("http://www.jb200.com")
    data = f.read()
    html = URLLister()
    html.feed(data)
    html.close()