最近没事的时候用python 做网页分析,抓取里面有用的数据,原来用过python SGMLParser来处理网页,其实如果处理比较简单的网页的话,用python SGMLParser已经够了,但是你如果你要处理比较复杂点的网页结构文本的话,可能用python Beautiful Soup会方便很多,也许少许的代码就可以完成你的工作了,所以python 处理东西还是非常的方便,有兴趣的可以去了解使用python BeautifulSoup,
给大家提供python BeautifulSoup的文档的址,http://www.crummy.com/software/BeautifulSoup/documentation.zh.html 。
您可能感兴趣的文章:
用beautiful soup多线程分析并抓取网页