python解析url并获取url下的超链接的代码_python网络编程

当前位置：首页 > 脚本编程 > python > python网络编程 > 正文

python解析url并获取url下的超链接的代码: 发布时间：2019-09-18编辑：脚本学堂

python解析url并获取url下的超链接的代码

解析url并获取url下的超链接，完整代码如下。

复制代码代码如下:

#!/usr/bin/env python

import urllib2
from bs4 import BeautifulSoup,SoupStrainer
import re
import sys
#import html5lib
#from html5lib import sanitizer
##from html5lib import treebuilders
reload(sys)
sys.setdefaultencoding( "utf-8" )

page = urllib2.urlopen("http://www.jb200.com")
soup = BeautifulSoup(page)
soup.originalEncoding
soup.prettify
url_list = soup.findAll(name='a',href=re.compile('^http://'))
for each_url in url_list:
str_url = str(each_url).split('"')
print str_url[1]

上一篇：python多线程方式执行多个bat的代码
下一篇：python多线程简明实例

与 python解析url并获取url下的超链接的代码有关的文章

本文标题：python解析url并获取url下的超链接的代码
本页链接：http://www.jb200.com/article/3060.html

浏览排行

栏目分类

热点文章

python解析url并获取url下的超链接的代码