python urllib2模块获取指定网页上所有超链接_Python模块

python urllib2模块获取指定网页上所有超链接: 发布时间：2019-07-21编辑：脚本学堂

如何用python获取网页中的链接呢，python通过urllib2模块抓取网页，使用正则表达式分析网页中全部url地址，如此便可以完成网页中所有链接的提取。

一、python获取指定网页上所有超链接

python通过urllib2抓取网页，然后通过正则表达式分析网页上的全部url地址。

代码：

复制代码代码示例:

#!/usr/bin/python

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

二、python实现网页链接提取

python如何提取网页链接？

例子：

复制代码代码示例:

#encoding:utf-8

import socket

import htmllib,formatter

def open_socket(host,servname):

    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

    port=socket.getservbyname(servname)

    s.connect((host,port))

    return s

host=''

host=input('请输入网址n')

mysocket=open_socket(host,'http')

message='GET http://%s/nn'%(host,)

mysocket.send(message)

file=mysocket.makefile()

htmldata=file.read()

file.close()

parser=htmllib.HTMLParser(formatter.NullFormatter())  

parser.feed(htmldata)

print 'n'.join(parser.anchorlist)

parser.close()

您可能感兴趣的文章：

上一篇：python beautifulsoup模块实例：抓取爱奇艺网视频播放的代码
下一篇：python BeautifulSoup库实例：使用BeautifulSoup抓取58手机维修信息

与 python urllib2模块获取指定网页上所有超链接有关的文章

本文标题：python urllib2模块获取指定网页上所有超链接
本页链接：http://www.jb200.com/python/31313.htm

python urllib2模块获取指定网页上所有超链接

python urllib2模块获取指定网页上所有超链接

您可能感兴趣的文章：

与 python urllib2模块获取指定网页上所有超链接有关的文章

浏览排行

栏目分类

栏目导航

热点文章

python urllib2模块获取指定网页上所有超链接

python urllib2模块获取指定网页上所有超链接

您可能感兴趣的文章：

与 python urllib2模块获取指定网页上所有超链接 有关的文章

浏览排行

栏目分类

栏目导航

热点文章

与 python urllib2模块获取指定网页上所有超链接有关的文章