用perl提取HTML网页内容的方法

发布时间:2020-05-05编辑:脚本学堂
使用LWP::Simple模块,提取网页源代码,赋值给一个字符串变量,然后再进行后续分析,比如部分文件的提取等...

使用LWP::Simple模块,提取网页源代码,赋值给一个字符串变量,然后再进行后续分析,比如部分文件的提取等:
 

复制代码 代码如下:
use LWP::Simple qw(get);
my $html = get( "http://www.jb200.com/index.html" );

另外,可以下载网页源代码,直接保存为一个文件:
 

复制代码 代码如下:
use LWP::Simple qw(getstore);
getstore( "http://www.jb200.com/index.html", "foo.html" );