PHP采集器的简单示例代码_php教程

PHP采集器的简单示例代码: 发布时间：2020-09-21编辑：脚本学堂

分享一例php实现的采集器代码，很简单，主要学习下php实现采集的原理与方法，感兴趣的朋友可以参考学习下。

本节内容：
php采集器代码

例子：

复制代码代码示例:

<?php
/**
* 采集器代码一例
* by www.jb200.com
*/
$url = "http://book.sina.com.cn/nzt/lit/zhuxian2/index.shtml";// 图书地址
$ver = "old"; //新旧版本

$r = file_get_contents($url); //用file_get_contents将网址打开并读取所打开的页面的内容
preg_match("/<meta name="description" content="(.*?)">/is",$r,$booktitle);//匹配此页面的标题
$bookname = $booktitle[1];//取第二层数组
$preg = '/<li><a href=(.*).shtml target=_blank class=a03>/isU';
preg_match_all($preg, $r, $zj); //将此页面的章节连接匹配出来
$bookzj = count($zj[1]);// 计算章节标题数量
if ($ver=="new"){
$content_start = "";
$content_end = "";
}
if ($ver=="old"){
$content_start = "</table>";
$content_end = "<br>";
}

header("Content-Type:text/html;charset=gb2312");

writer($bookname." 共".$bookzj."节rn帅哥刘并于".date("D M j G:i:s T Y")."为了毕业而设计小说整理收集rn", "./ailaopo/".$bookname.".txt","w+");
for ($i=0;$i<$bookzj;$i++) {
//echo "http://book.sina.com.cn".$zj[1][$i]".shtml";die();
//用file_get_contents将章节连接打开并读取所打开的页面的内容
$str = file_get_contents("http://book.sina.com.cn".$zj[1][$i].".shtml");
preg_match("/(<title>)(.*?)(</title>)/is",$str,$title);//匹配此连接页面的标题
$title = str_replace("_读书频道_新浪网","",$title[2]);//把$title[2]里面有_读书频道_新浪网的换成空
preg_match("/(".$content_start.")(.*?)(".$content_end.")/is",$str,$content);//匹配此连接页面的内容
$content = preg_replace("/<(.*?)>/s","",str_replace("</p>","rn",$content[2]));//用str_replace把$content[2]里有</p> 的换成rn
print_r($content);
exit;
//把第".($i+1)."节和标题与内容连接在一起放在变量
$result = " rn第".($i+1)."节--------".$title."_汪老师就是帅 --------- rn".$content;
writer($result, "./ailaopo/".$bookname.".txt","a+");//调用函数把$result
echo "小说".$bookname."共".$bookzj."节，现在整理到第".$i."节 _".$title."<br>";
}
echo "小说".$bookname."共".$bookzj."节已全部整理完成！";

function writer($content,$url,$mode)//定义函数名 writer 参数$content,$url,$mode
{
$fp = fopen($url, $mode);//打开文件$url
fwrite($fp, $content);//把$content放入到$fp
fclose($fp); //关闭$fp
}
?>

您可能感兴趣的文章：
phpQuery采集网页的实例分享
 php采集远程图片的思路与实现代码
 php采集程序代码(入门)
php写的文章采集URL补全函数(FormatUrl)
一个php文本采集类
 php 抓取蜘蛛爬虫痕迹的代码分享

上一篇：PHP中文首字母转拼音的简单示例
下一篇：PHP记录搜索引擎来路、关键字的示例代码

与 PHP采集器的简单示例代码有关的文章

本文标题：PHP采集器的简单示例代码
本页链接：http://www.jb200.com/article/14161.html

浏览排行

栏目分类

热点文章

PHP采集器的简单示例代码