检测网站内哪些页面没有被百度搜索引擎收录。
用到了传说中的curl,有关curl的用法,可以参考如下文章:
php中开启curl扩展的方法详解
php curl应用实例分析
php curl中post与get应用实例代码
PHP中用CURL伪造IP来源的方法
php curl 学习总结
来看具体代码:
<?php /* * 检测网页是否被百度收录,返回1则表示收录 返回0表示没有收录 * @ param string $url 待检测的网址 * @ by www.jb200.com */ function checkBaiduinclude($url){ $url='http://www.baidu.com/s?wd='.$url; $curl=curl_init(); curl_setopt($curl,CURLOPT_URL,$url); curl_setopt($curl,CURLOPT_RETURNTRANSFER,1); $rs=curl_exec($curl); curl_close($curl); if(!strpos($rs,'抱歉,没有找到')){ return 1; }else{ return 0; } } ?>
代码说明:
例如要检测http://www.jb200.com/article/10964.html 否被收录,则只需要:
checkBaiduInclude('http://www.jb200.com/article/10964.html');
大家可以完善下,做成一个查询功能放在网站上,相当不错的哦。