提取html标签的php代码

发布时间:2020-01-06编辑:脚本学堂
一段可以提取html标签的代码,有需要的朋友,可以参考下。

具体实现代码如下:
 

复制代码 代码示例:

<?php
/**
* 提取页面中的 html标签的代码
* 示例:
* print_r(tags("test1.htm","a"));
* print_r("http://localhost/index.htm","img");
*
*/

function tags($filename,$tag) {
$buffer = join("",file($filename));
$buffer = eregi_replace("rn","",$buffer);
$tagkey = sql_regcase($tag);
$buffer = eregi_replace("<$tagkey ","n<$tag ",$buffer);
$ar = split("n",$buffer);

foreach($ar as $v) {
if(! eregi("<$tagkey ",$v)) continue;
eregi("<$tagkey ([^>]*)((.*)</$tagkey)?",$v,$regs);
$p[tagName] = strtoupper($tag);
if($regs[3])
$p[Text] = $regs[3];
$s = trim(eregi_replace("[ t]+"," ",$regs[1]))." ";
$s = eregi_replace(" *= *","=",$s);

$a = split(" ",$s);
for($i=0;$i<count($a);$i++) {
$ch = array();
if(eregi("=["']",$a[$i])) {
$j = $i+1;
while(!eregi("["']$",$a[$i])) {
$a[$i] .= " ".$a[$j];
unset($a[$j]);
}
}
}
foreach($a as $k) {
$name = strtoupper(strtok($k,"="));
$value = strtok("");
if(eregi("^["']",$value))
$value = substr($value,1,-1);
if($name)
$p[Attrs][$name] = $value;
}
$pp[] = $p;
}
return $pp;
}
?>

您可能感兴趣的文章:
php去除HTML标签的二种方法
php 去除多余的HTML标签
php用strip_tags完整去除所有html标签的实例分享
php过滤html标记的函数strip_tags用法举例(图文)
php删除html标签的三种方法分享
php删除html标签及字符串中html标签的代码
php获取html网页内容的多个方法
去掉内容中 html 标签的代码
php正则过滤html标签、空格、换行符等的代码示例
php去除html标签获得输入纯文本文档strip_tags
php使HTML标签自动补全闭合函数的代码
php实现html标签自动补全的代码
thinkPHP的Html模板标签的使用方法