php汉字unicode编码与解码

发布时间:2019-12-26编辑:脚本学堂
本文介绍了php中实现汉字unicode编码与解码的方法,有需要的朋友参考下。

用php写一个unicode的编码和解码程序。
这次彻底点,把编码和解码的程序都一起写出来。

保护java源文件,将asc2编码的字符串转换为unicode编码

unicode编码在php中使用ucs-2编码,之前还真是没有发现,一直还以为是utf-8就行了。

代码:
 

复制代码 代码示例:

<?php
//将内容进行unicode编码,编码后的内容格式:yokau738b (原始:yoka王)
function unicode_encode($name)
{
    $name = iconv('utf-8', 'ucs-2', $name);
    $len = strlen($name);
    $str = '';
    for ($i = 0; $i < $len - 1; $i = $i + 2)
    {
        $c = $name[$i];
        $c2 = $name[$i + 1];
        if (ord($c) > 0)
        {    // 两个字节的文字
            $str .= 'u'.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);
        }
        else
        {
            $str .= $c2;
        }
    }
    return $str;
} // (脚本学堂 www.jb200.com 编辑整理)

// 将unicode编码后的内容进行解码,编码后的内容格式:yokau738b (原始:yoka王)
function unicode_decode($name)
{
    // 转换编码,将unicode编码转换成可以浏览的utf-8编码
    $pattern = '/([w]+)|(u([w]{4}))/i';
    preg_match_all($pattern, $name, $matches);
    if (!empty($matches))
    {
        $name = '';
        for ($j = 0; $j < count($matches[0]); $j++)
        {
            $str = $matches[0][$j];
            if (strpos($str, 'u') === 0)
            {
                $code = base_convert(substr($str, 2, 2), 16, 10);
                $code2 = base_convert(substr($str, 4), 16, 10);
                $c = chr($code).chr($code2);
                $c = iconv('ucs-2', 'utf-8', $c);
                $name .= $c;
            }
            else
            {
                $name .= $str;
            }
        }
    }
    return $name;
}

测试:
 

复制代码 代码示例:
echo '<h3>yokau738b -> '.unicode_decode('yokau738b').'</h3>';
$name = 'yoka王';
echo '<h3>'.unicode_encode($name).'</h3>';

注意:新浪博客的编辑器把/ ** * /全都给过滤了