php与mysql中utf8编码中文排序方法
中文共有三种排序方式:
1、根据拼音排序;
2、根据笔画排序;
3、根据偏旁排序。
说明:系统默认排序方式为拼音排序。
1、需要在php数组中用中文排序,一般使用utf8格式的文件,直接用asort排序不行。
用gbk和gb2312可以。这跟几种格式的编码有关系。gbk和gb2312本身的编码就是用拼音排序的。
2. 在mysql中,经常会对一个字段进行排序查询,但进行中文排序和查找的时候,对汉字的排序和查找结果往往都是错误的。
这种情况在mysql的很多版本中都存在。
mysql在查询字符串时是大小写不敏感的,在编绎mysql时一般以iso-8859字符集作为默认的字符集,因此在比较过程中中文编码字符大小写转换造成了这种现象。
解决方法:
对于包含中文的字段加上"binary"属性,使之作为二进制比较,例如将"name char(10)"改成"name char(10)binary"。
如果你使用源码编译mysql,可以编译mysql时使用 --with--charset=gbk 参数,这样mysql就会直接支持中文查找和排序了(默认的是latin1)。
也可以用 extra-charsets=gb2312,gbk 来加入多个字符集。
如果不想对表结构进行修改或者重新编译mysql,也可以在查询语句的 order by 部分使用 convert 函数。
例子: