python使用正则表达式解析网页编码。
例子:
复制代码 代码示例:
#!/bin/python
#site:www.jb200.com
#
import urllib.request
import re
content = urllib.request.urlopen("http://www.jb200.com/")
x = str(content.info())
match = re.search('charset=(?P<charset>w*)', x, re.IGNORECASE)
if match:
temp = x.decode(match.group('charset'))
您可能感兴趣的文章:
python配置文件中文转换Unicode编码的方法
python编码时应该注意的几个问题
python处理中文编码的问题
有关python中读写文件及中文编码的处理方法