python解析网页字符编码的小例子

发布时间:2020-04-24编辑:脚本学堂
分享一个使用python解析网页的字符编码的小例子,使用正则表达式解析页面内容编码,有需要的朋友参考学习下。

python使用正则表达式解析网页编码。
例子:
 

复制代码 代码示例:
#!/bin/python
#site:www.jb200.com
#
import urllib.request
import re
content = urllib.request.urlopen("http://www.jb200.com/")
x = str(content.info())
match = re.search('charset=(?P<charset>w*)', x, re.IGNORECASE)
if match:
    temp = x.decode(match.group('charset'))

您可能感兴趣的文章:

python配置文件中文转换Unicode编码的方法
python编码时应该注意的几个问题
python处理中文编码的问题
有关python中读写文件及中文编码的处理方法