在处理字符串时,在不知道字符串是何种编码时,则不能进行有效的字符串编码转换,面对多种不同编码的输入方式,是否会有一种有效的编码方式?
推荐使用chardet模块,chardet是一个非常优秀的编码识别模块。(pythonmokuai/ target=_blank class=infotextkey>python模块)
下载地址:http://pypi.python.org/pypi/chardet
使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式。
代码:
运行结果:
{'confidence': 0.99, 'encoding': 'GB2312'}