当前位置:   article > 正文

chardet.detect()

chardet.detect

chardet 提供自动检测字符编码的功能

chardet.detect() 函数接受一个参数,一个非unicode字符串, 它返回一个字典, 其中包含自动检测到的字符编码和从0到1的可信度级别。

chardet 的安装
pip install chardet

chardet 实例

1.网页编码判断

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
  • 1
  • 2
  • 3
  • 4
  • 5

2.文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/865476
推荐阅读
  

闽ICP备14008679号