当前位置:   article > 正文

‘gbk‘ codec can‘t decode byte 0xac in position 400623: illegal multibyte sequenc解决办法_gbk codec can't decode byte

gbk codec can't decode byte

 我在写代码的时候遇到了这个问题,可以推断文件是gbk无法解析的文件,我们的文本当中有中文字符(gbk表示国标)

我百度到的解决办法是将编码方式改为utf-8编码

with open('D:\文本数据分析\data\红岩.txt', 'r', encoding='utf-8') as f:

但是我的运行报错了这个问题

'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte

显然utf-8编码是不行的,改成下面这种就可以运行了

with open('D:\文本数据分析\data\红岩.txt', 'r', encoding="gb18030") as f:

现在很多读取文件默认使用utf-8来解码,但是有一些文本文件编码的时候却不一定使用的是utf-8编码,所以读取会出问题。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/151147
推荐阅读
相关标签
  

闽ICP备14008679号