UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 14: illegal multibyte sequence 解决_unicodedecodeerror gbk

作者：很楠不爱3 | 2024-02-27 07:26:59

踩

unicodedecodeerror gbk

这个错误是因为Python默认使用的编码方式（GBK）无法正确解码包含非ASCII字符的文件。可以尝试以下解决方案：

1. 修改文件编码：将文件的编码方式改为UTF-8或者其他支持中文的编码方式。
2. 修改代码：在打开文件时指定文件的编码方式，例如：
f = open(path, encoding='utf-8')

3. 在读文件之前使用chardet库检测文件的编码方式，然后再用相应的编码方式打开文件。例如：
import chardet

def get_text_Chinese(path):
with open(path, 'rb') as f:
data = f.read()
encoding = chardet.detect(data)['encoding']
f = open(path, encoding=encoding)
text = f.read()
cut_text = "".join(jieba.cut(text))
return cut_text

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/151058