UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c in position 28: illegal multibyte sequence_gbk' codec can't decode byte 0x9c in position 28:

作者：知新_RL | 2024-02-27 07:36:41

踩

gbk' codec can't decode byte 0x9c in position 28: illegal multibyte sequenc

这个问题是在尝试读取文件时遇到的，特别是当文件的编码格式不是 ‘gbk’ 时。Python 默认使用 ‘gbk’ 编码来解码文件，如果文件包含 ‘gbk’ 无法解码的字节，就会抛出这个错误。

解决这个问题的方法是显式指定文件的编码格式。通常，我们会使用 ‘utf-8’ 编码，因为它可以处理大多数文本文件。你可以在 open() 函数中使用 encoding 参数来指定编码。
下面是一个示例代码：

with open('your_file.txt', 'r', encoding='utf-8') as f:
    content = f.read()
1
2

这段代码会以 ‘utf-8’ 编码打开文件，并读取它的内容。如果文件是以其他编码格式保存的，你需要用相应的编码来替换 ‘utf-8’。如果你不确定文件的编码，你可以尝试使用 ‘utf-8’ 或 ‘latin1’，并查看是否仍然抛出错误。
需要注意的是，Python 的 open() 函数默认使用系统编码打开文件。如果你在一个使用不同默认编码的系统上运行代码（例如在 Linux 上使用 ‘utf-8’，而在 Windows 上使用 ‘gbk’），这可能会导致问题。在这种情况下，显式指定编码是一个好的做法。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/151116