赞
踩
这是我打开,阅读和输出的方式。 该文件是用于Unicode字符的UTF-8编码文件。 我想打印前10个UTF-8字符,但是下面代码片段的输出显示了10个无法识别的怪异字符。 想知道是否有人对如何正确打印有任何想法? 谢谢。
with open(name, 'r') as content_file:
content = content_file.read()
for i in range(10):
print content[i]
10个怪异角色中的每个角色都像这样,
?
问候,
林
共享文本文件内容
您的控制台或tty也必须支持该字符-您可能必须更改终端设置。
@cdarke,谢谢并投票。 我的控制台可以正确print content,这应该证明它支持UTF-8字符。 仅当我打印content[i]时才会发生此问题。 如果您有任何想法,那就太好了。
@RahulKumar,谢谢并投票。 不知道如何在此处发布原始原始文件,我尝试过,我的控制台可以正确地print content,这应该证明它支持UTF-8字符。 仅当我打印content[i]时才会发生此问题。 如果您有任何想法,那就太好了。
您可能会发现这篇文章很有帮助:实用Unicode,由SO老兵Ned Batchelder编写。
将Unicode代码点(字符)编码为UTF-8时,某些代码点将转换为单个字节,但是许多代码点会超过一个字节。标准7位ASCII范围内的字符将被编码为单个字节,但是更多的外来字符通常将需要更多的字节进行编码。
因此,您将获得那些奇怪的字符,
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。