举个例子
- >>> s = u'\u6ce8\u91ca'
- >>> s
- u'\u6ce8\u91ca'
- >>> print s
- 注释
- >>> print type(s)
- <type 'unicode'>
- >>> print s.encode('gbk')
- 注释
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
字符串前加u表示为unicode编码,而当前文本的unicode编码 可以设定,
比如utf-8编码就是第一行加上:
# -*- coding: utf-8 -*-
- 1
而gbk编码为
# -*- coding: gbk -*-
- 1
参考
python中文编码
详细的python编码内容
如例子
- "我是中文".decode("GBK").encode("GBK")
- #输出‘\xce\xd2\xca\xc7\xd6\xd0\xce\xc4′
- 1
- 2
可以参考
http://www.crifan.com/python_already_got_correct_encoding_string_but_seems_print_messy_code/