赞
踩
(参考资料 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html)
Unicode 只是一个符号集,它只规定了符号的 二进制代码 ,却没有规定这个二进制代码应该 如何存储
其中有的字符只有 1B ,有的有 4B ,多出来的会有很多 0 ,这不太好,那有什么办法呢?UTF-8 可以很好地解决这个问题,其他方式此处不做讨论
UTF-8 就是在互联网上使用最广的一种 Unicode 实现方式 ,解决了怎么存储 Unicode 中的二进制编码 ,存储方式如下:
UTF-8 编码 |
---|
0xxxxxxx |
110xxxxx 10xxxxxx |
1110xxxx 10xxxxxx 10xxxxxx |
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx |
下面详细讲述 一
转换成 utf-8 :
一
的 unicode 编码 '\u4e00'
(可以用python报错或baidu)Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。