当前位置:   article > 正文

彻底搞懂 Unicode、UTF-8 及 Python encode()的机制、应用场景_encode("unicode")

encode("unicode")

2.1.1 编码方式科普

(参考资料 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html)

Unicode 只是一个符号集,它只规定了符号的 二进制代码 ,却没有规定这个二进制代码应该 如何存储

其中有的字符只有 1B ,有的有 4B ,多出来的会有很多 0 ,这不太好,那有什么办法呢?UTF-8 可以很好地解决这个问题,其他方式此处不做讨论

UTF-8 就是在互联网上使用最广的一种 Unicode 实现方式 ,解决了怎么存储 Unicode 中的二进制编码 ,存储方式如下:

UTF-8 编码
0xxxxxxx
110xxxxx 10xxxxxx
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

下面详细讲述 转换成 utf-8 :

  1. 拿到 的 unicode 编码 '\u4e00' (可以用python报错或baidu)
  2. calc 计算一下
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/678878
推荐阅读
相关标签
  

闽ICP备14008679号