当前位置:   article > 正文

Python中字符、汉字、数字转为Unicode码_unicode_str = str.encode("unicode")

unicode_str = str.encode("unicode")

转载地址:https://blog.csdn.net/bit_sky/article/details/50926103

一、数字、字符(英文字符、标点、特殊符号等)转为Unicode码

  1. def charToUnic(ch):
  2. tmp_ch = hex(ord(ch))[2:]
  3. return "0" * (4 - len(tmp_ch)) + tmp_ch

二、汉字转为Unicode码

  1. def chineseToUnic(ch):
  2. return ch.decode('utf-8').encode('unicode_escape')[2:]

三、Unicode码解码为汉字

  1. str1 = '\u4f60\u597d'
  2. print str1.decode('unicode_escape')
  3. 你好

四、实例

  1. #!/usr/bin/python2.7
  2. # -*- coding: utf-8 -*
  3. import sys
  4. reload(sys)
  5. sys.setdefaultencoding('utf-8')
  6. # \u59ae\u8428\u53e4\u4e3d\u0020\u0020\u827e\u5219\u5b5c
  7. stre = u'\u59ae\u8428\u53e4\u4e3d\x07\u827e\u5219\u5b5c'
  8. def unicode_check(stre):
  9. if stre is None or len(stre) == 0:
  10. return ''
  11. else:
  12. unicode_str = stre.decode('utf-8').encode('unicode_escape') #汉字转为unicode
  13. # print unicode_str
  14. temp_str = []
  15. last_str = []
  16. for i in unicode_str:
  17. temp_str.append(i)
  18. j = 0
  19. while(j<len(temp_str)):
  20. if (temp_str[j] == '\\' and temp_str[j+1] == 'x'):
  21. temp_str[j+1] = 'u'
  22. temp_str[j+2] = '0'
  23. temp_str[j+3] = '0'
  24. #赋值
  25. last_str.append(temp_str[j])
  26. last_str.append(temp_str[j+1])
  27. last_str.append(temp_str[j+2])
  28. last_str.append(temp_str[j+3])
  29. last_str.append('2')
  30. last_str.append('0')
  31. j = j + 3 #往后 移动到了第三位
  32. else:
  33. last_str.append(temp_str[j])
  34. j = j + 1
  35. laststring = '' #保存最终的字符
  36. for i in last_str:
  37. laststring = laststring + i
  38. return laststring.decode('unicode_escape') # unicode转为汉字
  39. # a = '\xb3\xc2\xbd\xa8\xc3\xf4'
  40. # a = '\x07'
  41. # b = a.decode('gbk')
  42. # print b
  43. print unicode_check(stre)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/153679
推荐阅读
相关标签
  

闽ICP备14008679号