当前位置:   article > 正文

java中对Byte字符数组定长截取的方法_java 字节数组从第三位截取

java 字节数组从第三位截取

        今天在在处理从网络上接收到的字符串,因为是从后台C语言过来的一组拼接的字符串,要定长截取,然而由于C语言是用Byte的方式计数,而java中是用Unicode编码的方式计数,一个中文汉字以Bytes的方式是两个字节,而用Unicode的方式是一个字,所以难以准确的截取出我想到的内容,经过半天的探索发现应该以如下的方式来解决。

        先将字符串转换为Bytes【】数组,编码方式为“Unicode”,转出来的数组中的第一位和第二位是-2和-1,真正的内容从第三位开始,所有的字符都占用两个字节的空间,如果是英文和字母则第一个空间为0,如果是汉字就不是0,通过这样的方法就可以正确处理截取字符串的内容了!

  1. public static String bSubstring(String s, int length) throws Exception
  2. {
  3. byte[] bytes = s.getBytes("Unicode");
  4. int n = 0; // 表示当前的字节数
  5. int i = 2; // 要截取的字节数,从第3个字节开始
  6. for (; i < bytes.length && n < length; i++)
  7. {
  8. // 奇数位置,如3、5、7等,为UCS2编码中两个字节的第二个字节
  9. if (i % 2 == 1)
  10. {
  11. n++; // 在UCS2第二个字节时n加1
  12. }
  13. else
  14. {
  15. // 当UCS2编码的第一个字节不等于0时,该UCS2字符为汉字,一个汉字算两个字节
  16. if (bytes[i] != 0)
  17. {
  18. n++;
  19. }
  20. }
  21. }
  22. // 如果i为奇数时,处理成偶数
  23. if (i % 2 == 1)
  24. {
  25. // 该UCS2字符是汉字时,去掉这个截一半的汉字
  26. if (bytes[i - 1] != 0)
  27. i = i - 1;
  28. // 该UCS2字符是字母或数字,则保留该字符
  29. else
  30. i = i + 1;
  31. }
  32. return new String(bytes, 0, i, "Unicode");
  33. }


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/427540
推荐阅读
相关标签
  

闽ICP备14008679号