当前位置:   article > 正文

使用HashMap实现,对一个字符集进行哈夫曼编码

使用HashMap实现,对一个字符集进行哈夫曼编码

最终达到的效果:

调用一个类

class HuffmanCodin{.....}

使用类中的静态方法,获取哈夫曼编码:


事前准备——哈夫曼树的节点定义

  1. class Node implements Comparable<Node> {
  2. int weight;//权重
  3. Node left;
  4. Node right;
  5. char ch;//关键字,字符
  6. String code;//相应的哈夫曼编码
  7. public Node(char ch, int weight) {//构造方法,键值对
  8. this.weight = weight;
  9. this.ch = ch;
  10. }
  11. //构造方法,只设置出现频率
  12. public Node(int weight) {
  13. this.weight = weight;
  14. }
  15. //重写compareTo方法
  16. @Override
  17. public int compareTo(Node node) {
  18. if(this.weight - node.weight==0){//如果两个字符出现的频率一样,那么就比较字典序(两个字符一定是不同的)
  19. return this.ch-node.ch;
  20. }
  21. return this.weight - node.weight;//默认排列升序
  22. }
  23. //重写toString方法
  24. //效果:[ 字符 -> 010 ]
  25. @Override
  26. public String toString() {//重写之后,等一下打印就可以直接用引用就可以了
  27. return "[" + this.ch + " -> " + this.code + "] ";
  28. }
  29. }

步骤:

想要达到上述效果,大致可以分为这几步:

1、字符集转化成一个一个的键值对;

2、键值对转节点,节点放入一个集合

3、依据集合创建哈夫曼树。

4、对哈夫曼树的叶子节点进行哈夫曼编码

下面我们一点一点来解决


1、字符集转键值对

这里就要使用到HashMap了:

HashMap的

Key=一个字符

Value=权重(就是一个字符在字符集出现的频率,当然也不完全是,等一下会讲到)

  1. public class Test {
  2. public static void main(String[] args) {
  3. Scanner in = new Scanner(System.in);
  4. System.out.println("输入的字符集:");
  5. String arr = in.nextLine();
  6. char[] chars = arr.toCharArray();//转化成字符数组
  7. Node root=HuffmanCoding.createTree(chars);//调用这个静态方法,具体实现看下一块代码
  8. }
  9. }
  1. class HuffmanCoding {
  2. public static Node createTree(char[] arr) {
  3. Map.Entry<Character, Integer>[] entries = charGetEntry(arr);//获取键值对
  4. }

charGetEntry()方法就是专门用来把字符集转化成一个一个的键值对的,然后返回这个类型:

Map.Entry<Character, Integer>[]

为什么是这个类型?

因为HashMap不能直接同时访问Character也就是字符,以及Integer接也就是对应字符的权重。

如果要访问键值对,需要调用HashMap的setEntry方法,setEntry方法会返回Map.Entry<Character, Integer>[]类型的数组

而Map.Entry中有访问和修改关键字和值的方法。

charGetEntry()方法:

  1. private static Map.Entry<Character, Integer>[] charGetEntry(char[] arr) {
  2. //定义Hashmap储存不重复的键值对
  3. Map<Character, Integer> map = new HashMap<>(arr.length);//长度肯定不会超过arr的长度
  4. for (char ch : arr) {
  5. map.put(ch, 0);//权值默认先给0,等一下处理
  6. }
  7. //定义Entry[]这个集合,用来存放键值对
  8. Map.Entry<Character, Integer>[] entrys = new Map.Entry[map.size()];//长度刚好就是map的长度
  9. int i = 0;
  10. for (Map.Entry<Character, Integer> entry : map.entrySet()) {//遍历每一个entry,以此把每一个键值对放到集合entrys中
  11. entrys[i++] = entry;
  12. }
  13. //现在就可以赋值weight了
  14. i=entrys.length-1;//从后往前遍历,当然从前往后也可以
  15. while(i>=0){
  16. int n=0;
  17. for (int j = 0; j <arr.length ; j++) {
  18. if(entrys[i].getKey()==arr[j]){//两个字符一样,那么频率++
  19. n++;
  20. }
  21. }
  22. entrys[i--].setValue(n);
  23. }
  24. //程序到达这里,键值对已经储存完毕,下面直接返回集合即可
  25. return entrys;
  26. }

如下第一步完成:


2、键值对转节点

上一步我们已经获得了所有的键值对,储存在entries中,现在只需创建一个List<Node>类型的集合,获遍历entries,获取键值对即可:

  1. //放入节点中(用集合来管理)
  2. int length = entries.length;
  3. List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
  4. while (length > 0) {
  5. //用Node的构造方法,创建结点,第一个参数是关键子,第二个参数是权重
  6. nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
  7. length--;
  8. }

此时,第二步完成,nodeList就是一个储存着所有结点的集合。

3、构造哈夫曼树

此时类

HuffmanCoding

的静态方法createTree已经定义好了:

  1. public static Node createTree(char[] arr) {
  2. Map.Entry<Character, Integer>[] entries = charGetEntry(arr);//获取键值对,已经完成,保存在了entries中
  3. //放入节点中(用集合来管理)
  4. int length = entries.length;
  5. List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
  6. while (length > 0) {
  7. nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
  8. length--;
  9. }
  10. while (nodeList.size() > 1) {//只要大于一,就合并
  11. Collections.sort(nodeList);//先排升序,重写了用weight比较
  12. Node a = nodeList.remove(0);
  13. Node b = nodeList.remove(0);
  14. Node newNode = new Node(a.weight + b.weight);//这个是双亲节点
  15. newNode.left = a;
  16. newNode.right = b;
  17. nodeList.add(newNode);
  18. }
  19. return nodeList.remove(0);//还剩下的一个节点,就是哈夫曼树的根节点
  20. }

4、叶结点编码

下面运用的是递归,对叶子结点进行赋值0或者1(左结点是0,右结点时1):

  1. //这个函数可以把Node的code修改
  2. public static void coding(Node root, StringBuilder sb) {
  3. if (root == null) return;//如果只有一个节点,code==“”---->空字符串
  4. root.code = sb.toString();//先根节点
  5. if (root.left == null && root.right == null) {
  6. return;//直接返回
  7. }
  8. //如果不是叶子节点,那么一定有左右孩子----》因为这是哈夫曼树
  9. sb.append("0");//先左边,所以加一个0
  10. coding(root.left, sb);//递归
  11. sb.replace(sb.length() - 1, sb.length(), "1");//把最后一个替换成1,因为要走右边了
  12. coding(root.right, sb);//递归
  13. sb.delete(sb.length() - 1, sb.length());//也要删除,删除的区间是:左开右闭的!
  14. }

现在这个HuffmanCoding这个类就可以对一个字符集进行哈夫曼编码了,当然如果想要打印对应的值,需要写一个打印叶子结点的方法:

  1. //前序遍历打印叶子结点
  2. public static void showChar(Node root) {
  3. if (root == null) return;
  4. if (root.left == null && root.right == null) {//这是一个叶子节点,直接打印然后返回
  5. System.out.println(root);
  6. return;
  7. }
  8. //不是叶子结点,就遍历左右子树
  9. showChar(root.left);
  10. showChar(root.right);
  11. }

测试

最终哈夫曼编码类的源码:

  1. class HuffmanCoding {
  2. public static Node createTree(char[] arr) {
  3. Map.Entry<Character, Integer>[] entries = charGetEntry(arr);//获取键值对,已经完成,保存在了entries中
  4. //放入节点中(用集合来管理)
  5. int length = entries.length;
  6. List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
  7. while (length > 0) {
  8. nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
  9. length--;
  10. }
  11. while (nodeList.size() > 1) {//只要大于一,就合并
  12. Collections.sort(nodeList);//先排升序,重写了用weight比较
  13. Node a = nodeList.remove(0);
  14. Node b = nodeList.remove(0);
  15. Node newNode = new Node(a.weight + b.weight);//这个是双亲节点
  16. newNode.left = a;
  17. newNode.right = b;
  18. nodeList.add(newNode);
  19. }
  20. return nodeList.remove(0);//还剩下的一个节点,就是哈夫曼树的根节点
  21. }
  22. private static Map.Entry<Character, Integer>[] charGetEntry(char[] arr) {
  23. //定义Hashmap储存不重复的键值对
  24. Map<Character, Integer> map = new HashMap<>(arr.length);//长度肯定不会超过arr的长度
  25. for (char ch : arr) {
  26. map.put(ch, 0);//权值默认先给0,等一下处理
  27. }
  28. //定义Entry[],又来放键值对(可以访问的)
  29. Map.Entry<Character, Integer>[] entrys = new Map.Entry[map.size()];//长度刚好就是map的长度
  30. int i = 0;
  31. for (Map.Entry<Character, Integer> entry : map.entrySet()) {
  32. entrys[i++] = entry;
  33. }
  34. //先在赋值weight
  35. i=entrys.length-1;
  36. while(i>=0){
  37. int n=0;
  38. for (int j = 0; j <arr.length ; j++) {
  39. if(entrys[i].getKey()==arr[j]){//两个字符一样,那么频率佳佳
  40. n++;
  41. }
  42. }
  43. entrys[i--].setValue(n);
  44. }
  45. //程序到达这里,键值对已经储存完毕
  46. return entrys;
  47. }
  48. //这个函数可以把Node的code修改
  49. public static void coding(Node root, StringBuilder sb) {
  50. if (root == null) return;//如果只有一个节点,code==“”---->空字符串
  51. root.code = sb.toString();//先根节点
  52. if (root.left == null && root.right == null) {
  53. return;//直接返回
  54. }
  55. //如果不是叶子节点,那么一定有左右孩子----》因为这是哈夫曼树
  56. sb.append("0");//先左边,所以加一个0
  57. coding(root.left, sb);//递归
  58. sb.replace(sb.length() - 1, sb.length(), "1");//把最后一个替换成1,因为要走右边了
  59. coding(root.right, sb);//递归
  60. sb.delete(sb.length() - 1, sb.length());//也要删除,删除的区间是:左开右闭的!
  61. }
  62. //前序遍历打印叶子结点
  63. public static void showChar(Node root) {
  64. if (root == null) return;
  65. if (root.left == null && root.right == null) {//这是一个叶子节点,直接打印然后返回
  66. System.out.println(root);
  67. return;
  68. }
  69. //不是叶子结点,就遍历左右子树
  70. showChar(root.left);
  71. showChar(root.right);
  72. }
  73. }

类中静态方法使用的演示:

关于哈夫曼编码的解码

会了编码,其实解码就很容易了

值得注意的是:

不同的字符集合,对应的哈夫曼编码是有所差异的

所以如果要进行解码,那么必须直到每一个字符对应出现的频率

解码思路:

在接收到字符频度表之后,创建一颗哈夫曼树,每次从root结点开始遍历,从第一个字符开始,是0就往左树走,是1就往右走,直到叶子结点即可解码。

具体实现:

  1. public static void deCoding(Map.Entry<Character, Integer>[] arrEntry, String arr) {//需要接收字符频度表 and 哈夫曼编码
  2. Node Cur= createTree(arrEntry);//调用了重载的创建哈夫曼树的方法
  3. char[] chars = arr.toCharArray();
  4. int cur = 0;//表示读取编码的位置
  5. Node root=Cur;//Cur保存了哈夫曼树的根结点
  6. while (cur < chars.length) {//读完就退出循环
  7. while (root.left != null && root.right != null) {//没有到叶子结点就一直循环
  8. if (chars[cur] == '1') {//1走右边
  9. cur++;
  10. root = root.right;
  11. } else {//是二走左边
  12. cur++;
  13. root = root.left;
  14. }
  15. }
  16. //如果跳出了循环说明已经是叶子结点了
  17. System.out.println(root);
  18. root=Cur;
  19. }
  20. }

因为我们在createTree()方法中传入的类型是Map.Entry<Character, Integer>[],

所以需要对createTree()方法,

进行一次重载,

这个重载其实不麻烦,只要改一下接口,就可以了:

  1. private static Node createTree(Map.Entry<Character, Integer>[] entries){//重载方法,用在解码时调用这个方法
  2. //放入节点中(用集合来管理)
  3. int length = entries.length;//只改了这一行,和方法的唯一参数!!!!!
  4. List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
  5. while (length > 0) {
  6. nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
  7. length--;
  8. }
  9. while (nodeList.size() > 1) {//只要大于一,就合并
  10. Collections.sort(nodeList);//先排升序,重写了用weight比较
  11. Node a = nodeList.remove(0);
  12. Node b = nodeList.remove(0);
  13. Node newNode = new Node(a.weight + b.weight);//这个是双亲节点
  14. newNode.left = a;
  15. newNode.right = b;
  16. nodeList.add(newNode);
  17. }
  18. return nodeList.remove(0);//还剩下的一个节点,就是哈夫曼树的根节点
  19. }

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/562044
推荐阅读
相关标签
  

闽ICP备14008679号