赞
踩
堆排序的基本思想是:
要求:给你一个数组 {4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。
要求:给你一个数组 {4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。
package tree; import java.text.SimpleDateFormat; import java.util.Arrays; import java.util.Date; public class HeapSort { public static void main(String[] args) { // int[] arr = {4, 6, 8, 5, 9}; // heapSort(arr); // System.out.println(Arrays.toString(arr)); int[] arr = new int[8000000]; for (int i = 0; i < 8000000; i++) { arr[i] = (int) (Math.random() * 80000);// 生成一个0-80000的数据 } Date date1 = new Date(); SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); String date1Str = simpleDateFormat.format(date1); System.out.println("排序前的时间为:" + date1Str); heapSort(arr); Date date2 = new Date(); String date2Str = simpleDateFormat.format(date2); System.out.println("排序后的时间为:" + date2Str); } // 编写一个堆排序的方法 public static void heapSort(int[] arr) { int temp = 0; // 要求将数组按升序排序 // 分步完成 // adjustHeap(arr,1,arr.length); // System.out.println("第一次"+ Arrays.toString(arr)); // adjustHeap(arr,0,arr.length); // System.out.println("第二次"+ Arrays.toString(arr)); // 完成最终代码 // ① 将无序序列构建成一个堆,根据升序降序需求选择大顶堆或者小顶堆 for (int i = arr.length / 2 - 1; i >= 0; i--) { adjustHeap(arr, i, arr.length); } // ② 将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端 // ③ 重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序 for (int i = arr.length - 1; i > 0; i--) { // 交换 temp = arr[i]; arr[i] = arr[0]; arr[0] = temp; adjustHeap(arr, 0, i); } } /** * 将一个数组(二叉树),调整成一个大顶堆 * 功能:完成 将以i对应的非叶子节点的数调整成大顶堆 * 举例:int[] arr = {4, 6, 8, 5, 9} => i = 1 => adjustHeap => 得到 arr[] = {4, 9, 8, 5, 6} * 举例:如果我们再次调用adjustHeap => i = 0 => adjustHeap => 得到 arr[] = {9, 6, 8, 5, 4} * * @param arr 待调整数组 * @param i 表示非叶子节点的在数组中的索引 * @param length 表示对多少个元素进行调整,length在逐渐减少 */ public static void adjustHeap(int[] arr, int i, int length) { int temp = arr[i]; // 先取出当前元素的值,保存在临时变量 // 开始调整 // 说明 // 1. j = i * 2 + 1 j是i结点的左子节点 for (int j = i * 2 + 1; j < length; j = j * 2 + 1) { if (j + 1 < length && arr[j] < arr[j + 1]) { // 说明左子节点比右子节点小 j++; // j指向右子节点 } if (arr[j] > temp) { // 如果子节点大于父节点 arr[i] = arr[j]; // 把较大的值赋给当前结点 i = j; // ★★★★★★ i指向j 继续循环比较 } else { break; } } // 当for循环结束后,我们已经将以i为父节点的树的最大值,放在了最顶上(局部大顶堆) arr[i] = temp;//将temp值放到调整后的位置 } }
给你一个数列 {13, 7, 8, 3, 29, 6, 1},要求转成一颗赫夫曼树.
思路分析(示意图):
package huffmantree; import java.util.ArrayList; import java.util.Arrays; import java.util.Collections; import java.util.List; public class HuffmanTree { public static void main(String[] args) { int[] a = {13, 7, 8, 3, 29, 6, 1}; Arrays.sort(a); Node root = createHuffmanTree(a); // 测试 preOrder(root); } // 编写一个前序遍历的方法 public static void preOrder(Node root) { if (root != null) { root.preOrder(); } else { System.out.println("该树为空树"); } } /** * 创建赫夫曼树 * * @param arr 需要创建为赫夫曼树的数组 * @return 创建好的赫夫曼树头结点 */ public static Node createHuffmanTree(int[] arr) { // 第一步:为了操作方便 // 1. 遍历arr数组 // 2. 将arr每个元素构建成一个Node // 3. 将Node放入ArrayList中 List<Node> nodes = new ArrayList<Node>(); for (int value : arr) { nodes.add(new Node(value)); } // 我们处理的过程是循环的过程 while (nodes.size() > 1) { // 排序:从小到大 Collections.sort(nodes); // 取出根节点权值最小的两棵二叉树 // 1)取出权值最小的结点(二叉树) Node leftNode = nodes.get(0); // 2)取出权值第二小的结点(二叉树) Node rightNode = nodes.get(1); // 3)构建一颗新的二叉树 Node parent = new Node(leftNode.value + rightNode.value); parent.left = leftNode; parent.right = rightNode; // 4)从ArrayList中删除处理过的二叉树 nodes.remove(leftNode); nodes.remove(rightNode); // 5)将parent加入到nodes nodes.add(parent); } // 返回赫夫曼树的头结点 return nodes.get(0); } } // 创建节点类 // 为了让Node对象支持排序Collections集合排序 // 让Node实现Comparable接口 class Node implements Comparable<Node> { int value; // 结点权值 Node left; // 指向左子节点 Node right; // 指向右子节点 public Node(int value) { this.value = value; } @Override public String toString() { return "Node{" + "value=" + value + '}'; } @Override public int compareTo(Node o) { // 表示从小到大排序 return this.value - o.value; // 表示从大到小排序 // return -(this.value - o.value); } // 前序遍历 public void preOrder() { System.out.print(this.value + " "); if (this.left != null) { this.left.preOrder(); } if (this.right != null) { this.right.preOrder(); } } }
通信领域中信息的处理方式1-定长编码
i like like like java do you like a java // 共40个字符(包括空格)
105 32 108 105 107 101 32 108 105 107 101 32 108 105 107 101 32 106 97 118 97 32 100 111 32 121 111 117 32 108 105 107 101 32 97 32 106 97 118 97 //对应Ascii码
01101001 00100000 01101100 01101001 01101011 01100101 00100000 01101100 01101001 01101011 01100101 00100000 01101100 01101001 01101011 01100101 00100000 01101010 01100001 01110110 01100001 00100000 01100100 01101111 00100000 01111001 01101111 01110101 00100000 01101100 01101001 01101011 01100101 00100000 01100001 00100000 01101010 01100001 01110110 01100001 //对应的二进制
按照二进制来传递信息,总的长度是 359 (包括空格)
通信领域中信息的处理方式2-变长编码
i like like like java do you like a java // 共40个字符(包括空格)
d:1 y:1 u:1 j:2 v:2 o:2 l:4 k:4 e:4 i:5 a:5 :9 // 各个字符对应的个数
0= , 1=a, 10=i, 11=e, 100=k, 101=l, 110=o, 111=v, 1000=j, 1001=u, 1010=y, 1011=d
说明:按照各个字符出现的次数进行编码,原则是出现次数越多的,则编码越小,比如 空格出现了9 次, 编码为0 ,其它依次类推.
按照上面给各个字符规定的编码,则我们在传输 “i like like like java do you like a java” 数据时,编码就是 10010110100…
字符的编码都不能是其他字符编码的前缀,符合此要求的编码叫做前缀编码, 即不能匹配到重复的编码
通信领域中信息的处理方式3-赫夫曼编码
i like like like java do you like a java // 共40个字符(包括空格)
d:1 y:1 u:1 j:2 v:2 o:2 l:4 k:4 e:4 i:5 a:5 :9 // 各个字符对应的个数
按照上面字符出现的次数构建一颗赫夫曼树, 次数作为权值.(图后)
赫夫曼编码是无损处理方案
这个赫夫曼树根据排序方法不同,也可能不太一样,这样对应的赫夫曼编码也不完全一样,但是wpl 是一样的,都是最小的, 比如: 如果我们让每次生成的新的二叉树总是排在权值相同的二叉树的最后一个,则生成的二叉树为:
将给出的一段文本,比如 “i like like like java do you like a java” , 根据前面的讲的赫夫曼编码原理,对其进行数据压缩处理 ,形式如 "1010100110111101111010011011110111101001101111011110100001100001110011001111000011001111000100100100110111101111011100100001100001110
"
// 通过List创建对应赫夫曼树 /** * 通过List创建对应赫夫曼树 * @param nodes 需要创建赫夫曼树的所有节点组成的List * @return 赫夫曼树根节点 */ private static Node createHuffmanTree(List<Node> nodes) { while (nodes.size() > 1) { // 从小到大 Collections.sort(nodes); // 出去前两个点 Node leftNode = nodes.get(0); Node rightNode = nodes.get(1); // 创建一棵新的二叉树,它的根节点没有data,只有权值 Node parent = new Node(null, leftNode.weight + rightNode.weight); parent.left = leftNode; parent.right = rightNode; // 将已经处理的两棵二叉树从nodes移出 nodes.remove(leftNode); nodes.remove(rightNode); // 将新的二叉树加入到nodes nodes.add(parent); } // nodes最后剩下的结点就是哈夫曼树的根节点 return nodes.get(0); }
我们已经生成了 赫夫曼树, 下面我们继续完成任务
// 生成的赫夫曼树对应的赫夫曼编码 // 思路: // 1. 将赫夫曼编码表存放到一个Map<Byte,String>中 // 2. 在生成赫夫曼编码表时,需要拼接路径,所以创建一个StringBuilder,存储某个叶子节点的路径 static Map<Byte, String> huffmanCodes = new HashMap<Byte, String>(); static StringBuilder stringBuilder = new StringBuilder(); /** * 功能:将传入的node结点的所有叶子结点的赫夫曼编码得到,并放入到huffmanCodes中 * * @param node 传入结点,默认根节点 * @param code 路径:左子节点为0;右子节点为1 * @param stringBuilder 用于拼接路径 */ private static void getCodes(Node node, String code, StringBuilder stringBuilder) { StringBuilder stringBuilder1 = new StringBuilder(stringBuilder); // 将传入的code加入到stringBuilder1 stringBuilder1.append(code); if (node != null) { // 如果node==null 不处理 // 判断当前node是叶子节点还是非叶子节点 if (node.data == null) {// 非叶子节点 // 递归处理 // 向左递归 getCodes(node.left, "0", stringBuilder1); // 向右递归 getCodes(node.right, "1", stringBuilder1); } else { // 叶子节点 // 就表示找到某个叶子节点 huffmanCodes.put(node.data, stringBuilder1.toString()); } } } /** * 编写一个方法,将字符串对应的byte[] 数组,通过生成的赫夫曼编码表,返回一个赫夫曼编码压缩后的byte[] * * @param bytes 这是原始的字符串对应的byte[] * @param huffmanCodes 生成的赫夫曼编码map * @return 返回赫夫曼编码处理后的byte[] * 举例:接收"i like like like java do you like a java"对应的byte[]数组 => byte[] contentBytes = str.getBytes() * 返回的是1010100110111101111010011011110111101001101111011110100001100001110011001111000011001111000100100100110111101111011100100001100001110 * 该字符串对应的字节数组byte[] huffmanCodeBytes,即8位对应一个byte,放入huffmanCodeBytes * huffmanCodeBytes[0] = 10101000(补码) => byte[推导 10101000(补码) => 10101000 - 1 => 10100111(反码) => 11011000(原码) = -88] * 即使 huffmanCodeByte[1] = -88 */ public static byte[] zip(byte[] bytes, Map<Byte, String> huffmanCodes) { // 1. 先利用huffmanCodes 将 bytes 转成 赫夫曼编码对应的字符串 StringBuilder stringBuilder = new StringBuilder(); // 遍历bytes数组 for (byte b : bytes) { stringBuilder.append(huffmanCodes.get(b)); } // 将字符串转成byte[] 数组 // 统计返回的huffmanCodes长度 // 一句话 int len = (stringBuilder.length() + 7) / 8 int len; if (stringBuilder.length() % 8 == 0) { len = stringBuilder.length() / 8; } else { len = stringBuilder.length() / 8 + 1; } // 创建存储压缩后的byte数组 byte[] huffmanCondeBytes = new byte[len]; int index = 0; // 记录第几个byte for (int i = 0; i < stringBuilder.length(); i += 8) { // 因为每八位对应一个byte,所以步长+8 String strByte; if (i + 8 > stringBuilder.length()) { // 不够八位 strByte = stringBuilder.substring(i); } else { strByte = stringBuilder.substring(i, i + 8); } // 将strByte转成数组放到 huffmanCondeBytes[index] = (byte) Integer.parseInt(strByte, 2); index++; } return huffmanCondeBytes; }
使用赫夫曼编码来解码数据,具体要求是
/** * 将一个byte转成一个二进制字符串 * * @param b 接收的byte * @param flag 标识是否需要补高位,如果是true,表示需要补高位,如果是false不补 * 如果是最后一个字节,无须补高位 * @return b对应的二进制字符串(注意是按照补码返回) */ private static String byteToBitString(boolean flag, byte b) { // 使用变量保存b int temp = b; // 如果是正数,需要补高位 if (flag) { temp |= 256; // 按位与 256 1 0000 0000 | 0000 0001 => 1 0000 0001 } String str = Integer.toBinaryString(temp); // 返回的是temp对应的二进制的补码 if (flag) { str = str.substring(str.length() - 8); } return str; } /** * 编写一个方法,完成对压缩数据的解码 * * @param huffmanCodes 赫夫曼编码表Map * @param huffmanBytes 赫夫曼编码得到的字节数组 * @return 原来的字符串对应的数组 */ public static byte[] decode(Map<Byte, String> huffmanCodes, byte[] huffmanBytes) { // 1. 先得到huffmanBytes对应的二进制的字符串,形式1010100010111... StringBuilder stringBuilder = new StringBuilder(); // 将byte数组转成二进制字符串 for (int i = 0; i < huffmanBytes.length; i++) { // 判断是不是最后一个字节 boolean flag = (i == huffmanBytes.length - 1); stringBuilder.append(byteToBitString(!flag, huffmanBytes[i])); } // System.out.println(stringBuilder.toString()); // 把字符串按照指定的赫夫曼编码进行解码 // 把赫夫曼编码表反向调换 a -> 100 => 100 -> a Map<String, Byte> map = new HashMap<String, Byte>(); for (Map.Entry<Byte, String> entry : huffmanCodes.entrySet()) { map.put(entry.getValue(), entry.getKey()); } // 创建一个集合,存放Byte List<Byte> list = new ArrayList<>(); // i 可以理解成就是索引,扫描stringBuilder for (int i = 0; i < stringBuilder.length();) { int count = 1; // 小的计数器 boolean flag = true; Byte b = null; while (flag) { // 递增取出一个'1' 或者 '0' String key = stringBuilder.substring(i, i + count); // i不动,让count移动,直到匹配到一个字符 b = map.get(key); if (b == null) { //没有匹配到 count++; } else { flag = false; } } list.add(b); i += count; // i直接的移动到count } // 当for循环结束后,list中存放了所有的字符 // 把list中数据放入一个byte[] 并返回 byte[] b = new byte[list.size()]; for (int i = 0; i < b.length; i++) { b[i] = list.get(i); } return b; }
我们学习了通过赫夫曼编码对一个字符串进行编码和解码, 下面我们来完成对文件的压缩和解压,
/** * 将一个文件进行压缩 * @param srcFile 传入的希望压缩的文件的全路径 * @param dstFile 压缩后将压缩文件放到哪个目录 */ public static void zipFile(String srcFile,String dstFile){ // 创建一个文件输入流 FileInputStream is = null; // 创建输出流 OutputStream os = null; // 创建对象输出流 ObjectOutputStream oos = null; try { is = new FileInputStream(srcFile); // 创建一个和源文件大小一样的byte数组 byte[] b = new byte[is.available()]; // 读取文件 is.read(b); // 直接对源文件亚索 byte[] huffmanBytes = huffmanZip(b); // 创建一个文件输出流,存放压缩文件 os = new FileOutputStream(dstFile); // 创建一个和文件输出流关联的ObjectOutputStream oos = new ObjectOutputStream(os); // 把赫夫曼编码后的字节数组写入压缩文件 oos.writeObject(huffmanBytes); // 我们吧 // 这里我们以对象流的方式写入赫夫曼编码,目的是为了以后解压的时候恢复原文件的时候使用 // 注意一定要把赫夫曼编码写入压缩文件 oos.writeObject(huffmanCodes); }catch (Exception e){ System.out.println(e.getMessage()); }finally { try { is.close(); os.close(); oos.close(); }catch (Exception e){ System.out.println(e.getMessage()); } } }
/** * 编写一个方法,完成对压缩文件的解压 * @param zipFile 准备解压的文件 * @param dstFile 将文件解压到哪个路径 */ public static void unZip(String zipFile,String dstFile){ // 定义文件输入流 InputStream is = null; // 定义对象输入流 ObjectInputStream ois = null; // 定义文件输出流 OutputStream os = null; try { // 创建文件输入流 is = new FileInputStream(zipFile); // 创建一个和is关联的对象输入流 ois = new ObjectInputStream(is); // 读取byte数组 huffmanBytes byte[] huffmanBytes = (byte[])ois.readObject(); // 读取保存的赫夫曼编码表 Map<Byte,String> huffmanCodes = (Map<Byte, String>)ois.readObject(); // 解码 byte[] bytes = decode(huffmanCodes, huffmanBytes); // 将bytes数组写入文件 os = new FileOutputStream(dstFile); // 写数据到dstFile文件 os.write(bytes); }catch (Exception e){ System.out.println(e.getMessage()); }finally { try { is.close(); ois.close(); os.close(); }catch (Exception e){ System.out.println(e.getMessage()); } } }
package huffmancode; import java.io.*; import java.util.*; import java.util.zip.ZipFile; public class HuffmanCode { public static void main(String[] args) { /* String str = "i like like like java do you like a java"; byte[] contentBytes = str.getBytes(); byte[] huffmanCodesBytes = huffmanZip(contentBytes); System.out.println(Arrays.toString(huffmanCodesBytes)); // 解码 byte[] sourceBytes = decode(huffmanCodes, huffmanCodesBytes); System.out.println(new String(sourceBytes));*/ /* 分布过程 List<Node> nodes = getNodes(contentBytes); // System.out.println(nodes); // 测试创建的二叉树 // System.out.println("赫夫曼树:"); Node huffmanTreeRoot = createHuffmanTree(nodes); // preOrder(huffmanTreeRoot); // 测试是否生成对应哈夫曼编码 Map<Byte, String> huffmanCodes = getCodes(huffmanTreeRoot); byte[] huffmanCodeBytes = zip(contentBytes, huffmanCodes); System.out.println(Arrays.toString(huffmanCodeBytes));*/ // 测试压缩文件 // String srcFile = "d://src.pdf"; // String desFile = "d://dst.zip"; // zipFile(srcFile,desFile); // System.out.println("压缩文件成功"); // 测试解压文件 String zipFile = "d://dst.zip"; String dstFile = "d://src2.pdf"; unZip(zipFile,dstFile); System.out.println("解压成功"); } /** * 将一个文件进行压缩 * @param srcFile 传入的希望压缩的文件的全路径 * @param dstFile 压缩后将压缩文件放到哪个目录 */ public static void zipFile(String srcFile,String dstFile){ // 创建一个文件输入流 FileInputStream is = null; // 创建输出流 OutputStream os = null; // 创建对象输出流 ObjectOutputStream oos = null; try { is = new FileInputStream(srcFile); // 创建一个和源文件大小一样的byte数组 byte[] b = new byte[is.available()]; // 读取文件 is.read(b); // 直接对源文件亚索 byte[] huffmanBytes = huffmanZip(b); // 创建一个文件输出流,存放压缩文件 os = new FileOutputStream(dstFile); // 创建一个和文件输出流关联的ObjectOutputStream oos = new ObjectOutputStream(os); // 把赫夫曼编码后的字节数组写入压缩文件 oos.writeObject(huffmanBytes); // 我们吧 // 这里我们以对象流的方式写入赫夫曼编码,目的是为了以后解压的时候恢复原文件的时候使用 // 注意一定要把赫夫曼编码写入压缩文件 oos.writeObject(huffmanCodes); }catch (Exception e){ System.out.println(e.getMessage()); }finally { try { is.close(); os.close(); oos.close(); }catch (Exception e){ System.out.println(e.getMessage()); } } } /** * 编写一个方法,完成对压缩文件的解压 * @param zipFile 准备解压的文件 * @param dstFile 将文件解压到哪个路径 */ public static void unZip(String zipFile,String dstFile){ // 定义文件输入流 InputStream is = null; // 定义对象输入流 ObjectInputStream ois = null; // 定义文件输出流 OutputStream os = null; try { // 创建文件输入流 is = new FileInputStream(zipFile); // 创建一个和is关联的对象输入流 ois = new ObjectInputStream(is); // 读取byte数组 huffmanBytes byte[] huffmanBytes = (byte[])ois.readObject(); // 读取保存的赫夫曼编码表 Map<Byte,String> huffmanCodes = (Map<Byte, String>)ois.readObject(); // 解码 byte[] bytes = decode(huffmanCodes, huffmanBytes); // 将bytes数组写入文件 os = new FileOutputStream(dstFile); // 写数据到dstFile文件 os.write(bytes); }catch (Exception e){ System.out.println(e.getMessage()); }finally { try { is.close(); ois.close(); os.close(); }catch (Exception e){ System.out.println(e.getMessage()); } } } // 完成数据的解压 // 思路: // 1. 将huffmanCodeBytes[-88, -65, -56, -65, -56, -65, -55, 77, -57, 6, -24, -14, -117, -4, -60, -90, 28]转成赫夫曼编码对应的二进制字符串 // 重写先转成赫夫曼编码对应的二进制的字符串"1010100010111..." // 2. 将赫夫曼编码对应的二进制字符串转成原始字符串 /** * 编写一个方法,完成对压缩数据的解码 * * @param huffmanCodes 赫夫曼编码表Map * @param huffmanBytes 赫夫曼编码得到的字节数组 * @return 原来的字符串对应的数组 */ public static byte[] decode(Map<Byte, String> huffmanCodes, byte[] huffmanBytes) { // 1. 先得到huffmanBytes对应的二进制的字符串,形式1010100010111... StringBuilder stringBuilder = new StringBuilder(); // 将byte数组转成二进制字符串 for (int i = 0; i < huffmanBytes.length; i++) { // 判断是不是最后一个字节 boolean flag = (i == huffmanBytes.length - 1); stringBuilder.append(byteToBitString(!flag, huffmanBytes[i])); } // System.out.println(stringBuilder.toString()); // 把字符串按照指定的赫夫曼编码进行解码 // 把赫夫曼编码表反向调换 a -> 100 => 100 -> a Map<String, Byte> map = new HashMap<String, Byte>(); for (Map.Entry<Byte, String> entry : huffmanCodes.entrySet()) { map.put(entry.getValue(), entry.getKey()); } // 创建一个集合,存放Byte List<Byte> list = new ArrayList<>(); // i 可以理解成就是索引,扫描stringBuilder for (int i = 0; i < stringBuilder.length();) { int count = 1; // 小的计数器 boolean flag = true; Byte b = null; while (flag) { // 递增取出一个'1' 或者 '0' String key = stringBuilder.substring(i, i + count); // i不动,让count移动,直到匹配到一个字符 b = map.get(key); if (b == null) { //没有匹配到 count++; } else { flag = false; } } list.add(b); i += count; // i直接的移动到count } // 当for循环结束后,list中存放了所有的字符 // 把list中数据放入一个byte[] 并返回 byte[] b = new byte[list.size()]; for (int i = 0; i < b.length; i++) { b[i] = list.get(i); } return b; } /** * 将一个byte转成一个二进制字符串 * * @param b 接收的byte * @param flag 标识是否需要补高位,如果是true,表示需要补高位,如果是false不补 * 如果是最后一个字节,无须补高位 * @return b对应的二进制字符串(注意是按照补码返回) */ private static String byteToBitString(boolean flag, byte b) { // 使用变量保存b int temp = b; // 如果是正数,需要补高位 if (flag) { temp |= 256; // 按位与 256 1 0000 0000 | 0000 0001 => 1 0000 0001 } String str = Integer.toBinaryString(temp); // 返回的是temp对应的二进制的补码 if (flag) { str = str.substring(str.length() - 8); } return str; } /** * 使用一个方法,将前面的方法封装起来,便于调用 * * @param bytes 原始的字符串对应的字节数组 * @return 返回的是经过赫夫曼编码处理后(压缩后)的数组 */ private static byte[] huffmanZip(byte[] bytes) { List<Node> nodes = getNodes(bytes); // 根据nodes创建赫夫曼树 Node huffmanTreeRoot = createHuffmanTree(nodes); // 根据赫夫曼树创建对应的赫夫曼编码 Map<Byte, String> huffmanCodes = getCodes(huffmanTreeRoot); // 根据赫夫曼编码对原始赫夫曼编码亚索 byte[] huffmanCodeBytes = zip(bytes, huffmanCodes); return huffmanCodeBytes; } /** * 编写一个方法,将字符串对应的byte[] 数组,通过生成的赫夫曼编码表,返回一个赫夫曼编码压缩后的byte[] * * @param bytes 这是原始的字符串对应的byte[] * @param huffmanCodes 生成的赫夫曼编码map * @return 返回赫夫曼编码处理后的byte[] * 举例:接收"i like like like java do you like a java"对应的byte[]数组 => byte[] contentBytes = str.getBytes() * 返回的是1010100110111101111010011011110111101001101111011110100001100001110011001111000011001111000100100100110111101111011100100001100001110 * 该字符串对应的字节数组byte[] huffmanCodeBytes,即8位对应一个byte,放入huffmanCodeBytes * huffmanCodeBytes[0] = 10101000(补码) => byte[推导 10101000(补码) => 10101000 - 1 => 10100111(反码) => 11011000(原码) = -88] * 即使 huffmanCodeByte[1] = -88 */ public static byte[] zip(byte[] bytes, Map<Byte, String> huffmanCodes) { // 1. 先利用huffmanCodes 将 bytes 转成 赫夫曼编码对应的字符串 StringBuilder stringBuilder = new StringBuilder(); // 遍历bytes数组 for (byte b : bytes) { stringBuilder.append(huffmanCodes.get(b)); } // 将字符串转成byte[] 数组 // 统计返回的huffmanCodes长度 // 一句话 int len = (stringBuilder.length() + 7) / 8 int len; if (stringBuilder.length() % 8 == 0) { len = stringBuilder.length() / 8; } else { len = stringBuilder.length() / 8 + 1; } // 创建存储压缩后的byte数组 byte[] huffmanCondeBytes = new byte[len]; int index = 0; // 记录第几个byte for (int i = 0; i < stringBuilder.length(); i += 8) { // 因为每八位对应一个byte,所以步长+8 String strByte; if (i + 8 > stringBuilder.length()) { // 不够八位 strByte = stringBuilder.substring(i); } else { strByte = stringBuilder.substring(i, i + 8); } // 将strByte转成数组放到 huffmanCondeBytes[index] = (byte) Integer.parseInt(strByte, 2); index++; } return huffmanCondeBytes; } // 为了调用方便,我们重载getNodes private static Map<Byte, String> getCodes(Node root) { if (root == null) { return null; } else { // 处理root左子树 getCodes(root.left, "0", stringBuilder); getCodes(root.right, "1", stringBuilder); } return huffmanCodes; } /** * @param bytes 接收一个字节数组 * @return 返回一个List 形式[Node{date=97,weight=5},Node{date=32,weight=9}...] */ private static List<Node> getNodes(byte[] bytes) { // 1. 创建一个ArrayList ArrayList<Node> nodes = new ArrayList<>(); // 2. 遍历bytes,统计每个byte出现的次数 => map Map<Byte, Integer> counts = new HashMap<>(); for (byte b : bytes) { // Map仍然没有该字符数据 counts.merge(b, 1, Integer::sum); } // 把每一个键值对转换为Node对象,加入nodes集合 for (Map.Entry<Byte, Integer> entry : counts.entrySet()) { nodes.add(new Node(entry.getKey(), entry.getValue())); } return nodes; } /** * 通过List创建对应赫夫曼树 * @param nodes 需要创建赫夫曼树的所有节点组成的List * @return 赫夫曼树根节点 */ private static Node createHuffmanTree(List<Node> nodes) { while (nodes.size() > 1) { // 从小到大 Collections.sort(nodes); // 出去前两个点 Node leftNode = nodes.get(0); Node rightNode = nodes.get(1); // 创建一棵新的二叉树,它的根节点没有data,只有权值 Node parent = new Node(null, leftNode.weight + rightNode.weight); parent.left = leftNode; parent.right = rightNode; // 将已经处理的两棵二叉树从nodes移出 nodes.remove(leftNode); nodes.remove(rightNode); // 将新的二叉树加入到nodes nodes.add(parent); } // nodes最后剩下的结点就是哈夫曼树的根节点 return nodes.get(0); } // 生成的赫夫曼树对应的赫夫曼编码 // 思路: // 1. 将赫夫曼编码表存放到一个Map<Byte,String>中 // 2. 在生成赫夫曼编码表时,需要拼接路径,所以创建一个StringBuilder,存储某个叶子节点的路径 static Map<Byte, String> huffmanCodes = new HashMap<Byte, String>(); static StringBuilder stringBuilder = new StringBuilder(); /** * 功能:将传入的node结点的所有叶子结点的赫夫曼编码得到,并放入到huffmanCodes中 * * @param node 传入结点,默认根节点 * @param code 路径:左子节点为0;右子节点为1 * @param stringBuilder 用于拼接路径 */ private static void getCodes(Node node, String code, StringBuilder stringBuilder) { StringBuilder stringBuilder1 = new StringBuilder(stringBuilder); // 将传入的code加入到stringBuilder1 stringBuilder1.append(code); if (node != null) { // 如果node==null 不处理 // 判断当前node是叶子节点还是非叶子节点 if (node.data == null) {// 非叶子节点 // 递归处理 // 向左递归 getCodes(node.left, "0", stringBuilder1); // 向右递归 getCodes(node.right, "1", stringBuilder1); } else { // 叶子节点 // 就表示找到某个叶子节点 huffmanCodes.put(node.data, stringBuilder1.toString()); } } } // 前序遍历方法 private static void preOrder(Node root) { if (root != null) { root.preOrder(); } else { System.out.println("该树为空!"); } } } class Node implements Comparable<Node> { Byte data; // 存放数据(字符)本身,比如'a' => 97, ' ' => 32 int weight; // 权值,表示字符出现次数 Node left; Node right; public Node(Byte data, int weight) { this.data = data; this.weight = weight; } @Override public String toString() { return "Node{" + "data=" + data + ", weight=" + weight + '}'; } @Override public int compareTo(Node o) { // 从小到大排序 return this.weight - o.weight; } // 前序遍历 public void preOrder() { System.out.print(this.data + ":" + this.weight + " "); if (this.left != null) { this.left.preOrder(); } if (this.right != null) { this.right.preOrder(); } } }
给你一个数列 (7, 3, 10, 12, 5, 1, 9),要求能够高效的完成对数据的查询和添加。
二叉排序树:BST: (Binary Sort(Search) Tree), 对于二叉排序树的任何一个非叶子节点,要求左子节点的值比当前节点的值小,右子节点的值比当前节点的值大。
特别说明:如果有相同的值,可以将该节点放在左子节点或右子节点
比如针对前面的数据 (7, 3, 10, 12, 5, 1, 9) ,对应的二叉排序树为:
一个数组创建成对应的二叉排序树,并使用中序遍历二叉排序树,比如: 数组为 Array(7, 3, 10, 12, 5, 1, 9) , 创建成对应的二叉排序树为 :
package binarysourtree; public class BinarySortTreeDemo { public static void main(String[] args) { int[] arr = {7, 3, 10, 12, 5, 1, 9}; BinarySortTree binarySortTree = new BinarySortTree(); for(int a:arr){ binarySortTree.add(new Node(a)); } binarySortTree.infixOrder(); } } // 创建二叉排序树 class BinarySortTree { private Node root; // 添加节点的方法 public void add(Node node) { if (root == null) { // 如果root为空,直接把node加上 root = node; } else { root.add(node); } } // 中序遍历 public void infixOrder() { if (root != null) { root.infixOrder(); } else { System.out.println("二叉排序树为空"); } } } // 创建节点 class Node { int value; Node left; Node right; public Node(int value) { this.value = value; } // 添加节点方法 // 递归形式,需要满足二叉排序树 public void add(Node node) { if (node == null) { return; } // 判断传入节点的值和当前子树根节点值的关系 if (node.value < this.value) { // 如果当前结点左子节点为null if (this.left == null) { this.left = node; } else { // 递归向左子树添加 this.left.add(node); } } else { // 添加的节点的值大于等于当前结点的值 // 如果当前结点右子节点为null if (this.right == null) { this.right = node; } else { // 递归向右子树添加 this.right.add(node); } } } @Override public String toString() { return "Node{" + "value=" + value + '}'; } // 中序遍历 public void infixOrder() { if (this.left != null) { this.left.infixOrder(); } System.out.println(this); if (this.right != null) { this.right.infixOrder(); } } }
二叉排序树的删除情况比较复杂,有下面三种情况需要考虑
package binarysourtree; public class BinarySortTreeDemo { public static void main(String[] args) { int[] arr = {7, 3, 10, 12, 5, 1, 9}; BinarySortTree binarySortTree = new BinarySortTree(); for (int a : arr) { binarySortTree.add(new Node(a)); } System.out.println("中序遍历二叉树"); binarySortTree.infixOrder(); // 测试删除叶子节点 // binarySortTree.delNode(2); // System.out.println("删除节点后···"); // binarySortTree.infixOrder(); // 测试删除只有一个子树的结点 // binarySortTree.delNode(1); // System.out.println("删除节点后· ··"); // binarySortTree.infixOrder(); // 测试删除有两个子树的结点 binarySortTree.delNode(7); System.out.println("删除节点后· ··"); binarySortTree.infixOrder(); } } // 创建二叉排序树 class BinarySortTree { private Node root; // 查找要删除的结点 public Node search(int value) { if (root == null) { return null; } else { return root.search(value); } } // 查找要删除的结点的父节点 public Node searchParent(int value) { if (root == null) { return null; } else { return root.searchParent(value); } } // 编写方法 // 1. 返回 /** * 1. 返回以node为根节点的二叉排序树的最小结点的值 * 2. 删除以node为根节点的二叉排序树的最小结点 * * @param node 传入的结点(当做二叉排序树的根节点) * @return 返回的以node为根节点的二叉排序树的最小结点值 */ public int delRightTreeMin(Node node) { Node target = node; // 循环查找左节点,就会找到最小值 while (target.left != null) { target = target.left; } // 这是,target指向了最小的结点 delNode(target.value); // 删除最小结点 return target.value; } // 删除节点 public void delNode(int value) { if (root == null) { return; } else { // 1. 先去找到要删除的结点,targetNode Node targetNode = search(value); if (targetNode == null) { // 如果没有找到要删除的结点 return; } // 如果发现当前这棵二叉排序树只有一个节点 if (root.left == null && root.right == null) { root = null; // root置空 return; } // 2.去找到targetNode的父节点 Node parentNode = searchParent(value); if (targetNode.left == null && targetNode.right == null) {// Ⅰ. 如果删除的结点是叶子节点(没有子树) // 判断targetNode是父节点的左子节点还是右子节点 if (parentNode.left != null && parentNode.left.value == value) { // 是左子节点 parentNode.left = null; } else if (parentNode.right != null && parentNode.right.value == value) { // 是右子节点 parentNode.right = null; } } else if (targetNode.left != null && targetNode.right != null) {// Ⅱ. 删除有两棵子树的结点 int minVal = delRightTreeMin(targetNode.right); targetNode.value = minVal; // 该方法是从右子树中找最小的结点 // 也可以从左子树中找最大的结点 } else {// Ⅲ. 删除只有一棵子树的结点 if (targetNode.left != null) {// 如果要删除的结点有左子节点 // 如果targetNode是parentNode的左子节点 if (parentNode.left.value == value) { parentNode.left = targetNode.left; } else { // 如果targetNode是parentNode的右子节点 parentNode.right = targetNode.left; } } else {// 如果要删除的结点有右子节点 if (parentNode.left.value == value) { parentNode.left = targetNode.right; } else { parentNode.right = targetNode.right; } } } } } // 添加节点的方法 public void add(Node node) { if (root == null) { // 如果root为空,直接把node加上 root = node; } else { root.add(node); } } // 中序遍历 public void infixOrder() { if (root != null) { root.infixOrder(); } else { System.out.println("二叉排序树为空"); } } } // 创建节点 class Node { int value; Node left; Node right; /** * 查找要删除结点的父节点 * * @param value 要查找的值 * @return 找到返回要删除节点父节点,找不到返回null */ public Node searchParent(int value) { // 如果当前结点就是要删除节点的父节点,就返回 if ((this.left != null && this.left.value == value) || (this.right != null && this.right.value == value)) { return this; } else { // 如果查找的值小于当前的结点,并且当前结点的左子节点不为空 if (value < this.value && this.left != null) { return this.left.searchParent(value); // 向左子树递归查找 } else if (value >= this.value && this.right != null) { return this.right.searchParent(value); // 向右子树递归查找 } else { return null; // 没有找到父节点 } } } /** * 查找要删除的结点 * * @param value 希望删除的结点的值 * @return 如果找到返回该节点,否则返回null */ public Node search(int value) { if (this.value == value) { // 找到就是该节点 return this; } else if (value < this.value) { if (this.left != null) { return this.left.search(value); } else { return null; } } else { if (this.right == null) { return null; } else { return this.right.search(value); } } } public Node(int value) { this.value = value; } // 添加节点方法 // 递归形式,需要满足二叉排序树 public void add(Node node) { if (node == null) { return; } // 判断传入节点的值和当前子树根节点值的关系 if (node.value < this.value) { // 如果当前结点左子节点为null if (this.left == null) { this.left = node; } else { // 递归向左子树添加 this.left.add(node); } } else { // 添加的节点的值大于等于当前结点的值 // 如果当前结点右子节点为null if (this.right == null) { this.right = node; } else { // 递归向右子树添加 this.right.add(node); } } } @Override public String toString() { return "Node{" + "value=" + value + '}'; } // 中序遍历 public void infixOrder() { if (this.left != null) { this.left.infixOrder(); } System.out.println(this); if (this.right != null) { this.right.infixOrder(); } } }
给你一个数列{1,2,3,4,5,6},要求创建一颗二叉排序树(BST), 并分析问题所在.
上图BST 存在的问题分析:
// 结点左旋转
private void leftRotate() {
// 1. 创建一个新的结点newNode,值等于当前根结点的值
Node newNode = new Node(value);
// 2. 把新结点的左子树设置成当前结点的左子树
newNode.left = left;
// 3. 把新结点的右子树设置成当前结点的右子树的左子树
newNode.right = right.left;
// 4. 把当前结点的值换成右子结点的值
value = right.value;
// 5. 把当前结点的右子树设置成当前结点右子树的右子树
right = right.right;
// 6. 把当前结点的左子树设置成最开始创建的新结点
left = newNode;
}
// 结点右旋转
private void rightRotate() {
// 1. 创建一个新的结点newNode,值等于当前根结点的值
Node newNode = new Node(value);
// 2. 把新结点的右子树设置成当前结点的右子树
newNode.right = right;
// 3. 把新结点的左子树设置成当前结点的左子树的右子树
newNode.left = left.right;
// 4. 把当前结点的值换成左子结点的值
value = left.value;
// 5. 把当前结点的左子树设置成当前结点左子树的左子树
left = left.left;
// 6. 把当前结点的右子树设置成最开始创建的新结点
right = newNode;
}
双旋转主要体现在每次添加节点的时候,根据左右子树判断如何旋转,在调整前,需要根据左右子树的左右子树高度情况判断是否需要对子树的子树进行旋转。即结点对象Node的add方法中后两个if语句中的if判断语句。
package avl; import java.util.Map; public class AVLTreeDemo { public static void main(String[] args) { // int[] arr = {4, 3, 6, 5, 7, 8}; // int[] arr = {10, 12, 8, 9, 7, 6}; int[] arr = {10, 11, 7, 6, 8, 9}; // 创建一个AVLTree对象 AVLTree avlTree = new AVLTree(); // 添加结点 for (int a : arr) { avlTree.add(new Node(a)); } // 遍历 System.out.println("中序遍历···"); avlTree.infixOrder(); System.out.println("平衡处理后~"); System.out.println("树的高度:" + avlTree.getRoot().height()); System.out.println("树的左子树高度:" + avlTree.getRoot().leftHeight()); System.out.println("树的右子树高度:" + avlTree.getRoot().rightHeight()); } } // 创建AVLTree class AVLTree { private Node root; public Node getRoot() { return root; } // 查找要删除的结点 public Node search(int value) { if (root == null) { return null; } else { return root.search(value); } } // 查找要删除的结点的父结点 public Node searchParent(int value) { if (root == null) { return null; } else { return root.searchParent(value); } } // 编写方法 // 1. 返回 /** * 1. 返回以node为根结点的二叉排序树的最小结点的值 * 2. 删除以node为根结点的二叉排序树的最小结点 * * @param node 传入的结点(当做二叉排序树的根结点) * @return 返回的以node为根结点的二叉排序树的最小结点值 */ public int delRightTreeMin(Node node) { Node target = node; // 循环查找左结点,就会找到最小值 while (target.left != null) { target = target.left; } // 这是,target指向了最小的结点 delNode(target.value); // 删除最小结点 return target.value; } // 删除结点 public void delNode(int value) { if (root == null) { return; } else { // 1. 先去找到要删除的结点,targetNode Node targetNode = search(value); if (targetNode == null) { // 如果没有找到要删除的结点 return; } // 如果发现当前这棵二叉排序树只有一个结点 if (root.left == null && root.right == null) { root = null; // root置空 return; } // 2.去找到targetNode的父结点 Node parentNode = searchParent(value); if (targetNode.left == null && targetNode.right == null) {// Ⅰ. 如果删除的结点是叶子结点(没有子树) // 判断targetNode是父结点的左子结点还是右子结点 if (parentNode.left != null && parentNode.left.value == value) { // 是左子结点 parentNode.left = null; } else if (parentNode.right != null && parentNode.right.value == value) { // 是右子结点 parentNode.right = null; } } else if (targetNode.left != null && targetNode.right != null) {// Ⅱ. 删除有两棵子树的结点 int minVal = delRightTreeMin(targetNode.right); targetNode.value = minVal; // 该方法是从右子树中找最小的结点 // 也可以从左子树中找最大的结点 } else {// Ⅲ. 删除只有一棵子树的结点 if (targetNode.left != null) {// 如果要删除的结点有左子结点 if (parentNode != null) { // 如果targetNode是parentNode的左子结点 if (parentNode.left.value == value) { parentNode.left = targetNode.left; } else { // 如果targetNode是parentNode的右子结点 parentNode.right = targetNode.left; } } else { root = targetNode.left; } } else {// 如果要删除的结点有右子结点 if (parentNode != null) { if (parentNode.left.value == value) { parentNode.left = targetNode.right; } else { parentNode.right = targetNode.right; } } else { root = targetNode.right; } } } } } // 添加结点的方法 public void add(Node node) { if (root == null) { // 如果root为空,直接把node加上 root = node; } else { root.add(node); } } // 中序遍历 public void infixOrder() { if (root != null) { root.infixOrder(); } else { System.out.println("二叉排序树为空"); } } } // 创建结点 class Node { int value; Node left; Node right; public Node(int value) { this.value = value; } // 结点左旋转 private void leftRotate() { // 1. 创建一个新的结点newNode,值等于当前根结点的值 Node newNode = new Node(value); // 2. 把新结点的左子树设置成当前结点的左子树 newNode.left = left; // 3. 把新结点的右子树设置成当前结点的右子树的左子树 newNode.right = right.left; // 4. 把当前结点的值换成右子结点的值 value = right.value; // 5. 把当前结点的右子树设置成当前结点右子树的右子树 right = right.right; // 6. 把当前结点的左子树设置成最开始创建的新结点 left = newNode; } // 结点右旋转 private void rightRotate() { // 1. 创建一个新的结点newNode,值等于当前根结点的值 Node newNode = new Node(value); // 2. 把新结点的右子树设置成当前结点的右子树 newNode.right = right; // 3. 把新结点的左子树设置成当前结点的左子树的右子树 newNode.left = left.right; // 4. 把当前结点的值换成左子结点的值 value = left.value; // 5. 把当前结点的左子树设置成当前结点左子树的左子树 left = left.left; // 6. 把当前结点的右子树设置成最开始创建的新结点 right = newNode; } // 返回以该结点为根结点的树的高度 public int height() { return Math.max(left == null ? 0 : left.height(), right == null ? 0 : right.height()) + 1; } // 返回左子树的高度 public int leftHeight() { return left == null ? 0 : left.height(); } // 返回右子树的高度 public int rightHeight() { return right == null ? 0 : right.height(); } /** * 查找要删除结点的父结点 * * @param value 要查找的值 * @return 找到返回要删除结点父结点,找不到返回null */ public Node searchParent(int value) { // 如果当前结点就是要删除结点的父结点,就返回 if ((this.left != null && this.left.value == value) || (this.right != null && this.right.value == value)) { return this; } else { // 如果查找的值小于当前的结点,并且当前结点的左子结点不为空 if (value < this.value && this.left != null) { return this.left.searchParent(value); // 向左子树递归查找 } else if (value >= this.value && this.right != null) { return this.right.searchParent(value); // 向右子树递归查找 } else { return null; // 没有找到父结点 } } } /** * 查找要删除的结点 * * @param value 希望删除的结点的值 * @return 如果找到返回该结点,否则返回null */ public Node search(int value) { if (this.value == value) { // 找到就是该结点 return this; } else if (value < this.value) { if (this.left != null) { return this.left.search(value); } else { return null; } } else { if (this.right == null) { return null; } else { return this.right.search(value); } } } // 添加结点方法 // 递归形式,需要满足二叉排序树 public void add(Node node) { if (node == null) { return; } // 判断传入结点的值和当前子树根结点值的关系 if (node.value < this.value) { // 如果当前结点左子结点为null if (this.left == null) { this.left = node; } else { // 递归向左子树添加 this.left.add(node); } } else { // 添加的结点的值大于等于当前结点的值 // 如果当前结点右子结点为null if (this.right == null) { this.right = node; } else { // 递归向右子树添加 this.right.add(node); } } // 当添加完一个结点后,(如果右子树高度-左子树高度) > 1 if (rightHeight() - leftHeight() > 1) { // 如果它的右子树的左子树高度大于它的右子树的右子树高度 if (right != null && right.leftHeight() > right.rightHeight()) { // 先对当前结点右节点(右子树)=> 右旋转 right.rightRotate(); // 再对当前结点进行左旋转 leftRotate(); }else{ // 直接进行左旋转即可 leftRotate(); } return; // 必须结束当前判断 } // 当添加完一个结点后,(如果左子树高度-右子树高度) > 1 if (leftHeight() - rightHeight() > 1) { // 如果它的左子树的右子树高度大于它的左子树的左子树高度 if (left != null && left.rightHeight() > left.leftHeight()) { // 先对当前结点左节点(左子树)=> 左旋转 left.leftRotate(); // 再对当前结点进行右旋转 rightRotate(); }else{ // 直接进行右旋转即可 rightRotate(); } } } @Override public String toString() { return "Node{" + "value=" + value + '}'; } // 中序遍历 public void infixOrder() { if (this.left != null) { this.left.infixOrder(); } System.out.println(this); if (this.right != null) { this.right.infixOrder(); } } }
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。