当前位置:   article > 正文

java集合学习

java集合学习

1.概述

集合是一种存储数据的容器,较数组而言,集合可以存储不同类型的数据,且集合的容量是动态的,并且提供了一系列方法便于数据的操作。

2.集合体系

在Java中,集合可分为两大类,Collection接口下的单列集合和Map接口下的双列集合(存储键值对)

单列集合体系图(部分)

Collection接口继承了Iterable接口,所以其接口的实现类都是可迭代的对象。

 Collection接口中规定的方法

 双列集合体系图(部分)

 

3.list接口及实现类

List接口的特点

  • 允许存储重复值
  • 允许存储多个空值
  • 存取是有序的,支持通过索引操作元素
  • JDK中已知实现子类

 List接口的常用方法

 常见子类介绍

1.ArrayList

构造方法

存储数据的方式:数组

扩容机制

  1. eg.
  2. ArrayList<Integer> arr = new ArrayList();
  3. arr.add(1);
  4. 执行过程(源码):
  5. 1.执行构造方法
  6. public ArrayList() {
  7. this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
  8. }
  9. 2.执行add()
  10. public boolean add(E e) {
  11. // 判断是否需要扩容
  12. ensureCapacityInternal(size + 1); // Increments modCount!!
  13. elementData[size++] = e;
  14. return true;
  15. }
  16. 3. 执行ensureCapacityInternal(int minCapacity)
  17. private void ensureCapacityInternal(int minCapacity) {
  18. ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
  19. }
  20. 4.执行calculateCapacity,确认最小需要的容量
  21. private static int calculateCapacity(Object[] elementData, int minCapacity) {
  22. if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
  23. return Math.max(DEFAULT_CAPACITY, minCapacity);
  24. }
  25. return minCapacity;
  26. }
  27. 5.执行ensureExplicitCapacity(),判断当前数组长度和所需最小容量之间的关系,决定是否进行扩容
  28. private void ensureExplicitCapacity(int minCapacity) {
  29. modCount++;
  30. // overflow-conscious code
  31. if (minCapacity - elementData.length > 0)
  32. grow(minCapacity);
  33. }
  34. 6.grow(int minCapacity),扩容
  35. int oldCapacity = elementData.length;
  36. // 扩容为原来的1.5倍
  37. int newCapacity = oldCapacity + (oldCapacity >> 1);
  38. // 扩容后是否满足需求
  39. if (newCapacity - minCapacity < 0)
  40. newCapacity = minCapacity;
  41. // 超过最大容量的处理
  42. if (newCapacity - MAX_ARRAY_SIZE > 0)
  43. newCapacity = hugeCapacity(minCapacity);
  44. // minCapacity is usually close to size, so this is a win:
  45. // 数据拷贝
  46. elementData = Arrays.copyOf(elementData, newCapacity);

2.Vector

Vector与AraayList都是通过数据进行数据的存储,不同的地方在于Vector是线程安全的,在多线程环境能够保证数据的一致性。

除此之外的一些不同之处

构造方法的不同:

  1. eg. Vector<Integer> vec = new Vector<>();
  2. 过程如下:
  3. 1. public Vector() {
  4. this(10);
  5. }
  6. 2. public Vector(int initialCapacity) {
  7. this(initialCapacity, 0);
  8. }
  9. 3. public Vector(int initialCapacity, int capacityIncrement) {
  10. super();
  11. if (initialCapacity < 0)
  12. throw new IllegalArgumentException("Illegal Capacity: "+
  13. initialCapacity);
  14. this.elementData = new Object[initialCapacity];
  15. this.capacityIncrement = capacityIncrement;
  16. }

扩容机制的不同

  1. // 前面确认是否需要扩容的步骤类似ArrayList
  2. // 实现扩容
  3. private void grow(int minCapacity) {
  4. // overflow-conscious code
  5. int oldCapacity = elementData.length;
  6. // Vector 的扩容取决于capacityIncrement,在capacityIncrement不大于0情况下扩容为原来的2倍数
  7. int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
  8. capacityIncrement : oldCapacity);
  9. if (newCapacity - minCapacity < 0)
  10. newCapacity = minCapacity;
  11. if (newCapacity - MAX_ARRAY_SIZE > 0)
  12. newCapacity = hugeCapacity(minCapacity);
  13. elementData = Arrays.copyOf(elementData, newCapacity);
  14. }

3.LinkedList

linkedlist使用双向链表实现

构造方法

在序列末尾添加元素

  1. eg.在序列末尾添加一个元素
  2. 源码:
  3. 1. public boolean add(E e) {
  4. linkLast(e);
  5. return true;
  6. }
  7. 2. void linkLast(E e) {
  8. final Node<E> l = last;
  9. final Node<E> newNode = new Node<>(l, e, null);
  10. last = newNode;
  11. if (l == null)
  12. first = newNode;
  13. else
  14. l.next = newNode;
  15. size++;
  16. modCount++;
  17. }

图解(此处箭头为双向箭头)

 

 

 因为使用的是链表,所以不存在扩容问题。(删除元素以及在指定位置插入元素原理相同)

List接口常见实现类小结

ArrayList使用数组存储数据,适合查询较多的场景。LinkedList使用的是来链表,在遍历上效率较低,但增加或删除元素效率较高。如果是在多线程环境下,且需要考虑线程安全问题,则选择Vector.

注意事项

  • LinkedList增加(删除)元素的效率一定高于ArrayList么?事无绝对,数组增加(删除)元素效率低的本质原因是会对增加(删除)之后位置元素的影响,需要将元素前移(后移)。所以,当增加(删除)的元素位于序列的末尾,不需要移动任何元素时,ArrayList的效率是高于LinkedList的。

4.set接口及实现类

set接口的特点

  • 不允许存储重复值
  • 仅且允许存储一个空值
  • 存取是无序的(不能通过索引访问,另外linkedHashSet看起来是有序的)

 set接口已知方法

常见子类介绍

HashSet

构造方法

public HashSet() {
// HashSet 底层实现为HashMap
// jdk8之前HashMap通过哈希表实现(数组+链表)
// jdk之后通过数组+链表+红黑树实现
    map = new HashMap<>();
}
public HashMap() {
// loadFactor加载因子,用于计算threshold(扩容阈值) = 容量 * 加载因子  
 this.loadFactor = DEFAULT_LOAD_FACTOR; // 0.75
}

扩容机制

容量变为原来的2倍数,且扩容阈值也变为原来的2倍数 

 eg.

  1. 源码:
  2. 1.方法入口
  3. public boolean add(E e) {
  4. return map.put(e, PRESENT)==null;
  5. }
  6. 2.
  7. public V put(K key, V value) {
  8. return putVal(hash(key), key, value, false, true);
  9. }
  10. 3. 通过特定算法计算对象的hash值
  11. static final int hash(Object key) {
  12. int h;
  13. return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
  14. }
  15. 4.
  16. final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
  17. boolean evict) {
  18. // 辅助变量
  19. Node<K,V>[] tab; Node<K,V> p; int n, i;
  20. // 是否进行第一次扩容,初始容量16,初始加载因子0.75
  21. if ((tab = table) == null || (n = tab.length) == 0)
  22. n = (tab = resize()).length;
  23. // 通过计算出的hash值与table表当前最大索引值进行计算得出元素放置的位置
  24. // 如果该位置为空,直接存入
  25. if ((p = tab[i = (n - 1) & hash]) == null)
  26. tab[i] = newNode(hash, key, value, null);
  27. // 如果该位置有元素
  28. else {
  29. Node<K,V> e; K k;
  30. // 首先与头节点进行比较,如果与头节点相同,则不添加
  31. if (p.hash == hash &&
  32. ((k = p.key) == key || (key != null && key.equals(k))))
  33. e = p;
  34. // 与头节点不同,判断表的这个位置存储的是链表还是树,如果已转化为树,则调用putTreeVal(...)
  35. else if (p instanceof TreeNode)
  36. e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
  37. // 以上都不满足,与头节点不同且还未转化为树结构
  38. // 与链表的每个节点进行比较,有相同或到达末尾就结束比较
  39. else {
  40. for (int binCount = 0; ; ++binCount) {
  41. // 判断添加后是否会触发链表转化为红黑树
  42. // 转化机制 单条链表元素个数为 TREEIFY_THRESHOLD(8) ,
  43. // 且table表的容量达到MIN_TREEIFY_CAPACITY(64)
  44. if ((e = p.next) == null) {
  45. p.next = newNode(hash, key, value, null);
  46. if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
  47. treeifyBin(tab, hash);
  48. break;
  49. }
  50. // 依次比较,存在重复就跳出
  51. if (e.hash == hash &&
  52. ((k = e.key) == key || (key != null && key.equals(k))))
  53. break;
  54. p = e;
  55. }
  56. }
  57. // 存在重复元素
  58. if (e != null) { // existing mapping for key
  59. V oldValue = e.value;
  60. if (!onlyIfAbsent || oldValue == null)
  61. e.value = value;
  62. afterNodeAccess(e);
  63. return oldValue;
  64. }
  65. }
  66. ++modCount;
  67. if (++size > threshold)
  68. resize();
  69. afterNodeInsertion(evict);
  70. return null;
  71. }

简图

遍历元素顺序探究

预期:按照table表顺序进行遍历,如果某个位置链表元素超过1,则将该位置链表遍历结束后 再访问table表的下一个元素。

测试代码:

  1. package Test;
  2. import java.util.Collections;
  3. import java.util.HashSet;
  4. import java.util.Objects;
  5. public class HashSetDemo {
  6. public static void main(String[] args) {
  7. HashSet<TestPreparation> hs = new HashSet<>();
  8. Collections.addAll(hs, new TestPreparation(1), new TestPreparation(2), new TestPreparation(3), new TestPreparation(4), new TestPreparation(5) , new TestPreparation(6), new TestPreparation(null));
  9. System.out.println(hs);
  10. }
  11. }
  12. // 测试类
  13. class TestPreparation{
  14. Integer value;
  15. public TestPreparation(Integer value) {
  16. this.value = value;
  17. }
  18. // 通过value进行比较
  19. @Override
  20. public boolean equals(Object o) {
  21. if (this == o) return true;
  22. if (o == null || getClass() != o.getClass()) return false;
  23. TestPreparation that = (TestPreparation) o;
  24. return value.equals(that.value);
  25. }
  26. // 重写hashCode(),只会返回 1,2,3更容易发生哈希冲突
  27. @Override
  28. public int hashCode() {
  29. if (value % 3 == 0 )
  30. return 3;
  31. else if (value % 2 == 0)
  32. return 2;
  33. else
  34. return 1;
  35. }
  36. @Override
  37. public String toString() {
  38. return value.toString() ;
  39. }
  40. }

过程:

 如预期元素都集中在table的1,2,3位置

1号位元素

 

2号位元素

 

3号位元素

 

通过上图可推断输出结果为 1,5,2,4,3,6

实际结果为

 所以HashSet遍历元素的顺序为按照table表索引,依次遍历每个位置的链表

补充依据

  1. @Override
  2. public void forEach(BiConsumer<? super K, ? super V> action) {
  3. Node<K,V>[] tab;
  4. if (action == null)
  5. throw new NullPointerException();
  6. if (size > 0 && (tab = table) != null) {
  7. int mc = modCount;
  8. for (int i = 0; i < tab.length; ++i) {
  9. for (Node<K,V> e = tab[i]; e != null; e = e.next)
  10. action.accept(e.key, e.value);
  11. }
  12. if (modCount != mc)
  13. throw new ConcurrentModificationException();
  14. }
  15. }

 注意事项

  • HashSet的去重与元素在内部的排序与hashCode()和equals(Object object)方法相关,可根据需求对两个方法进行重写。

TreeSet

构造方法

无参构造执行顺序
public TreeSet() {
    this(new TreeMap<E,Object>());
}
TreeSet(NavigableMap<E,Object> m) {
    this.m = m;
}
public TreeMap() {
    comparator = null;
}

Tree的底层实现为TreeMap

 TreeSet添加元素

通过传入的比较器进行比较或通过对象实现comparable接口重写的compareTo方法进行比较,根据返回值进行元素排序和判断是否添加,返回0就认为是重复元素不进行添加,返回值不为0则按照比较规则进行元素排序。

注意事项:

1.TreeSet添加的元素通常为可进行比较的一些对象,要么满足传入比较器的比较规则,要么实现了Comparable接口。

2.TreeSet存储的通常是一类元素,或能够通过比较器进行比较的元素。

3.常见异常

  • java.lang.ClassCastException

eg.

 异常根源

 public int compareTo(String anotherString)

  •  

5.Map接口及实现类

Map接口的特点

  • 存储键值对,键唯一对应值,可以通过键寻找对应的值,反之则不行
  • 键不能重复,允许值重复
  • 部分实现类一个键为空

实现类

 Map接口方法

 常用实现类学习

HashMap、TreeMap和HashTable

HashMap、TreeMap的数据存储方式,以及添加元素时的执行过程可见上文HashSet和TreeSet处介绍

HashTable特点:

  • 键和值都不能为null
  • 线程安全
  • 效率较低

构造方法

eg. Hashtable<String, Integer> ht = new Hashtable<>();

ht.put("1",100);

  1. 执行过程:
  2. 1.
  3. public Hashtable() {
  4. this(11, 0.75f);
  5. }
  6. 2.
  7. public Hashtable(int initialCapacity, float loadFactor)
  8. 3.判断是否添加元素(省略部分代码)
  9. public synchronized V put(K key, V value){
  10. // 值不能为空
  11. if (value == null) {
  12. throw new NullPointerException();
  13. }
  14. // ... 省略代码为判断键是否已经存在,方式为计算hash值,确认放在table表的位置
  15. // 为空直接放入
  16. // 不为空对该位置的链表元素依次进行判断
  17. addEntry(hash, key, value, index);
  18. return null;
  19. }
  20. 4. 添加元素(省略部分代码)
  21. private void addEntry(int hash, K key, V value, int index) {
  22. // 判断是否进行扩容
  23. // 如果扩容,需要重新计算元素存放的位置
  24. if (count >= threshold) {
  25. // Rehash the table if the threshold is exceeded
  26. rehash();
  27. tab = table;
  28. hash = key.hashCode();
  29. index = (hash & 0x7FFFFFFF) % tab.length;
  30. }
  31. // 将元素放置在指定位置
  32. tab[index] = new Entry<>(hash, key, value, e);
  33. }
  34. 5.扩容部分(省略部分代码)
  35. protected void rehash() {
  36. // 扩容倍数为
  37. // 不超过最大值new = old*2 + 1;
  38. // 超过则等于
  39. int newCapacity = (oldCapacity << 1) + 1;
  40. if (newCapacity - MAX_ARRAY_SIZE > 0) {
  41. if (oldCapacity == MAX_ARRAY_SIZE)
  42. // Keep running with MAX_ARRAY_SIZE buckets
  43. return;
  44. newCapacity = MAX_ARRAY_SIZE;
  45. }
  46. // 重新确定阈值
  47. // 将已经存放的元素按照之前的流程重新计算位置添加
  48. threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
  49. table = newMap;
  50. for (int i = oldCapacity ; i-- > 0 ;) {
  51. for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
  52. Entry<K,V> e = old;
  53. old = old.next;
  54. int index = (e.hash & 0x7FFFFFFF) % newCapacity;
  55. e.next = (Entry<K,V>)newMap[index];
  56. newMap[index] = e;
  57. }
  58. }

6.适用场景分析

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/973967
推荐阅读
相关标签
  

闽ICP备14008679号