赞
踩
- vector是表示可变大小数组的序列容器。
- 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
- 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小 为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是 一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大 小。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存 储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是 对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增 长。
- 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末 尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list 统一的迭代器和引用更好。
学习vector要一定要善于查看:vector文档。vector在实际当中非常重要,这里我们主要熟悉一些常用接口就可以了,下面主要介绍了重点要掌握的接口内容。
(constructor)构造函数声明 | 接口说明 |
vector()(重点) | 无参构造 |
vector(size_type n, const value_type& val = value_type()) | 构造并初始化n个val |
vector (const vector& x); (重点) | 拷贝构造 |
vector (InputIterator first, InputIterator last); | 使用迭代器进行初始化构造 |
注意:size_type指的是unsigned int,value_type是一个自定义类型,会自动推演成和vector元素一样的类型,InputIterator 指的是迭代器(typedef T* InputIterator )T也是自定义类型。
iterator的使用 | 接口说明 |
begin + end(重点) | 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置 的iterator/const_iterator |
rbegin + rend | 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的 reverse_iterator |
vector的迭代器也和string一样支撑范围for遍历
容量空间 | 接口说明 |
size | 获取数据个数 |
capacity | 获取容量大小 |
empty | 判断是否为空 |
resize(重点) | 改变vector的size |
reserve(重点) | 改变vector的capacity |
shrink_to_fit | 缩容vector的capacity让其和size一样大 |
clear | 移除vector中的所有元素,并让size为0 |
注意:reserve和size,包括后面的clear函数都不会缩容,因为缩容和扩容一样,要重新开辟新空间,拷贝数据,释放旧空间,而对与自定义类型而言,有可能存在深拷贝问题,时间开销极大。因此,一般情况下,是不会考虑缩容的。
vector的扩容机制和string的一样,他们都是动态增长的数组,VS下大约是1.5倍,Linux g++下是标准的2倍扩容,测试用例如下:
- void TestVectorExpand()
- {
- size_t sz;
- vector<int> v;
- sz = v.capacity();
- cout << "making v grow:\n";
- for (int i = 0; i < 100; ++i)
- {
- v.push_back(i);
- if (sz != v.capacity())
- {
- sz = v.capacity();
- cout << "capacity changed: " << sz << '\n';
- }
- }
- }
vector增删查改 | 接口说明 |
push_back(重点) | 尾插 |
pop_back(重点) | 尾删 |
find | 查找。(注意这个是算法模块实现,不是vector的成员接口) |
insert | 在position之前插入val |
erase | 删除position位置的数据 |
swap | 交换两个vector的数据空间 |
operator[](重点) | 像数组一样访问 |
补充:vector的增删查改和string的类似,但不同的是vector没有find接口,包括后面的list也是一样。
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了 封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的 空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器, 程序可能会崩溃)。
对于vector可能会导致其迭代器失效的操作有:
1. 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、 push_back等。
- void test_vector1()
- {
- vector<int> v{1,2,3,4,5,6};
-
- auto it = v.begin();
-
- // 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
- // v.resize(100, 8);
-
- // reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
- // v.reserve(100);
-
- // 插入元素期间,可能会引起扩容,而导致原空间被释放
- // v.insert(v.begin(), 0);
- // v.push_back(8);
-
- // 给vector重新赋值,可能会引起底层容量改变
- v.assign(100, 8);
-
- /*
- 出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉,
- 而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的
- 空间,而引起代码运行时崩溃。
- 解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新
- 赋值即可。
- */
- while(it != v.end())
- {
- cout<< *it << " " ;
- ++it;
- }
- cout<<endl;
-
-
- }
2. 指定位置元素的删除操作--erase
- void test_vector2()
- {
- int a[] = { 1, 2, 3, 4 };
- vector<int> v(a, a + sizeof(a) / sizeof(int));
- // 使用find查找3所在位置的iterator
- vector<int>::iterator pos = find(v.begin(), v.end(), 3);
- // 删除pos位置的数据,导致pos迭代器失效。
- v.erase(pos);
- cout << *pos << endl; // 此处会导致非法访问
- }
erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是 没有元素的,那么pos就失效了。因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效 了。
3. Linux下,g++编译器对迭代器失效的检测并不是非常严格,处理也没有vs下极端。
- void test_vector3()
- {
- vector<int> v{1,2,3,4,5};
- for(size_t i = 0; i < v.size(); ++i)
- cout << v[i] << " ";
- cout << endl;
- auto it = v.begin();
- cout << "扩容之前,vector的容量为: " << v.capacity() << endl;
- // 通过reserve将底层空间设置为100,目的是为了让vector的迭代器失效
- v.reserve(100);
- cout << "扩容之后,vector的容量为: " << v.capacity() << endl;
-
- // 经过上述reserve之后,it迭代器肯定会失效,在vs下程序就直接崩溃了,但是linux下不会
- // 虽然可能运行,但是输出的结果是不对的
- while(it != v.end())
- {
- cout << *it << " ";
- ++it;
- }
- cout << endl;
- }
vs下的结果:
Linux下的结果:
Linux没有提示报错。
4. 与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效
- void TestString()
- {
- string s("hello");
- auto it = s.begin();
- // 放开之后代码会崩溃,因为resize到20会string会进行扩容
- // 扩容之后,it指向之前旧空间已经被释放了,该迭代器就失效了
- // 后序打印时,再访问it指向的空间程序就会崩溃
- //s.resize(20, '!');
- while (it != s.end())
- {
- cout << *it;
- ++it;
- }
- cout << endl;
- it = s.begin();
- while (it != s.end())
- {
- it = s.erase(it);
- // 按照下面方式写,运行时程序会崩溃,因为erase(it)之后
- // it位置的迭代器就失效了
- // s.erase(it);
- ++it;
- }
- }
迭代器失效解决办法:在使用前,对迭代器重新赋值即可。
以下是我参照vector核心框架,根据自己理解写出的vector模拟实现,如有错误,欢迎大家评论区指正。
- namespace my_vector
- {
- template<class T>
- class vector
- {
- public:
- typedef T* iterator;
- typedef const T* const_iterator;
- //迭代器begin和end
- iterator begin()
- {
- return _start;
- }
-
- iterator end()
- {
- return _finish;
- }
- //const版本
- const_iterator begin() const
- {
- return _start;
- }
-
- const_iterator end() const
- {
- return _finish;
- }
- //重载operator[]
- T& operator[](size_t pos)
- {
- assert(pos < size());
- return _start[pos];
- }
-
- const T& operator[](size_t pos) const
- {
- assert(pos < size());
- return _start[pos];
- }
-
- vector()
- :_start(nullptr)
- , _finish(nullptr)
- , _endofstorage(nullptr)
- {}
- //传统拷贝构造写法
- // v2(v1)
- /*vector(const vector<T>& v)
- :_start(nullptr)
- , _finish(nullptr)
- , _endofstorage(nullptr)
- {
- reserve(v.capacity());
- for (const auto& e : v)
- {
- push_back(e);
- }
- }*/
-
- //拷贝构造现代写法
- template <class InputIterator>
- vector(InputIterator first, InputIterator last)
- :_start(nullptr)
- , _finish(nullptr)
- , _endofstorage(nullptr)
- {
- while (first != last)
- {
- push_back(*first);
- ++first;
- }
- }
-
- vector(const vector<T>& v)
- :_start(nullptr)
- , _finish(nullptr)
- , _endofstorage(nullptr)
- {
- vector<T> tmp(v.begin(), v.end());
- swap(tmp);
- }
-
- // v1 = v2
- // v1 = v1; // 极少数情况,能保证正确性,所以这里就这样写没什么问题
- vector<T>& operator=(vector<T> v)
- {
- swap(v);
- return *this;
- }
- //析构函数
- ~vector()
- {
- delete[] _start;
- _start = _finish = _endofstorage = nullptr;
- }
-
-
- void reserve(size_t n)
- {
- if (n > capacity())
- {
- size_t oldSize = size();
- T* tmp = new T[n];
-
- if (_start)
- {
- //memcpy(tmp, _start, sizeof(T)*oldSize);
- for (size_t i = 0; i < oldSize; ++i)
- {
- tmp[i] = _start[i];
- }
-
- delete[] _start;
- }
-
- _start = tmp;
- _finish = tmp + oldSize;
- _endofstorage = _start + n;
- }
- }
-
- void resize(size_t n, T val = T())
- {
- if (n > capacity())
- {
- reserve(n);
- }
-
- if (n > size())
- {
- while (_finish < _start + n)
- {
- *_finish = val;
- ++_finish;
- }
- }
- else
- {
- _finish = _start + n;
- }
- }
-
- bool empty() const
- {
- return _finish == _start;
- }
-
- size_t size() const
- {
- return _finish - _start;
- }
-
- size_t capacity() const
- {
- return _endofstorage - _start;
- }
-
- void push_back(const T& x)
- {
- if (_finish == _endofstorage)
- {
- size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
- reserve(newCapacity);
- }
-
- *_finish = x;
- ++_finish;
- }
-
- void pop_back()
- {
- assert(!empty());
-
- --_finish;
- }
-
- // 迭代器失效 : 扩容引起,野指针问题
- iterator insert(iterator pos, const T& val)
- {
- assert(pos >= _start);
- assert(pos < _finish);
-
- if (_finish == _endofstorage)
- {
- size_t len = pos - _start;
- size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
- reserve(newCapacity);
-
- // 扩容会导致pos迭代器失效,需要更新处理一下
- pos = _start + len;
- }
-
- // 挪动数据
- iterator end = _finish - 1;
- while (end >= pos)
- {
- *(end + 1) = *end;
- --end;
- }
-
- *pos = val;
- ++_finish;
-
- return pos;
- }
-
- iterator erase(iterator pos)
- {
- assert(pos >= _start);
- assert(pos < _finish);
-
-
- iterator begin = pos+1;
- while (begin < _finish)
- {
- *(begin-1) = *(begin);
- ++begin;
- }
-
- --_finish;
-
- return pos;
- }
-
- void swap(vector<T>& v)
- {
- std::swap(_start, v._start);
- std::swap(_finish, v._finish);
- std::swap(_endofstorage, v._endofstorage);
- }
-
- void clear()
- {
- _finish = _start;
- }
-
- private:
- iterator _start;
- iterator _finish;
- iterator _endofstorage;
- };
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。