当前位置:   article > 正文

C++ vector的内部实现原理及基本用法_vector内部实现

vector内部实现

本文基于STL vector源代码,但是不考虑分配器allocator,迭代器iterator,异常处理try/catch等内容,同时对_Ucopy()、 _Umove()、 _Ufill()函数也不会过度分析。

一、vector的定义

template<class _Ty,
    class _Ax>
    class vector
        : public _Vector_val<_Ty, _Ax>
    {   // varying size array of values
public:
    /********/
protected:
    pointer _Myfirst;   // pointer to beginning of array
    pointer _Mylast;    // pointer to current end of sequence
    pointer _Myend; // pointer to end of array
    };
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12

简单理解,就是vector是利用上述三个指针来表示的,基本示意图如下:
在这里插入图片描述
两个关键大小:
大小:size=_Mylast - _Myfirst;
容量:capacity=_Myend - _Myfirst;
分别对应于resize()、reserve()两个函数。
size表示vector中已有元素的个数,容量表示vector最多可存储的元素的个数;为了降低二次分配时的成本,vector实际配置的大小可能比客户需求的更大一些,以备将来扩充,这就是容量的概念。即capacity>=size,当等于时,容器此时已满,若再要加入新的元素时,就要重新进行内存分配,整个vector的数据都要移动到新内存。二次分配成本较高,在实际操作时,应尽量预留一定空间,避免二次分配。

二、构造与析构

1、构造

vector的构造函数主要有以下几种:

vector() : _Mybase()
    {   // construct empty vector
    _Buy(0);
    }       
explicit vector(size_type _Count) : _Mybase()
    {   // construct from _Count * _Ty()
    _Construct_n(_Count, _Ty());
    }
vector(size_type _Count, const _Ty& _Val) : _Mybase()
    {   // construct from _Count * _Val
    _Construct_n(_Count, _Val);
    }
vector(const _Myt& _Right) : _Mybase(_Right._Alval)
    {   // construct by copying _Right
    if (_Buy(_Right.size()))
        _Mylast = _Ucopy(_Right.begin(), _Right.end(), _Myfirst);
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

vector优异性能的秘诀之一,就是配置比其所容纳的元素所需更多的内存,一般在使用vector之前,就先预留足够空间,以避免二次分配,这样可以使vector的性能达到最佳。因此元素个数_Count是个远比元素值 _Val重要的参数,因此当构造一个vector时,首要参数一定是元素个数。
由上各构造函数可知,基本上所有构造函数都是基于_Construct _n() 的

bool _Buy(size_type _Capacity)
    {   // allocate array with _Capacity elements
    _Myfirst = 0, _Mylast = 0, _Myend = 0;
    if (_Capacity == 0)    //_Count为0时,直接返回
        return (false);
    else
        {   // nonempty array, allocate storage
        _Myfirst = this->_Alval.allocate(_Capacity);  //分配内存,并更新成员变量
        _Mylast = _Myfirst;
        _Myend = _Myfirst + _Capacity;
        }
    return (true);
    }

void _Construct_n(size_type _Count, const _Ty& _Val)
    {   // 构造含有_Count个值为_Val的元素的容器
    if (_Buy(_Count))
        _Mylast = _Ufill(_Myfirst, _Count, _Val);
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

这样就完成了vector容器的构造了。

2、析构

vector的析构函数很简单,就是先销毁所有已存在的元素,然后释放所有内存

void _Tidy()
    {   // free all storage
    if (_Myfirst != 0)
        {   // something to free, destroy and deallocate it
        _Destroy(_Myfirst, _Mylast);
        this->_Alval.deallocate(_Myfirst, _Myend - _Myfirst);
        }
    _Myfirst = 0, _Mylast = 0, _Myend = 0;
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

三、插入和删除元素

vector的插入和删除元素是通过push_ back () 、 pop_back()两个接口来实现的,他们的内部实现也非常简单

void push_back(const _Ty& _Val)
{   // insert element at end
     if (size() < capacity())
         _Mylast = _Ufill(_Mylast, 1, _Val);
     else
         insert(end(), _Val);    //空间不足时,就会触发内存的二次分配
}

void pop_back()
{   // erase element at end
     if (!empty())
         {   // erase last element
         _Destroy(_Mylast - 1, _Mylast);
         --_Mylast;
         }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

四、其他接口

1、reserve()操作

之前提到过reserve(Count) 函数主要是预留Count大小的空间,对应的是容器的容量,目的是保证(_Myend - _Myfirst)>=Count。只有当空间不足时,才会操作,即重新分配一块内存,将原有元素拷贝到新内存,并销毁原有内存

void reserve(size_type _Count)
     {   // determine new minimum length of allocated storage
     if (capacity() < _Count)
         {   // not enough room, reallocate
         pointer _Ptr = this->_Alval.allocate(_Count);
         _Umove(begin(), end(), _Ptr);
         size_type _Size = size();
         if (_Myfirst != 0)
             {   // destroy and deallocate old array
             _Destroy(_Myfirst, _Mylast);
             this->_Alval.deallocate(_Myfirst, _Myend - _Myfirst);
             }
         _Myend = _Ptr + _Count;
         _Mylast = _Ptr + _Size;
         _Myfirst = _Ptr;
         }
     }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

2、resize()操作

resize(Count) 函数主要是用于改变size的,也就是改变vector的大小,最终改变的是(_Mylast - _Myfirst)的值,当size < Count时,就插入元素,当size >Count时,就擦除元素。

void resize(size_type _Newsize, _Ty _Val)
    {   // determine new length, padding with _Val elements as needed
    if (size() < _Newsize)
        _Insert_n(end(), _Newsize - size(), _Val);
    else if (_Newsize < size())
        erase(begin() + _Newsize, end());
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

3、_Insert_n()操作

resize()操作和insert()操作都会利用到_Insert_n()这个函数,这个函数非常重要,也比其他函数稍微复杂一点
虽然_Insert_n(_where, _Count, _Val ) 函数比较长,但是操作都非常简单,主要可以分为以下几种情况:

1、_Count == 0,不需要插入,直接返回

2、max_size() - size() < _Count,超过系统设置的最大容量,会溢出,造成Xlen()异常

3、_Capacity < size() + _Count,vector的容量不足以插入Count个元素,需要进行二次分配,扩大vector的容量。 在VS下,vector容量会扩大50%,即 _Capacity = _Capacity + _Capacity / 2;若仍不足,则 _Capacity = size() + _Count;

else if (_Capacity < size() + _Count)
        {   // not enough room, reallocate
        _Capacity = max_size() - _Capacity / 2 < _Capacity
            ? 0 : _Capacity + _Capacity / 2;    // try to grow by 50%
        if (_Capacity < size() + _Count)
            _Capacity = size() + _Count;
        pointer _Newvec = this->_Alval.allocate(_Capacity);
        pointer _Ptr = _Newvec;
        _Ptr = _Umove(_Myfirst, _VEC_ITER_BASE(_Where),_Newvec);    // copy prefix
        _Ptr = _Ufill(_Ptr, _Count, _Val);  // add new stuff
        _Umove(_VEC_ITER_BASE(_Where), _Mylast, _Ptr);  // copy suffix
        //内存释放与变量更新
        }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

这种情况下,数据从原始容器移动到新分配内存时是从前到后移动的
在这里插入图片描述
4、空间足够,且被插入元素的位置比较靠近_Mylast,即已有元素的尾部

这种情况下不需要再次进行内存分配,且数据是从后往前操作的。首先是将where~last向后移动,为待插入数据预留Count大小的空间,然后从_Mylast处开始填充,然后将从where处开始填充剩余元素

else if ((size_type)(_Mylast - _VEC_ITER_BASE(_Where)) < _Count)
        {   // new stuff spills off end
        _Umove(_VEC_ITER_BASE(_Where), _Mylast,
            _VEC_ITER_BASE(_Where) + _Count);   // copy suffix
        _Ufill(_Mylast, _Count - (_Mylast - _VEC_ITER_BASE(_Where)),
            _Val);  // insert new stuff off end
        _Mylast += _Count;
        std::fill(_VEC_ITER_BASE(_Where), _Mylast - _Count,
            _Val);  // insert up to old end
        }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

5、空间足够,但插入的位置比较靠前

    {   // new stuff can all be assigned
    _Ty _Tmp = _Val;    // in case _Val is in sequence

    pointer _Oldend = _Mylast;
    _Mylast = _Umove(_Oldend - _Count, _Oldend,
        _Mylast);   // copy suffix
    _STDEXT _Unchecked_move_backward(_VEC_ITER_BASE(_Where), _Oldend - _Count,
        _Oldend);   // copy hole
    std::fill(_VEC_ITER_BASE(_Where), _VEC_ITER_BASE(_Where) + _Count,
        _Tmp);  // insert into hole
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

4、erase()操作

iterator erase(const_iterator _First_arg,
        const_iterator _Last_arg)
        {   // erase [_First, _Last)
        iterator _First = _Make_iter(_First_arg);
        iterator _Last = _Make_iter(_Last_arg);

        if (_First != _Last)
            {   // worth doing, copy down over hole
            pointer _Ptr = _STDEXT unchecked_copy(_VEC_ITER_BASE(_Last), _Mylast,
                _VEC_ITER_BASE(_First));

            _Destroy(_Ptr, _Mylast);
            _Mylast = _Ptr;
            }
        return (_First);
        }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

主要操作就是将后半部分的有效元素向前拷贝,并将后面空间的无效元素析构,并更新_Mylast变量
在这里插入图片描述

5、assign()操作

assign()操作最终都会调用到下面的函数,主要操作是首先擦除容器中已有的全部元素,在从头开始插入Count个Val元素

void _Assign_n(size_type _Count, const _Ty& _Val)
        {   // assign _Count * _Val
        _Ty _Tmp = _Val;    // in case _Val is in sequence
        erase(begin(), end());
        insert(begin(), _Count, _Tmp);
        }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

五、基本使用

在经过上述对vector内部实现的分析后,再来理解相应接口就变得简单得多。
vector对外接口主要可以分为:

1、构造、析构

vector <Elem> c
vector <Elem> c1(c2)
vector <Elem> c(n)
vector <Elem> c(n, elem)
vector <Elem> c(beg,end)
c.~ vector <Elem>()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

2、插入、删除、赋值

c.push_back(elem)
c.pop_back()
c.insert(pos,elem)
c.insert(pos,n,elem)
c.insert(pos,beg,end)
c.erase(pos)
c.erase(beg,end)
c.clear()
c.assign(beg,end)
c.assign(n,elem)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

3、大小相关

c.capacity()
c.max_size()
c.resize(num)
c.reserve()
c.size()
  • 1
  • 2
  • 3
  • 4
  • 5

4、获取迭代器

c.begin()
c.end()
c.rbegin()
c.rend()
  • 1
  • 2
  • 3
  • 4

5、获取数据

operator[]
c.at(idx)
c.front()
c.back()
  • 1
  • 2
  • 3
  • 4

原文链接:https://blog.csdn.net/u012658346/article/details/50725933

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/430954
推荐阅读
相关标签
  

闽ICP备14008679号