vector

什么是vector？

vector是表示可变大小数组的序列容器。
就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。
本质讲，vector使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。
vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
因此，vector占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。
与其它动态序列容器相比（deques, lists and forward_lists）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起lists和forward_lists统一的迭代器和引用更好。

vector的使用

我们首先来看一下vector文档中的成员函数：vector文档

构造函数

vector()：创建一个空vector
vector(size_type n, const value_type& val = value_type())：创建一个vector，元素个数为n,且值为val
vector(const vector& x)：拷贝构造函数
vector(InputIterator first, InputIterator last):复制[first,last)区间内另一个数组的元素到vector中

#include<iostream>
#include<vector>
int main()
{
    std::vector<int> v1;//创建一个空vector
    std::vector<int> v2(4,100);//创建一个vector，元素个数为4,且值为100
    std::vector<int> v3(v2.begin(),v2.end());//复制[v2,v2+5)区间内另一个数组的元素到vector中
    std::vector<int> v4(v3);//拷贝构造函数
    return 0;
}

传迭代器进行构造：

vector<int> v2(v1.begin(),v1.end());

如果不想要v1的第一个和最后一个，可以这样写：

vector<int> v2(++v1.begin(),--v1.end());

可以看到迭代器构造函数是一个模板函数，所以不一定只用vector的迭代器，也可以用其他容器迭代器初始化，只要数据类型匹配(*iterator对象的类型跟vector中存的数据类型是一致的)：

string s("hello world");
vector<char> v3(s.begin(),s.end());

迭代器进行初始化模板函数实际是这样实现的：

temolate<class InputIterator>
vector(InputIterator first,InputIterator last)
{
    while(first != last)
    {
        push_back(*first);
        ++first;
    }
}

我们定义下面两个对象有没有差别？

string s("111111");
vector<char> vc(6,'1');//调用构造函数

能不能用vc替代s？

不能，vector里面给char，虽然它们底层都是数组中存char类型数据，但是还是不一样的，s对象中指向的空间结尾有\0，string的很多操作是独有的，比如+=字符串等等

vector成员函数的使用

上面知道了vector类对象如何初始化，那么我们想要遍历该对象该怎么遍历呢？

首先使用push_back尾插进去数据，遍历方法：

1、下标+[]

2、迭代器遍历

3、范围for遍历

#include<iostream>
#include<vector>
using namespace std;
void test_vector()
{
    vector<int> v;
    //使用push_back尾插数据
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    
    //遍历vector
    //1、下标+[]
    for(size_t i =0;i<v.size(),i++)
    {
        v[i]-=1;
        cout<<v[i]<<" ";
    }
    cout<<endl;
    //2、迭代器
    vector<int>::iterator it = v.begin();
    while(it!=v.end())
    {
        *it += 1;
        cout<<*it<<" ";
        ++it;
    }
    cout<<endl;
    
    //范围for
    for(auto e:v)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}
int main()
{
    test_vector();
    return 0;
}

我们还可以利用反向迭代器进行反向遍历：

void test_vector()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    //反向迭代器进行遍历
    vector<int>::reverse_iterator rit = v.rbegin();
    while(rit!=v.rend())
    {
        cout<<*rit<<" ";
        ++rit;
    }
    cout<<endl;
}

这里的rit不是原生指针，而是被封装的类对象，重载operator才能实现rit时，倒着走。

max_size

返回vector可以容纳的最大元素数。实际中并没有什么意义

void test_vextor3()
{
    vector<int> v;
    cout<<v.max_size()<<endl;//没什么意义
    v.reserve(10);//开空间，改变容量
}

reserve

如果n大于当前对象的容量，该函数将使容器的容量增加至少n个数据。其他情况容量不会改变

好多人在reserve改变容量后会这样去访问数据：

for(size_t i =0;i<10;i++)
{
    v[i]=i;//error
}

这样是错误的，operator[]会检查_size，会造成越界报错

正确的访问方式：

for(size_t i =0;i<10;i++)
{
    v[i]=push_back(i);//正确
}

resize

改变这个vector对象的长度为n，如果n小于当前vector的长度，则将当前值缩短到第n个数据，删除第n个以外的数据。如果n大于当前vector对象长度,延长该vector对象长度，并在最后插入指定内容直到达到的延长后的长度n。如果指定值, 用该值来初始化,否则,他们初始化为匿名对象。

v.resize(20);//开空间+初始化

assign

分配新的内容给vector，代替它当前的内容，并且修改它的大小。可以看到assign函数的参数可以是迭代器，也可以是val个数和val

void test_vector4()
{
    int a[]={1,2,3,4,5};
    vector<int> v;
    v.assign(a,a+4);
    //v.assign(3,4);//这样可以分配3个4给v
    for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

需要注意的是迭代器传值时的区间是左闭右开

也可以这样分配内容：

v.assign(3,4);

insert

void test_vector5()
{
    int a[]={1,2,3,4,5};
    vector<int> v(a,a+5);
    //头插
    v.insert(v.begin(),0);
    for(auto e:v)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}

那么我们假设想在2的前面插入呢？我们想一想我们肯定先需要找到2这个元素，才能在它前面插入元素，而我们发现vector当中没有find函数，但是在算法里面有一个find函数模板以提供使用：

find函数参数是迭代器区间以及需要找到的val值，返回的是这段区间第一次发现的元素的迭代器，如果没有发现则返回的是last，我们想要在2之前插入元素：

void test_vector5()
{
    int a[] = { 1,2,3,4,5 };
	vector<int> v(a, a + 5);
    vector<int>::iterator pos = find(v.begin(),v.end(),2);
    if(pos!= v.end())
    {
        v.insert(pos,20);
    }
    for(auto e:v)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}

在算法模块还有一个函数便于我们使用：sort函数

void test_vector6()
{
    int a[] = { 1,2,3,4,5 };
	vector<int> v(a, a + 5);
    //默认排升序
    sort(v.begin(),v.end());
}

它默认是排升序，但是我们还可以进行排降序，需要加一个参数：

//排降序 -- 关于greater<int>是一个仿函数类
sort(v.begin(),v.end(),greater<int>())

这里我们不深讲解这个参数，重点讲解vector

我们还可以用sort对数组进行排序：

void test_vector6()
{
    //指向数组的空间的指针是天然的迭代器
    int a1[]={30,1,13,23,42};
    sort(a1,a1+5);//也可以对数组排序
    for(auto e:a1)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}

指向数组的空间的指针是天然的迭代器，故也是可以对数组进行排序的

erase

void test_vector5()
{
    int a[]={1,2,3,4,5};
    vector<int> v(a,a+5);
    //头插
    v.erase(v.begin());
    
    //删除2
    //没有find，在算法里面有一个find函数模板以提供使用
    vector<int>::iterator pos = find(v.begin(),v.end(),2);
    if(pos!= v.end())
    {
        v.erase(pos);
    }
}

vector的数据还可以是vector，类似于二维数组，我们来看一道题：

杨辉三角
核心思想：找出杨辉三角的规律，发现每一行头尾都是1，中间第[j]个数等于上一行[j-1]+[j]

class Solution
{
public:
    vector<vector<int>> generate(int numRows)
    {
        vector<vector<int>> vv;
        //开辟杨辉三角的空间
        vv.resize(numRowd);
        for(size_t i = 0;i<vv.size();i++)
        {
            vv[i].resize(i+1,0);//第一行一个数据，第二行二个...第五行五个
            //每一行第一个和最后一个初始化为1
            //vv[i].front() = 1;
            vv[i][0] = 1;
            vv[i][vv[i].size()-1]] = 1;
        }
        for(size_t i =0;i<vv.size();++i)
        {
            for(size_t j=0;j<vv[i].size();++j)
            {
                if(vv[i][j]==0)
                {
                    vv[i][j] = vv[i-1][j]+vv[i-1][j-1];
                }
            }
        }
        return vv;
    } 
};

vector的模拟实现

模拟实现的目的是为了学习它的一些细节和核心框架，我们模拟实现时将vector分装在一个命名空间中，防止与std中的vector冲突，首先vector是模板，所以我们需要将vector写成模板的样子：

namespace ZSB
{
    template<class T>
    class vector
    {
    public:
        //...
    private:
        //...
    };
}

那么我们的成员变量有些什么呢？

private:
    iterator _start;
    iterator _finish;
    iterator _endofstorage;

_start， _finish，_endofstorage;这三个变量都分别代表什么意思呢？_start指向数据的头，_finish指向数据结束的下一个位置，_endofstorage指向容量结束的下一个位置。iterator又是什么呢？是迭代器，在vector中的迭代器其实也是指针，只是将他typedef了：

迭代器和const迭代器的模拟实现

typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
    return _start;
}
iterator end()
{
    return _finish;
}
const_iterator begin()const
{
    return _start;
}
const_iterator end()const
{
    return _finish;
}

可以看到vector当中的迭代器也是相当于指针，只是将指针typedef了

无参构造函数的模拟实现

vector()
     :_start(nullptr)
     , _finish(nullptr)
     , _endofstorage(nullptr)
{}

将三个成员变量初始化为nullptr

size、capacity、empty成员函数的模拟实现

size_t size()const
{
    return _finish - _start;
}
size_t capacity()const
{
    return _endofstorage - _start;
}
bool empty()
{
    return _start == _finish;
}

_start指向数据的头，_finish指向数据结束的下一个位置，_endofstorage指向容量结束的下一个位置，finish减去start就是size，endofstorage减去start就是capacity，判断是否为空，只需知道start是否等于finish即可

operator[]模拟实现

T& operator[](size_t i)
{
    assert(i >= 0 && i < size());
    return _start[i];
}
const T& operator[](size_t i)const
{
    assert(i >= 0 && i < size());
    return _start[i];
}

operator[]和const修饰的operator[]模拟实现

reserve模拟实现

//开空间
void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t sz = size();//以防_start被改，size计算错误。保存size
        T* tmp = new T[n];
        if(_start)
        {
            memcpy(tmp, _start, sizeof(T) * size());
        	delete[] _start;
        }
        _start = tmp;
        _finish = _start + sz;
        //_finish = _start+size();//error，因为_start已经被修改，size计算错误了
        _endofstorage = _start + n;
    }
}

当reserve的参数n大于容量时，则需要扩容，这里需要注意的是我们需要先将size保存下来以便后面更新成员变量，然后再进行开空间然后拷贝，拷贝完成需要更新成员变量

这里不能使用memcpy进行拷贝，原因是什么我们放在最后面说明。

resize模拟实现

void resize(size_t n, const T& val = T())
{
    if(n>size())
    {
        //判断容量是否够
        if(n>capacity())
        {
            //不够需要增容
            reserve(n);
        }
        else
        {
            //容量够，需要改变_finish，并且进行新增数据的初始化
            while(_finish<n)
            {
                *_finish = val;
                _finish++;
            }
        }
    }
    else
    {
        _finish =_start + n;
    }
}

首先判断resize参数n是否大于size，大于size的话再判断容量是否够，不够需要增容，够的话需要改变_finish，并且对新增数据初始化，n小于size的话，直接改变_finish即可

push_back模拟实现

void push_back(const T& x)
{
     if (_finish == _endofstorage)
     {
     	 size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
         reserve(newcapacity);
     }
	  //new时初始化过了，可以直接复制
      *_finish = x;
      ++_finish;
}

注意需要判断是否需要增容

pop_back模拟实现

void pop_back()
{
     assert(!empty(*this));
     --_finish;
}

注意删除前需要该对象不为空

迭代器失效问题

void test_vector1()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if (pos != v.end())
    {
        //找到了
        v.insert(pos, 20);
    }
    //在insert以后pos可能就失效了，insert增容导致的，如果insert没有增容，pos还是指向原来的位置，访问没报错，那么我们依旧认为pos失效了，这里失效是指的是pos的意义变了，pos指向的不是原来的值了
    cout << *pos << endl;
    *pos = 100;
}

上面这段代码在解引用pos时会进行报错：

是怎么引起的呢？看下图解释：

由于insert扩容，导致pos失效，pos指向的空间释放，pos本质是一个野指针
insert插入数据，就算没有扩容，我们也认为pos失效了，因为pos的意义变了，不再指向原来的数据

调试验证：

因为增容，重新开辟了一块空间，而pos还指向的是原来空间的地址，该空间已经释放，就出现野指针的问题

上面是vs版本下的验证，不同编译器可能检查处理机制不一样，我们再在Linux平台下进行验证：

#include<vector>
#include<iostream>
#include<stdio.h>
#include<algorithm>
using namespace std;
void test_vector1()
{
    std::vector<int> v;
    v.reserve(4);
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if (pos != v.end())
    {
        //找到了
        printf("%p\n",v.begin());
        v.insert(pos, 20);
    }
    //在insert以后pos可能就失效了，insert增容导致的，如果insert没有增容，pos还是指向原来的位置，访问没报错，那么我们依旧认为pos失效了，这里失效是指的是pos的意义变了，pos指向的不是原来的值了
        
    printf("%p\n",v.begin());
    cout << *pos << endl;
    *pos = 100;
}
int main()
{
        test_vector1();
        return 0;
}

我们经过验证，Linux平台gcc编译器下并不会报错，我们分别打印增容前和增容后的v.begin()，发现两次的地址并不一样，说明确实进行了增容

那我们提前将空间开好，那么insert里面不进行增容，那么编译的情况是怎么样的呢？我们来验证一下：

vs版本：

可以看到它依旧会报错

Linux下g++编译器：

Linux平台下依旧不会报错，可以看到他这次并没有增容，并且它打印的是插入的数据

erase也会引起迭代器失效：

void test_vector3()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if (pos != v.end())
    {
        //找到了
        v.erase(pos);
    }
    cout << *pos << endl;
    *pos = 100;
    //erase导致pos失效了，pos没有野指针，只是意义变了，但是vs版本进行了强制检查，都不能访问，同样的代码在Linux当中g++下不会报错，说明两个环境的检查机制不一样
//但是无论编译器是否报错，erase(pos)以后，我们都认为pos失效了，失效了以后不要*pos访问，可能会出问题
}

我们在vs版本下验证此代码：

vs版本下虽然pos没有野指针，pos只是意义变了，但是vs版本下进行了强制检查，不能进行访问。

我们用同样的代码在Linux平台下验证：

可以看到Linux下不会报错，会正常运行，但是无论编译器是否报错，erase(pos)以后，我们都认为pos失效了，失效了以后不要*pos访问，可能会出问题

我们看一个极端的情况：要求删除v中的所有偶数

void test_vector4()
{
    ZSB::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    //要求删除v中所有偶数
    ZSB::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        ++it;
    }
}

Linux平台下运行结果：

可以看到发生了段错误，请看如下解释：

VS版本下会直接在it越界时会报错：

void test_vector4()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    
    //要求删除v中所有偶数
    std::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        ++it;
    }
}

Linux下的运行结果：

可以看到正常运行了，为什么会正常运行呢？

而相同的代码会在vs下会报错：

所以说不同平台的检查机制不一样

在Linux中并且代码会出现逻辑性错误，无法完成删除偶数，看下面例子：

void test_vector4()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(2);
    v.push_back(4);
    v.push_back(5);
    
    //要求删除v中所有偶数
    std::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        ++it;
    }
    for(auto e:v)
    {
            cout<<e<<endl;
    }
    cout<<endl;
}

2并没有被删除，为什么呢？

结论：

insert和erase后的迭代器都失效了，不要去访问，否则会出现意想不到的结果

那么库里面的insert和erase是怎么实现的呢？

insert的模拟实现

可以看到insert返回的是迭代器：

它返回一个指向新插入的第一个元素，那么insert我们可以这样写：

iterator insert(iterator pos,const T& x)
{
    assert(pos >= _start && pos <= _finish);
    if(_finish == _endofstorage)
    {
        //容量不够进行扩容
        size_t len = pos-_start;
        size_t newcapacity = capacity()==0?4:capacity()*2;
        reserve(newcapacity);
        
        pos = _start + len;
    }
    //挪动数据
    iterator end = _finish-1;
    while(end >= pos)
    {
        *(end+1) = *(end);
        --end;
    }
    *pos = x;
    ++_finish;
    return pos;
}

首先我们需要断言，因为需要在正确的位置插入；然后insert时如果容量不够了的话我们需要首先增容，，需要注意的是防止pos失效，我们需要在增容后将pos更新指向新空间对应原空间的那个pos位置，那么怎么才能知道那个位置呢？所以我们需要先将pos相对于_start的位置保存下来，增容完成后将pos更新，即pos=_start+len，然后从最后一个数据开始往后挪动数据，挪动完成后将x放在pos位置处，++_finish，然后返回pos，此时的pos位置就是插入元素的第一个位置

erase的模拟实现

可以看到erase也是返回一个迭代器，它返回删除的那个元素的下一个元素：

iterator erase(iterator pos)
{
    assert(pos >= _start && pos < _finish);
    iterator it = pos+1;
    while(it!=_finish)
    {
        *(it-1) = *it;
        it++;
    }
    --_finish;
    return pos;//返回删除位置的下一个位置
}

有些编译器版本删除元素可能考虑缩容，但是我们这里模拟实现erase不考虑缩容，所以这里挪动数据就行，最后返回pos，此时pos位置的元素就是删除位置的下一个位置

此时就可以复用push_back和pop_back：

void push_back(const T& x)
{
    insert(_finish,x);
}
void pop_back()
{
    erase(_finish-1);
}

析构函数

~vector()
{
    delete[] _start;
    _start = _finish = _endofstorage = nullptr;
}

delete时，需要加[]，因为销毁的是一段连续的空间

拷贝构造函数

我们不写相当于用的是默认的拷贝构造，默认的拷贝构造是浅拷贝，所以我们需要写深拷贝：

深拷贝传统写法

//v2(v1)
//1、传统写法
vector(const vector<T>& v)
{
    //先开辟和v相同大小的空间
    _start = new T[v.capacity()];
    //拷贝
    memcpy(_start,v._start,sizeof(T)*v.size());
    //更新finish和endofstorage
    _finish = _start+v.size();
    _endofstorage = _start + v.capacity;
}

vector<int> v2(v1);
for(auto e:v2)
{
    cout<<e<<" "<<endl;
}
cout<<endl;

传统深拷贝方法二：

vector(const vector<T>& v)
    :_start(nullptr)
    :_finish(nullptr)
    :_endofstorage(nullptr)
{
    reserve(v.capacity());//复用reserve和push_back
    for(const auto& e:v)//e是string类型时引用接收减少拷贝构造 
    {
        push_back(e);
    }
}

上面这种还是传统写法，只不过是复用reserve和push_back，进行复用就不用我们自己去开空间了

深拷贝现代写法

现代写法怎么写呢？现代写法是自己不开空间，让别人开好空间初始化完，然后自己再和别人开的空间交换，这里其实就是利用vector的一个通过迭代器构造函数来构造tmp对象，传参传被拷贝对象的迭代器即可，然后将this指向的对象和tmp对象交换，因为这里用到了迭代器构造函数与交换函数，所以我们首先模拟实现一下迭代器构造函数与交换函数：

迭代器构造函数与swap函数模拟实现

//类模板的成员函数，还可以再定义模板参数
template <class InputIterator>
//迭代器构造函数
//这是个模板函数，任意类型的迭代器都可以，比如string
vector(InputIterator first，InputIterator last)
    :_start(nullptr)
    :_finish(nullptr)
    :_endofstorage(nullptr)
{
    while(first != last)
    {
        push_back(*first);
        ++first;
    }
}
//v1.swap(tmp)
void swap(vector<T>& v)
{
    std::swap(_start,v._start);
    std::swap(_finish,v._finish);
    std::swap(_finish,v._finish); 
}

需要注意的是迭代器构造函数是个模板函数，任意类型的迭代器都可以，比如string的迭代器

这时就可以写深拷贝的现代写法了：

//现代写法
//v2(v1)
vector(const vector<T>& v)
    :_start(nullptr)
    :_finish(nullptr)
    :_endofstorage(nullptr)
{
    //利用tmp开空间，在string里是传v1._str来构造tmp
    vector<T> tmp(v.begin(),v.end());
    this->swap(tmp);
}

注意需要将_start，_finish，_endofstorage初始化为空，因为临时对象tmp在函数调用结束后会销毁，如果不初始化，它们都是随机值，delete时会出错。

赋值重载

那么赋值重载呢？我们想将一个对象赋值给另一个对象呢？

v1 = v4;

我们知道赋值重载不写会用编译器默认生成的，而此时也会出现浅拷贝问题，所以我们要写深拷贝的赋值重载函数：

赋值重载的传统写法

//传统写法
vector<T>& operator=(const vector<T>& v)
{
    if(this!=&v)
    {
        //先清理原内容
        delete[] _start;
        _start = _finish = _endofstorage = nullptr;
        //开辟空间
    	reverse(v.capacity);
        for(auto& e: v)//e是string类型时引用接收减少拷贝构造 
        {
            push_back(e);
        }
    }
    return *this;
}

先清理原内容，然后再开辟空间，最后进行插入数据

赋值重载的现代写法

//现代写法
//比如v1=v2
vector<T>& operator=(vector<T> v)//值传递
{
    swap(v);
    return *this;
    //结束会释放局部变量v，v指向的空间现在其实就是this之前指向的空间，刚刚好这块空间要释放
}

通过值传递，用v2拷贝构造局部变量v，然后将this指向的对象和v交换，释放原空间的工作交给了函数调用结束，结束会销毁局部变量v，v指向的空间其实就是this之前指向的空间，刚刚好这块空间要释放

memcpy带来的浅拷贝问题

我们看下面代码：

void test_vector9()
{
    vector<string> v;
    v.reserve(4);
    v.push_back("11111");
    v.push_back("11111");
    v.push_back("11111");
    v.push_back("11111");
    v.push_back("11111");//这里要增容会出问题
    
    for(auto e:v)
    {
        cout<<e<<" ";
    }
    cout<<endl;
}

上面的代码你运行时会正常运行，但是你通过调试会发现在函数出口处会引发一个错误：

增容会出问题，因为增容会调用reserve，数据类型是int不会出问题，但是string就会有问题，问题出在memcpy

问题图解：

所以说memcpy导致了更深层次浅拷贝问题：vector<string>

如何解决呢？

for(size_t i = 0;i<sz;++i)
{
    //如果T是string
    //这里调用的就是string的赋值重载，string的赋值重载完成的是深拷贝
    tmp[i] = _start[i];
}

总结：

T是int，doublde等内置类型时可以用memcpy，当T是string时，不能用memcpy

因为拷贝构造传统写法那里也用到了memcpy，所以也需要改，如下：

拷贝构造传统写法修正：

//v2(v1)
//1、传统写法
vector(const vector<T>& v)
{
    //先开辟和v相同大小的空间
    _start = new T[v.capacity()];
    //拷贝
    //memcpy(_start,v._start,sizeof(T)*v.size());//error
    for(size_t i = 0;i<sz;++i)
    {
        //如果T是string
        //这里调用的就是string的赋值重载，string的赋值重载完成的是深拷贝
        _start[i] = v._start[i];
    }
    //更新finish和endofstorage
    _finish = _start+v.size();
    _endofstorage = _start + v.capacity;
}

reserve修正：

//开空间
void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t sz = size();//以防_start被改，size计算错误。保存size
        T* tmp = new T[n];
        for(size_t i = 0;i<sz;++i)
        {
            //如果T是string
            //这里调用的就是string的赋值重载，string的赋值重载完成的是深拷贝
            tmp[i] = _start[i];
        }
        _start = tmp;
        _finish = _start + sz;
        //_finish = _start+size();//error，因为_start已经被修改，size计算错误了
        _endofstorage = _start + n;
    }
}

完整的vector模拟实现的类：

#include<iostream>
#include<assert.h>
#include<vector>
using namespace std;
namespace ZSB
{
    template<class T>
    class vector
    {
    public:
        typedef T* iterator;
        typedef const T* const_iterator;
        iterator begin()
        {
            return _start;
        }
        iterator end()
        {
            return _finish;
        }
        const_iterator begin()const
        {
            return _start;
        }
        const_iterator end()const
        {
            return _finish;
        }
        vector()
            :_start(nullptr)
            , _finish(nullptr)
            , _endofstorage(nullptr)
        {}
        //类模板的成员函数，还可以再定义模板参数
        template <class InputIterator>
        //迭代器构造函数
        //这是个模板函数，任意类型的迭代器都可以，比如string
        vector(InputIterator first，InputIterator last)
            :_start(nullptr)
            :_finish(nullptr)
            :_endofstorage(nullptr)
        {
            while(first != last)
            {
                push_back(*first);
                ++first;
            }
        }
         //拷贝构造
        vector(const vector<T>& v)
            :_start(nullptr)
            :_finish(nullptr)
            :_endofstorage(nullptr)
        {
            reserve(v.capacity());//复用reserve和push_back
            for(const auto& e:v)//e是string类型时引用接收减少拷贝构造 
            {
                push_back(e);
            }
        }
        //赋值重载现代写法
        //比如v1=v2
        vector<T>& operator=(vector<T> v)//值传递
        {
            swap(v);
            return *this;
            //结束会释放局部变量v，v指向的空间现在其实就是this之前指向的空间，刚刚好这块空间要释放
        }
        
        size_t size()const
        {
            return _finish - _start;
        }
        size_t capacity()const
        {
            return _endofstorage - _start;
        }
        bool empty()
        {
            return _start == _finish;
        }
        T& operator[](size_t i)
        {
            assert(i >= 0 && i < size());
            return _start[i];
        }
        const T& operator[](size_t i)const
        {
            assert(i >= 0 && i < size());
            return _start[i];
        }
        //v1.swap(tmp)
        void swap(vector<T>& v)
        {
            std::swap(_start,v._start);
            std::swap(_finish,v._finish);
            std::swap(_finish,v._finish); 
        }
        //开空间
        void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t sz = size();//以防_start被改，size计算错误。保存size
                T* tmp = new T[n];
                /*if(_start) { memcpy(tmp, _start, sizeof(T) * size()); delete[] _start; }*/
                for(size_t i = 0;i<sz;++i)
                {
                    //如果T是string
                    //这里调用的就是string的赋值重载，string的赋值重载完成的是深拷贝
                    tmp[i] = _start[i];
                }
                _start = tmp;
                _finish = _start + sz;
                //_finish = _start+size();//error，因为_start已经被修改，size计算错误了
                _endofstorage = _start + n;
            }
        }
        //开空间+初始化
        void resize(size_t n, const T& val = T())
        {
            if (n > size())
            {
                if (n > capacity())
                {
                    reserve(n);
                }
                while (_finish < _start + n)
                {
                    *_finish = val;
                    ++_finish;
                }
                /*for(iterator i=_finish;i<n;i++) { } _finish = n;*/
            }
            else
            {
                _finish = _start + n;
            }
        }
        void push_back(const T& x)
        {
            if (_finish == _endofstorage)
            {
                size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
                reserve(newcapacity);
            }
            //new时初始化过了，可以直接复制
            *_finish = x;
            ++_finish;
        }
        void pop_back()
        {
            assert(!empty(*this));
            --_finish;
        }
        iterator insert(iterator pos,const T& x)
        {
            assert(pos >= _start && pos <= _finish);
            if(_finish == _endofstorage)
            {
                //容量不够进行扩容
                size_t len = pos-_start;
                size_t newcapacity = capacity()==0?4:capacity()*2;
                reserve(newcapacity);
                pos = _start + len;
            }
            //挪动数据
            iterator end = _finish-1;
            while(end >= pos)
            {
                *(end+1) = *(end);
                --end;
            }
            *pos = x;
            ++_finish;
            return pos;
        }
        iterator erase(iterator pos)
        {
            assert(pos >= _start && pos < _finish);
            iterator it = pos+1;
            while(it!=_finish)
            {
                *(it-1) = *it;
                it++;
            }
            --_finish;
            return pos;//返回删除位置的下一个位置
        }
       
    private:
        iterator _start;
        iterator _finish;
        iterator _endofstorage;
    };
    
    void print(const vector<int>& v)
    {
        vector<int>::const_iterator it = v.begin();
        while (it != v.end())
        {
            cout << *it << " " << endl;
            ++it;
        }
        cout << endl;
        //范围for
        for (auto e : v)
        {
            cout << e << " ";
        }
        cout << endl;
        for (size_t i = 0; i < v.size(); i++)
        {
            cout << v[i] << " ";
        }
        cout << endl;
    }
    void test_vector1()
    {
        vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        vector<int>::iterator it = v.begin();
        while (it != v.end())
        {
            cout << *it << " " << endl;
            ++it;
        }
        cout << endl;
        //范围for
        for (auto e : v)
        {
            cout << e << " ";
        }
        cout << endl;
        for (size_t i = 0; i < v.size(); i++)
        {
            cout << v[i] << " ";
        }
        cout << endl;
    }
    void test_vector2()
    {
        vector<string> v;
        string s("hello");
        v.push_back(s);
        v.push_back(string("hello"));//自动隐式转换
        v.push_back("hello");
        v.push_back("hello");
        v.push_back("hello");
        v.push_back("hello");
        for (auto e : v)
        {
            cout << e << " ";
        }
        cout << endl;
    }
}
//迭代器失效问题
//类似于野指针问题
namespace std
{
    void test_vector1()
    {
        std::vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
        if (pos != v.end())
        {
            //找到了
            v.insert(pos, 20);
        }
        //在insert以后pos可能就失效了，insert增容导致的，如果insert没有增容，pos还是指向原来的位置，访问没报错，那么我们依旧认为pos失效了，这里失效是指的是pos的意义变了，pos指向的不是原来的值了
        cout << *pos << endl;
        *pos = 100;
    }
    void test_vector2()
    {
        std::vector<int> v;
        v.reserve(6);
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
        if (pos != v.end())
        {
            //找到了
            v.insert(pos, 20);
        }
        //在insert以后pos可能就失效了，insert增容导致的，如果insert没有增容，pos还是指向原来的位置，访问没报错，那么我们依旧认为pos失效了，这里失效是指的是pos的意义变了，pos指向的不是原来的值了
        cout << *pos << endl;
        *pos = 100;
    }
    void test_vector3()
    {
        std::vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
        if (pos != v.end())
        {
            //找到了
            v.erase(pos);
        }
        cout << *pos << endl;
        *pos = 100;
        //erase导致pos失效了，pos没有野指针，只是意义变了，但是vs版本进行了强制检查，都不能访问，同样的代码在Linux当中g++下不会报错，说明两个环境的检查机制不一样
//但是无论编译器是否报错，erase(pos)以后，我们都认为pos失效了，失效了以后不要*pos访问，可能会出问题
    }
    void test_vector4()
    {
        ZSB::vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        //要求删除v中所有偶数
        ZSB::vector<int>::iterator it = v.begin();
        while (it != v.end())
        {
            if (*it % 2 == 0)
            {
                v.erase(it);
            }
            ++it;
        }
    }
}
int main()
{
    test_vector1();
    return 0;
}

C++STL之vector的使用和实现