C++STL之vector的使用和实现

x33g5p2x  于2021-11-16 转载在 C/C++  
字(20.1k)|赞(0)|评价(0)|浏览(369)

vector

什么是vector?

  1. vector是表示可变大小数组的序列容器。
  2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
  3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
  4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
  5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
  6. 与其它动态序列容器相比(deques, lists and forward_lists), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起lists和forward_lists统一的迭代器和引用更好。

vector的使用

我们首先来看一下vector文档中的成员函数:vector文档

构造函数

  • vector():创建一个空vector
  • vector(size_type n, const value_type& val = value_type()):创建一个vector,元素个数为n,且值为val
  • vector(const vector& x):拷贝构造函数
  • vector(InputIterator first, InputIterator last):复制[first,last)区间内另一个数组的元素到vector中
  1. #include<iostream>
  2. #include<vector>
  3. int main()
  4. {
  5. std::vector<int> v1;//创建一个空vector
  6. std::vector<int> v2(4,100);//创建一个vector,元素个数为4,且值为100
  7. std::vector<int> v3(v2.begin(),v2.end());//复制[v2,v2+5)区间内另一个数组的元素到vector中
  8. std::vector<int> v4(v3);//拷贝构造函数
  9. return 0;
  10. }

传迭代器进行构造:

  1. vector<int> v2(v1.begin(),v1.end());

如果不想要v1的第一个和最后一个,可以这样写:

  1. vector<int> v2(++v1.begin(),--v1.end());

可以看到迭代器构造函数是一个模板函数,所以不一定只用vector的迭代器,也可以用其他容器迭代器初始化,只要数据类型匹配(*iterator对象的类型跟vector中存的数据类型是一致的):

  1. string s("hello world");
  2. vector<char> v3(s.begin(),s.end());

迭代器进行初始化模板函数实际是这样实现的:

  1. temolate<class InputIterator>
  2. vector(InputIterator first,InputIterator last)
  3. {
  4. while(first != last)
  5. {
  6. push_back(*first);
  7. ++first;
  8. }
  9. }

我们定义下面两个对象有没有差别?

  1. string s("111111");
  2. vector<char> vc(6,'1');//调用构造函数

能不能用vc替代s?

不能,vector里面给char,虽然它们底层都是数组中存char类型数据,但是还是不一样的,s对象中指向的空间结尾有\0,string的很多操作是独有的,比如+=字符串等等

vector成员函数的使用

上面知道了vector类对象如何初始化,那么我们想要遍历该对象该怎么遍历呢?

首先使用push_back尾插进去数据,遍历方法:

1、下标+[]

2、迭代器遍历

3、范围for遍历

  1. #include<iostream>
  2. #include<vector>
  3. using namespace std;
  4. void test_vector()
  5. {
  6. vector<int> v;
  7. //使用push_back尾插数据
  8. v.push_back(1);
  9. v.push_back(2);
  10. v.push_back(3);
  11. v.push_back(4);
  12. //遍历vector
  13. //1、下标+[]
  14. for(size_t i =0;i<v.size(),i++)
  15. {
  16. v[i]-=1;
  17. cout<<v[i]<<" ";
  18. }
  19. cout<<endl;
  20. //2、迭代器
  21. vector<int>::iterator it = v.begin();
  22. while(it!=v.end())
  23. {
  24. *it += 1;
  25. cout<<*it<<" ";
  26. ++it;
  27. }
  28. cout<<endl;
  29. //范围for
  30. for(auto e:v)
  31. {
  32. cout<< e <<" ";
  33. }
  34. cout<<endl;
  35. }
  36. int main()
  37. {
  38. test_vector();
  39. return 0;
  40. }

我们还可以利用反向迭代器进行反向遍历:

  1. void test_vector()
  2. {
  3. vector<int> v;
  4. v.push_back(1);
  5. v.push_back(2);
  6. v.push_back(3);
  7. v.push_back(4);
  8. //反向迭代器进行遍历
  9. vector<int>::reverse_iterator rit = v.rbegin();
  10. while(rit!=v.rend())
  11. {
  12. cout<<*rit<<" ";
  13. ++rit;
  14. }
  15. cout<<endl;
  16. }

这里的rit不是原生指针,而是被封装的类对象,重载operator才能实现rit时,倒着走。

max_size

返回vector可以容纳的最大元素数。实际中并没有什么意义

  1. void test_vextor3()
  2. {
  3. vector<int> v;
  4. cout<<v.max_size()<<endl;//没什么意义
  5. v.reserve(10);//开空间,改变容量
  6. }

reserve

如果n大于当前对象的容量,该函数将使容器的容量增加至少n个数据。其他情况容量不会改变

好多人在reserve改变容量后会这样去访问数据:

  1. for(size_t i =0;i<10;i++)
  2. {
  3. v[i]=i;//error
  4. }

这样是错误的,operator[]会检查_size,会造成越界报错

正确的访问方式:

  1. for(size_t i =0;i<10;i++)
  2. {
  3. v[i]=push_back(i);//正确
  4. }

resize

改变这个vector对象的长度为n,如果n小于当前vector的长度,则将当前值缩短到第n个数据,删除第n个以外的数据。如果n大于当前vector对象长度,延长该vector对象长度,并在最后插入指定内容直到达到的延长后的长度n。如果指定值, 用该值来初始化,否则,他们初始化为匿名对象。

  1. v.resize(20);//开空间+初始化

assign

分配新的内容给vector,代替它当前的内容,并且修改它的大小。可以看到assign函数的参数可以是迭代器,也可以是val个数和val

  1. void test_vector4()
  2. {
  3. int a[]={1,2,3,4,5};
  4. vector<int> v;
  5. v.assign(a,a+4);
  6. //v.assign(3,4);//这样可以分配3个4给v
  7. for (auto e : v)
  8. {
  9. cout << e << " ";
  10. }
  11. cout << endl;
  12. }

需要注意的是迭代器传值时的区间是左闭右开

也可以这样分配内容:

  1. v.assign(3,4);

insert

  1. void test_vector5()
  2. {
  3. int a[]={1,2,3,4,5};
  4. vector<int> v(a,a+5);
  5. //头插
  6. v.insert(v.begin(),0);
  7. for(auto e:v)
  8. {
  9. cout<< e <<" ";
  10. }
  11. cout<<endl;
  12. }

那么我们假设想在2的前面插入呢?我们想一想我们肯定先需要找到2这个元素,才能在它前面插入元素,而我们发现vector当中没有find函数,但是在算法里面有一个find函数模板以提供使用:

find函数参数是迭代器区间以及需要找到的val值,返回的是这段区间第一次发现的元素的迭代器,如果没有发现则返回的是last,我们想要在2之前插入元素:

  1. void test_vector5()
  2. {
  3. int a[] = { 1,2,3,4,5 };
  4. vector<int> v(a, a + 5);
  5. vector<int>::iterator pos = find(v.begin(),v.end(),2);
  6. if(pos!= v.end())
  7. {
  8. v.insert(pos,20);
  9. }
  10. for(auto e:v)
  11. {
  12. cout<< e <<" ";
  13. }
  14. cout<<endl;
  15. }

在算法模块还有一个函数便于我们使用:sort函数

  1. void test_vector6()
  2. {
  3. int a[] = { 1,2,3,4,5 };
  4. vector<int> v(a, a + 5);
  5. //默认排升序
  6. sort(v.begin(),v.end());
  7. }

它默认是排升序,但是我们还可以进行排降序,需要加一个参数:

  1. //排降序 -- 关于greater<int>是一个仿函数类
  2. sort(v.begin(),v.end(),greater<int>())

这里我们不深讲解这个参数,重点讲解vector

我们还可以用sort对数组进行排序:

  1. void test_vector6()
  2. {
  3. //指向数组的空间的指针是天然的迭代器
  4. int a1[]={30,1,13,23,42};
  5. sort(a1,a1+5);//也可以对数组排序
  6. for(auto e:a1)
  7. {
  8. cout<< e <<" ";
  9. }
  10. cout<<endl;
  11. }

指向数组的空间的指针是天然的迭代器,故也是可以对数组进行排序的

erase

  1. void test_vector5()
  2. {
  3. int a[]={1,2,3,4,5};
  4. vector<int> v(a,a+5);
  5. //头插
  6. v.erase(v.begin());
  7. //删除2
  8. //没有find,在算法里面有一个find函数模板以提供使用
  9. vector<int>::iterator pos = find(v.begin(),v.end(),2);
  10. if(pos!= v.end())
  11. {
  12. v.erase(pos);
  13. }
  14. }

vector的数据还可以是vector,类似于二维数组,我们来看一道题:

杨辉三角
核心思想:找出杨辉三角的规律,发现每一行头尾都是1,中间第[j]个数等于上一行[j-1]+[j]

  1. class Solution
  2. {
  3. public:
  4. vector<vector<int>> generate(int numRows)
  5. {
  6. vector<vector<int>> vv;
  7. //开辟杨辉三角的空间
  8. vv.resize(numRowd);
  9. for(size_t i = 0;i<vv.size();i++)
  10. {
  11. vv[i].resize(i+1,0);//第一行一个数据,第二行二个...第五行五个
  12. //每一行第一个和最后一个初始化为1
  13. //vv[i].front() = 1;
  14. vv[i][0] = 1;
  15. vv[i][vv[i].size()-1]] = 1;
  16. }
  17. for(size_t i =0;i<vv.size();++i)
  18. {
  19. for(size_t j=0;j<vv[i].size();++j)
  20. {
  21. if(vv[i][j]==0)
  22. {
  23. vv[i][j] = vv[i-1][j]+vv[i-1][j-1];
  24. }
  25. }
  26. }
  27. return vv;
  28. }
  29. };

vector的模拟实现

模拟实现的目的是为了学习它的一些细节和核心框架,我们模拟实现时将vector分装在一个命名空间中,防止与std中的vector冲突,首先vector是模板,所以我们需要将vector写成模板的样子:

  1. namespace ZSB
  2. {
  3. template<class T>
  4. class vector
  5. {
  6. public:
  7. //...
  8. private:
  9. //...
  10. };
  11. }

那么我们的成员变量有些什么呢?

  1. private:
  2. iterator _start;
  3. iterator _finish;
  4. iterator _endofstorage;

_start, _finish,_endofstorage;这三个变量都分别代表什么意思呢?_start指向数据的头,_finish指向数据结束的下一个位置,_endofstorage指向容量结束的下一个位置。iterator又是什么呢?是迭代器,在vector中的迭代器其实也是指针,只是将他typedef了:

迭代器和const迭代器的模拟实现

  1. typedef T* iterator;
  2. typedef const T* const_iterator;
  3. iterator begin()
  4. {
  5. return _start;
  6. }
  7. iterator end()
  8. {
  9. return _finish;
  10. }
  11. const_iterator begin()const
  12. {
  13. return _start;
  14. }
  15. const_iterator end()const
  16. {
  17. return _finish;
  18. }

可以看到vector当中的迭代器也是相当于指针,只是将指针typedef了

无参构造函数的模拟实现

  1. vector()
  2. :_start(nullptr)
  3. , _finish(nullptr)
  4. , _endofstorage(nullptr)
  5. {}

将三个成员变量初始化为nullptr

size、capacity、empty成员函数的模拟实现

  1. size_t size()const
  2. {
  3. return _finish - _start;
  4. }
  5. size_t capacity()const
  6. {
  7. return _endofstorage - _start;
  8. }
  9. bool empty()
  10. {
  11. return _start == _finish;
  12. }

_start指向数据的头,_finish指向数据结束的下一个位置,_endofstorage指向容量结束的下一个位置,finish减去start就是size,endofstorage减去start就是capacity,判断是否为空,只需知道start是否等于finish即可

operator[]模拟实现

  1. T& operator[](size_t i)
  2. {
  3. assert(i >= 0 && i < size());
  4. return _start[i];
  5. }
  6. const T& operator[](size_t i)const
  7. {
  8. assert(i >= 0 && i < size());
  9. return _start[i];
  10. }

operator[]和const修饰的operator[]模拟实现

reserve模拟实现

  1. //开空间
  2. void reserve(size_t n)
  3. {
  4. if (n > capacity())
  5. {
  6. size_t sz = size();//以防_start被改,size计算错误。保存size
  7. T* tmp = new T[n];
  8. if(_start)
  9. {
  10. memcpy(tmp, _start, sizeof(T) * size());
  11. delete[] _start;
  12. }
  13. _start = tmp;
  14. _finish = _start + sz;
  15. //_finish = _start+size();//error,因为_start已经被修改,size计算错误了
  16. _endofstorage = _start + n;
  17. }
  18. }

当reserve的参数n大于容量时,则需要扩容,这里需要注意的是我们需要先将size保存下来以便后面更新成员变量,然后再进行开空间然后拷贝,拷贝完成需要更新成员变量

这里不能使用memcpy进行拷贝,原因是什么我们放在最后面说明。

resize模拟实现

  1. void resize(size_t n, const T& val = T())
  2. {
  3. if(n>size())
  4. {
  5. //判断容量是否够
  6. if(n>capacity())
  7. {
  8. //不够需要增容
  9. reserve(n);
  10. }
  11. else
  12. {
  13. //容量够,需要改变_finish,并且进行新增数据的初始化
  14. while(_finish<n)
  15. {
  16. *_finish = val;
  17. _finish++;
  18. }
  19. }
  20. }
  21. else
  22. {
  23. _finish =_start + n;
  24. }
  25. }

首先判断resize参数n是否大于size,大于size的话再判断容量是否够,不够需要增容,够的话需要改变_finish,并且对新增数据初始化,n小于size的话,直接改变_finish即可

push_back模拟实现

  1. void push_back(const T& x)
  2. {
  3. if (_finish == _endofstorage)
  4. {
  5. size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
  6. reserve(newcapacity);
  7. }
  8. //new时初始化过了,可以直接复制
  9. *_finish = x;
  10. ++_finish;
  11. }

注意需要判断是否需要增容

pop_back模拟实现

  1. void pop_back()
  2. {
  3. assert(!empty(*this));
  4. --_finish;
  5. }

注意删除前需要该对象不为空

迭代器失效问题

  1. void test_vector1()
  2. {
  3. std::vector<int> v;
  4. v.push_back(1);
  5. v.push_back(2);
  6. v.push_back(3);
  7. v.push_back(4);
  8. std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
  9. if (pos != v.end())
  10. {
  11. //找到了
  12. v.insert(pos, 20);
  13. }
  14. //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
  15. cout << *pos << endl;
  16. *pos = 100;
  17. }

上面这段代码在解引用pos时会进行报错:

是怎么引起的呢?看下图解释:

  • 由于insert扩容,导致pos失效,pos指向的空间释放,pos本质是一个野指针
  • insert插入数据,就算没有扩容,我们也认为pos失效了,因为pos的意义变了,不再指向原来的数据

调试验证:

因为增容,重新开辟了一块空间,而pos还指向的是原来空间的地址,该空间已经释放,就出现野指针的问题

上面是vs版本下的验证,不同编译器可能检查处理机制不一样,我们再在Linux平台下进行验证:

  1. #include<vector>
  2. #include<iostream>
  3. #include<stdio.h>
  4. #include<algorithm>
  5. using namespace std;
  6. void test_vector1()
  7. {
  8. std::vector<int> v;
  9. v.reserve(4);
  10. v.push_back(1);
  11. v.push_back(2);
  12. v.push_back(3);
  13. v.push_back(4);
  14. std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
  15. if (pos != v.end())
  16. {
  17. //找到了
  18. printf("%p\n",v.begin());
  19. v.insert(pos, 20);
  20. }
  21. //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
  22. printf("%p\n",v.begin());
  23. cout << *pos << endl;
  24. *pos = 100;
  25. }
  26. int main()
  27. {
  28. test_vector1();
  29. return 0;
  30. }

我们经过验证,Linux平台gcc编译器下并不会报错,我们分别打印增容前和增容后的v.begin(),发现两次的地址并不一样,说明确实进行了增容

那我们提前将空间开好,那么insert里面不进行增容,那么编译的情况是怎么样的呢?我们来验证一下:

vs版本:

可以看到它依旧会报错

Linux下g++编译器:

Linux平台下依旧不会报错,可以看到他这次并没有增容,并且它打印的是插入的数据

erase也会引起迭代器失效:

  1. void test_vector3()
  2. {
  3. std::vector<int> v;
  4. v.push_back(1);
  5. v.push_back(2);
  6. v.push_back(3);
  7. v.push_back(4);
  8. std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
  9. if (pos != v.end())
  10. {
  11. //找到了
  12. v.erase(pos);
  13. }
  14. cout << *pos << endl;
  15. *pos = 100;
  16. //erase导致pos失效了,pos没有野指针,只是意义变了,但是vs版本进行了强制检查,都不能访问,同样的代码在Linux当中g++下不会报错,说明两个环境的检查机制不一样
  17. //但是无论编译器是否报错,erase(pos)以后,我们都认为pos失效了,失效了以后不要*pos访问,可能会出问题
  18. }

我们在vs版本下验证此代码:

vs版本下虽然pos没有野指针,pos只是意义变了,但是vs版本下进行了强制检查,不能进行访问。

我们用同样的代码在Linux平台下验证:

可以看到Linux下不会报错,会正常运行,但是无论编译器是否报错,erase(pos)以后,我们都认为pos失效了,失效了以后不要*pos访问,可能会出问题

我们看一个极端的情况:要求删除v中的所有偶数

  1. void test_vector4()
  2. {
  3. ZSB::vector<int> v;
  4. v.push_back(1);
  5. v.push_back(2);
  6. v.push_back(3);
  7. v.push_back(4);
  8. //要求删除v中所有偶数
  9. ZSB::vector<int>::iterator it = v.begin();
  10. while (it != v.end())
  11. {
  12. if (*it % 2 == 0)
  13. {
  14. v.erase(it);
  15. }
  16. ++it;
  17. }
  18. }

Linux平台下运行结果:

可以看到发生了段错误,请看如下解释:

VS版本下会直接在it越界时会报错:

  1. void test_vector4()
  2. {
  3. std::vector<int> v;
  4. v.push_back(1);
  5. v.push_back(2);
  6. v.push_back(3);
  7. v.push_back(4);
  8. v.push_back(5);
  9. //要求删除v中所有偶数
  10. std::vector<int>::iterator it = v.begin();
  11. while (it != v.end())
  12. {
  13. if (*it % 2 == 0)
  14. {
  15. v.erase(it);
  16. }
  17. ++it;
  18. }
  19. }

Linux下的运行结果:

可以看到正常运行了,为什么会正常运行呢?

而相同的代码会在vs下会报错:

所以说不同平台的检查机制不一样

在Linux中并且代码会出现逻辑性错误,无法完成删除偶数,看下面例子:

  1. void test_vector4()
  2. {
  3. std::vector<int> v;
  4. v.push_back(1);
  5. v.push_back(2);
  6. v.push_back(2);
  7. v.push_back(4);
  8. v.push_back(5);
  9. //要求删除v中所有偶数
  10. std::vector<int>::iterator it = v.begin();
  11. while (it != v.end())
  12. {
  13. if (*it % 2 == 0)
  14. {
  15. v.erase(it);
  16. }
  17. ++it;
  18. }
  19. for(auto e:v)
  20. {
  21. cout<<e<<endl;
  22. }
  23. cout<<endl;
  24. }

2并没有被删除,为什么呢?

结论:

insert和erase后的迭代器都失效了,不要去访问,否则会出现意想不到的结果

那么库里面的insert和erase是怎么实现的呢?

insert的模拟实现

可以看到insert返回的是迭代器:

它返回一个指向新插入的第一个元素,那么insert我们可以这样写:

  1. iterator insert(iterator pos,const T& x)
  2. {
  3. assert(pos >= _start && pos <= _finish);
  4. if(_finish == _endofstorage)
  5. {
  6. //容量不够进行扩容
  7. size_t len = pos-_start;
  8. size_t newcapacity = capacity()==0?4:capacity()*2;
  9. reserve(newcapacity);
  10. pos = _start + len;
  11. }
  12. //挪动数据
  13. iterator end = _finish-1;
  14. while(end >= pos)
  15. {
  16. *(end+1) = *(end);
  17. --end;
  18. }
  19. *pos = x;
  20. ++_finish;
  21. return pos;
  22. }

首先我们需要断言,因为需要在正确的位置插入;然后insert时如果容量不够了的话我们需要首先增容,,需要注意的是防止pos失效,我们需要在增容后将pos更新指向新空间对应原空间的那个pos位置,那么怎么才能知道那个位置呢?所以我们需要先将pos相对于_start的位置保存下来,增容完成后将pos更新,即pos=_start+len,然后从最后一个数据开始往后挪动数据,挪动完成后将x放在pos位置处,++_finish,然后返回pos,此时的pos位置就是插入元素的第一个位置

erase的模拟实现

可以看到erase也是返回一个迭代器,它返回删除的那个元素的下一个元素:

  1. iterator erase(iterator pos)
  2. {
  3. assert(pos >= _start && pos < _finish);
  4. iterator it = pos+1;
  5. while(it!=_finish)
  6. {
  7. *(it-1) = *it;
  8. it++;
  9. }
  10. --_finish;
  11. return pos;//返回删除位置的下一个位置
  12. }

有些编译器版本删除元素可能考虑缩容,但是我们这里模拟实现erase不考虑缩容,所以这里挪动数据就行,最后返回pos,此时pos位置的元素就是删除位置的下一个位置

此时就可以复用push_back和pop_back:

  1. void push_back(const T& x)
  2. {
  3. insert(_finish,x);
  4. }
  5. void pop_back()
  6. {
  7. erase(_finish-1);
  8. }

析构函数

  1. ~vector()
  2. {
  3. delete[] _start;
  4. _start = _finish = _endofstorage = nullptr;
  5. }

delete时,需要加[],因为销毁的是一段连续的空间

拷贝构造函数

我们不写相当于用的是默认的拷贝构造,默认的拷贝构造是浅拷贝,所以我们需要写深拷贝:

深拷贝传统写法
  1. //v2(v1)
  2. //1、传统写法
  3. vector(const vector<T>& v)
  4. {
  5. //先开辟和v相同大小的空间
  6. _start = new T[v.capacity()];
  7. //拷贝
  8. memcpy(_start,v._start,sizeof(T)*v.size());
  9. //更新finish和endofstorage
  10. _finish = _start+v.size();
  11. _endofstorage = _start + v.capacity;
  12. }
  1. vector<int> v2(v1);
  2. for(auto e:v2)
  3. {
  4. cout<<e<<" "<<endl;
  5. }
  6. cout<<endl;

传统深拷贝方法二:

  1. vector(const vector<T>& v)
  2. :_start(nullptr)
  3. :_finish(nullptr)
  4. :_endofstorage(nullptr)
  5. {
  6. reserve(v.capacity());//复用reserve和push_back
  7. for(const auto& e:v)//e是string类型时引用接收减少拷贝构造
  8. {
  9. push_back(e);
  10. }
  11. }

上面这种还是传统写法,只不过是复用reserve和push_back,进行复用就不用我们自己去开空间了

深拷贝现代写法

现代写法怎么写呢?现代写法是自己不开空间,让别人开好空间初始化完,然后自己再和别人开的空间交换,这里其实就是利用vector的一个通过迭代器构造函数来构造tmp对象,传参传被拷贝对象的迭代器即可,然后将this指向的对象和tmp对象交换,因为这里用到了迭代器构造函数与交换函数,所以我们首先模拟实现一下迭代器构造函数与交换函数:

迭代器构造函数与swap函数模拟实现

  1. //类模板的成员函数,还可以再定义模板参数
  2. template <class InputIterator>
  3. //迭代器构造函数
  4. //这是个模板函数,任意类型的迭代器都可以,比如string
  5. vector(InputIterator firstInputIterator last)
  6. :_start(nullptr)
  7. :_finish(nullptr)
  8. :_endofstorage(nullptr)
  9. {
  10. while(first != last)
  11. {
  12. push_back(*first);
  13. ++first;
  14. }
  15. }
  16. //v1.swap(tmp)
  17. void swap(vector<T>& v)
  18. {
  19. std::swap(_start,v._start);
  20. std::swap(_finish,v._finish);
  21. std::swap(_finish,v._finish);
  22. }

需要注意的是迭代器构造函数是个模板函数,任意类型的迭代器都可以,比如string的迭代器

这时就可以写深拷贝的现代写法了:

  1. //现代写法
  2. //v2(v1)
  3. vector(const vector<T>& v)
  4. :_start(nullptr)
  5. :_finish(nullptr)
  6. :_endofstorage(nullptr)
  7. {
  8. //利用tmp开空间,在string里是传v1._str来构造tmp
  9. vector<T> tmp(v.begin(),v.end());
  10. this->swap(tmp);
  11. }

注意需要将_start,_finish,_endofstorage初始化为空,因为临时对象tmp在函数调用结束后会销毁,如果不初始化,它们都是随机值,delete时会出错。

赋值重载

那么赋值重载呢?我们想将一个对象赋值给另一个对象呢?

  1. v1 = v4;

我们知道赋值重载不写会用编译器默认生成的,而此时也会出现浅拷贝问题,所以我们要写深拷贝的赋值重载函数:

赋值重载的传统写法
  1. //传统写法
  2. vector<T>& operator=(const vector<T>& v)
  3. {
  4. if(this!=&v)
  5. {
  6. //先清理原内容
  7. delete[] _start;
  8. _start = _finish = _endofstorage = nullptr;
  9. //开辟空间
  10. reverse(v.capacity);
  11. for(auto& e: v)//e是string类型时引用接收减少拷贝构造
  12. {
  13. push_back(e);
  14. }
  15. }
  16. return *this;
  17. }

先清理原内容,然后再开辟空间,最后进行插入数据

赋值重载的现代写法
  1. //现代写法
  2. //比如v1=v2
  3. vector<T>& operator=(vector<T> v)//值传递
  4. {
  5. swap(v);
  6. return *this;
  7. //结束会释放局部变量v,v指向的空间现在其实就是this之前指向的空间,刚刚好这块空间要释放
  8. }

通过值传递,用v2拷贝构造局部变量v,然后将this指向的对象和v交换,释放原空间的工作交给了函数调用结束,结束会销毁局部变量v,v指向的空间其实就是this之前指向的空间,刚刚好这块空间要释放

memcpy带来的浅拷贝问题

我们看下面代码:

  1. void test_vector9()
  2. {
  3. vector<string> v;
  4. v.reserve(4);
  5. v.push_back("11111");
  6. v.push_back("11111");
  7. v.push_back("11111");
  8. v.push_back("11111");
  9. v.push_back("11111");//这里要增容会出问题
  10. for(auto e:v)
  11. {
  12. cout<<e<<" ";
  13. }
  14. cout<<endl;
  15. }

上面的代码你运行时会正常运行,但是你通过调试会发现在函数出口处会引发一个错误:

增容会出问题,因为增容会调用reserve,数据类型是int不会出问题,但是string就会有问题,问题出在memcpy

问题图解:

所以说memcpy导致了更深层次浅拷贝问题:vector<string>

如何解决呢?

  1. for(size_t i = 0;i<sz;++i)
  2. {
  3. //如果T是string
  4. //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
  5. tmp[i] = _start[i];
  6. }

总结:

T是int,doublde等内置类型时可以用memcpy,当T是string时,不能用memcpy

因为拷贝构造传统写法那里也用到了memcpy,所以也需要改,如下:

拷贝构造传统写法修正:

  1. //v2(v1)
  2. //1、传统写法
  3. vector(const vector<T>& v)
  4. {
  5. //先开辟和v相同大小的空间
  6. _start = new T[v.capacity()];
  7. //拷贝
  8. //memcpy(_start,v._start,sizeof(T)*v.size());//error
  9. for(size_t i = 0;i<sz;++i)
  10. {
  11. //如果T是string
  12. //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
  13. _start[i] = v._start[i];
  14. }
  15. //更新finish和endofstorage
  16. _finish = _start+v.size();
  17. _endofstorage = _start + v.capacity;
  18. }

reserve修正:

  1. //开空间
  2. void reserve(size_t n)
  3. {
  4. if (n > capacity())
  5. {
  6. size_t sz = size();//以防_start被改,size计算错误。保存size
  7. T* tmp = new T[n];
  8. for(size_t i = 0;i<sz;++i)
  9. {
  10. //如果T是string
  11. //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
  12. tmp[i] = _start[i];
  13. }
  14. _start = tmp;
  15. _finish = _start + sz;
  16. //_finish = _start+size();//error,因为_start已经被修改,size计算错误了
  17. _endofstorage = _start + n;
  18. }
  19. }

完整的vector模拟实现的类:

  1. #include<iostream>
  2. #include<assert.h>
  3. #include<vector>
  4. using namespace std;
  5. namespace ZSB
  6. {
  7. template<class T>
  8. class vector
  9. {
  10. public:
  11. typedef T* iterator;
  12. typedef const T* const_iterator;
  13. iterator begin()
  14. {
  15. return _start;
  16. }
  17. iterator end()
  18. {
  19. return _finish;
  20. }
  21. const_iterator begin()const
  22. {
  23. return _start;
  24. }
  25. const_iterator end()const
  26. {
  27. return _finish;
  28. }
  29. vector()
  30. :_start(nullptr)
  31. , _finish(nullptr)
  32. , _endofstorage(nullptr)
  33. {}
  34. //类模板的成员函数,还可以再定义模板参数
  35. template <class InputIterator>
  36. //迭代器构造函数
  37. //这是个模板函数,任意类型的迭代器都可以,比如string
  38. vector(InputIterator firstInputIterator last)
  39. :_start(nullptr)
  40. :_finish(nullptr)
  41. :_endofstorage(nullptr)
  42. {
  43. while(first != last)
  44. {
  45. push_back(*first);
  46. ++first;
  47. }
  48. }
  49. //拷贝构造
  50. vector(const vector<T>& v)
  51. :_start(nullptr)
  52. :_finish(nullptr)
  53. :_endofstorage(nullptr)
  54. {
  55. reserve(v.capacity());//复用reserve和push_back
  56. for(const auto& e:v)//e是string类型时引用接收减少拷贝构造
  57. {
  58. push_back(e);
  59. }
  60. }
  61. //赋值重载现代写法
  62. //比如v1=v2
  63. vector<T>& operator=(vector<T> v)//值传递
  64. {
  65. swap(v);
  66. return *this;
  67. //结束会释放局部变量v,v指向的空间现在其实就是this之前指向的空间,刚刚好这块空间要释放
  68. }
  69. size_t size()const
  70. {
  71. return _finish - _start;
  72. }
  73. size_t capacity()const
  74. {
  75. return _endofstorage - _start;
  76. }
  77. bool empty()
  78. {
  79. return _start == _finish;
  80. }
  81. T& operator[](size_t i)
  82. {
  83. assert(i >= 0 && i < size());
  84. return _start[i];
  85. }
  86. const T& operator[](size_t i)const
  87. {
  88. assert(i >= 0 && i < size());
  89. return _start[i];
  90. }
  91. //v1.swap(tmp)
  92. void swap(vector<T>& v)
  93. {
  94. std::swap(_start,v._start);
  95. std::swap(_finish,v._finish);
  96. std::swap(_finish,v._finish);
  97. }
  98. //开空间
  99. void reserve(size_t n)
  100. {
  101. if (n > capacity())
  102. {
  103. size_t sz = size();//以防_start被改,size计算错误。保存size
  104. T* tmp = new T[n];
  105. /*if(_start) { memcpy(tmp, _start, sizeof(T) * size()); delete[] _start; }*/
  106. for(size_t i = 0;i<sz;++i)
  107. {
  108. //如果T是string
  109. //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
  110. tmp[i] = _start[i];
  111. }
  112. _start = tmp;
  113. _finish = _start + sz;
  114. //_finish = _start+size();//error,因为_start已经被修改,size计算错误了
  115. _endofstorage = _start + n;
  116. }
  117. }
  118. //开空间+初始化
  119. void resize(size_t n, const T& val = T())
  120. {
  121. if (n > size())
  122. {
  123. if (n > capacity())
  124. {
  125. reserve(n);
  126. }
  127. while (_finish < _start + n)
  128. {
  129. *_finish = val;
  130. ++_finish;
  131. }
  132. /*for(iterator i=_finish;i<n;i++) { } _finish = n;*/
  133. }
  134. else
  135. {
  136. _finish = _start + n;
  137. }
  138. }
  139. void push_back(const T& x)
  140. {
  141. if (_finish == _endofstorage)
  142. {
  143. size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
  144. reserve(newcapacity);
  145. }
  146. //new时初始化过了,可以直接复制
  147. *_finish = x;
  148. ++_finish;
  149. }
  150. void pop_back()
  151. {
  152. assert(!empty(*this));
  153. --_finish;
  154. }
  155. iterator insert(iterator pos,const T& x)
  156. {
  157. assert(pos >= _start && pos <= _finish);
  158. if(_finish == _endofstorage)
  159. {
  160. //容量不够进行扩容
  161. size_t len = pos-_start;
  162. size_t newcapacity = capacity()==0?4:capacity()*2;
  163. reserve(newcapacity);
  164. pos = _start + len;
  165. }
  166. //挪动数据
  167. iterator end = _finish-1;
  168. while(end >= pos)
  169. {
  170. *(end+1) = *(end);
  171. --end;
  172. }
  173. *pos = x;
  174. ++_finish;
  175. return pos;
  176. }
  177. iterator erase(iterator pos)
  178. {
  179. assert(pos >= _start && pos < _finish);
  180. iterator it = pos+1;
  181. while(it!=_finish)
  182. {
  183. *(it-1) = *it;
  184. it++;
  185. }
  186. --_finish;
  187. return pos;//返回删除位置的下一个位置
  188. }
  189. private:
  190. iterator _start;
  191. iterator _finish;
  192. iterator _endofstorage;
  193. };
  194. void print(const vector<int>& v)
  195. {
  196. vector<int>::const_iterator it = v.begin();
  197. while (it != v.end())
  198. {
  199. cout << *it << " " << endl;
  200. ++it;
  201. }
  202. cout << endl;
  203. //范围for
  204. for (auto e : v)
  205. {
  206. cout << e << " ";
  207. }
  208. cout << endl;
  209. for (size_t i = 0; i < v.size(); i++)
  210. {
  211. cout << v[i] << " ";
  212. }
  213. cout << endl;
  214. }
  215. void test_vector1()
  216. {
  217. vector<int> v;
  218. v.push_back(1);
  219. v.push_back(2);
  220. v.push_back(3);
  221. v.push_back(4);
  222. vector<int>::iterator it = v.begin();
  223. while (it != v.end())
  224. {
  225. cout << *it << " " << endl;
  226. ++it;
  227. }
  228. cout << endl;
  229. //范围for
  230. for (auto e : v)
  231. {
  232. cout << e << " ";
  233. }
  234. cout << endl;
  235. for (size_t i = 0; i < v.size(); i++)
  236. {
  237. cout << v[i] << " ";
  238. }
  239. cout << endl;
  240. }
  241. void test_vector2()
  242. {
  243. vector<string> v;
  244. string s("hello");
  245. v.push_back(s);
  246. v.push_back(string("hello"));//自动隐式转换
  247. v.push_back("hello");
  248. v.push_back("hello");
  249. v.push_back("hello");
  250. v.push_back("hello");
  251. for (auto e : v)
  252. {
  253. cout << e << " ";
  254. }
  255. cout << endl;
  256. }
  257. }
  258. //迭代器失效问题
  259. //类似于野指针问题
  260. namespace std
  261. {
  262. void test_vector1()
  263. {
  264. std::vector<int> v;
  265. v.push_back(1);
  266. v.push_back(2);
  267. v.push_back(3);
  268. v.push_back(4);
  269. std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
  270. if (pos != v.end())
  271. {
  272. //找到了
  273. v.insert(pos, 20);
  274. }
  275. //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
  276. cout << *pos << endl;
  277. *pos = 100;
  278. }
  279. void test_vector2()
  280. {
  281. std::vector<int> v;
  282. v.reserve(6);
  283. v.push_back(1);
  284. v.push_back(2);
  285. v.push_back(3);
  286. v.push_back(4);
  287. std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
  288. if (pos != v.end())
  289. {
  290. //找到了
  291. v.insert(pos, 20);
  292. }
  293. //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
  294. cout << *pos << endl;
  295. *pos = 100;
  296. }
  297. void test_vector3()
  298. {
  299. std::vector<int> v;
  300. v.push_back(1);
  301. v.push_back(2);
  302. v.push_back(3);
  303. v.push_back(4);
  304. std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
  305. if (pos != v.end())
  306. {
  307. //找到了
  308. v.erase(pos);
  309. }
  310. cout << *pos << endl;
  311. *pos = 100;
  312. //erase导致pos失效了,pos没有野指针,只是意义变了,但是vs版本进行了强制检查,都不能访问,同样的代码在Linux当中g++下不会报错,说明两个环境的检查机制不一样
  313. //但是无论编译器是否报错,erase(pos)以后,我们都认为pos失效了,失效了以后不要*pos访问,可能会出问题
  314. }
  315. void test_vector4()
  316. {
  317. ZSB::vector<int> v;
  318. v.push_back(1);
  319. v.push_back(2);
  320. v.push_back(3);
  321. v.push_back(4);
  322. //要求删除v中所有偶数
  323. ZSB::vector<int>::iterator it = v.begin();
  324. while (it != v.end())
  325. {
  326. if (*it % 2 == 0)
  327. {
  328. v.erase(it);
  329. }
  330. ++it;
  331. }
  332. }
  333. }
  334. int main()
  335. {
  336. test_vector1();
  337. return 0;
  338. }

相关文章