当前位置:   article > 正文

C++之string类(·标准库中的string类·string类的模拟实现)_c++ 在堆上创建 string

c++ 在堆上创建 string

【本节目标】
·1. 为什么要学习string类
·2. 标准库中的string类
·3. string类的模拟实现

1. 为什么学习string类?

1.1 C语言中的字符串

C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。

2. 标准库中的string类

2.1 string类

1. 字符串是表示字符序列的类
2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。
3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
1. string是表示字符串的字符串类
2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。

3. string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator>string;
4. 不能操作多字节或者变长字符的序列。
使用string类时,必须包含#include头文件以及using namespace std;

2.2 string类的常用接口说明

1. string类对象的常见构造

(constructor)函数名称功能说明
string() (重点)构造空的string类对象,即空字符串
string(const char* s) (重点)用C-string来构造string类对象
string(const string&s) (重点)拷贝构造函数
string(size_t n, char c) string类对象中包含n个字符c
  1. int main()
  2. {
  3. string s1; // 构造空的string类对象s1
  4. string s2("hello bit"); // 用C格式字符串构造string类对象s2
  5. string s3(s2); // 拷贝构造s3
  6. return 0;
  7. }

2. string类对象的容量操作

函数名称 功能说明
size(重点)返回字符串有效字符长度
length返回字符串有效字符长度
capacity 返回空间总大小
empty (重点)检测字符串释放为空串,是返回true,否则返回false
clear (重点)清空有效字符
reserve (重点)为字符串预留空间
resize (重点)将有效字符的个数改成n个,多出的空间用字符c填充
size,length,capacity,clear的实际应用:
string在VS下的 增容
reserve:开空间,影响容量
  1. void TestPushBackReserve()
  2. {
  3. string s;
  4. // 利用reserve提高插入数据的效率,避免增容带来的开销
  5. s.reserve(100);//申请至少能存储100个字符的空间
  6. size_t sz = s.capacity();
  7. cout << "capacity changed: " << sz << '\n';
  8. cout << "making s grow:\n";
  9. for (int i = 0; i < 100; ++i)
  10. {
  11. //s.push_back('c');
  12. s += 'c';
  13. if (sz != s.capacity())
  14. {
  15. sz = s.capacity();
  16. cout << "capacity changed: " << sz << '\n';
  17. }
  18. }
  19. }

 resize:开空间,对这些空间给一个初始值,进行初始化

 注意:
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()
2. clear()只是将string中有效字符清空,不改变底层空间大小
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变
4. reserve(size_t res_arg=0):为string预留空间,提前就开好了足够的空间,避免增容,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时reserver不会改变容量大小

3. string类对象的访问及遍历操作
函数名称功能说明
operator[] (重点)返回pos位置的字符,const string类对象调用
begin+ endbegin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器
rbegin + rendbegin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器
范围forC++11支持更简洁的范围for的新遍历方式
  1. void test_string1()
  2. {
  3. string s1("hello world");
  4. //遍历字符串:
  5. //方式一:下标+[]
  6. for (size_t i = 0; i < s1.size(); i++)
  7. {
  8. s1[i] += 1;
  9. }//修改字符串元素
  10. for (size_t i = 0; i < s1.size(); i++)
  11. {
  12. cout << s1[i] << " ";
  13. }//利用下标+[]遍历打印字符串
  14. cout << endl;
  15. //方式二:迭代器
  16. string::iterator it = s1.begin();
  17. while (it != s1.end())
  18. {
  19. *it -= 1;
  20. it++;
  21. }//利用迭代器修改字符串内容
  22. it = s1.begin();
  23. while (it != s1.end())
  24. {
  25. cout << *it << " ";
  26. it++;
  27. }//利用迭代器遍历打印字符串
  28. cout << endl;
  29. //方式三:范围for(语法糖)(C++11才可使用)
  30. //自动往后迭代,自动判断结束
  31. for (auto& e : s1)
  32. //注意这里的auto要加上引用,s1把每个字符赋值给e,所以e是s1每个字符的拷贝,对e改变不会改变s1的内容,所以要加上引用
  33. {
  34. e -= 1;
  35. }//利用范围for修改字符串
  36. for (auto e : s1)//auto自动推导s1的类型
  37. {
  38. cout << e << " ";
  39. }//利用范围for遍历字符串打印
  40. cout << endl;
  41. }

 迭代器的思路图解:

反向迭代器:主要用来倒着遍历字符串。

  1. void test_string2()
  2. {
  3. //反向迭代器
  4. string s1("hello world");
  5. //string::reverse_iterator rit = s1.rbegin();
  6. auto rit = s1.rbegin();//auto自动推导上面的类型
  7. while (rit != s1.rend())
  8. {
  9. cout << *rit << " ";
  10. rit++;
  11. }
  12. cout << endl;
  13. }

迭代器遍历的意义是什么呢?-----所有的容器都可以使用迭代器这种方式去访问修改

对于string,无论是正着遍历,倒着遍历,下标+[]的方式都已经足够方便了。为什么还需要迭代器呢?

对于string,下标+[]的方式就足够好用,可能大家觉得迭代器比较多余。但是如果是其他容器(数据结构)呢?那么下标+[]这种方式似乎就不适用了,所以迭代器才是最通用的方式!

4. string类对象的修改操作

函数名称 功能说明
push_back 在字符串后尾插字符c
append 在字符串后追加一个字符串
operator+= (重点)在字符串后追加字符串str
c_str(重点) 返回C格式字符串
find + npos(重点)从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置
rfind从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置
substr 在str中从pos位置开始,截取n个字符,然后将其返回
尾插+=,append,push_back的应用场景:
  1. int main()
  2. {
  3. string s1;
  4. s1.push_back('a');
  5. s1.append("bcde");
  6. cout << s1 << endl;
  7. s1 += ':';
  8. s1 += "hello world";
  9. cout << s1 << endl;
  10. return 0;
  11. }

c_str的应用场景:

  find+nops,rfind,substr的场景应用:

  1. void test_string4()
  2. {
  3. string file("test.txt");
  4. FILE* fout=fopen(file.c_str(), "w");
  5. //要求取出文件的后缀名
  6. size_t pos = file.find('.');//从头开始找使用find
  7. if (pos != string::npos)
  8. {
  9. string suffix = file.substr(pos, file.size() - pos);//file.size()-pos=4
  10. cout << suffix << endl;
  11. }
  12. string file("test.txt.zip");
  13. FILE* fout = fopen(file.c_str(), "w");
  14. //要求取出文件的后缀名
  15. size_t pos = file.rfind('.');//从后面找使用rfind
  16. if (pos != string::npos)
  17. {
  18. string suffix = file.substr(pos, file.size() - pos);//file.size()-pos=4
  19. cout << suffix << endl;
  20. }
  21. //上面两个查找类似于char * strstr ( const char *str2, const char * str1)的C库函数
  22. }
  1. void test_string5()
  2. {
  3. //find的第二个作用实例:
  4. string url("http://www.cplusplus.com/reference/string/string/?kw=string");
  5. size_t pos1 = url.find(':');
  6. string protocol = url.substr(0, pos1 - 0);
  7. cout << protocol << endl;
  8. //如何去取中间的域名?
  9. size_t pos2 = url.find('/', pos1 + 3);//pos1+3是从w开始找,找到/位置为止
  10. string domainName = url.substr(pos1 + 3, pos2 - (pos1 + 3));
  11. cout << domainName << endl;
  12. string usi = url.substr(pos2 + 1);
  13. cout << usi << endl;
  14. }

除了尾插的+=,append,push_back之外,还有insert可以进行头插和中间插入,但是效率很低,尽量少用。

还有erase的头删尾删字符删除场景:

5. string类非成员函数

函数功能说明
operator+尽量少用,因为传值返回,导致深拷贝效率低
operator>> (重点)输入运算符重载
operator<< (重点)输出运算符重载
getline (重点)获取一行字符串
relational operators (重点)大小比较
  1. int main()
  2. {
  3. string s;
  4. //cin>>s;//cin和scnaf默认以空格或换行符为间隔
  5. getline(cin,s);//获取一行字符串
  6. }

 

3. string类的模拟实现

3.1 经典的string类问题

上面已经对string类进行了简单的介绍,大家只要能够正常使用即可。接下来自己来模拟实现string类,最主要是实现string类的构造、拷贝构造、赋值运算符重载以及析构函数。大家看下以下string类的实现是否有问题?

  1. namespace Bernard
  2. {
  3. class string
  4. {
  5. public:
  6. string(const char* str)
  7. :_str(new char[strlen(str)+1])
  8. {
  9. strcpy(_str, str);
  10. }
  11. ~string()
  12. {
  13. delete[] _str;
  14. _str = nullptr;
  15. }
  16. private:
  17. char* _str;
  18. };
  19. void Teststring()
  20. {
  21. string s1("hello bit!!!");
  22. string s2(s1);
  23. }
  24. }
  25. int main()
  26. {
  27. Bernard::Teststring();
  28. return 0;
  29. }

说明:上述string类没有显式定义其拷贝构造函数与赋值运算符重载,此时编译器会合成默认的,当用s1构造s2时,编译器会调用默认的拷贝构造。最终导致的问题是,s1、s2共用同一块内存空间,在释放时同一块空间被释放多次而引起程序崩溃,这种拷贝方式,称为浅拷贝

3.2 浅拷贝

浅拷贝:也称位拷贝,编译器只是将对象中的值拷贝过来。如果对象中管理资源,最后就会导致多个对象共享同一份资源,当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该资源已经被释放,以为还有效,所以当继续对资源进项操作时,就会发生发生了访问违规。要解决浅拷贝问题,C++中引入了深拷贝

3.3 深拷贝

如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。

3.3.1 传统版写法的string类

  1. class string
  2. {
  3. public:
  4. string(const char* str = "")//常量字符串默认加\0
  5. {
  6. // 构造string类对象时,如果传递nullptr指针,认为程序非法,此处断言下
  7. if (nullptr == str)
  8. {
  9. assert(false);
  10. return;
  11. }
  12. _str = new char[strlen(str) + 1];
  13. strcpy(_str, str);
  14. }
  15. string(const string& s)
  16. : _str(new char[strlen(s._str) + 1])
  17. {
  18. strcpy(_str, s._str);
  19. }
  20. string& operator=(const string& s)
  21. {
  22. if (this != &s)//防止出现自己给自己拷贝(s3=s3)的时候空间被清理掉
  23. {
  24. char* tmp = new char[strlen(s._str) + 1];//先开辟空间再释放this空间
  25. strcpy(tmp, s._str);
  26. delete[] _str;
  27. _str = tmp;
  28. }
  29. return *this;
  30. }
  31. ~string()
  32. {
  33. if (_str)
  34. {
  35. delete[] _str;
  36. _str = nullptr;
  37. }
  38. }
  39. private:
  40. char* _str;
  41. };

3.3.2 现代版写法的string类

  1. class string
  2. {
  3. public:
  4. string(const char* str = "")
  5. {
  6. if (nullptr == str)
  7. str = "";
  8. _str = new char[strlen(str) + 1];
  9. strcpy(_str, str);
  10. }
  11. //s2(s1)
  12. string(const string& s)
  13. : _str(nullptr)//先把s2置为空指针
  14. {
  15. string tmp(s._str);
  16. swap(_str, tmp._str);
  17. }
  18. string& operator=(string s)
  19. {
  20. swap(_str, s._str);
  21. return *this;
  22. }
  23. ~string()
  24. {
  25. if (_str)
  26. {
  27. delete[] _str;
  28. _str = nullptr;
  29. }
  30. }
  31. private:
  32. char* _str;
  33. };

这里看一个小知识点(C++98中),string类中的swap函数和全局函数的swap函数:

  1. int main()
  2. {
  3. std::string s1("hello world");
  4. std::string s2("111111");
  5. s1.swap(s2);//string提供的swap函数,效率更高--仅仅是对成员变量进行交换即可
  6. swap(s1, s2);//全局函数提供的swap,代价很大--中间进行了三次string的深拷贝过程
  7. return 0;
  8. }

下面来看看std下的string内部存储结构:

  1. class string1
  2. {
  3. private:
  4. char _Buf[16];//字符长度小于16,就是存在这个数组对象中
  5. char* _Ptr;//如果大于等于16,就会去堆上申请
  6. size_t _mySize;
  7. size_t _myRes;
  8. };
  9. int main()
  10. {
  11. string s1("11111");
  12. string s2("111111111111111111111111111111");
  13. cout << sizeof(s1) << endl;//28
  14. cout << sizeof(s2) << endl;//28
  15. return 0;
  16. }

3.4 string类的模拟实现

  1. namespace Bernard
  2. {
  3. class string
  4. {
  5. public:
  6. typedef char* iterator;
  7. typedef const char* const_iterator;
  8. const_iterator begin()const
  9. {
  10. return _str;
  11. }
  12. const_iterator end()const
  13. {
  14. return _str + _size;
  15. }
  16. iterator begin()//第一个位置的指针
  17. {
  18. return _str;
  19. }
  20. iterator end()//最后一个有效数据的下一位的指针
  21. {
  22. return _str + _size;
  23. }
  24. /*string()
  25. :_str(new char[1])
  26. ,_size(0)
  27. ,_capacity(0)
  28. {
  29. _str[0] = '\0';
  30. }*/
  31. string(const char* str = "")//常量字符串默认加\0
  32. :_size(strlen(str))
  33. , _capacity(_size)
  34. {
  35. _str = new char[_capacity + 1];
  36. strcpy(_str, str);
  37. }
  38. ~string()
  39. {
  40. delete[] _str;
  41. _str = nullptr;
  42. _size = _capacity = 0;
  43. }
  44. void Swap(string& s)
  45. {
  46. swap(_str, s._str);
  47. swap(_size, s._size);
  48. swap(_capacity, s._capacity);
  49. }
  50. //s2(s1)
  51. string(const string& s)
  52. :_str(nullptr)
  53. , _size(0)
  54. , _capacity(0)//初始化防止交换过后出现随机值
  55. {
  56. string tmp(s._str);
  57. //this->Swap(tmp);
  58. Swap(tmp);
  59. }
  60. //s1=s3
  61. string& operator=(string& s)
  62. {
  63. Swap(s);
  64. return *this;
  65. }
  66. const char* c_str()const
  67. {
  68. return _str;
  69. }
  70. size_t size()const
  71. {
  72. return _size;
  73. }
  74. char& operator[](size_t pos)//可读可写的方式
  75. {
  76. assert(pos < _size);
  77. return _str[pos];
  78. }
  79. const char& operator[](size_t pos)const//只读的方式
  80. {
  81. assert(pos < _size);
  82. return _str[pos];
  83. }
  84. void reserve(size_t n)//扩容函数
  85. {
  86. if (n > _capacity)
  87. {
  88. char* tmp = new char[n + 1];//要给\0多开一个空间,+1一下
  89. strcpy(tmp, _str);
  90. delete[] _str;
  91. _str = tmp;
  92. _capacity = n;
  93. }
  94. }
  95. void resize(size_t n, char ch = '\0')
  96. {
  97. if (n <= _size)//size小的情况
  98. {
  99. _str[n] = '\0';
  100. _size = n;
  101. }
  102. else//size大的情况
  103. {
  104. if (n > _capacity)//如果n比容量大需要拿来扩容一下
  105. {
  106. reserve(n);
  107. }
  108. memset(_str + _size, ch, n - _size);
  109. _size = n;
  110. _str[_size] = '\0';
  111. }
  112. }
  113. void push_back(char ch)
  114. {
  115. //if (_size == _capacity)
  116. //{
  117. // //增容
  118. // reserve(_capacity == 0 ? 4 : _capacity * 2);
  119. //}
  120. //_str[_size] = ch;//先放入字符
  121. //_size++;
  122. //_str[_size] = '\0';//最后放入\0
  123. insert(_size, ch);//复用insert
  124. }
  125. void append(const char* str)
  126. {
  127. //size_t len = strlen(str);
  128. //if (_size + len > _capacity)
  129. //{
  130. // reserve(_size + len);
  131. //}
  132. //strcpy(_str + _size, str);//直接在\0处开始插入str即可
  133. //_size += len;
  134. insert(_size, str);//复用insert
  135. }
  136. string& operator+=(char ch)//加上一个字符
  137. {
  138. push_back(ch);
  139. return *this;
  140. }
  141. string& operator+=(const char* str)//加上一个字符串
  142. {
  143. append(str);
  144. return *this;
  145. }
  146. size_t find(char ch)
  147. {
  148. for (size_t i = 0; i < _size; i++)
  149. {
  150. if (ch == _str[i])
  151. {
  152. return i;
  153. }
  154. }
  155. return npos;
  156. }
  157. size_t find(const char* str, size_t pos = 0)
  158. {
  159. const char* ptr = strstr(_str + pos, str);
  160. if (ptr == nullptr)
  161. {
  162. return npos;
  163. }
  164. else
  165. {
  166. return ptr - _str;//用找到的起始下标-字符串起始下标就是需要返回的下标
  167. }
  168. }
  169. string& insert(size_t pos, char ch)
  170. {
  171. assert(pos <= _size);
  172. if (_size == _capacity)
  173. {
  174. reserve(_capacity == 0 ? 4 : _capacity * 2);
  175. }
  176. size_t end = _size + 1;
  177. while (end > pos)
  178. {
  179. _str[end] = _str[end - 1];
  180. end--;
  181. }
  182. _str[pos] = ch;
  183. _size++;
  184. return *this;
  185. }
  186. string& insert(size_t pos, const char* str)
  187. {
  188. assert(pos <= _size);
  189. size_t len = strlen(str);
  190. if (_size + len > _capacity)
  191. {
  192. reserve(_size + len+1);//注意这里一定要多给一个位置
  193. }
  194. size_t end = _size + len;
  195. while (end >= pos + len)//注意这个地方的边界控制
  196. {
  197. _str[end] = _str[end - len];
  198. end--;
  199. }
  200. strncpy(_str + pos, str, len);
  201. _size += len;
  202. return *this;
  203. }
  204. string& erase(size_t pos = 0, size_t len = npos)
  205. {
  206. assert(pos < _size);
  207. if (len == npos || pos + len >= _size)//当需要删除的数据长度过大,超过了有效数据的个数时
  208. {
  209. _str[pos] = '\0';//直接在pos位置填\0即可
  210. _size = pos;
  211. }
  212. else
  213. {
  214. strcpy(_str + pos, _str + pos + len);//直接把pos位置后面的值全部拷贝过去即可
  215. _size -= len;
  216. }
  217. }
  218. bool operator<(const string& s)const
  219. {
  220. return strcmp(_str, s._str) < 0;
  221. }
  222. void clear()
  223. {
  224. _str[0]='\0';
  225. _size=0;
  226. }
  227. private:
  228. char* _str;
  229. size_t _size;//有效字符的个数
  230. size_t _capacity;//能存储有效字符的空间数,不包括\0
  231. static const size_t npos;
  232. };
  233. }
  234. const size_t string::npos = -1;//整型的最大值
  235. bool operator<(const string& s1, const string& s2)
  236. {
  237. //size_t i1 = 0, i2 = 0;
  238. //while (i1 < s1.size() && i2 < s2.size())
  239. //{
  240. // if (s1[i1] < s2[i2])
  241. // {
  242. // return true;
  243. // }
  244. // else if (s1[i1] > s2[i2])
  245. // {
  246. // return false;
  247. // }
  248. // else
  249. // {
  250. // i1++;
  251. // i2++;
  252. // }
  253. //}
  254. 三种可能情况
  255. "abcd" "abcd" --false
  256. "abcd" "abcde" --true
  257. "abcde" "abcd" --false
  258. //return i2 < s2.size() ? true : false;//第一种实现方式
  259. strcmp(s1.c_str(), s2.c_str()) < 0;//第二种实现方法
  260. }
  261. bool operator==(const string& s1, const string& s2)
  262. {
  263. return strcmp(s1.c_str(), s2.c_str()) == 0;
  264. }
  265. bool operator<=(const string& s1, const string& s2)
  266. {
  267. return s1 < s2 || s1 == s2;
  268. }
  269. bool operator>(const string& s1, const string& s2)
  270. {
  271. return !(s1 <= s2);
  272. }
  273. bool operator>=(const string& s1, const string& s2)
  274. {
  275. return !(s1 < s2);
  276. }
  277. bool operator!=(const string& s1, const string& s2)
  278. {
  279. return !(s1 == s2);
  280. }
  281. ostream& operator<<(ostream& out, const string& s)
  282. {
  283. /*for (auto ch : s)
  284. {
  285. out << ch;
  286. }*///方法一
  287. for (size_t i = 0; i < s.size(); i++)
  288. {
  289. out << s[i];
  290. }//方法二
  291. //注意不能使用c_str(),因为c_str遇到\0就停止了
  292. return out;
  293. }
  294. istream& operator>>(istream& in, string& s)
  295. {
  296. s.clear();
  297. char ch = in.get();
  298. while (ch != ' ' && ch != '\n')//遇到换行或空格结束
  299. {
  300. s += ch;
  301. ch = in.get();
  302. }
  303. return in;
  304. }

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号