羊村懒王

这个屌丝很懒，什么也没留下！

热门标签

C++之string类(·标准库中的string类·string类的模拟实现)_c++ 在堆上创建 string

作者：羊村懒王 | 2024-04-26 10:30:57

踩

c++ 在堆上创建 string

【本节目标】
·1. 为什么要学习string类
·2. 标准库中的string类
·3. string类的模拟实现

1. 为什么学习string类？

1.1 C语言中的字符串

C语言中，字符串是以'\0'结尾的一些字符的集合，为了操作方便，C标准库中提供了一些str系列的库函数，但是这些库函数与字符串是分离开的，不太符合OOP的思想，而且底层空间需要用户自己管理，稍不留神可能还会越界访问。

2. 标准库中的string类

2.1 string类

1. 字符串是表示字符序列的类
2. 标准的字符串类提供了对此类对象的支持，其接口类似于标准字符容器的接口，但添加了专门用于操作单字节字符字符串的设计特性。
3. string类是使用char(即作为它的字符类型，使用它的默认char_traits和分配器类型(关于模板的更多信息，请参阅basic_string)。
4. string类是basic_string模板类的一个实例，它使用char来实例化basic_string模板类，并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
5. 注意，这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列，这个类的所有成员(如长度或大小)以及它的迭代器，将仍然按照字节(而不是实际编码的字符)来操作。
总结：
1. string是表示字符串的字符串类
2. 该类的接口与常规容器的接口基本相同，再添加了一些专门用来操作string的常规操作。

3. string在底层实际是：basic_string模板类的别名，typedef basic_string<char, char_traits, allocator>string;
4. 不能操作多字节或者变长字符的序列。
在使用string类时，必须包含#include头文件以及using namespace std;

2.2 string类的常用接口说明

1. string类对象的常见构造

(constructor)函数名称功能说明
string() （重点） 构造空的string类对象，即空字符串
string(const char* s) （重点） 用C-string来构造string类对象
string(const string&s) （重点） 拷贝构造函数
string(size_t n, char c) string类对象中包含n个字符c
int main()
{
	string s1; // 构造空的string类对象s1
	string s2("hello bit"); // 用C格式字符串构造string类对象s2
	string s3(s2); // 拷贝构造s3
	return 0;
}

2. string类对象的容量操作

函数名称功能说明
size（重点） 返回字符串有效字符长度
length 返回字符串有效字符长度
capacity 返回空间总大小
empty （重点） 检测字符串释放为空串，是返回true，否则返回false
clear （重点） 清空有效字符
reserve （重点） 为字符串预留空间
resize （重点） 将有效字符的个数改成n个，多出的空间用字符c填充

size，length，capacity，clear的实际应用：

string在VS下的增容：

reserve：开空间，影响容量


void TestPushBackReserve()
{
	string s;
	// 利用reserve提高插入数据的效率，避免增容带来的开销
	s.reserve(100);//申请至少能存储100个字符的空间
	size_t sz = s.capacity();
	cout << "capacity changed: " << sz << '\n';
	cout << "making s grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		//s.push_back('c');
		s += 'c';
		if (sz != s.capacity())
		{
			sz = s.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}

resize：开空间，对这些空间给一个初始值，进行初始化

注意：
1. size()与length()方法底层实现原理完全相同，引入size()的原因是为了与其他容器的接口保持一致，一般情况下基本都是用size()。
2. clear()只是将string中有效字符清空，不改变底层空间大小。
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个，不同的是当字符个数增多时：resize(n)用0来填充多出的元素空间，resize(size_t n, char c)用字符c来填充多出的元素空间。注意：resize在改变元素个数时，如果是将元素个数增多，可能会改变底层容量的大小，如果是将元素个数减少，底层空间总大小不变。
4. reserve(size_t res_arg=0)：为string预留空间，提前就开好了足够的空间，避免增容，不改变有效元素个数，当reserve的参数小于string的底层空间总大小时，reserver不会改变容量大小。

3. string类对象的访问及遍历操作
函数名称功能说明
operator[] （重点） 返回pos位置的字符，const string类对象调用
begin+ end begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器
rbegin + rend begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器
范围for C++11支持更简洁的范围for的新遍历方式


void test_string1()
{
	string s1("hello world");
 
	//遍历字符串:
 
	//方式一：下标+[]
	for (size_t i = 0; i < s1.size(); i++)
	{
		s1[i] += 1;
	}//修改字符串元素
	for (size_t i = 0; i < s1.size(); i++)
	{
		cout << s1[i] << " ";
	}//利用下标+[]遍历打印字符串
	cout << endl;
 
	//方式二：迭代器
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		*it -= 1;
		it++;
	}//利用迭代器修改字符串内容
	it = s1.begin();
	while (it != s1.end())
	{
		cout << *it << " ";
		it++;
	}//利用迭代器遍历打印字符串
	cout << endl;
 
	//方式三：范围for(语法糖)(C++11才可使用)
	//自动往后迭代，自动判断结束
	for (auto& e : s1)
	//注意这里的auto要加上引用,s1把每个字符赋值给e，所以e是s1每个字符的拷贝，对e改变不会改变s1的内容，所以要加上引用
	{
		e -= 1;
	}//利用范围for修改字符串
	for (auto e : s1)//auto自动推导s1的类型
	{
		cout << e << " ";
	}//利用范围for遍历字符串打印
	cout << endl;
 
}

迭代器的思路图解：

反向迭代器：主要用来倒着遍历字符串。


void test_string2()
{
	//反向迭代器
	string s1("hello world");
	//string::reverse_iterator rit = s1.rbegin();
	auto rit = s1.rbegin();//auto自动推导上面的类型
	while (rit != s1.rend())
	{
		cout << *rit << " ";
		rit++;
	}
	cout << endl;
}

迭代器遍历的意义是什么呢？-----所有的容器都可以使用迭代器这种方式去访问修改

对于string，无论是正着遍历，倒着遍历，下标+[]的方式都已经足够方便了。为什么还需要迭代器呢？

对于string，下标+[]的方式就足够好用，可能大家觉得迭代器比较多余。但是如果是其他容器(数据结构)呢？那么下标+[]这种方式似乎就不适用了，所以迭代器才是最通用的方式！

4. string类对象的修改操作

函数名称功能说明
push_back 在字符串后尾插字符c
append 在字符串后追加一个字符串
operator+= (重点) 在字符串后追加字符串str
c_str(重点) 返回C格式字符串
find + npos(重点) 从字符串pos位置开始往后找字符c，返回该字符在字符串中的位置
rfind 从字符串pos位置开始往前找字符c，返回该字符在字符串中的位置
substr 在str中从pos位置开始，截取n个字符，然后将其返回

尾插+=，append，push_back的应用场景：


int main()
{
	string s1;
 
	s1.push_back('a');
	s1.append("bcde");
	cout << s1 << endl;
 
	s1 += ':';
	s1 += "hello world";
	cout << s1 << endl;
 
	return 0;
}

c_str的应用场景：

find+nops,rfind,substr的场景应用：


void test_string4()
{
	string file("test.txt");
	FILE* fout=fopen(file.c_str(), "w");
	//要求取出文件的后缀名
	size_t pos = file.find('.');//从头开始找使用find
	if (pos != string::npos)
	{
		string suffix = file.substr(pos, file.size() - pos);//file.size()-pos=4
		cout << suffix << endl;
	}
 
 
	string file("test.txt.zip");
	FILE* fout = fopen(file.c_str(), "w");
	//要求取出文件的后缀名
	size_t pos = file.rfind('.');//从后面找使用rfind
	if (pos != string::npos)
	{
		string suffix = file.substr(pos, file.size() - pos);//file.size()-pos=4
		cout << suffix << endl;
	}
 
	//上面两个查找类似于char * strstr ( const char *str2, const char * str1)的C库函数
}


void test_string5()
{
	//find的第二个作用实例:
	string url("http://www.cplusplus.com/reference/string/string/?kw=string");
	size_t pos1 = url.find(':');
	string protocol = url.substr(0, pos1 - 0);
	cout << protocol << endl;
 
	//如何去取中间的域名？
	size_t pos2 = url.find('/', pos1 + 3);//pos1+3是从w开始找,找到/位置为止
	string domainName = url.substr(pos1 + 3, pos2 - (pos1 + 3));
	cout << domainName << endl;
 
	string usi = url.substr(pos2 + 1);
	cout << usi << endl;
}

除了尾插的+=，append，push_back之外，还有insert可以进行头插和中间插入，但是效率很低，尽量少用。

还有erase的头删尾删字符删除场景：

5. string类非成员函数

函数功能说明
operator+ 尽量少用，因为传值返回，导致深拷贝效率低
operator>> （重点） 输入运算符重载
operator<< （重点） 输出运算符重载
getline （重点） 获取一行字符串
relational operators （重点） 大小比较
int main()
{
    string s;
    //cin>>s;//cin和scnaf默认以空格或换行符为间隔
    getline(cin,s);//获取一行字符串
}

3. string类的模拟实现

3.1 经典的string类问题

上面已经对string类进行了简单的介绍，大家只要能够正常使用即可。接下来自己来模拟实现string类，最主要是实现string类的构造、拷贝构造、赋值运算符重载以及析构函数。大家看下以下string类的实现是否有问题？


namespace Bernard
{
	class string
	{
	public:
		string(const char* str)
			:_str(new char[strlen(str)+1])
		{
			strcpy(_str, str);
		}
		~string()
		{
			delete[] _str;
			_str = nullptr;
		}
	private:
		char* _str;
	};
	void Teststring()
	{
		string s1("hello bit!!!");
		string s2(s1);
	}
}
int main()
{
	Bernard::Teststring();
	return 0;
}

说明：上述string类没有显式定义其拷贝构造函数与赋值运算符重载，此时编译器会合成默认的，当用s1构造s2时，编译器会调用默认的拷贝构造。最终导致的问题是，s1、s2共用同一块内存空间，在释放时同一块空间被释放多次而引起程序崩溃，这种拷贝方式，称为浅拷贝。

3.2 浅拷贝

浅拷贝：也称位拷贝，编译器只是将对象中的值拷贝过来。如果对象中管理资源，最后就会导致多个对象共享同一份资源，当一个对象销毁时就会将该资源释放掉，而此时另一些对象不知道该资源已经被释放，以为还有效，所以当继续对资源进项操作时，就会发生发生了访问违规。要解决浅拷贝问题，C++中引入了深拷贝。

3.3 深拷贝

如果一个类中涉及到资源的管理，其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。

3.3.1 传统版写法的string类


class string
{
public:
	string(const char* str = "")//常量字符串默认加\0了
	{
		// 构造string类对象时，如果传递nullptr指针，认为程序非法，此处断言下
		if (nullptr == str)
		{
			assert(false);
			return;
		}
		_str = new char[strlen(str) + 1];
		strcpy(_str, str);
	}
	string(const string& s)
		: _str(new char[strlen(s._str) + 1])
	{
		strcpy(_str, s._str);
	}
	string& operator=(const string& s)
	{
		if (this != &s)//防止出现自己给自己拷贝(s3=s3)的时候空间被清理掉
		{
			char* tmp = new char[strlen(s._str) + 1];//先开辟空间再释放this空间
			strcpy(tmp, s._str);
			delete[] _str;
			_str = tmp;
		}
		return *this;
	}
	~string()
	{
		if (_str)
		{
			delete[] _str;
			_str = nullptr;
		}
	}
private:
	char* _str;
};

3.3.2 现代版写法的string类


class string
{
public:
	string(const char* str = "")
	{
		if (nullptr == str)
			str = "";
		_str = new char[strlen(str) + 1];
		strcpy(_str, str);
	}
	//s2(s1)
	string(const string& s)
		: _str(nullptr)//先把s2置为空指针
	{
		string tmp(s._str);
		swap(_str, tmp._str);
	}
	string& operator=(string s)
	{
		swap(_str, s._str);
		return *this;
	}
	~string()
	{
		if (_str)
		{
			delete[] _str;
			_str = nullptr;
		}
	}
private:
	char* _str;
};

这里看一个小知识点(C++98中)，string类中的swap函数和全局函数的swap函数:


int main()
{
	std::string s1("hello world");
	std::string s2("111111");
 
	s1.swap(s2);//string提供的swap函数,效率更高--仅仅是对成员变量进行交换即可
	swap(s1, s2);//全局函数提供的swap,代价很大--中间进行了三次string的深拷贝过程
 
	return 0;
}

下面来看看std下的string内部存储结构：


class string1
{
private:
	char _Buf[16];//字符长度小于16，就是存在这个数组对象中
	char* _Ptr;//如果大于等于16，就会去堆上申请
	size_t _mySize;
	size_t _myRes;
};
int main()
{
	string s1("11111");
	string s2("111111111111111111111111111111");
	cout << sizeof(s1) << endl;//28
	cout << sizeof(s2) << endl;//28
	return 0;
}

3.4 string类的模拟实现


namespace Bernard
{
	class string
	{
	public:
		typedef char* iterator;
		typedef const char* const_iterator;
		const_iterator begin()const
		{
			return _str;
		}
		const_iterator end()const
		{
			return _str + _size;
		}
		iterator begin()//第一个位置的指针
		{
			return _str;
		}
		iterator end()//最后一个有效数据的下一位的指针
		{
			return _str + _size;
		}
		/*string()
			:_str(new char[1])
			,_size(0)
			,_capacity(0)
		{
			_str[0] = '\0';
		}*/
		string(const char* str = "")//常量字符串默认加\0了
			:_size(strlen(str))
			, _capacity(_size)
		{
			_str = new char[_capacity + 1];
			strcpy(_str, str);
		}
		~string()
		{
			delete[] _str;
			_str = nullptr;
			_size = _capacity = 0;
		}
		void Swap(string& s)
		{
			swap(_str, s._str);
			swap(_size, s._size);
			swap(_capacity, s._capacity);
		}
		//s2(s1)
		string(const string& s)
			:_str(nullptr)
			, _size(0)
			, _capacity(0)//初始化防止交换过后出现随机值
		{
			string tmp(s._str);
			//this->Swap(tmp);
			Swap(tmp);
		}
		//s1=s3
		string& operator=(string& s)
		{
			Swap(s);
			return *this;
		}
		const char* c_str()const
		{
			return _str;
		}
		size_t size()const
		{
			return _size;
		}
		char& operator[](size_t pos)//可读可写的方式
		{
			assert(pos < _size);
			return _str[pos];
		}
		const char& operator[](size_t pos)const//只读的方式
		{
			assert(pos < _size);
			return _str[pos];
		}
		void reserve(size_t n)//扩容函数
		{
			if (n > _capacity)
			{
				char* tmp = new char[n + 1];//要给\0多开一个空间,+1一下
				strcpy(tmp, _str);
				delete[] _str;
				_str = tmp;
				_capacity = n;
			}
		}
		void resize(size_t n, char ch = '\0')
		{
			if (n <= _size)//比size小的情况
			{
				_str[n] = '\0';
				_size = n;
			}
			else//比size大的情况
			{
				if (n > _capacity)//如果n比容量大需要拿来扩容一下
				{
					reserve(n);
				}
				memset(_str + _size, ch, n - _size);
				_size = n;
				_str[_size] = '\0';
			}
		}
		void push_back(char ch)
		{
			//if (_size == _capacity)
			//{
			//	//增容
			//	reserve(_capacity == 0 ? 4 : _capacity * 2);
			//}
			//_str[_size] = ch;//先放入字符
			//_size++;
			//_str[_size] = '\0';//最后放入\0
			insert(_size, ch);//复用insert
		}
		void append(const char* str)
		{
			//size_t len = strlen(str);
			//if (_size + len > _capacity)
			//{
			//	reserve(_size + len);
			//}
			//strcpy(_str + _size, str);//直接在\0处开始插入str即可
			//_size += len;
			insert(_size, str);//复用insert
		}
		string& operator+=(char ch)//加上一个字符
		{
			push_back(ch);
			return *this;
		}
		string& operator+=(const char* str)//加上一个字符串      
		{
			append(str);
			return *this;
		}
		size_t find(char ch)
		{
			for (size_t i = 0; i < _size; i++)
			{
				if (ch == _str[i])
				{
					return i;
				}
			}
			return npos;
		}
		size_t find(const char* str, size_t pos = 0)
		{
			const char* ptr = strstr(_str + pos, str);
			if (ptr == nullptr)
			{
				return npos;
			}
			else
			{
				return ptr - _str;//用找到的起始下标-字符串起始下标就是需要返回的下标
			}
		}
		string& insert(size_t pos, char ch)
		{
			assert(pos <= _size);
			if (_size == _capacity)
			{
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}
			size_t end = _size + 1;
			while (end > pos)
			{
				_str[end] = _str[end - 1];
				end--;
			}
			_str[pos] = ch;
			_size++;
			return *this;
		}
		string& insert(size_t pos, const char* str)
		{
			assert(pos <= _size);
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				reserve(_size + len+1);//注意这里一定要多给一个位置
			}
			size_t end = _size + len;
			while (end >= pos + len)//注意这个地方的边界控制
			{
				_str[end] = _str[end - len];
				end--;
			}
			strncpy(_str + pos, str, len);
			_size += len;
			return *this;
		}
		string& erase(size_t pos = 0, size_t len = npos)
		{
			assert(pos < _size);
			if (len == npos || pos + len >= _size)//当需要删除的数据长度过大，超过了有效数据的个数时
			{
				_str[pos] = '\0';//直接在pos位置填\0即可
				_size = pos;
			}
			else
			{
				strcpy(_str + pos, _str + pos + len);//直接把pos位置后面的值全部拷贝过去即可
				_size -= len;
			}
		}
		bool operator<(const string& s)const
		{
			return strcmp(_str, s._str) < 0;
		}
        void clear()
        {
            _str[0]='\0';
            _size=0;
        }    
	private:
		char* _str;
		size_t _size;//有效字符的个数
		size_t _capacity;//能存储有效字符的空间数，不包括\0
		static const size_t npos;
	};
}
const size_t string::npos = -1;//整型的最大值
bool operator<(const string& s1, const string& s2)
{
	//size_t i1 = 0, i2 = 0;
	//while (i1 < s1.size() && i2 < s2.size())
	//{
	//	if (s1[i1] < s2[i2])
	//	{
	//		return true;
	//	}
	//	else if (s1[i1] > s2[i2])
	//	{
	//		return false;
	//	}
	//	else
	//	{
	//		i1++;
	//		i2++;
	//	}
	//}
	三种可能情况
	"abcd" "abcd" --false
	"abcd" "abcde" --true
	"abcde" "abcd" --false
	//return i2 < s2.size() ? true : false;//第一种实现方式
	strcmp(s1.c_str(), s2.c_str()) < 0;//第二种实现方法
}
bool operator==(const string& s1, const string& s2)
{
	return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool operator<=(const string& s1, const string& s2)
{
	return s1 < s2 || s1 == s2;
}
bool operator>(const string& s1, const string& s2)
{
	return !(s1 <= s2);
}
bool operator>=(const string& s1, const string& s2)
{
	return !(s1 < s2);
}
bool operator!=(const string& s1, const string& s2)
{
	return !(s1 == s2);
}
ostream& operator<<(ostream& out, const string& s)
{
	/*for (auto ch : s)
	{
		out << ch;
	}*///方法一
	for (size_t i = 0; i < s.size(); i++)
	{
		out << s[i];
	}//方法二
	//注意不能使用c_str(),因为c_str遇到\0就停止了
	return out;
}
istream& operator>>(istream& in, string& s)
{
    s.clear();
	char ch = in.get();
	while (ch != ' ' && ch != '\n')//遇到换行或空格结束
	{
		s += ch;
		ch = in.get();
	}
	return in;
}

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】