当前位置:   article > 正文

应用层协议HTTP与HTTPS

应用层协议HTTP与HTTPS

HTTP与HTTPS的介绍

HTTP(Hypertext Transfer Protocol,超文本传输协议)和HTTPS(Hypertext Transfer Protocol Secure,超文本传输安全协议)都是用于在Web上传输数据的协议,但它们之间存在一些重要的差异,特别是在安全性和加密方面。

  • HTTP:是不安全的,传输的数据都是未加密的明文。这意味着在传输过程中,任何在路径上的设备都可以读取或篡改数据。
  • HTTPS:是安全的,通过传输加密和身份认证保证了传输过程的安全性。HTTPS在HTTP的基础上加入了SSL/TLS协议,SSL/TLS协议负责数据的加密和解密,以及服务器身份验证和消息完整性检查。
  • HTTP:不需要证书和密钥。
  • HTTPS:使用SSL/TLS协议进行通信时,服务器需要提供一个证书来证明其身份。这个证书是由一个受信任的证书颁发机构(CA)签发的。同时,服务器和客户端还会协商一个会话密钥,用于后续通信的加密和解密。

 

HTTP协议

认识URL

我们平时说的网址就是URL:

https://mp.csdn.net/mp_blog/creation/editor/139219562?spm=1001.2014.3001.4503

但是现在几乎都是更加安全的HTTPS协议

  • https://就是协议方案名。//用于协议与域名的分隔符
  • mp.csdn.net就是服务器地址,也就是域名,一般通过应用层协议DNS进行域名解析成我们的IP地址。
  • 还有省略的端口号,HTTP:通常默认使用80端口,HTTPS:通常默认使用443端口。
  • /mp_blog/creation/editor/139219562表示的就是后端Linux服务器上的路径,但是最前面的/并不一定表示的是根目录,而是web根目录。/同时也作为域名和路径的分隔符。
  • ?spm=1001.2014.3001.4503这里?隔开,后面spm表示的是参数名,后面一串是参数的内容。如果有多组参数就用&符号作为参数间隔。

 URL的编码与解码

 因为我们的URL中是含有特殊的分割字符的,如:/?等这样的字符,所以URL中不能随意的出现类似于这种特殊字符,如果某个参数中需要带有这样的字符,就必须先对这些字符进行转义。

转移规则:将需要转码的字符转为16进制,然后从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格

HTTP协议的内容

HTTP请求协议内容

  1. POST /index.html HTTP/1.1
  2. Host: www.example.com
  3. Content-Length: 15
  4. User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3
  5. Content-Type: application/x-www-form-urlencoded
  6. Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
  7. Referer: http://www.example.com/index.html
  8. Accept-Encoding: gzip, deflate, sdch, br
  9. Accept-Language: en-US,en;q=0.8
  10. Cookie: name=value; name2=value2
  11. username=alice&password=secret

第一行是请求行内容。

请求行包含三个主要部分:HTTP方法、请求资源的URL和HTTP协议版本。

第二行开始到空行是请求头。

请求头包含一系列的字段,每个字段都包含一个名字和一个值,它们之间用冒号(:)分隔。

空行后面的内容就是请求体。

请求体不是每个HTTP请求都必需的,它通常用于POST和PUT等请求中,以发送数据给服务器。请求体的格式取决于Content-Type头字段的值。而当前请求体是一个表单数据,它包含了用户名(username)和密码(password)两个字段。

每一行的数据结尾用\r\n作为换行

 请求资源的URL

当我们通过访问http协议资源时,是通过IP和端口port与请求URL来访问服务器指定路径下的资源的,我服务器运行起来其实就是一个进程,而该进程并不一定是在根目录下执行的,而我们服务器一般会创建一个主文件夹,其中存放有我们所需要访问的资源数据,而该主文件夹就是web根目录,所以当服务端接收到客户端访问的URL时就可以进行路径解析,然后到指定web下的路径中读取资源内容并返回。

HTTP响应协议内容

  1. HTTP/1.1 200 OK
  2. Content-Type: text/html; charset=utf-8
  3. Content-Length: 1234
  4. Server: Apache/2.4.41 (Unix)
  5. Date: Mon, 21 Oct 2023 13:12:00 GMT
  6. <html>
  7. <head>
  8. <title>Welcome</title>
  9. </head>
  10. <body>
  11. <h1>Hello, World!</h1>
  12. </body>
  13. </html>

第一行是状态行内容。

状态行包含三个主要部分:HTTP协议版本、状态码以及状态消息。

第二行开始到空行是响应头。

响应头包含一系列的字段,每个字段都包含一个名字和一个值,它们之间用冒号(:)分隔。

空行后面的内容就是响应体。

响应体是服务器返回给客户端的实际数据。它可能包含HTML、XML、JSON、纯文本、图片、视频等多种类型的数据。响应体的内容和格式由Content-Type头字段决定。其实准确说响应体的内容就是客户端访问服务器指定路径下的文件信息。

每一行的数据结尾用\r\n作为换行

 

请求协议解析代码 

请求和响应代码是源自同一个头文件Http_protocol.hpp中:

  1. #pragma once
  2. #include "socket.h"
  3. #include <sstream>
  4. #include <fstream>
  5. const string http_sep = "\r\n";
  6. const string wwwroot = "./www.root"; // 这就是url下的根目录/
  7. const string homepage = "index.html"; // 访问根目录下的默认文件
  8. class HttpRequest
  9. {
  10. bool Get_line(string &request, string &ret) // 实现读取每一行数据的功能
  11. {
  12. int pos = request.find(http_sep);
  13. if (pos == string::npos)
  14. return false;
  15. ret = request.substr(0, pos);
  16. request.erase(0, pos + http_sep.size());
  17. return true;
  18. }
  19. public:
  20. HttpRequest()
  21. : _req_blank(http_sep), _targetpath(wwwroot)
  22. {
  23. }
  24. void Parse_reqline() // 分析请求行,并根据url确定路径_targetpath
  25. {
  26. //_method _url _http_version
  27. stringstream ss(_req_line);
  28. ss >> _method >> _url >> _http_version; // 以空格作为分隔符一次放到三个string流中
  29. // 路径解析
  30. if (_url == "/")
  31. {
  32. _targetpath += "/" + homepage;
  33. }
  34. else // 粗略处理
  35. {
  36. _targetpath += _url;
  37. }
  38. }
  39. void Parse_suffix() // 解析url下的指定文件类型即后缀
  40. {
  41. //_targetpath: www.root/image/1.jpg
  42. int pos = _targetpath.rfind('.');
  43. if (pos == string::npos)
  44. _suffix = "未知类型";
  45. else
  46. _suffix = _targetpath.substr(pos);
  47. }
  48. void parse() // 报文分析
  49. {
  50. // 1.分析请求行,同时提取url路径
  51. Parse_reqline();
  52. // 2.解析url下的指定文件类型即后缀
  53. Parse_suffix();
  54. }
  55. string Get_filecontent_func(string path) // 读取指定路径下的数据
  56. {
  57. ifstream in(path, ios::binary); // 按照二进制方式来读取
  58. if (!in.is_open())
  59. return "";
  60. string ret;
  61. // a.读取一般非二进制数据的方法
  62. // string line;
  63. // while (getline(in, line))
  64. // {
  65. // ret += line;
  66. // }
  67. // getline不能拿来读取二进制文件
  68. // 1.换行符问题 2.编码问题 3.性能问题
  69. // b.读取二进制数据
  70. in.seekg(0, in.end); // 文件流偏移到结尾数
  71. int file_size = in.tellg(); // 读取文件大小
  72. in.seekg(0, in.beg); // 回到文件开头指向
  73. ret.resize(file_size);
  74. in.read((char *)ret.c_str(), file_size);
  75. in.close();
  76. return ret;
  77. }
  78. string Get_filecontent()
  79. {
  80. return Get_filecontent_func(_targetpath);
  81. }
  82. string Get_404()
  83. {
  84. return Get_filecontent_func("www.root/404.html");
  85. }
  86. void Deserialize(string &request) // 反序列化
  87. {
  88. Get_line(request, _req_line);
  89. string line;
  90. while (1)
  91. {
  92. bool ok = Get_line(request, line);
  93. if (ok && line.empty()) // 读到空行,即报头解析完毕
  94. {
  95. _req_content = request; // 空行后面就是实际内容
  96. break;
  97. }
  98. else if (ok && !line.empty()) // 读取报头数据
  99. {
  100. _req_header.push_back(line);
  101. }
  102. else
  103. break;
  104. }
  105. }
  106. string Url()
  107. {
  108. return _url;
  109. }
  110. string Path()
  111. {
  112. return _targetpath;
  113. }
  114. string Suffix()
  115. {
  116. return _suffix;
  117. }
  118. void my_debug()
  119. {
  120. cout << "------------------------------------" << endl;
  121. cout << "_req_line-> " << _req_line << endl;
  122. for (auto s : _req_header)
  123. {
  124. cout << "_req_header-> " << s << endl;
  125. }
  126. cout << "_req_blank-> " << _req_blank << endl;
  127. cout << "_req_content-> " << _req_content << endl;
  128. cout << "------------------------------------" << endl;
  129. }
  130. private:
  131. // 报文字段
  132. string _req_line; // 请求行(请求方法,url,http版本)
  133. vector<string> _req_header; // 请求报头
  134. string _req_blank; // 空行(区分请求报头和有效载荷的,载荷长度就在报头中解析得到)
  135. string _req_content; // 有效载荷
  136. private: // 解析请求行字段
  137. //_method _url _http_version
  138. string _method;
  139. string _url;
  140. string _http_version;
  141. string _targetpath; // url指定路径
  142. string _suffix; // 通过url确定访问的文件后缀
  143. };

响应协议包装代码

  1. const string blank_sep = " ";
  2. const string line_sep = "\r\n";
  3. class HttpRsponse
  4. {
  5. public:
  6. HttpRsponse()
  7. : _http_version("Http/1.0"), _status_code(200), _statuscode_desc("OK"), _rsp_blank(line_sep)
  8. {}
  9. void Set_statuscode(int code)
  10. {
  11. _status_code = code;
  12. }
  13. void Set_statuscode_desc(string s)
  14. {
  15. _statuscode_desc = s;
  16. }
  17. string Serialize(const string &httpheader, const string &content)
  18. {
  19. // 1.添加状态行数据、报头数据、换行、正文
  20. _status_line = _http_version + blank_sep + to_string(_status_code) + blank_sep + _statuscode_desc + line_sep;
  21. string rsp_content = _status_line + httpheader + line_sep + "\r\n" + content;
  22. return rsp_content;
  23. }
  24. ~HttpRsponse() {}
  25. private:
  26. string _status_line; // 状态行(响应行)
  27. vector<string> _rsp_header; // 响应报头
  28. string _rsp_blank; // 空行
  29. string _rsp_content; // 正文
  30. private:
  31. //_http_version _status_code _statuscode_desc
  32. string _http_version; // 版本
  33. int _status_code; // 状态码
  34. string _statuscode_desc; // 状态码描述
  35. };

 请求方法get/post

请求协议资源中的第一行请求行内容的第一个字段就是请求方法,而我们最常用的请求方法就是get/post方法。get通常用来获取资源,但是也可以上传资源;而post通常用来上传资源。一般不写提交方法时,默认都是get方法。

 我们通过表单来认识get与post方法:

创建表单并使用get方法

  1. <html>
  2. <meta charset="UTF-8"> <!-- 正确的汉字编码 -->
  3. <!-- <form action="dira/dirb/ab.html" method="post"> -->
  4. <!-- 表单内容会被提交并跳转到action,action指定了某个服务器脚本(子进程)来处理被提交表单 -->
  5. <form action="dira/dirb/ab.html" method="get">
  6. First name:<br>
  7. <input type="text" name="my_name" value="aaaaaa"> <!-- text指的是文本,右边给的是缺省值 -->
  8. <br>
  9. Last name:<br>
  10. <input type="password" name="my_password" value="">
  11. <br><br>
  12. <input type="submit" value="登录">
  13. </form>
  14. </html>

 

可以发现使用get方法时,在表单中填入的数据并登录以后,数据都通过?衔接回显到url上了 


使用post方法

 

 不难发现,post方法并没有将表单数据回显到url中,而是将数据回显到请求协议内容中的正文字段。所以正常情况下一个请求 默认情况下是没有正文的,除非用post传参,正文就可以有内容。

 

 get/post总结
  • get通过url传参;post通过请求正文传参
  • get传参到url时会受到字节个数的限制;而post传参到正文中无字节的限制
  • get私密性更差,会将参数直接传递到url上,可以直接看到;而post方法相对好一点,会将参数传递到正文,但是通过请求协议的数据抓包也可以查看到。

 状态码

 例如典型的状态码404:打开文件失败,文件不存在。状态码200:请求正常处理……

所以当我们接收到请求内容时,服务端可以根据客户端访问的数据来进行返回对应的状态码和状态码描述。


307状态码

当我们将状态码设置为307时,此时就代表着进行临时重定向,是通过响应报头location的值来确定具体重定向到哪个新的网址。也就是进行网页跳转。类似于在进入一个全新的网站时会优先跳转到登录界面、摇一摇转其他软件……

301状态码

而301状态码是永久重定向。我们要知道网页中是存在很多链接的,例如我们进入csdn中,有写博客功能,刷知识点,浏览大佬的博客……其实都是一个界面上打包好的一个个链接,点进去就会跳转到一个新的界面。这其实就有点像一个多叉树的结构。例如当我们搜索引擎获取网页时,该网页与很多的url相对应,但是如果我们的网页过期了,那么返回301时location就会更新链接,也就是搜索引擎不在用老的链接了,而是新的链接。

协议字段cookie

Http是无连接无状态的。也就是说客户端访问服务器的时候是没有记录的,也就是不会保存你的个人登录信息,相当于每次切换网页都要重新进行登录。这其实就是因为每个人的登录信息不同,所对应的权限使用功能也不同,例如VIP用户和非VIP用户的区别,所以就有了cookie字段用来记录个人登录信息。

全过程就是:当浏览器获取登录页面时需要在表单上输入用户名和密码,然后就会将输入的数据信息回显到请求协议的正文字段(post方法),服务端就可以通过解析请求协议的字段拿到用户信息,然后将用户的信息保存到set-cookie字段并保存到后端数据库中,此时就能够记录当前用户。

而且浏览器(客户端)也会自动保存个人信息到请求协议中的cookie字段,浏览器保存cookie有文件级和内存级两种保存方式,一般都是采用文件级的方式进行保存。


但是一般cookie字段信息太过于暴露,所以就有session字段,session是一个结构体,其中保存了cookie里的信息,并且是一组键值对的数据,sessionid-session的字段,sessionid就是表示着具体的session字段信息,sessionid就是一串数字。而且一个服务器上会存在大量的登录用户,所以就需要管理session结构体:

  1. #include <iostream>
  2. #include <string>
  3. #include <unordered_map>
  4. #include <memory>
  5. using namespace std;
  6. // 先描述
  7. class Session
  8. {
  9. public:
  10. Session(const string &username, const string &password, const int &status)
  11. {}
  12. private:
  13. string _username;
  14. string _password;
  15. int _status;
  16. };
  17. // 类对象作为成员一般可以设成智能指针
  18. using Session_ptr = unique_ptr<Session>;
  19. // 再组织
  20. class Session_manage
  21. {
  22. string Generate_id(const string &username, const int &status)
  23. {}
  24. public:
  25. string Addsession(const string &username, const string &password, const int &status) // 返回sessionid
  26. {}
  27. void Delsession(const string &id)
  28. {}
  29. void Chgsession(const string &id)
  30. {}
  31. bool Searchsession(const string &id)
  32. {}
  33. private:
  34. // sessionid Session_ptr
  35. unordered_map<string, Session_ptr> _sessions;
  36. };

服务端响应字段代码

  1. #include "Tcpserver.hpp"
  2. #include "Http_protocol.hpp"
  3. // Http协议(无连接,无状态)
  4. string Suffixtotype(const string &suffix) // 通过后缀确定文件类型
  5. {
  6. if (suffix == ".html" || suffix == ".htm")
  7. return "text/html";
  8. else if (suffix == ".png")
  9. return "application/x-png";
  10. else if (suffix == ".jpg")
  11. return "image/jpeg";
  12. else
  13. return "no-entering";
  14. }
  15. string Codetodesc(int code) // 状态码转换成对应的状态码描述
  16. {
  17. switch (code)
  18. {
  19. case 200:
  20. return "OK";
  21. case 301:
  22. return "Move permanently";
  23. case 302:
  24. return "Redirect";
  25. case 307:
  26. return "Temporary Redirect";
  27. case 403:
  28. return "Forbidden";
  29. case 404:
  30. return "Not Found";
  31. case 504:
  32. return "Bad Gateway";
  33. default:
  34. return "unknow";
  35. }
  36. }
  37. string deal(string &s) // 服务端处理客户端信息
  38. {
  39. // !!!对收到的客户端数据信息做解析并打包返回
  40. HttpRequest req;
  41. // 1.反序列化(就是隔离请求行,请求报头,有效载荷)
  42. req.Deserialize(s);
  43. // 2.解析请求行内容并提取url路径
  44. req.parse();
  45. cout<<req.Url()<<endl;
  46. // 3.在URL目录下读取数据客户端访问想要的信息
  47. string content = req.Get_filecontent();
  48. // 4.构建响应
  49. HttpRsponse rsp;
  50. if (content.empty()) // 如果读取的文件数据为空
  51. {
  52. content = req.Get_404();
  53. rsp.Set_statuscode(404);
  54. rsp.Set_statuscode_desc(Codetodesc(404));
  55. }
  56. string httpheader = "Content-Length: " + to_string(content.size()) + "\r\n"
  57. + "Content-Type: " + Suffixtotype(req.Suffix()) + "\r\n"
  58. + "Location: https://www.baidu.com/"+"\r\n";
  59. //当识别到状态码为307,则表明是临时重定向到location下的网址,浏览器此时提取location字段后发生二次请求
  60. //307一般用来临时页面跳转,例如软件界面的广告
  61. //301是永久性重定向移动,请求资源已被永久的移动到新的url,浏览器会自动定向到新的url
  62. //a.http无状态-cookie(用来保存客户的登录信息,登陆之后,浏览器自动填充cookie)
  63. //b.还有一种方式是将session(保存客户端登录信息)与sessionid(随机数)构成映射,所以就直接返回sessionid给客户端
  64. string cookie_name="Set-Cookie: username=chenrui\r\n";
  65. string cookie_passeord="Set-Cookie: password=666666\r\n";
  66. string cookie_status="Set-Cookie: status=login\r\n";
  67. httpheader+=cookie_name+cookie_passeord+cookie_status;
  68. string rsp_content = rsp.Serialize(httpheader, content);
  69. req.my_debug(); // 打印客户端信息
  70. return rsp_content;
  71. }
  72. int main(int argc, char *argv[])
  73. {
  74. if (argc != 2)
  75. {
  76. cout << "格式错误\n正确格式:" << argv[0] << " port"
  77. << endl;
  78. }
  79. uint16_t port = atoi(argv[1]);
  80. // tcp_server tsv(port);
  81. unique_ptr<Tcp_server> tsv(new Tcp_server(port, deal)); // 创建套接字,且绑定并监听
  82. tsv->loop(); // accept等待客户端套接字连接
  83. }

socket代码tcp

  1. #pragma once
  2. #include <iostream>
  3. #include <cstdint>
  4. #include <string>
  5. #include<vector>
  6. #include <sys/types.h>
  7. #include <sys/socket.h>
  8. #include <netinet/in.h>
  9. #include <arpa/inet.h>
  10. #include <unistd.h>
  11. #include <stdlib.h>
  12. #include <string.h>
  13. #include <thread>
  14. #include <functional>
  15. #include <memory>
  16. using namespace std;
  17. #define default_backlog 5
  18. // 设计模式:模版方法类
  19. class my_socket // 抽象类
  20. {
  21. public:
  22. virtual void Creat_socket() = 0; // 纯虚函数,必须重写
  23. virtual void Bind(int port) = 0;
  24. virtual void Listen(int backlog) = 0;
  25. virtual my_socket *Accept(string &ip, uint16_t &port) = 0;
  26. virtual void Connect(string ip, uint16_t port) = 0;
  27. virtual int Get_sockfd() = 0;
  28. virtual void Close() = 0;
  29. virtual void Recv(string &ret, int len) = 0;
  30. virtual void Send(string s) = 0;
  31. public:
  32. void tcpserver_socket(uint16_t port, int backlog = default_backlog)
  33. {
  34. Creat_socket();
  35. Bind(port);
  36. Listen(backlog);
  37. // 因为服务会返回的执行accept获取连接,所以选择分离
  38. }
  39. void tcpclient_socket(string ip, uint16_t port)
  40. {
  41. Creat_socket();
  42. Connect(ip, port);
  43. }
  44. };
  45. class tcp_socket : public my_socket // 继承并重写虚函数
  46. {
  47. public:
  48. tcp_socket()
  49. {
  50. }
  51. tcp_socket(int sockfd)
  52. : _sockfd(sockfd)
  53. {
  54. }
  55. virtual void Creat_socket()
  56. {
  57. _sockfd = socket(AF_INET, SOCK_STREAM, 0);
  58. if (_sockfd < 0)
  59. {
  60. cerr << "创建套接字失败" << endl;
  61. exit(-1);
  62. }
  63. }
  64. virtual void Bind(int port)
  65. {
  66. struct sockaddr_in local;
  67. local.sin_family = AF_INET;
  68. local.sin_port = htons(port);
  69. local.sin_addr.s_addr = INADDR_ANY;
  70. int n = bind(_sockfd, (sockaddr *)&local, sizeof(local));
  71. if (n < 0)
  72. {
  73. cerr << "绑定套接字失败" << endl;
  74. exit(-1);
  75. }
  76. }
  77. virtual void Listen(int backlog)
  78. {
  79. int n = listen(_sockfd, backlog);
  80. if (n == -1)
  81. {
  82. cerr << "监听套接字失败" << endl;
  83. exit(-1);
  84. }
  85. }
  86. virtual my_socket *Accept(string &ip, uint16_t &port)
  87. {
  88. while (1)
  89. {
  90. struct sockaddr_in client;
  91. socklen_t len = sizeof(client);
  92. int newsockfd = accept(_sockfd, (sockaddr *)&client, &len); // 监听套接字不关闭,可以用来接收多个客户端的连接
  93. if (newsockfd < 0)
  94. {
  95. cerr << "获取连接失败" << endl;
  96. }
  97. port = ntohs(client.sin_port);
  98. char buffer[64];
  99. inet_ntop(AF_INET, &client.sin_addr, buffer, sizeof(buffer)); // 1.网络转本机 2.4字节ip转字符串ip
  100. ip = buffer;
  101. if (newsockfd < 0)
  102. {
  103. cerr << "接收套接字失败" << endl;
  104. }
  105. else
  106. cout << "接收套接字成功" << endl;
  107. return new tcp_socket(newsockfd);
  108. }
  109. }
  110. virtual void Connect(string ip, uint16_t port)
  111. {
  112. struct sockaddr_in server;
  113. server.sin_family = AF_INET; // socket inet(ip) 协议家族,绑定网络通信的信息
  114. server.sin_port = htons(port); // 将主机端口号转成网络
  115. // server.sin_addr.s_addr = inet_addr(ip.c_str()); // 转成网络序列的四字节ip
  116. inet_pton(AF_INET, ip.c_str(), &server.sin_addr); // 转成网络序列的四字节ip
  117. int n = connect(_sockfd, (sockaddr *)&server, sizeof(server)); // 自动bind
  118. if (n != 0)
  119. {
  120. cerr << "连接失败" << endl;
  121. exit(-1);
  122. }
  123. else
  124. cout << "连接成功" << endl;
  125. }
  126. virtual int Get_sockfd()
  127. {
  128. return _sockfd;
  129. }
  130. virtual void Close()
  131. {
  132. if (_sockfd > 0)
  133. close(_sockfd);
  134. }
  135. virtual void Recv(string &ret, int len)
  136. {
  137. char stream_buffer[len];
  138. int n = recv(_sockfd, stream_buffer, len - 1, 0);
  139. if (n > 0)
  140. {
  141. stream_buffer[n] = 0;
  142. ret += stream_buffer; // ret在读取之前可能还有内容残留
  143. }
  144. else
  145. {
  146. exit(0);
  147. }
  148. }
  149. virtual void Send(string s)
  150. {
  151. send(_sockfd, s.c_str(), s.size(), 0);
  152. }
  153. private:
  154. int _sockfd;
  155. };

 

HTTPS协议

HTTPS 也是⼀个应⽤层协议. 是在 HTTP 协议的基础上引⼊了⼀个加密层.
加密就是把 明文 (要传输的信息)进行一系列变换,生产密文。解密就是把密文再进行一系列变换, 还原成明文在这个加密和解密的过程中, 往往需要⼀个或者多个中间的数据, 辅助进行这个过程, 这样的数据称为密钥。

为什么要进行加密 

http的内容是明文传输的,明文数据会经过路由器、wifi热点、通信服务运营商、代理服务器等多个物理节点,如果信息在传输过程中被劫持,传输的内容就完全暴露了。劫持者还可以篡改传输的信息且不被双方察觉,这就是中间人攻击,所以才需要对信息进行加密。

 

加密方式 

对称加密

对称加密采⽤单钥密码系统的加密方法,同⼀个密钥可以同时用作信息的加密和解密,这种加密方法称为对称加密,也称为单密钥加密,也就是加密和解密的密钥相同。

特点:算法公开、计算量小、加密速度快、加密效率高

非对称加密

非对称加密需要两个密钥来进行加密和解密,这两个密钥分别是公开密钥(public key,简称公钥)和私有密钥private key,简称私钥)。可以公钥加密私钥解密或者私钥加密公钥解密。

特点:算法强度复杂、安全性依赖于算法与密钥但是由于其算法复杂,而使得加密解密速度没有对称加密解密的速度快。 

 

数据摘要(数据指纹) 

数字指纹(数据摘要),其基本原理是利⽤单向散列函数(Hash函数)对信息进⾏运算,生成⼀串固定长度的数字摘要。数字指纹并不是⼀种加密机制,但可以⽤来判断数据有没有被篡改。也就是用来对比经过网络传输前后的数据,从而判断数据是否改变

和加密算法的区别:摘要严格意义不是加密,因为没有解密,只不过从摘要很难反推原信息,通常用来进行数据对比。

数字签名

数据摘要经过加密,就得到了数字指纹。


HTTPS的工作过程 

 HTTPS想要达到的效果就是,通信双方在数据跨网络传输的时候不会造成数据的泄露。

需要了解,对称加密是使用同一个公钥,但是加密速度快效率高;非对称加密是一个公钥一个私钥,但是使用复杂效率低。所以就有了一些方案的出现:

  1. 对称加密。采用一个公钥进行加密,服务器在第一次传送对称密钥时,此时中间人同样也可以拿到该密钥,所以数据会暴露出去。
  2. 非对称机密。服务端进行传输公钥时,中间人也能拿到公钥,虽然服务端公钥加密传输数据是安全的,但是此时服务端私钥加密传输数据,而客户端与中间人都可以用公钥解密,
  3. 非对称加密+非对称加密。此时虽然看起来没什么大问题,但是传输效率很低。
  4. 非对称加密+对称加密。服务端向客户端传送非对称密钥的公钥,此时客户端也有一份,然后客户端此时动态的生成对称密钥,通过非对称公钥进行加密传送给服务端,此时服务端有非对称私钥,可以解密获取对称密钥,此后客户端与服务端就可以通过对称密钥进行通信。核心即非对称密钥加密对称密钥。
    但是以上2、3、4情况的安全并不是真正的安全,其实也是存在漏洞的。当非对称传输时,服务端将一个密钥给客户端时,假如中间人一开始就介入的话,中间人就会先拿到该密钥,此时中间人自己也生成一组非对称密钥,然后将自己的密钥传给客户端,此时客户端生成对称密钥并通过非对称密钥进行加密传送给服务端时,中间人抢先一步拿到数据,用自己的密钥解密,并在通过原来服务端传来的密钥加密并回显给服务端。此时中间人就拿到了对称密钥,就能够将数据解密。这其实就是数据不一致,即服务端发来的密钥并不是客户端收到的密钥,从而无法判断公钥的合法性。

    此时就引入了证书,即CA认证:

 

 CA认证

服务端在使用HTTPS前,需要向CA机构申领⼀份数字证书,数字证书里含有证书申请者信息、公钥信息等。服务器把证书传输给浏览器,浏览器从证书⾥获取公钥就行了。证书就如⾝份证,证明服务端公钥的权威性。

生成证书的全过程 

某企业服务器运转前先申请证书,而在此之前需要先生成一组非对称密钥,将私钥自己保留,公钥和域名等企业相关信息打包生成.csr文件发送给CA机构,CA机构会对信息进行审核,如果审核通过以后会将明文信息(即有效时间、域名、申请者、公钥……)填充进证书并返回给企业,此时服务器就不用将非对称密钥单独传送过去了,直接把证书传过去就OK了。

但是证书的内容都是明文,那将证书传送的过程能保证安全???

:当CA机构验证申请者信息通过了以后就会生成证书,而生成完整的证书时,会先将传来的明文信息通过哈希散列形成数据指纹,然后将数据指纹通过CA的私钥(CA机构会为申请者生成一组非对称密钥)形成签名,最后将签名和明文信息一起发送给企业服务器。而想要验证CA证书是否一致的问题就可以通过明文信息散列成散列值,将签名通过公钥(计算机浏览器内置CA公钥)解密形成散列值,进行对比。

 所以说https的工作过程其实就是浏览器内置CA权威机构公钥+生成证书(server的公钥)+非对称加密&&对称加密。

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/656407
推荐阅读
相关标签
  

闽ICP备14008679号