当前位置:   article > 正文

C++ TinyWebServer项目总结(5. Linux网络编程基础API)

C++ TinyWebServer项目总结(5. Linux网络编程基础API)

还是给我的语雀文档打个广告: 《5. C++ TinyWebServer项目总结(5. Linux网络编程基础API)》我的文章都是先在语雀里记录的,然后再同步发送到CSDN上,有些格式问题实在是懒得改了,可能会导致大家看的不舒服,建议有需要的大家可以看看我的原文:

语雀icon-default.png?t=N7T8https://www.yuque.com/u39624144/zvaea9/xdkson4kiaas4lx6?singleDoc#%20%E3%80%8AWebServer%E3%80%8B

主机字节序和网络字节序

现代 CPU 的累加器一次都能装载(至少)4个字节(对于 32 位的机器),即一个 int 类型。那么这4个字节在内存中排列的顺序将影响它被累加器装载的整数值,这就是字节序问题。

字节存储顺序主要分为大端序(Big-endian)和小端序(Little-endian),区别如下

  • Big-endian:高位字节存入低地址,低位字节存入高地址
  • Little-endian:低位字节存入低地址,高位字节存入高地址

例如,将12345678h写入1000h开始的内存中,以大端序和小端序模式存放结果如下:

现代 PC 大多采用小端字节序,因此小端字节序又称为主机字节序;

而在两台不同字节序的主机之间传递数据时,发送端总是把要发送的数据转化成大端字节序数据后再发送,因此大端字节序也被称为网络字节序。

网络字节顺序是TCP / IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释,网络字节顺序采用大端排序方式。

“大同小异 ”:大端字节序的 字节顺序 和 内存地址顺序相同;小端字节序则相反。

通用 socket 地址和专用 socket 地址

socket 网络编程接口中表示 socket 地址是结构体 sockaddr,其定义如下:

  1. #include <bits/socket.h>
  2. struct sockaddr{
  3. sa_family_t sa_family;
  4. char sa_data[14];
  5. };
  6. typedef unsigned short int sa_family_t;

sa_family成员是地址族类型(sa_family_t)的变量。地址族类型通常与协议类型对应。常见的协议族和对应的地址族如下所示:

sa_data成员用于存放socket地址值。但是,不同的协议族的地址值具有不同的含义和长度 :

可以看到,14个字节只能装下 IPv4地址,没办法装下IPv6的地址。因此,该结构体表示方式已经被废掉,Linux定义了下面这个新的通用的socket地址结构体,这个结构体不仅提供了足够大的空间用于存放地址值,而且是内存对齐的(内存对齐可以加快CPU访问速度)

  1. #include <bits/socket.h>
  2. struct sockaddr_storage
  3. {
  4. sa_family_t sa_family;
  5. unsigned long int __ss_align; //不用管,用来作内存对齐的
  6. char __ss_padding[ 128 - sizeof(__ss_align) ];
  7. };
  8. typedef unsigned short int sa_family_t;

Linux 为各个协议族提供了专门的 socket 地址结构体。

UNIX 本地域协议族使用如下专用的 socket 地址结构体:

  1. #include <sys/un.h>
  2. struct sockaddr_un
  3. {
  4. sa_family_t sin_family; /* 地址族: AF_UNIX */
  5. char sun_path[108]; /* 文件路径名 */
  6. };

TCP / IP 协议族有 sockaddr_insockaddr_in6 两个专用的 socket 地址结构体,它们分别用于 IPv4 和 IPv6:

  1. #include <netinet/in.h>
  2. struct sockaddr_in
  3. {
  4. sa_family_t sin_family; /* 地址族: AF_INET */
  5. in_port_t sin_port; /* 端口号: 用网络字节序表示 */
  6. struct in_addr sin_addr; /* IPv4地址结构体 */
  7. };
  8. struct in_addr
  9. {
  10. u_int32_t s_addr; /* IPv4地址, 用网络字节序表示 */
  11. };
  12. struct sockaddr_in6
  13. {
  14. sa_family_t sin6_family; /* 地址族: AF_INET6 */
  15. in_port_t sin6_port; /* 端口号: 用网络字节序表示 */
  16. uint32_t sin6_flowinfo; /* IPv6 flow information */
  17. struct in6_addr sin6_addr; /* IPv6 地址结构体 */
  18. uint32_t sin6_scope_id; /* IPv6 scope-id */
  19. };
  20. struct in6_addr
  21. {
  22. unsigned char sa_addr[16]; /* IPv6 地址, 用网络字节序表示 */
  23. };

所有专用 socket 地址(以及 sockaddr_storage)类型的变量在实际使用时都需要转化为通用 socket 地址类型 sockaddr(强制转化即可),因为所有 socket 编程接口使用的地址参数类型都是 sockaddr。

IP 地址转换函数

人们习惯用可读性好的字符串来表示IP地址,比如用点分十进制字符串表示IPV4地址,以及用十六进制字符串表示IPv6地址,但编程中我们需要先把他们转化为整数(二进制)方能使用。而记录日志相反,我们需要把整数表示的IP地址转化为可读的字符串。

  1. /*
  2. #include <arpa/inet.h>
  3. // p:点分十进制的IP字符串,n:表示network,网络字节序的整数
  4. int inet_pton(int af, const char *src, void *dst);
  5. af: 地址族: AF_INET AF_INET6
  6. src: 需要转换的点分十进制的IP字符串
  7. dst: 转换后的结果保存在这个里面
  8. // 将网络字节序的整数,转换成点分十进制的IP地址字符串
  9. const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);
  10. af: 地址族: AF_INET AF_INET6
  11. src: 要转换的ip的整数的地址
  12. dst: 转换成IP地址字符串保存的地方
  13. size:第三个参数的大小(数组的大小)
  14. 返回值:返回转换后的数据的地址(字符串),和 dst 是一样的
  15. */
  16. #include <stdio.h>
  17. #include <arpa/inet.h>
  18. int main() {
  19. // 创建一个ip字符串, 点分十进制的IP地址字符串
  20. char buf[] = "192.168.1.0";
  21. unsigned int num = 0;
  22. // 将 点分十进制的IP字符串 转换成 网络字节序的整数
  23. inet_pton(AF_INET, buf, &num);
  24. unsigned char *p = (unsigned char *)&num;
  25. printf("%d %d %d %d\n", *p, *(p+1), *(p+2), *(p+3));
  26. // 将 网络字节序的IP整数 转换成 点分十进制的IP字符串
  27. char ip[16] = ""; //字符串 IP 地址四段,每段最多三个字节,加上3个“.”,再加一个字符串结束符
  28. const char * str = inet_ntop(AF_INET, &num, ip, 16);
  29. printf("str : %s\n", str);
  30. printf("ip : %s\n", ip);
  31. printf("%d\n", ip == str);
  32. return 0;
  33. }

一个 IPv4 地址,如果用字符串数组来存储,最多需要多大的字符串数组?

  • IPv4 地址格式:
    • IPv4 地址是由四个八位字节(每个0-255之间)组成,每个字节以 . 分隔。
    • 一个完整的 IPv4 地址的格式示例为 255.255.255.255,这个是最大可能的字符串长度。
  • 字符数计算:
    • 每个字节(0-255)可以用 1 到 3 个字符表示(如 0, 10, 255)。
    • 四个字节之间有三个 . 分隔符。
    • 因此,最大长度的 IPv4 地址字符串是 xxx.xxx.xxx.xxx,总共 15 个字符。
  • 字符串结束符:
    • C 语言中的字符串以 \0 结束符结尾,所以需要额外的 1 个字节空间来存储这个结束符。

因此,字符串数组大小应该为 16 ,才可以存储最完整的 IPv4 地址字符串形式(15个字符 xxx.xxx.xxx.xxx)和一个结束符(\0)。

创建 socket

  1. #include <sys/types.h>
  2. #include <sys/socket.h>
  3. #include <arpa/inet.h>//包含了这个头文件,上面两个就可以省略
  4. int socket(int domain,int type,int protoco1);

功能:创建一个套接字

参数:

domain:底层协议族

    • PF_INET:IPv4
    • PF_INET6:IPv6
    • PF_UNIX:UNIX 本地域协议族

type:指定通信过程中使用的服务类型

    • SOCK_STREAM:流服务(TCP等)
    • SOCK_DGRAM:数据报服务(UDP等)
    • 自 Linux 内核版本 2.6.17 起,type 参数可以接受上述服务类型与下面两个重要的标志相与的值:SOCK_NONBLOCKSOCK_CLOEXEC,前者将 socket 设置为非阻塞的。

protocol:在前两个参数构成的协议集合下,再选择一个具体的协议。一般设置为 0(因为前面两个参数已经完全决定了它的值)

返回值:

成功:返回 socket 文件描述符,操作的就是内核缓冲区

失败:返回-1 并设置 errno

命名 socket

即将一个 socket 与 socket 地址绑定。

int bind(int sockfd,const struct sockaddr* my_addr,socklen_t addrlen);

功能:my_addr 所指的 socket 地址分配给未命名的 sockfd 文件描述符,addrlen 指出 socket 地址长度。

参数:

sockfd:通过socket函数得到的文件描述符

my_addr:需要绑定的 socket 地址,这个地址封装了ip 地址和端口号的信息

addrlen:第二个参数结构体占的内存大小

返回值:

成功:返回 0

失败:返回-1 并设置 errno

监听 socket

socket 被命名后,还不能马上接受客户连接,需要使用如下系统调用,创建一个监听队列,存放待处理的客户连接:

int listen(int sockfd,int backlog);

功能:监听指定 socket上的连接

参数:

sockfd:通过socket()函数得到的文件描述符,指定被监听的 socket

backlog:提示内核监听队列的最大长度,超过该设定的最大值,服务器将不受理新的客户连接。

返回值:

成功:返回 0

失败:返回 -1 并设置 errno

接受连接

int accept(int sockfd,struct sockaddr *addr ,sock1en_t *addrlen);

功能:从 listen 监听队列中接受一个连接。accept 只是从监听队列中取出连接,而不关心连接处于何种状态。

参数:
sockfd:执行过 listen 系统调用的监听 socket
addr:记录了连接成功后客户端的地址信息(socket 地址)
addrlen:指定第二个参数的 socket 地址长度。
返回值:
成功:返回一个新的连接 socket,该 socket 唯一标识了被接受的这个连接,服务器可以通过读写该 socket 来与被接受连接的客户端通信。
失败:返回-1 并设置 errno

发起连接

服务器通过 listen 调用来被动接受连接,而客户端通过 connect 来主动与服务器发起连接。

int connect(int sockfd,const struct sockaddr *serv_addr,socklen_t addr1en);

参数:
sockfd:用于通信的文件描述符,由 socket 系统调用返回。
addr:客户端要连接的服务器的地址信息,即服务器监听的 socket 地址。
addrlenaddr 的地址长度。

返回值:

成功:返回0,连接成功建立,则 sockfd 唯一标识这个连接,客户端可以通过读写 sockfd 来与服务器通信。

失败:返回 -1并设置 errno

关闭连接

int close (int fd);

功能:关闭该连接对应的 socket

参数:

fd:待关闭的 socket。注意,close 调用并非总是立即关闭一个连接,而是将 fd 的引用计数减一。当引用计数为 0 时,才真正关闭这个连接。如果要立即终止连接,可以使用 shutdown 系统调用:

int shutdown(int sockfd, int howto);

功能:立即关闭该连接对应的 socket

参数:

sockfd:待关闭的 socket。

howto:决定了 shutdown 的行为。

    • SHUT_RD:断开输入流。套接字无法接收数据(即使输入缓冲区收到数据也被抹去),无法调用输入相关函数。
    • SHUT_WR:断开输出流。套接字无法发送数据,但如果输出缓冲区中还有未传输的数据,则将传递到目标主机。
    • SHUT_RDWR:同时断开 I/O 流。相当于分两次调用 shutdown(),其中一次以 SHUT_RD 为参数,另一次以 SHUT_WR 为参数。

返回值:

成功:返回0

失败:返回 -1并设置 errno

shutdown 可以分别关闭 socket 上的读和写,而 close 只能同时关闭。

数据读写

TCP 数据读写

用于 TCP 流数据的读写调用:

  1. #include <sys/types.h>
  2. #include <sys/socket.h>
  3. ssize_t recv(int sockfd, void *buf, size_t len, int flags)
  4. ssize_t send(int sockfd, const void *buf, size_t len, int flags)

recv()成功时返回实际读取到的数据长度,可能小于指定读缓冲区的大小 len,因此可能需要多次调用才能读取完整数据。返回 0 说明对方已经关闭连接。返回-1 说明出错;

send()成功时返回实际写入 sockfd 的数据长度

flags 参数为数据收发提供了额外的控制。只对 sendrecv 的当前调用生效。而 setsockopt 可以永久修改 socket 的某些属性。

UDP 数据读写

系统调用是:

  1. #include <sys/types.h>
  2. #include <sys/socket.h>
  3. ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
  4. struct sockaddr *src_addr, socklen_t *addrlen);
  5. ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
  6. const struct sockaddr *dest_addr, socklen_t addrlen);

recvfrom

参数:

sockfd:一个已打开的套接字的描述符。

buf:一个指针,指向读缓冲区。

len:读缓冲区的大小(以字节为单位)。

src_addr:一个指针,指向发送端的 socket 地址。(UDP 是无连接的,每次通信都需要指定通信地址)

addrlen:开始时,它应该设置为 src_addr 缓冲区的大小。当 recvfrom() 返回时,该值会被修改为实际地址的长度(以字节为单位)。

flags:控制接收行为的标志。通常可以设置为0。

返回值:

在成功的情况下,recvfrom() 返回接收到的字节数。

如果没有数据可读或 socket 已经关闭,那么返回值为0。

出错时,返回 -1,并设置全局变量 errno 以指示错误类型。

sendto:与recvfrom类似。

实际上,recvfromsendto也可以用于面向连接的 socket 的数据读写,当连接已经建立时,只需要把recvfrom/sendtosrc_addraddrlen设置为 NULL,即可忽略发送端/接收端的 socket 地址。

通用数据读写

不仅能用于 TCP 流数据,还能用于 UDP 数据报。

  1. #include <sys/socket.h>
  2. ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
  3. ssize_t recvmsg(int sockfd, const struct msghdr *msg, int flags);

带外标记

Linux内核检测到TCP紧急标志时,将通知应用程序有带外数据需要接收。内核通知应用程序带外数据到达的两种常见方式是:I/O复用产生的异常事件和SIGURG信号。但是,即使应用程序得到了有带外数据需要接收的通知,还需要知道带外数据在数据流中的具体位置,才能准确接收带外数据。这一点可通过如下系统调用实现:

  1. #include <sys/socket.h>
  2. int sockatmark( int sockfd );

sockatmark 判断 sockfd 是否处于带外标记,即下一个被读取到的数据是否是带外数据。

如果是,sockatmark返回1,此时我们就可以利用带MSG_OOB标志的recv调用来接收带外数据。如果不是,则sockatmark返回0。

地址信息函数

在某些情况下,我们想知道一个连接socket的本端socket地址,以及远端的socket地址。下面这两个函数正是用于解决这个问题:

  1. #include <sys/socket.h>
  2. int getsockname( int sockfd,struct sockaddr* address,socklen t* address_len );
  3. int getpeername( int sockfd,struct sockaddr* address, socklen t* address_len );

getsockname获取sockfd 对应的本端socket地址,并将其存储于address参数指定的内存中,该socket地址的长度则存储于address_len参数指向的变量中。如果实际socket地址的长度大于 address所指内存区的大小,那么该socket地址将被截断。getsockname 成功时返回0,失败返回-1并设置 errno。

getpeerame 获取 sockfd对应的远端socket地址,其参数及返回值的含义与 getsockname的参数及返回值相同。

socket 选项

用来读取和设置socket文件描述符属性的方法:

  1. #include <sys/socket.h>
  2. int getsockopt( int sockfd, int level,int option_name,
  3. void* option_value, socklen_t* restrict option_len );
  4. int setsockopt( int sockfd, int level,int option_name,
  5. const void* option_value, socklen_t option_len );

实战:TCP通信实现(服务器端和客户端)

接下来,我们通过一个实战小项目,来更加深刻的理解 TCP 通信和 socket 的使用。项目代码来自:【Linux】socket 编程(socket套接字介绍、字节序、socket地址、IP地址转换函数、套接字函数、TCP通信实现)_linux socket-CSDN博客

整个流程经历了以下阶段:

  1. 在代码中,服务器端先通过socket调用,创建了一个 socket;
  2. 服务器端调用 bind 将 socket 绑定到一个 IP 地址和端口号;
  3. 服务器端调用 listen 使 socket 进入监听状态,准备接收客户端的连接请求;
  4. 客户端调用 connect,发起连接请求;
  5. 服务器端调用 accept,接受客户端的连接请求;
  6. TCP 连接建立,可以通过 read/write 收发数据。

服务器端

  1. #include <stdio.h>
  2. #include <arpa/inet.h>
  3. #include <unistd.h>
  4. #include <string.h>
  5. #include <stdlib.h>
  6. /* TCP服务器端实现 */
  7. int main() {
  8. /*
  9. * 1.创建socket(用于监听的套接字):
  10. * 使用 socket 函数创建一个套接字 listen_fd
  11. * AF_INET: 表示使用 IPv4 协议
  12. * SOCK_STREAM: 表示使用 TCP 连接。
  13. */
  14. int listen_fd = socket(AF_INET, SOCK_STREAM, 0);
  15. if(listen_fd == -1) {
  16. perror("socket");
  17. exit(-1);
  18. }
  19. /*
  20. * 2.绑定/命名 socket:
  21. * struct sockaddr_in 用于指定服务器的地址和端口。
  22. * INADDR_ANY 让服务器绑定到所有可用的网络接口(即可以接受任何 IP 地址的连接)。
  23. * 使用 bind 函数将套接字与指定的 IP 地址和端口绑定。
  24. * 如果 bind 返回 -1,表示绑定失败,输出错误信息并退出程序。
  25. */
  26. struct sockaddr_in saddr;
  27. saddr.sin_family = AF_INET;
  28. saddr.sin_addr.s_addr = INADDR_ANY; // 0.0.0.0
  29. saddr.sin_port = htons(9999);
  30. int ret = bind(listen_fd, (struct sockaddr *)&saddr, sizeof(saddr));
  31. if(ret == -1) {
  32. perror("bind");
  33. exit(-1);
  34. }
  35. /*
  36. * 3.监听连接
  37. * listen 函数使套接字进入监听状态,准备接收来自客户端的连接请求。
  38. * 第二个参数 8 指定了连接队列的最大长度,即最多可以有 8 个连接请求排队等待处理。
  39. * 如果 listen 返回 -1,表示监听失败,输出错误信息并退出程序。
  40. */
  41. ret = listen(listen_fd, 8);
  42. if(ret == -1) {
  43. perror("listen");
  44. exit(-1);
  45. }
  46. /*
  47. * 4.接收客户端连接
  48. * 使用 accept 函数接受客户端的连接请求,accept 返回一个新的套接字 cfd,用于与客户端通信。
  49. * clientaddr 用于存储客户端的地址信息。
  50. * 如果 accept 返回 -1,表示接收连接失败,输出错误信息并退出程序。
  51. */
  52. struct sockaddr_in clientaddr;
  53. socklen_t len = sizeof(clientaddr);
  54. int cfd = accept(listen_fd, (struct sockaddr *)&clientaddr, &len);
  55. if(cfd == -1) {
  56. perror("accept");
  57. exit(-1);
  58. }
  59. /*
  60. * 5. 输出客户端的信息
  61. * inet_ntop 函数将客户端的 IP 地址从网络字节序转换为点分十进制字符串格式,并输出。
  62. * ntohs 函数将客户端的端口号从网络字节序转换为主机字节序,并输出。
  63. */
  64. char clientIP[16];
  65. inet_ntop(AF_INET, &clientaddr.sin_addr.s_addr, clientIP, sizeof(clientIP));
  66. unsigned short clientPort = ntohs(clientaddr.sin_port);
  67. printf("client ip is %s, port is %d\n", clientIP, clientPort);
  68. // 6.通信
  69. char recvBuf[1024] = {0};
  70. while(1) {
  71. // 获取客户端的数据
  72. int num = read(cfd, recvBuf, sizeof(recvBuf));
  73. if(num == -1) {
  74. perror("read");
  75. exit(-1);
  76. } else if(num > 0) {
  77. printf("recv client data : %s\n", recvBuf);
  78. } else if(num == 0) {
  79. // 表示客户端断开连接
  80. printf("clinet closed...");
  81. break;
  82. }
  83. char *data = "hello,i am server";
  84. // 给客户端发送数据
  85. write(cfd, data, strlen(data));
  86. }
  87. // 7. 关闭文件描述符
  88. close(cfd);
  89. close(listen_fd);
  90. return 0;
  91. }

客户端

  1. #include <stdio.h>
  2. #include <arpa/inet.h>
  3. #include <unistd.h>
  4. #include <string.h>
  5. #include <stdlib.h>
  6. /* TCP客户端实现 */
  7. int main() {
  8. // 1.创建套接字: AF_INET 表示使用 IPv4 地址,SOCK_STREAM 表示使用 TCP 连接。
  9. int fd = socket(AF_INET, SOCK_STREAM, 0);
  10. if(fd == -1) {
  11. perror("socket");
  12. exit(-1);
  13. }
  14. // 2.连接服务器端: 设定服务器的 IP 地址和端口号(此处为 "10.1.1.161"9999)。
  15. struct sockaddr_in serveraddr;
  16. serveraddr.sin_family = AF_INET;
  17. inet_pton(AF_INET, "10.1.1.161", &serveraddr.sin_addr.s_addr);
  18. serveraddr.sin_port = htons(9999);
  19. int ret = connect(fd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));
  20. if(ret == -1) {
  21. perror("connect");
  22. exit(-1);
  23. }
  24. // 3.通信
  25. char recvBuf[1024] = {0};
  26. while(1) {
  27. char *data = "hello,i am client";
  28. // 通过 write 函数发送消息 "hello,i am client" 到服务器。
  29. write(fd, data , strlen(data));
  30. sleep(1);
  31. int len = read(fd, recvBuf, sizeof(recvBuf));
  32. if(len == -1) {
  33. perror("read");
  34. exit(-1);
  35. } else if(len > 0) {
  36. printf("recv server data : %s\n", recvBuf);
  37. } else if(len == 0) {
  38. // 如果 read 返回 0,表示服务器关闭了连接,客户端程序将结束循环并关闭连接。
  39. printf("server closed...");
  40. break;
  41. }
  42. }
  43. // 4. 关闭连接
  44. close(fd);
  45. return 0;
  46. }

效果

编译运行上述代码,在终端中可以看单到:

参考

  1. 大端序和小端序_大端序和小端序的区别-CSDN博客
  2. C++的socket地址详解_如何定义c socket ip地址-CSDN博客
  3. 深入理解TCP协议及其源代码-send和recv背后数据的收发过程 - zhqian - 博客园
  4. Linux网络编程- recvfrom() & sendto()-CSDN博客
  5. recvmsg 和 sendmsg 函数详解 以及如何进行多进程之间文件描述符的发送与接收-CSDN博客
  6. 【Linux】socket 编程(socket套接字介绍、字节序、socket地址、IP地址转换函数、套接字函数、TCP通信实现)_linux socket-CSDN博客
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/1010978
推荐阅读
相关标签
  

闽ICP备14008679号