赞
踩
还是给我的语雀文档打个广告: 《5. C++ TinyWebServer项目总结(5. Linux网络编程基础API)》我的文章都是先在语雀里记录的,然后再同步发送到CSDN上,有些格式问题实在是懒得改了,可能会导致大家看的不舒服,建议有需要的大家可以看看我的原文:
语雀https://www.yuque.com/u39624144/zvaea9/xdkson4kiaas4lx6?singleDoc#%20%E3%80%8AWebServer%E3%80%8B
现代 CPU 的累加器一次都能装载(至少)4个字节(对于 32 位的机器),即一个 int 类型。那么这4个字节在内存中排列的顺序将影响它被累加器装载的整数值,这就是字节序问题。
字节存储顺序主要分为大端序(Big-endian)和小端序(Little-endian),区别如下
例如,将12345678h
写入1000h
开始的内存中,以大端序和小端序模式存放结果如下:
现代 PC 大多采用小端字节序,因此小端字节序又称为主机字节序;
而在两台不同字节序的主机之间传递数据时,发送端总是把要发送的数据转化成大端字节序数据后再发送,因此大端字节序也被称为网络字节序。
网络字节顺序
是TCP / IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释,网络字节顺序采用大端排序方式。
“大同小异 ”:大端字节序的 字节顺序 和 内存地址顺序相同;小端字节序则相反。
socket 网络编程接口中表示 socket 地址是结构体 sockaddr,其定义如下:
- #include <bits/socket.h>
-
- struct sockaddr{
- sa_family_t sa_family;
- char sa_data[14];
- };
-
- typedef unsigned short int sa_family_t;
sa_family
成员是地址族类型(sa_family_t
)的变量。地址族类型通常与协议类型对应。常见的协议族和对应的地址族如下所示:
而sa_data
成员用于存放socket地址值。但是,不同的协议族的地址值具有不同的含义和长度 :
可以看到,14个字节只能装下 IPv4地址,没办法装下IPv6的地址。因此,该结构体表示方式已经被废掉,Linux定义了下面这个新的通用的socket地址结构体,这个结构体不仅提供了足够大的空间用于存放地址值,而且是内存对齐的(内存对齐可以加快CPU访问速度)
- #include <bits/socket.h>
- struct sockaddr_storage
- {
- sa_family_t sa_family;
- unsigned long int __ss_align; //不用管,用来作内存对齐的
- char __ss_padding[ 128 - sizeof(__ss_align) ];
- };
- typedef unsigned short int sa_family_t;
Linux 为各个协议族提供了专门的 socket 地址结构体。
UNIX 本地域协议族使用如下专用的 socket 地址结构体:
-
- #include <sys/un.h>
- struct sockaddr_un
- {
- sa_family_t sin_family; /* 地址族: AF_UNIX */
- char sun_path[108]; /* 文件路径名 */
- };
TCP / IP 协议族有 sockaddr_in
和 sockaddr_in6
两个专用的 socket 地址结构体,它们分别用于 IPv4 和 IPv6:
- #include <netinet/in.h>
- struct sockaddr_in
- {
- sa_family_t sin_family; /* 地址族: AF_INET */
- in_port_t sin_port; /* 端口号: 用网络字节序表示 */
- struct in_addr sin_addr; /* IPv4地址结构体 */
- };
-
- struct in_addr
- {
- u_int32_t s_addr; /* IPv4地址, 用网络字节序表示 */
- };
-
- struct sockaddr_in6
- {
- sa_family_t sin6_family; /* 地址族: AF_INET6 */
- in_port_t sin6_port; /* 端口号: 用网络字节序表示 */
- uint32_t sin6_flowinfo; /* IPv6 flow information */
- struct in6_addr sin6_addr; /* IPv6 地址结构体 */
- uint32_t sin6_scope_id; /* IPv6 scope-id */
- };
-
- struct in6_addr
- {
- unsigned char sa_addr[16]; /* IPv6 地址, 用网络字节序表示 */
- };
所有专用 socket 地址(以及 sockaddr_storage
)类型的变量在实际使用时都需要转化为通用 socket 地址类型 sockaddr
(强制转化即可),因为所有 socket 编程接口使用的地址参数类型都是 sockaddr。
人们习惯用可读性好的字符串来表示IP地址,比如用点分十进制字符串表示IPV4地址,以及用十六进制字符串表示IPv6地址,但编程中我们需要先把他们转化为整数(二进制)方能使用。而记录日志相反,我们需要把整数表示的IP地址转化为可读的字符串。
- /*
- #include <arpa/inet.h>
- // p:点分十进制的IP字符串,n:表示network,网络字节序的整数
- int inet_pton(int af, const char *src, void *dst);
- af: 地址族: AF_INET AF_INET6
- src: 需要转换的点分十进制的IP字符串
- dst: 转换后的结果保存在这个里面
-
- // 将网络字节序的整数,转换成点分十进制的IP地址字符串
- const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);
- af: 地址族: AF_INET AF_INET6
- src: 要转换的ip的整数的地址
- dst: 转换成IP地址字符串保存的地方
- size:第三个参数的大小(数组的大小)
- 返回值:返回转换后的数据的地址(字符串),和 dst 是一样的
-
- */
-
- #include <stdio.h>
- #include <arpa/inet.h>
-
- int main() {
-
- // 创建一个ip字符串, 点分十进制的IP地址字符串
- char buf[] = "192.168.1.0";
- unsigned int num = 0;
-
- // 将 点分十进制的IP字符串 转换成 网络字节序的整数
- inet_pton(AF_INET, buf, &num);
- unsigned char *p = (unsigned char *)#
- printf("%d %d %d %d\n", *p, *(p+1), *(p+2), *(p+3));
-
-
- // 将 网络字节序的IP整数 转换成 点分十进制的IP字符串
- char ip[16] = ""; //字符串 IP 地址四段,每段最多三个字节,加上3个“.”,再加一个字符串结束符
- const char * str = inet_ntop(AF_INET, &num, ip, 16);
- printf("str : %s\n", str);
- printf("ip : %s\n", ip);
- printf("%d\n", ip == str);
-
- return 0;
- }
.
分隔。255.255.255.255
,这个是最大可能的字符串长度。0
, 10
, 255
)。.
分隔符。xxx.xxx.xxx.xxx
,总共 15 个字符。\0
结束符结尾,所以需要额外的 1 个字节空间来存储这个结束符。因此,字符串数组大小应该为 16 ,才可以存储最完整的 IPv4 地址字符串形式(15个字符 xxx.xxx.xxx.xxx
)和一个结束符(\0
)。
- #include <sys/types.h>
- #include <sys/socket.h>
- #include <arpa/inet.h>//包含了这个头文件,上面两个就可以省略
-
- int socket(int domain,int type,int protoco1);
功能:创建一个套接字
参数:
domain
:底层协议族
type
:指定通信过程中使用的服务类型
SOCK_STREAM
:流服务(TCP等)SOCK_DGRAM
:数据报服务(UDP等)type
参数可以接受上述服务类型与下面两个重要的标志相与的值:SOCK_NONBLOCK
和 SOCK_CLOEXEC
,前者将 socket 设置为非阻塞的。protocol
:在前两个参数构成的协议集合下,再选择一个具体的协议。一般设置为 0(因为前面两个参数已经完全决定了它的值)
返回值:
成功:返回 socket 文件描述符,操作的就是内核缓冲区
失败:返回-1 并设置 errno
即将一个 socket 与 socket 地址绑定。
int bind(int sockfd,const struct sockaddr* my_addr,socklen_t addrlen);
功能:将 my_addr
所指的 socket 地址分配给未命名的 sockfd
文件描述符,addrlen
指出 socket 地址长度。
参数:
sockfd
:通过socket
函数得到的文件描述符
my_addr
:需要绑定的 socket 地址,这个地址封装了ip 地址和端口号的信息
addrlen
:第二个参数结构体占的内存大小
返回值:
成功:返回 0
失败:返回-1 并设置 errno
socket 被命名后,还不能马上接受客户连接,需要使用如下系统调用,创建一个监听队列,存放待处理的客户连接:
int listen(int sockfd,int backlog);
功能:监听指定 socket上的连接
参数:
sockfd
:通过socket()
函数得到的文件描述符,指定被监听的 socket
backlog
:提示内核监听队列的最大长度,超过该设定的最大值,服务器将不受理新的客户连接。
返回值:
成功:返回 0
失败:返回 -1 并设置 errno
int accept(int sockfd,struct sockaddr *addr ,sock1en_t *addrlen);
功能:从 listen 监听队列中接受一个连接。accept 只是从监听队列中取出连接,而不关心连接处于何种状态。
参数:sockfd
:执行过 listen
系统调用的监听 socketaddr
:记录了连接成功后客户端的地址信息(socket 地址)addrlen
:指定第二个参数的 socket 地址长度。
返回值:
成功:返回一个新的连接 socket,该 socket 唯一标识了被接受的这个连接,服务器可以通过读写该 socket 来与被接受连接的客户端通信。
失败:返回-1 并设置 errno
服务器通过 listen
调用来被动接受连接,而客户端通过 connect
来主动与服务器发起连接。
int connect(int sockfd,const struct sockaddr *serv_addr,socklen_t addr1en);
参数:sockfd
:用于通信的文件描述符,由 socket
系统调用返回。addr
:客户端要连接的服务器的地址信息,即服务器监听的 socket 地址。addrlen
:addr
的地址长度。
返回值:
成功:返回0,连接成功建立,则 sockfd
唯一标识这个连接,客户端可以通过读写 sockfd
来与服务器通信。
失败:返回 -1并设置 errno
int close (int fd);
功能:关闭该连接对应的 socket
参数:
fd
:待关闭的 socket。注意,close
调用并非总是立即关闭一个连接,而是将 fd
的引用计数减一。当引用计数为 0 时,才真正关闭这个连接。如果要立即终止连接,可以使用 shutdown
系统调用:
int shutdown(int sockfd, int howto);
功能:立即关闭该连接对应的 socket
参数:
sockfd
:待关闭的 socket。
howto
:决定了 shutdown
的行为。
SHUT_RD
:断开输入流。套接字无法接收数据(即使输入缓冲区收到数据也被抹去),无法调用输入相关函数。SHUT_WR
:断开输出流。套接字无法发送数据,但如果输出缓冲区中还有未传输的数据,则将传递到目标主机。SHUT_RDWR
:同时断开 I/O 流。相当于分两次调用 shutdown()
,其中一次以 SHUT_RD
为参数,另一次以 SHUT_WR
为参数。返回值:
成功:返回0
失败:返回 -1并设置 errno
shutdown
可以分别关闭 socket 上的读和写,而 close
只能同时关闭。
用于 TCP 流数据的读写调用:
- #include <sys/types.h>
- #include <sys/socket.h>
-
- ssize_t recv(int sockfd, void *buf, size_t len, int flags)
- ssize_t send(int sockfd, const void *buf, size_t len, int flags)
recv()
成功时返回实际读取到的数据长度,可能小于指定读缓冲区的大小 len
,因此可能需要多次调用才能读取完整数据。返回 0 说明对方已经关闭连接。返回-1 说明出错;
send()
成功时返回实际写入 sockfd 的数据长度
flags
参数为数据收发提供了额外的控制。只对 send
和 recv
的当前调用生效。而 setsockopt
可以永久修改 socket 的某些属性。
系统调用是:
- #include <sys/types.h>
- #include <sys/socket.h>
-
- ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
- struct sockaddr *src_addr, socklen_t *addrlen);
- ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
- const struct sockaddr *dest_addr, socklen_t addrlen);
recvfrom
:
参数:
sockfd
:一个已打开的套接字的描述符。
buf
:一个指针,指向读缓冲区。
len
:读缓冲区的大小(以字节为单位)。
src_addr
:一个指针,指向发送端的 socket 地址。(UDP 是无连接的,每次通信都需要指定通信地址)
addrlen
:开始时,它应该设置为 src_addr
缓冲区的大小。当 recvfrom()
返回时,该值会被修改为实际地址的长度(以字节为单位)。
flags
:控制接收行为的标志。通常可以设置为0。
返回值:
在成功的情况下,recvfrom()
返回接收到的字节数。
如果没有数据可读或 socket 已经关闭,那么返回值为0。
出错时,返回 -1,并设置全局变量 errno 以指示错误类型。
sendto
:与recvfrom
类似。
实际上,recvfrom
和sendto
也可以用于面向连接的 socket 的数据读写,当连接已经建立时,只需要把recvfrom
/sendto
的 src_addr
和addrlen
设置为 NULL
,即可忽略发送端/接收端的 socket 地址。
不仅能用于 TCP 流数据,还能用于 UDP 数据报。
- #include <sys/socket.h>
-
- ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
- ssize_t recvmsg(int sockfd, const struct msghdr *msg, int flags);
Linux内核检测到TCP紧急标志时,将通知应用程序有带外数据需要接收。内核通知应用程序带外数据到达的两种常见方式是:I/O复用产生的异常事件和SIGURG信号。但是,即使应用程序得到了有带外数据需要接收的通知,还需要知道带外数据在数据流中的具体位置,才能准确接收带外数据。这一点可通过如下系统调用实现:
- #include <sys/socket.h>
- int sockatmark( int sockfd );
sockatmark
判断 sockfd
是否处于带外标记,即下一个被读取到的数据是否是带外数据。
如果是,sockatmark
返回1,此时我们就可以利用带MSG_OOB
标志的recv
调用来接收带外数据。如果不是,则sockatmark
返回0。
在某些情况下,我们想知道一个连接socket的本端socket地址,以及远端的socket地址。下面这两个函数正是用于解决这个问题:
- #include <sys/socket.h>
-
- int getsockname( int sockfd,struct sockaddr* address,socklen t* address_len );
- int getpeername( int sockfd,struct sockaddr* address, socklen t* address_len );
getsockname
获取sockfd
对应的本端socket地址,并将其存储于address
参数指定的内存中,该socket地址的长度则存储于address_len
参数指向的变量中。如果实际socket地址的长度大于 address所指内存区的大小,那么该socket地址将被截断。getsockname
成功时返回0,失败返回-1并设置 errno。
getpeerame
获取 sockfd
对应的远端socket地址,其参数及返回值的含义与 getsockname
的参数及返回值相同。
用来读取和设置socket文件描述符属性的方法:
- #include <sys/socket.h>
-
- int getsockopt( int sockfd, int level,int option_name,
- void* option_value, socklen_t* restrict option_len );
- int setsockopt( int sockfd, int level,int option_name,
- const void* option_value, socklen_t option_len );
接下来,我们通过一个实战小项目,来更加深刻的理解 TCP 通信和 socket 的使用。项目代码来自:【Linux】socket 编程(socket套接字介绍、字节序、socket地址、IP地址转换函数、套接字函数、TCP通信实现)_linux socket-CSDN博客
整个流程经历了以下阶段:
socket
调用,创建了一个 socket;bind
将 socket 绑定到一个 IP 地址和端口号;listen
使 socket 进入监听状态,准备接收客户端的连接请求;connect
,发起连接请求;accept
,接受客户端的连接请求;read
/write
收发数据。- #include <stdio.h>
- #include <arpa/inet.h>
- #include <unistd.h>
- #include <string.h>
- #include <stdlib.h>
-
- /* TCP服务器端实现 */
- int main() {
-
- /*
- * 1.创建socket(用于监听的套接字):
- * 使用 socket 函数创建一个套接字 listen_fd
- * AF_INET: 表示使用 IPv4 协议
- * SOCK_STREAM: 表示使用 TCP 连接。
- */
- int listen_fd = socket(AF_INET, SOCK_STREAM, 0);
-
- if(listen_fd == -1) {
- perror("socket");
- exit(-1);
- }
-
- /*
- * 2.绑定/命名 socket:
- * struct sockaddr_in 用于指定服务器的地址和端口。
- * INADDR_ANY 让服务器绑定到所有可用的网络接口(即可以接受任何 IP 地址的连接)。
- * 使用 bind 函数将套接字与指定的 IP 地址和端口绑定。
- * 如果 bind 返回 -1,表示绑定失败,输出错误信息并退出程序。
- */
- struct sockaddr_in saddr;
- saddr.sin_family = AF_INET;
- saddr.sin_addr.s_addr = INADDR_ANY; // 0.0.0.0
- saddr.sin_port = htons(9999);
- int ret = bind(listen_fd, (struct sockaddr *)&saddr, sizeof(saddr));
-
- if(ret == -1) {
- perror("bind");
- exit(-1);
- }
-
- /*
- * 3.监听连接
- * listen 函数使套接字进入监听状态,准备接收来自客户端的连接请求。
- * 第二个参数 8 指定了连接队列的最大长度,即最多可以有 8 个连接请求排队等待处理。
- * 如果 listen 返回 -1,表示监听失败,输出错误信息并退出程序。
- */
- ret = listen(listen_fd, 8);
- if(ret == -1) {
- perror("listen");
- exit(-1);
- }
-
- /*
- * 4.接收客户端连接
- * 使用 accept 函数接受客户端的连接请求,accept 返回一个新的套接字 cfd,用于与客户端通信。
- * clientaddr 用于存储客户端的地址信息。
- * 如果 accept 返回 -1,表示接收连接失败,输出错误信息并退出程序。
- */
- struct sockaddr_in clientaddr;
- socklen_t len = sizeof(clientaddr);
- int cfd = accept(listen_fd, (struct sockaddr *)&clientaddr, &len);
-
- if(cfd == -1) {
- perror("accept");
- exit(-1);
- }
-
- /*
- * 5. 输出客户端的信息
- * inet_ntop 函数将客户端的 IP 地址从网络字节序转换为点分十进制字符串格式,并输出。
- * ntohs 函数将客户端的端口号从网络字节序转换为主机字节序,并输出。
- */
- char clientIP[16];
- inet_ntop(AF_INET, &clientaddr.sin_addr.s_addr, clientIP, sizeof(clientIP));
- unsigned short clientPort = ntohs(clientaddr.sin_port);
- printf("client ip is %s, port is %d\n", clientIP, clientPort);
-
- // 6.通信
- char recvBuf[1024] = {0};
- while(1) {
-
- // 获取客户端的数据
- int num = read(cfd, recvBuf, sizeof(recvBuf));
- if(num == -1) {
- perror("read");
- exit(-1);
- } else if(num > 0) {
- printf("recv client data : %s\n", recvBuf);
- } else if(num == 0) {
- // 表示客户端断开连接
- printf("clinet closed...");
- break;
- }
-
- char *data = "hello,i am server";
- // 给客户端发送数据
- write(cfd, data, strlen(data));
- }
-
- // 7. 关闭文件描述符
- close(cfd);
- close(listen_fd);
-
- return 0;
- }
- #include <stdio.h>
- #include <arpa/inet.h>
- #include <unistd.h>
- #include <string.h>
- #include <stdlib.h>
-
- /* TCP客户端实现 */
- int main() {
-
- // 1.创建套接字: AF_INET 表示使用 IPv4 地址,SOCK_STREAM 表示使用 TCP 连接。
- int fd = socket(AF_INET, SOCK_STREAM, 0);
- if(fd == -1) {
- perror("socket");
- exit(-1);
- }
-
- // 2.连接服务器端: 设定服务器的 IP 地址和端口号(此处为 "10.1.1.161" 和 9999)。
- struct sockaddr_in serveraddr;
- serveraddr.sin_family = AF_INET;
- inet_pton(AF_INET, "10.1.1.161", &serveraddr.sin_addr.s_addr);
- serveraddr.sin_port = htons(9999);
- int ret = connect(fd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));
-
- if(ret == -1) {
- perror("connect");
- exit(-1);
- }
-
-
- // 3.通信
- char recvBuf[1024] = {0};
- while(1) {
-
- char *data = "hello,i am client";
- // 通过 write 函数发送消息 "hello,i am client" 到服务器。
- write(fd, data , strlen(data));
-
- sleep(1);
-
- int len = read(fd, recvBuf, sizeof(recvBuf));
- if(len == -1) {
- perror("read");
- exit(-1);
- } else if(len > 0) {
- printf("recv server data : %s\n", recvBuf);
- } else if(len == 0) {
- // 如果 read 返回 0,表示服务器关闭了连接,客户端程序将结束循环并关闭连接。
- printf("server closed...");
- break;
- }
- }
-
- // 4. 关闭连接
- close(fd);
-
- return 0;
- }
-
编译运行上述代码,在终端中可以看单到:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。