赞
踩
socket这个词可以表示很多概念:
1. 在TCP/IP协议中,“IP地址+TCP或UDP端口号”唯一标识网络通讯中的一个进程,“IP地址+端口号”就称为socket。
2. 在TCP协议中,建立连接的两个进程各自有一个socket来标识,那么这两个socket组成的socket pair就唯一标识一个连接。socket本身有“插座”的意思,因此用来描述网络连接的一对一关系。
3. TCP/IP协议最早在BSD UNIX上实现,为TCP/IP协议设计的应用层编程接口称为socketAPI。本节的主要内容是socket API,主要介绍TCP协议的函数接口,最后简要介绍UDP协议和UNIX Domain Socket的函数接口。
预备知识:
1.1. 网络字节序
我们已经知道,内存中的多字节数据相对于内存地址有大端和小端之分,磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分。网络数据流同样有大端小端之分,那么如何定义网络数据流的地址呢?发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出,接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存,因此,网络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是高地址。
TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节。例如上一节的UDP段格式,地址0-1是16位的源端口号,如果这个端口号是1000(0x3e8),则地址0是0x03,地址1是0xe8,也就是先发0x03,再发0xe8,这16位 (两个字节) 在发送主机的缓冲区中也应该是低地址存0x03,高地址存0xe8。但是,如果发送主机是小端字节序的,这16位被解释成0xe803,而不是1000。因此,发送主机把1000填到发送缓冲区之前需要做字节序的转换(意思就是说都是按照大端字节序进行发送的,所以如果发送主机是小端字节序的,必须先转换成大端字节序)。同样地,接收主机如果是小端字节序的,接到16位的源端口号也要做字节序的转换。如果主机 (发送主机和接收主机?)是大端字节序的,发送和接收都不需要做转换。同理,32位的IP地址也要考虑网络字节序和主机字节序的问题。
为使网络程序具有可移植性,使同样的C代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换。
- #include <arpa/inet.h>
- uint32_t htonl(uint32_t hostlong);
- uint16_t htons(uint16_t hostshort);
- uint32_t ntohl(uint32_t netlong);
- uint16_t ntohs(uint16_t netshort);
这些函数名很好记,h表示host,n表示network,l表示32位长整数,s表示16位短整数。例如htonl表示将32位的长整数从主机字节序转换为网络字节序,例如将IP地址转换后准备发送。如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回,如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。
大小端模式 大小端模式-Tay_linux-ChinaUnix博客
socket地址的数据类型及相关函数
socket API是一层抽象的网络编程接口,适用于各种底层网络协议,如IPv4、IPv6,以及后面要讲的UNIX Domain Socket。然而,各种网络协议的地址格式并不相同,如下图所示(该图出自[UNPv13e]):
sockaddr 数据结构
IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位端口号和32位IP地址,IPv6地址用sockaddr_in6结构体表示,包括16位端口号、128位IP地址和一些控制字段。UNIX Domain Socket的地址格式定义在sys/un.h中,用sockaddr_un结构体表示。各种socket地址结构体的开头都是相同的,前16位表示整个结构体的长度(并不是所有UNIX的实现都有长度字段,如Linux就没有),后16位表示地址类型。IPv4、IPv6 和 Unix Domain Socket的地址类型分别定义为常数AF_INET、AF_INET6、AF_UNIX。这样,只要取得某种sockaddr结构体的首地址,不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的内容。因此,socket API可以接受各种类型的sockaddr结构体指针做参数,例如 bind、accept、connect 等函数,这些函数的参数应该设计成void *类型以便接受各种类型的指针,但是sock API的实现早于ANSI C标准化,那时还没有void *类型,因此这些函数的参数都用struct sockaddr *类型表示,在传递参数之前要强制类型转换一下,例如:
- /* initialize servaddr */
- bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- struct sockaddr_in servaddr;
本节只介绍基于IPv4的 socket 网络编程,sockaddr_in中的成员struct in_addr sin_addr表示32位 的IP地址。但是我们通常用点分十进制的字符串表示IP地址,以下函数可以在字符串表示和in_addr表示之间转换。
- 字符串转in_addr的函数:
-
- #include <arpa/inet.h>
-
- int inet_aton(const char *strptr, struct in_addr *addrptr);
- in_addr_t inet_addr(const char *strptr);
- int inet_pton(int family, const char *strptr, void *addrptr);
- in_addr转字符串的函数:
-
- char *inet_ntoa(struct in_addr inaddr);
- const char *inet_ntop(int family, const void *addrptr, char* strptr, size_t len);
其中inet_pton和inet_ntop不仅可以转换IPv4的in_addr,还可以转换IPv6的in6_addr,因此函数接口是void *addrptr。
基于TCP协议的网络程序:
下图是基于TCP协议的客户端/服务器程序的一般流程(该图出自[UNPv13e]):
建立连接的过程(该图出自[UNPv13e]):
服务器调用socket()、bind()、listen()完成初始化后,调用accept()阻塞等待,处于监听端口的状态,客户端调用socket()初始化后,调用connect()发出SYN段并阻塞等待服务器应答,服务器应答一个SYN-ACK段,客户端收到后从connect()返回,同时应答一个ACK段,服务器收到后从accept()返回。
数据传输的过程:
建立连接后,TCP协议提供全双工的通信服务,但是一般的客户端/服务器程序的流程是由客户端主动发起请求,服务器被动处理请求,一问一答的方式。因此,服务器从accept()返回后立刻调用read(),读socket就像读管道一样,如果没有数据到达就阻塞等待,这时客户端调用write()发送请求给服务器,服务器收到后从read()返回,对客户端的请求进行处理,在此期间客户端调用read()阻塞等待服务器的应答,服务器调用write()将处理结果发回给客户端,再次调用read()阻塞等待下一条请求,客户端收到后从read()返回,发送下一条请求,如此循环下去。
关闭连接的过程(该图出自[UNPv13e]):
如果客户端没有更多的请求了,就调用close()关闭连接,就像写端关闭的管道一样,服务器的read()返回0,这样服务器就知道客户端关闭了连接,也调用close()关闭连接。注意,任何一方调用close()后,连接的两个传输方向都关闭,不能再发送数据了。如果一方调用shutdown()则连接处于半关闭状态,仍可接收对方发来的数据。
在学习socket API时要注意应用程序和TCP协议层是如何交互的: *应用程序调用某个socket函数时TCP协议层完成什么动作,比如调用connect()会发出SYN段 *应用程序如何知道TCP协议层的状态变化,比如从某个阻塞的socket函数返回就表明TCP协议收到了某些段,再比如read()返回0就表明收到了FIN段。
最简单的TCP网络程序
下面通过最简单的客户端/服务端程序的实例来学习socket API 。
server.c 的作用是从客户端读取字符,然后将每个字符转换为大写并会送给客户端。
- /*server.c*/
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <unistd.h>
- #include <sys/socket.h>
- #include <netinet/in.h>
- #include <ctype.h>
- #include <arpa/inet.h>
-
- #define MAX_LINE 80
- #define SERV_PORT 8000
-
-
- int main(void){
- struct sockaddr_in servaddr, cliaddr;
- socklen_t cliaddr_len;
- int listenfd, connfd;
- char buf[MAX_LINE];
- char str[INET_ADDRSTRLEN];
- int i, n;
-
- listenfd = socket(AF_INET, SOCK_STREAM, 0);
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port=htons(SERV_PORT);
-
- bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- listen(listenfd, 20);
- printf("Accepting connectios ...\n");
- while (1) {
- cliaddr_len= sizeof(cliaddr);
- connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &cliaddr_len);
- n = read(connfd, buf, MAX_LINE);
- printf("received from %s\n", inet_ntop(AF_INET, &cliaddr.sin_addr, str, sizeof(str)));
- printf("received port %d\n", ntohs(cliaddr.sin_port));
- for (i=0; i<n; i++)
- buf[i] = toupper(buf[i]);
- write(connfd, buf, n);
- close(connfd);
- }
- return 0;
- }
下面介绍程序中用到的socket API, 这些函数都在 sys/socket.h中。
int socket(int family, int type, int protocol);
socket()打开一个网络通讯端口,如果成功的话,就像open()一样返回一个文件描述符,应用程序可以像读写文件一样用read/write在网络上收发数据,如果socket()调用出错则返回-1。对于IPv4,family参数指定为AF_INET。对于TCP协议,type参数指定为SOCK_STREAM,表示面向流的传输协议。如果是UDP协议,则type参数指定为SOCK_DGRAM,表示面向数据报的传输协议。protocol 参数的介绍从略,指定为0即可。
int bind(int sockfd, const struct sockaddr *myaddr, socklen_t addrlen);
服务器程序所监听的网络地址和端口号通常是固定不变的,客户端程序得知服务器程序的地址和端口号后就可以向服务器发起连接,因此服务器需要调用bind绑定一个固定的网络地址和端口号。bind() 成功返回0,失败返回-1。
bind() 的作用是将参数sockfd和myaddr绑定在一起,使sockfd这个用于网络通讯的文件描述符监听myaddr所描述的地址和端口号。前面讲过,struct sockaddr *是一个通用指针类型,myaddr 参数实际上可以接受多种协议的sockaddr结构体,而它们的长度各不相同,所以需要第三个参数addrlen指定结构体的长度。我们的程序中对myaddr参数是这样初始化的:
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port = htons(SERV_PORT);
首先将整个结构体清零,然后设置地址类型为AF_INET,网络地址为INADDR_ANY,这个宏表示本地的任意IP地址,因为服务器可能有多个网卡,每个网卡也可能绑定多个IP地址,这样设置可以在所有的IP地址上监听,直到与某个客户端建立了连接时才确定下来到底用哪个IP地址,端口号为SERV_PORT,我们定义为8000。
int listen(int sockfd, int backlog);
典型的服务器程序可以同时服务于多个客户端,当有客户端发起连接时,服务器调用的accept()返回并接受这个连接,如果有大量的客户端发起连接而服务器来不及处理,尚未accept的客户端就处于连接等待状态,listen()声明sockfd处于监听状态,并且最多允许有backlog个客户端处于连接等待状态,如果接收到更多的连接请求就忽略。listen()成功返回0,失败返回-1。
int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);
三方握手完成后,服务器调用 accept() 接受连接,如果服务器调用 accept() 时还没有客户端的连接请求,就阻塞等待直到有客户端连接上来。cliaddr是一个传出参数,accept() 返回时传出客户端的地址和端口号。addrlen参数是一个传入传出参数(value-result argument),传入的是调用者提供的缓冲区cliaddr的长度以避免缓冲区溢出问题,传出的是客户端地址结构体的实际长度(有可能没有占满调用者提供的缓冲区)。如果给cliaddr参数传NULL,表示不关心客户端的地址。
我们的服务器程序结构是这样的:
- while (1) {
- cliaddr_len = sizeof(cliaddr);
- connfd = accept(listenfd,
- (struct sockaddr *)&cliaddr, &cliaddr_len);
- n = read(connfd, buf, MAXLINE);
- ......
- close(connfd);
- }
整个是一个while死循环,每次循环处理一个客户端连接。由于cliaddr_len是传入传出参数,每次调用accept()之前应该重新赋初值。accept()的参数listenfd是先前的监听文件描述符,而accept()的返回值是另外一个文件描述符connfd,之后与客户端之间就通过这个connfd通讯,最后关闭connfd 断开连接,而不关闭listenfd,再次回到循环开头listenfd 仍然用作accept的参数。accept()成功返回一个文件描述符,出错返回-1。
client.c 的作用是从命令行参数中获得一个字符串发给服务器,然后接收服务器返回的字符串并打印。
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <unistd.h>
- #include <sys/socket.h>
- #include <netinet/in.h>
- #include <arpa/inet.h>
-
- #define MAXLINE 80
- #define SERV_PORT 8000
-
-
- int main(int argc, char* argv[]){
- struct sockaddr_in servaddr;
- char buf[MAXLINE];
- int sockfd, n;
- char *str;
- if (argc !=2){
- fputs("usage: ./client messsage\n", stderr);
- exit(1);
- }
- str = argv[1];
- sockfd = socket(AF_INET, SOCK_STREAM, 0);
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- inet_pton(AF_INET, "127.0.0.1", &servaddr.sin_addr);
- servaddr.sin_port = htons(SERV_PORT);
-
- connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- write(sockfd, str, strlen(str));
-
- n = read(sockfd, buf, MAXLINE);
- printf("Response from server:\n");
- write(STDOUT_FILENO, buf, n);
-
- close(sockfd);
- return 0;
- }
由于客户端不需要固定的端口号,因此不必调用bind(),客户端的端口号由内核自动分配。注意,客户端不是不允许调用bind(),只是没有必要调用bind()固定一个端口号,服务器也不是必须调用bind(),但如果服务器不调用bind(),内核会自动给服务器分配监听端口,每次启动服务器时端口号都不一样,客户端要连接服务器就会遇到麻烦。
connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen);
客户端需要调用 connect() 连接服务器,connect 和 bind的参数形式一致,区别在于bind的参数是自己的地址,而connect的参数是对方的地址。connect()成功返回0,出错返回-1。
先编译运行服务器:
- [root@localhost socket]# ./server
- Accepting connectios ...
然后在另一个终端里用netstat命令查看:
- [root@localhost socket]# netstat -apn|grep 8000
- tcp 0 0 0.0.0.0:8000 0.0.0.0:* LISTEN 1957/./server
- unix 2 [ ] DGRAM 80003 1696/sshd: root@pts
- [root@localhost socket]#
可以看到server进程监听8000端口,IP地址还没有确定下来。现在编译运行客户端:
- [root@localhost socket]# ./client aaa
- Response from server:
- AAA[root@localhost socket]#
回到server所在的终端,查看server的输出:
- [root@localhost socket]# ./server
- Accepting connectios ...
- received from 127.0.0.1
- received port 47894
可见客户端的端口号是自动分配的。现在把客户端所连接的服务器IP改为其他主机的IP,试试两台主机的通讯。
再做一个实验,在客户端的connect() 代码之后插入一个while(1); 死循环,使客户端和服务器处于连接中的状态,用 netstat 命令查看:
应用程序中的一个socket 文件描述符对应一个socket pair,也就是源地址:源端口号和目的地址:目的端口号,也对应一个TCP连接。
client 和 server的socket状态
socket文件描述符 | 原地址:源端口 | 目的地址:目的端口号 | 状态 |
server.c中的listenfd | 0.0.0.0:8000 | 0.0.0.0:* | LISTEN |
server.c中的connfd | 127.0.0.10:8000 | 127.0.0.0.1:44406 | ESTABLISHED |
client.c中的sockfd | 127.0.0.0:44406 | 127.0.0.1:46640 | ESTABLISHED |
错误处理和读写控制
上面的例子不仅功能简单,而且简单到几乎没有什么错误处理,我们知道,系统调用不能保证每次都成功,必须进行出错处理,这样一方面可以保证程序逻辑正常,另一方面可以迅速得到故障信息。
为使错误处理的代码不影响主程序的可读性,我们把与socket相关的一些系统函数加上错误处
理代码包装成新的函数,做成一个模块wrap.c:
- #include <stdlib.h>
- #include <errno.h>
- #include <sys/socket.h>
-
- void perr_exit(const char* s){
- perror(s);
- exit(1);
- }
-
-
- int Accept(int fd, struct sockaddr *sa, socklen_t *salenptr){
- int n;
- again:
- if ((n = accept(fd, sa, salenptr))< 0 ) {
- if ((errno == ECONNABORTED) || (errno == EINTR))
- goto again;
- else
- perr_exit("accept error");
- }
- return n;
- }
-
-
- void Bind(int fd, const struct sockaddr *sa, socklen_t salen){
- if (bind(fd, sa, salen) < 0)
- perr_exit("bind error");
-
- }
-
-
- void Connect(int fd, const struct sockaddr *sa, socklen_t salen){
- if (connect(fd, sa, salen) < 0)
- perr_exit("connect error");
- }
-
-
- void Listen(int fd, int backlog){
- if (listen(fd, backlog) < 0)
- perr_exit("listen error");
- }
-
-
- int Socket(int family, int type, int protocol){
- int n;
- if ((n=socket(family, type, protocol))<0)
- perr_exit("socket error");
- return n;
- }
-
- ssize_t Read(int fd, void *ptr, size_t nbytes){
- ssize_t n;
- again:
- if ((n=read(fd, ptr, nbytes)) == -1) {
- if (errno == EINTR)
- goto again;
- else
- return -1;
- }
- return 0;
- }
-
- ssize_t Write(int fd, const void *ptr, size_t nbytes){
- ssize_t n;
- again:
- if ((n=write(fd, ptr, nbytes)) == -1){
- if (errno == EINTR)
- goto again;
- else
- return -1;
- }
- return n;
- }
-
- void Close(int fd){
- if (close(fd) == -1)
- perr_exit("close error");
- }
慢系统调用 accept、read和write被信号中断时应该重试。connect虽然也会阻塞,但是被信号中断时不能立刻重试。对于accept,如果errno是ECONNABORTED,也应该重试。详细解释见参考资料。
TCP协议是面向流的,read和write调用的返回值往往小于参数指定的字节数。对于read调用,如果接收缓冲区中有20字节,请求读100个字节,就会返回20。对于write调用,如果请求写100个字节,而发送缓冲区中只有20个字节的空闲位置,那么write会阻塞,直到把100个字节全部交给发送缓冲区才返回,但如果socket文件描述符有O_NONBLOCK标志,则write不阻塞,直接返回20。为避免这些情况干扰主程序的逻辑,确保读写我们所请求的字节数,我们实现了两个包装函数readn和writen,也放在wrap.c中:
- ssize_t Readn(int fd, void *vptr, size_t n){
- size_t nlet;
- ssize_t nread;
- char *ptr;
-
- ptr = vptr;
- nleft = n;
- while(nleft > 0){
- if ((nread=read(fd, ptr, nleft)) < 0 ){
- if (errno==EINTR)
- nread =0;
- else
- return -1;
- } else if (nread == 0)
- break;
- nleft -=nread;
- ptr += nread;
- }
- return n - nleft;
- }
-
- ssize_t Writen(int fd, const void *vptr, size_t n){
- size_t nleft;
- ssize_t nwritten;
- const char *ptr;
-
- ptr = vptr;
- nleft = n;
- while (nleft>0) {
- if ((nwritten = write(fd, ptr, nleft)) <=0){
- if (nwritten <0 && errno == EINTR)
- nwritten = 0;
- else
- return -1;
- }
- nleft -=nwritten;
- ptr += nwritten;
- }
- return n;
- }
如果应用层协议的各字段长度固定,用readn来读是非常方便的。例如设计一种客户端上传文件的协议,规定前12字节表示文件名,超过12字节的文件名截断,不足12字节的文件名用'\0'补齐,从第13字节开始是文件内容,上传完所有文件内容后关闭连接,服务器可以先调用readn读12个字节,根据文件名创建文件,然后在一个循环中调用read读文件内容并存盘,循环结束的条件是read返回0。
字段长度固定的协议往往不够灵活,难以适应新的变化。比如,以前DOS的文件名是8字节主文件名加“.”加3字节扩展名,不超过12字节,但是现代操作系统的文件名可以长得多,12字节就不够用了。那么制定一个新版本的协议规定文件名字段为256字节怎么样?这样又造成很大的浪费,因为大多数文件名都很短,需要用大量的'\0'补齐256字节,而且新版本的协议和老版本的程序无法兼容,如果已经有很多人在用老版本的程序了,会造成遵循新协议的程序与老版本程序的互操作性(Interoperability)问题。如果新版本的协议要添加新的字段,比如规定前12字节是文件名,从13到16字节是文件类型说明,从第17字节开始才是文件内容,同样会造成和老版本的程序无法兼容的问题。
现在重新看看上一节的TFTP协议是如何避免上述问题的:TFTP协议的各字段是可变长的,以'\0'为分隔符,文件名可以任意长,再看blksize等几个选项字段,TFTP协议并没有规定从第m字节到第n字节是blksize的值,而是把选项的描述信息“blksize”与它的值“512”一起做成一个可变长的字段,这样,以后添加新的选项仍然可以和老版本的程序兼容(老版本的程序只要忽略不认识的选项就行了)。
因此,常见的应用层协议都是带有可变长字段的,字段之间的分隔符用换行的比用'\0'的更常见,例如本节后面要介绍的HTTP协议。可变长字段的协议用readn来读就很不方便了,为此我们实现一个类似于fgets的readline函数,也放在wrap.c中:
- static ssize_t my_read(int fd, char *ptr){
-
- static int read_cnt;
- static char *read_ptr;
- static char read_bu[100];
-
- if (read_cnt <=0) {
- again:
- if ( (read_cnt =read(fd, read_buf, sizeof(read_buf)) ) < 0 ) {
- if (errno == EINTR)
- goto again;
- return -1;
-
- } else if (read_cnt == 0)
- return 0;
- read_ptr = read_buf;
- }
- read_cnt--;
- *ptr = *read_ptr++;
- return 1;
- }
-
- ssize_t Readline(int fd, void *vptr, size_t manx_len){
- ssize_t n, rc;
- char c, *ptr;
-
- ptr = vptr;
- for (n=1; n < maxlen; n++){
- if ((rc = my_read(fd, &c)) == -1){
- *ptr++ =c;
- if (c == '\n')
- break;
- }else if (rc ==0 ){
- *ptr = 0;
- return n-1;
- }else
- return -1;
- }
- *ptr =0;
- return n;
- }
习题
1、请读者自己写出wrap.c的头文件wrap.h,后面的网络程序代码都要用到这个头文件。
2、修改server.c和client.c,添加错误处理。
2.3. 把client改为交互式输入
目前实现的client每次运行只能从命令行读取一个字符串发给服务器,再从服务器收回来,现在
我们把它改成交互式的,不断从终端接受用户输入并和server交互。
- #include <stdio.h>
- #include <string.h>
- #include <unistd.h>
- #include <arpa/inet.h>
- #include <netinet/in.h>
- #include "wrap.h"
-
- #define MAXLINE 80
- #define SERV_PORT 8000
-
-
- int main(int argc, char* argv[]){
- struct sockaddr_in servaddr;
- char buf[MAXLINE];
- int sockfd, n;
-
- sockfd = Socket(AF_INET, SOCK_STREAM, 0);
- //sockfd = socket(AF_INET, SOCK_STREAM, 0);
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- inet_pton(AF_INET, "127.0.0.1", &servaddr.sin_addr);
- servaddr.sin_port = htons(SERV_PORT);
-
- Connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- //connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- while (fgets(buf, MAXLINE, stdin)!=NULL) {
- Write(sockfd, buf, strlen(buf));
- //write(sockfd, buf, strlen(buf));
-
- n = Read(sockfd, buf, MAXLINE);
- //n = read(sockfd, buf, MAXLINE);
- if (n == 0 ) {
- printf("the other side has been closed.\n");
- } else {
- Write(STDOUT_FILENO, buf, n);
- // write(STDOUT_FILENO, buf, n);
- }
- }
- Close(sockfd);
- //close(sockfd);
- return 0;
- }
- /*server.c*/
- #include "wrap.h"
-
- #define MAXLINE 80
- #define SERV_PORT 8000
-
-
- int main(void){
-
- struct sockaddr_in servaddr, cliaddr;
- socklen_t cliaddr_len;
- int listenfd, connfd;
- char buf[MAXLINE];
- char str[INET_ADDRSTRLEN];
- int i, n;
-
- listenfd = socket(AF_INET, SOCK_STREAM, 0);
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port=htons(SERV_PORT);
-
- Bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- Listen(listenfd, 20);
- printf("Accepting connectios ...\n");
-
- while(1){
- cliaddr_len= sizeof(cliaddr);
- connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &cliaddr_len);
- while(1){
- n = Read(connfd, buf, MAXLINE);
- if (n == 0 ){
- printf("the other side has been closed.\n");
- break;
- }
- printf("received from %s\n", inet_ntop(AF_INET, &cliaddr.sin_addr, str, sizeof(str)));
- printf("received port %d\n", ntohs(cliaddr.sin_port));
- for (i=0; i< n; i++)
- buf[i] = toupper(buf[i]);
- Write(connfd, buf, n);
- }
- Close(connfd);
- }
- return 0;
- }
分别执行 gcc client.c wrap.c -o client 和 gcc server.c wrap.c -o server 来生成对应的可执行文件。
如上修改止之后,客户端可以和服务端进行多次交互。我们知道,服务器通常是要同时服务多个客户端的,运行上面的server和client之后,再开一个终端运行client试试,结果会发现client不能获取服务,想想为什么呢?
2.4. 使用fork并发处理多个client的请求
怎么解决这个问题?网络服务器通常用fork来同时服务多个客户端,父进程专门负责监听端口,每次accept一个新的客户端连接就fork出一个子进程专门服务这个客户端。但是子进程退出时会产生僵尸进程,父进程要注意处理SIGCHLD信号和调用wait清理僵尸进程。以下给出代码框架,完整的代码请读者自己完成。
以下给出代码框架,完整的代码请读者自己完成。
- listenfd = socket(...);
- bind(listenfd, ...);
- listen(listenfd, ...);
- while (1) {
- connfd = accept(listenfd, ...);
- n = fork();
- if (n == -1) {
- perror("call to fork");
- exit(1);
- } else if (n == 0) {
- close(listenfd);
- while (1) {
- read(connfd, ...);
- ...
- write(connfd, ...);
- }
- close(connfd);
- exit(0);
- } else {
- close(connfd);
- }
-
- }
2.5. setsockopt
现在做一个测试,首先启动server,然后启动client,然后用Ctrl-C使server终止,这时马上再运行server,结果是:
这是因为,虽然server的应用程序终止了,但TCP协议层的连接并没有完全断开,因此不能再次监听同样的server端口。我们用netstat命令查看一下:
netstat -apn 命令用于查看所有进程和端口号使用情况
server终止时,socket描述符会自动关闭并发FIN段给client,client收到FIN后处于CLOSE_WAIT状态,但是client并没有终止,也没有关闭socket描述符,因此不会发FIN给server,因此server的TCP连接处于FIN_WAIT2状态。
现在用Ctrl-C把client也终止掉,再观察现象:
client 终止时自动关闭socket描述符,server的TCP连接收到client发的FIN段后处于TIME_WAIT状态。TCP协议规定,主动关闭连接的一方要处于TIME_WAIT状态,等待两个MSL(maximum segment lifetime)的时间后才能回到CLOSED状态,因为我们先Ctrl-C终止了server,所以server是主动关闭连接的一方,在TIME_WAIT期间仍然不能再次监听同样的server端口。MSL在RFC1122中规定为两分钟,但是各操作系统的实现不同,在Linux上一般经过半分钟后就可以再次启动server了。至于为什么要规定TIME_WAIT的时间请读者参考UNP2.7节。
在server的TCP连接没有完全断开之前不允许重新监听是不合理的,因为,TCP连接没有完全断开指的是connfd(127.0.0.1:8000)没有完全断开,而我们重新监听的是listenfd(0.0.0.0:8000),虽然是占用同一个端口,但IP地址不同,connfd对应的是与某个客户端通讯的一个具体的IP地址,而listenfd对应的是wildcard address。解决这个问题的方法是使用setsockopt()设置socket描述符的选项SO_REUSEADDR为1,表示允许创建端口号相同但IP地址不同的多个socket描述符。在server代码的socket()和bind()调用之间插入如下代码:
有关setsockopt可以设置的其它选项请参考UNP第7章。
2.6. 使用select
select是网络程序中很常用的一个系统调用,它可以同时监听多个阻塞的文件描述符(例如多个网络连接),哪个有数据到达就处理哪个,这样,不需要fork和多进程就可以实现并发服务的server。
- /*select_server.c*/
- #include "wrap.h"
-
- #define MAXLINE 80
- #define SERV_PORT 8000
-
-
- int main(void){
-
- int i, maxi, maxfd, listenfd, connfd, sockfd;
- int nready, client[FD_SETSIZE];
- ssize_t n;
- fd_set rset, allset;
- char buf[MAXLINE];
- char str[INET_ADDRSTRLEN];
- socklen_t cliaddr_len;
- struct sockaddr_in cliaddr, servaddr;
-
-
- listenfd = Socket(AF_INET, SOCK_STREAM, 0);
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port=htons(SERV_PORT);
-
- Bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- Listen(listenfd, 20);
- maxfd = listenfd; /*initialize*/
- maxi = -1; /*index into client[] array*/
- printf("FD_SETSIZE....................%d", FD_SETSIZE);
- for (i=0; i< FD_SETSIZE; i++){
- client[i] = -1; /* -1 indicates available entry*/
- }
- FD_ZERO(&allset);
- FD_SET(listenfd, &allset);
-
- for (;;){
- rset = allset; /*structure assignment*/
- nready = select(maxfd+1, &rset, NULL, NULL, NULL);
- if (nready <0 ){
- perr_exit("select error");
- }
- if (FD_ISSET(listenfd, &rset)){ /*new client connection*/
- cliaddr_len = sizeof(cliaddr);
- connfd = Accept(listenfd, (struct sockaddr *)&cliaddr, &cliaddr_len);
- printf("received from %s at PORT %d\n",
- inet_ntop(AF_INET,
- &cliaddr.sin_addr, str, sizeof(str)),
- ntohs(cliaddr.sin_port)
- );
- for (i=0; i< FD_SETSIZE; i++){
- if (client[i] < 0){
- client[i] = connfd; /*save descriptor*/
- break;
- }
- }
- if (i == FD_SETSIZE){
- fputs("too many clients\n", stderr);
- exit(1);
- }
- FD_SET(connfd, &allset); /*add new descriptor to set*/
- if (connfd > maxfd) {
- maxfd = connfd; /*for select */
- }
- if (i > maxi){
- maxi= i; /*max index in client[] array*/
- }
- if (--nready ==0 ){
- continue; /* no more readable descriptors*/
- }
- }
- printf("begin......%d\n", maxi);
- for (i = 0; i <= maxi; i++ ){ /*check all clients for data*/
- if ((sockfd = client[i]) < 0){
- continue;
- }
- if (FD_ISSET(sockfd, &rset)){
- if ( (n=Read(sockfd, buf, MAXLINE)) == 0 ){
- /*connection closed by client*/
- Close(sockfd);
- FD_CLR(sockfd, &allset);
- client[i] = -1;
- }else{
- int j;
- for (j=0; j<n; j++){
- buf[j] = toupper(buf[j]);
- }
- Write(sockfd, buf, n);
- }
- if (--nready ==0 ){
- break; /*no more readable descriptors*/
- }
- }
- }
- }
- return 0;
- }
通过实验发现,在打开多个终端之后,执行./client 开启多个客户端程序,会发现不会出现服务器不响应请求的现象,说明已经解决了服务端同时处理多个客户端请求的问题。
注意:FD_SETSIZE 大小是1024。
注意:在写这些代码的时候,特别要注意条件判断,如果条件判断有问题,则可能会导致程序卡死的现象发生。
3. 基于UDP协议的网络程序
下图是典型的UDP客户端/服务器通讯过程(该图出自[UNPv13e])。
以下是简单的UDP服务器和客户端程序
- /*server.c*/
- #include "wrap.h"
-
- #define MAXLINE 80
- #define SERV_PORT 8000
-
- int main (void) {
- struct sockaddr_in servaddr, cliaddr;
- socklen_t cliaddr_len;
- int sockfd;
- char buf[MAXLINE];
- char str[INET_ADDRSTRLEN];
-
- int i, n;
- sockfd = Socket(AF_INET, SOCK_DGRAM, 0);
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port = htons(SERV_PORT);
-
- Bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));
- printf("Accepting connections.....\n");
-
- while(1){
- cliaddr_len = sizeof(cliaddr);
- n = recvfrom(sockfd, buf, MAXLINE, 0, (struct sockaddr *)&cliaddr, &cliaddr_len);
- if (n == -1){
- perr_exit("recvfrom error");
- }
- printf("received from %s at PORT %d\n",
- inet_ntop(AF_INET, &cliaddr.sin_addr, str, sizeof(str)),
- ntohs(cliaddr.sin_port)
- );
- for (i =0; i< n; i++) {
- buf[i] = toupper(buf[i]);
- }
- printf("server buf %s\n", buf);
- n = sendto(sockfd, buf, n, 0, (struct sockaddr *)&cliaddr, sizeof(cliaddr));
- if (n == -1){
- perr_exit("sendto error");
- }
- }
-
- }
- /*client.c*/
-
- #include "wrap.h"
-
- #define MAXLINE 80
- #define SERV_PORT 8000
-
- int main(int argc, char *argv[]){
-
- struct sockaddr_in servaddr;
- int sockfd, n;
- char buf[MAXLINE];
- char str[INET_ADDRSTRLEN];
- socklen_t servaddr_len;
-
- sockfd = Socket(AF_INET, SOCK_DGRAM, 0 );
-
- bzero(&servaddr, sizeof(servaddr));
- servaddr.sin_family = AF_INET;
- inet_pton(AF_INET, "127.0.0.1", &servaddr.sin_addr);
- servaddr.sin_port = htons(SERV_PORT);
-
- while (fgets(buf, MAXLINE, stdin) !=NULL){
- n = sendto(sockfd, buf, strlen(buf), 0, (struct sockaddr *)&servaddr, sizeof(servaddr));
- if (n == -1){
- perr_exit("sendto error");
- }
- n = recvfrom(sockfd, buf, MAXLINE, 0, NULL, 0);
- if (n == -1){
- perr_exit("recvfrom server");
- }
- Write(STDOUT_FILENO, buf, n);
- }
- Close(sockfd);
- return 0;
- }
由于UDP不需要维护连接,程序逻辑简单了很多,但是UDP协议是不可靠的,实际上有很多保证通讯可靠性的机制需要在应用层实现。
编译运行server,在两个终端里各开一个client与server交互,看看server是否具有并发服务的能力。用Ctrl+C关闭server,然后再运行server,看此时client还能否和server联系上。和前面TCP程序的运行结果相比较,体会无连接的含义。
参考:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。