Linux TCP通信出现CLOSE_WAIT后导致服务端进程挂掉

在前文中讲述了Linux服务端TCP通信出现CLOSE_WAIT状态的原因，这篇文章主要通过一个实例演示它个一个“恶劣”影响：直接使服务端进程Down掉。

CentOS服务端建立监听端口

一、CentOS服务端建立监听端口

如上图所示，在虚拟机CentOS7服务器（192.168.1.178）中打开一个终端界面，建立8000端口的监听服务（PID:13035）。所用代码如下，和上一篇文章中的程序大体一样，只是多了一个SIGPIPE信号处理以及自动回复(Auto response from server.)部分。

/** 
 * @FileName    server_socket.c
 * @Describe    A simple example for creating a listen as a server and simulate generate a sigpipe signal in linux.
 * @Author      vfhky 2016-02-29 08:01 https://typecodes.com/cseries/tcpclosewaitsigpipe.html
 * @Compile 	gcc server_socket.c -o server_socket
 */
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>
#include <signal.h>

//Whether add a signal handle.
#define SIGNAL_HANDLE 0

void sig_handle( int signal )
{
	printf( "Receive a signal=[%d].\n", signal );
	return;
}

int main( int argc, char **argv )
{
	int server_sockfd;
	int client_sockfd;
	int len;
	int llOpt = 1;
	struct sockaddr_in my_addr;
	struct sockaddr_in remote_addr;
	int sin_size;
	char buf[BUFSIZ];
	memset( &my_addr, 0, sizeof(my_addr) );
	my_addr.sin_family = AF_INET;
	my_addr.sin_addr.s_addr = INADDR_ANY;
	my_addr.sin_port = htons(8000);
	
	#if SIGNAL_HANDLE
	struct sigaction new_act, old_act;
	new_act.sa_handler = sig_handle;
	new_act.sa_flags = 0;
	sigemptyset( &new_act.sa_mask );
	sigaction( SIGPIPE, &new_act, &old_act );
	sigaction( SIGINT, &new_act, &old_act );	
	#endif
	
	if( ( server_sockfd = socket( AF_INET, SOCK_STREAM, 0 ) ) < 0 )
	{  
		perror("socket");
		return 1;
	}
	
	if( setsockopt( server_sockfd, SOL_SOCKET, SO_REUSEADDR, &llOpt, sizeof(llOpt) ) ) {
        close(server_sockfd);
        return errno;
    }
    
	if( bind( server_sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr) ) < 0 )
	{
		perror( "bind" );
		return 1;
	}
	
	listen( server_sockfd, 5 );
	
	sin_size = sizeof( struct sockaddr_in );
	
	printf( "Server is listening with pid=[%d].\n", getpid() );
	
	while(1)
	{
		if( ( client_sockfd = accept( server_sockfd, (struct sockaddr *)&remote_addr, &sin_size ) ) < 0 )
		{
			perror( "accept" );
			return 1;
		}
		//Print the ip address and port of client.
		printf( "Accept client[%s:%u].\n", inet_ntoa(remote_addr.sin_addr), ntohs(remote_addr.sin_port) );
		
		send( client_sockfd, "Auto response from server.", strlen("Auto response from server."), 0 );
		
		memset( buf, 0x00, BUFSIZ );
		while( ( len = recv( client_sockfd ,buf, BUFSIZ, 0) ) > 0 )
		{
			buf[len]='\0';
			printf( "Message from client=[%s]\n", buf );
		}
		close( client_sockfd );
	}
	close( server_sockfd );
	return 0;
}

二、在Linux中利用telnet命令创建一个客户端

新建一个shell脚本netstat_nap.sh，里面只包含一条有效命令netstat -nap|head -n 2;netstat -nap|grep 8000。

再打开一个Linux终端界面，然后输入命令telnet 192.168.1.177 8000作为客户端建立与服务端的TCP连接。这时执行脚本./netstat_nap.sh可以看到Linux客户端（PID:13045）和服务端（PID:13035）的TCP通信已经变成ESTABLISHED状态，效果如下图所示：

Linux中利用netstat和lsof命令查看TCP服务状态

三、在Windows中利用telnet命令创建一个客户端

在Windows主机（192.168.1.110）中打开一个PowerShell终端界面，然后输入命令telnet 192.168.1.177 8000作为客户端建立与Linux服务端的TCP连接。

如下图所示，执行脚本./netstat_nap.sh，可以看到Windows客户端（端口:64012）和服务端（PID:13035）的TCP通信已经变成ESTABLISHED状态。同时使用命令lsof -i:8000，可以看到进程打开的文件。此时，处于LISTEN状态的13035进程对应的Recv-Q（表示内核中已经接收的队列）从0变成了1。

Linux中利用netstat和lsof命令查看TCP服务状态