怎么建一个支持10万左右TCP连接的服务器

怎么建一个支持10万左右TCP连接的服务器,第1张

不知道你是否对10万个连接有概念,但你的意思应该是指并发连接吧,说实话是很大了,就算把并发的概念放大一点,每秒10万个连接。

这么大的连接数,主要考验的是服务器的性能,具体需要什么配置或档次,这需要详细的测试,除非具体做过这方面工程的公司或类似大型门户的公司有具体数据,网上不容易找到详细的测试文档,但这肯定要涉及到负载均衡和服务器的集群两项技术。

三报文握手(three way handshake)以前都称为三次握手,其实这是一次握手过程中交换中交换了三个报文,而并不是进行了三次握手。handshake使用的是单数并不是复数,表明只是一次握手。

1SYN_SENT

SYN_SENT表示请求连接,当你要访问其它的计算机的服务时首先要发个 同步信号 给该端口,此时状态为SYN_SENT,如果连接成功了就变为 ESTABLISHED ,此时SYN_SENT状态非常短暂。

2ACK

ACK (Acknowledgement)即是确认字符,在数据通信中,接收站发给发送站的一种传输类 控制字符 。表示发来的数据已确认接收无误。

3SYN_RCVD(同步收到)

4ESTAB_LISHED(已建立连接)

5传输控制模块TCB

传输控制模块TCB(Transmission Control Block)存储了每一个连接中的一些重要信息。

一开始,B的PCP服务器进程先创建 传输控制模块TCB ,准备接受客户进程的连接请求。然后服务器进程就处于 LISTEN (收听)状态,等待客户的连接请求。

1SYN=1,seq=x

A的TCP客户进程也是首先创建 传输控制模块TCB ,然后,在打算建立TCP连接时,向B发出请求报文段,这时首部中的同步位 SYN=1 ,同时选择一个初始序号 seq=x 。即 SYN=1,seq=x 。TCP规定,SYN报文段(即SYN=1的报文段)不能携带数据,但要 消耗一个序号 。这时,TCP客户进程进入 SYN_SENT (同步已发送)状态。

2SYN=1,ACK=1,seq=y,ack=x+1

B收到连接请求报文段后,如同意建立连接,则向A发送确认。在确认报文段中应把SYN位和ACK位都置1,确认号是 ack=x+1 ,同时也为自己选择一个初始号 seq=y 。即 SYN=1,ACK=1,seq=y,ack=x+1

请注意:这个报文段也不能携带数据,但同时 要消耗一个序号 。这时TCP服务器进程进入 SYN_RCVD (同步收到)状态。

3ACK=1,seq=x+1,ack=y+1

TCP客户进程收到B的确认后,还要向B给出确认。确认报文段的ACK置1,确认号 ack=y+1 ,而自己的序号 seq=x+1 。即 ACK=1,seq=x+1,ack=y+1 TCP的标准规定,ACK报文段可以携带数据。但 如果不携带数据则不消耗序号 ,在这中情况下,下一个数据报文段仍然是 seq=x+1 。这时。TCP连接已经建立,A进入 ESTAB_LISHED (已建立连接)状态。

4 当B收到A的确认后,也进入 ESTAB_LISHED 状态。

1、先提出一个问题, 可以不进行三次握手直接往服务端发送数据包吗?

是不可以的,也是可以的

1)不可以是因为现在的TCP连接标准和规范要求传输数据前先确认两端的状态,有一端状态不OK的话,发数据包有什么用呢;

2)说可以是站在网络连接的角度,像 UDP 协议;

2、TCP三次握手

1)标志位、随机序列号和确认序列号是在数据包的 TCP 首部里面;

2)几个状态是指客户端和服务端连接过程中 socket 状态;

3)第一次握手,客户端向服务端发送数据包,该数据包中 SYN 标志位为 1,还有随机生成的序列号c_seq,客户端状态改为 SYN-SENT ;

4)第二次握手,服务端接收到客户端发过来的数据包中 SYN 标志位为 1,就知道客户端想和自己建立连接,服务端会根据自身的情况决定是拒绝连接,或确定连接,还是丢弃该数据包;

拒绝连接,会往客户端发一个数据包,该数据包中 RST 标志位为 1,客户端会报 Connection refused ;

丢弃客户端的数据包,超过一定时间后客户端会报 Connection timeout;

确定连接时会往客户端发一个数据包,该数据包中 ACK 标志位为 1,确认序列号 ack=c_seq+1,SYN 标志位为 1,随机序列号 s_seq,状态由 LISTEN 改为 SYN-RCVD ;

5)第三次握手,客户端接收到数据包会做校验,校验ACK标志位和确认序列号 ack=c_seq+1,如果确定是服务端的确认数据包,改自己的状态为 ESTABLISHED ,并给服务端发确认数据包;

6)服务端接到客户端数据包,会校验ACK标志位和确认序列号 ack=s_seq+1,改自己的状态为 ESTABLISHED ,之后就可以进行数据传输了;

7)建立连接时的数据包是没有实际内容的,没有应用层的数据;

8)建立连接之后发起的请求数据包,每个数据包都会封装各层协议的头部信息,标志位ACK为1,其他标志位变动;

9)网络进程间的通信,一台服务器内部的进程间通信不用这样;

3、TCP 连接三次握手抓包

1)Socket 在 linux 系统中是一种特殊的文件,因为 linux 系统的理念就是一切皆文件,是系统内核级的功能;

2)以上定义比较具体,可以抽象来理解,是一个内核级的用于通信的功能层,包含一组接口函数,这些函数实际就是操作 socket 文件句柄文件描述符;

一个 TCP 连接由四要素源IP、源Port、目标IP、目标Port唯一标识,也即 socket 由这四要素唯一确定;

一个 TCP 连接的建立也就是客户端、服务端创建了相对应的一对 socket,客户端和服务端之间的通信也就是这对 socket 间的通信(物理层面是网卡在发送/接收比特流数据);

3) 一个服务与另一个服务建立连接,他们的端口是什么呢

客户端发出请求端口号是随机的,服务端是进程监听的端口号;

2、socket 主要函数介绍

1、进程通信,一个进程只有一个监听 socket,connect socket 是针对一个客户的一个连接的,有很多个; 2、connect 函数内部在发起请求前会找系统随机一个端口号; 3、连接建立后,客户端发起请求传输数据,服务端会直接交给 connect socket 处理,不会交给监听 socket 处理;

4、监听 socket 在处理客户端请求时,如果此时其他客户端发请求过来,监听 socket 是没法处理的,此时系统会维护请求队列由 backlog 参数指定;

全连接队列(completed connection queue)

半连接队列(incomplete connection queue)

Linux 内核 22 版本之前 ,backlog 的大小等于全连接队列和半连接队列之和;

Linux 内核 22 版本之后 ,backlog 的大小之和全连接队列有关系:

半连接队列大小由 /proc/sys/net/ipv4/tcp_max_syn_backlog 文件指定,可以开很大;

全连接队列大小由 /proc/sys/net/core/somaxconn 文件和 backlog 参数指定,取两个中的最小值;

tomcat acceptCount 就是配置全连接队列大小;

3、socket 函数在建立连接和数据传输的大概使用情况

4、TCP首部结构

1)2的16次方等于 65536,所以系统中端口号的限制个数为 65536,一般1024以下端口被系统占用;

2)标志位这里是 6 个,还有其他标志位的,只是这 6 个标志位常用;

3)seq 序列号,ack 确认序列号,序列号在数据传输时分包用到。三次握手时 seq 序列号是随机的,没有实际意义;

4)TCP 包首部后面接着的是 IP 包首部,再紧接着的是以太网包首部,其实都是加 0101010101 二进制位;

几个常用标志位,首先一个标志位占一个 bit 位,只能是二进制中的 1 或 0;

1)SYN ,简写 S ,请求标志位,用来建立连接。在TCP三次握手中收到带有该标志位的数据包,表示对方想与己方建立连接;

2)ACK ,简写 ,请求确认/应答标志位,用于对对方的请求进行应答,对方收到含该标志位的数据包,会知道己方存在且可用。也会用在连接建立之后,己方发送响应数据给对方的数据包中;

3)FIN ,简写 F ,请求断开标志位,用于断开连接。对方收到己方的含该标志位的数据包,就知道己方想与它断开连接,不再保持连接;

4)RST ,简写 R ,请求复位标志位,因网络或己方服务原因导致有数据包丢失,己方接收到的数据包序列号与上一个数据包的序列号不衔接,那己方会发送含该标志位的数据包告诉对方,对方接收到含该标志位的数据包就知道己方要求它重新三次握手建立连接并重新发送丢失的数据包,一般断点续传会用到该标志位;

还有就是如果对方发过来的数据错了,有问题,己方也会发送含该标志位的数据包;

5)PSH ,简写 P ,推送标志位,表示收到数据包后要立即交给应用程序去处理,不应该放在缓存中,read()/write() 都有缓存区;

6)URG ,简写 U ,紧急标志位,该标志位表示 tcp 包首部中的紧急指针域有效,督促中间层尽快处理;

7)ECE,在保留位中;

8)CWR,在保留位中;

5、TCP 抓包

1)服务端会根据自身情况,没有要处理的数据时会把第二次和第三次挥手合并成一次挥手,此时标志位 FIN=1 / ACK=1;

2)MSL 是 Maximum Segment Lifetime 缩写,指数据包在网络中最大生存时间,RFC 建议是 2分钟;

详细描述:

1)客户端、服务端都可以主动发起断开连接;

2)第一次挥手,客户端向服务端发送含 FIN=1 标志位的数据包,随机序列号 seq=m,此时客户端状态由 ESTABLISHED 变为 FIN_WAIT_1 ;

3)第二次挥手,服务端收到含 FIN=1 标志位的数据包,就知道客户端要断开连接,服务端会向客户端发送含 ACK=1 标志位的应答数据包,确认序列号 ack=m+1,此时服务端状态由 ESTABLISHED 变为 CLOSE_WAIT ;

4)客户端收到含 ACK=1 标志位的应答数据包,知道服务端的可以断开的意思,此时客户端状态由 FIN_WAIT_1 变为 FIN_WAIT_2 ;(第一、二次挥手也只是双方交换一下意见而已)

5)第三次挥手,服务端处理完剩下的数据后再次向客户端发送含 FIN=1 标志位的数据包,随机序列号 seq=n,告诉客户端现在可以真正的断开连接了,此时服务端状态由 CLOSE_WAIT 变为 LAST_ACK ;

6)第四次挥手,客户端收到服务端再次发送的含 FIN=1 标志位的数据包,就知道服务端处理好了可以断开连接了,但是客户端为了慎重起见,不会立马关闭连接,而是改状态,且向服务端发送含 ACK=1 标志位的应答数据包,确认序列号 ack=n+1,此时客户端状态由 FIN_WAIT_2 变为 TIME_WAIT ;

等待 2 个MSL 时间还是未收到服务端发过来的数据,则表明服务端已经关闭连接了,客户端也会关闭连接释放资源,此时客户端状态由 TIME_WAIT 变为 CLOSED ;

也就是说 TIME_WAIT 状态存在时长在 1~4分钟;

7)服务端收到含 ACK=1 标志位的应答数据包,知道客户端确认可以断开了,就立即关闭连接释放资源,此时服务端状态由 LAST_ACK 变为 CLOSED ;

SYN 洪水攻击(SYN Flood)

是一种 DoS攻击(拒绝服务攻击),大概原理是伪造大量的TCP请求,服务端收到大量的第一次握手的数据包,且都会发第二次握手数据包去回应,但是因为 IP 是伪造的,一直都不会有第三次握手数据包,导致服务端存在大量的半连接,即 SYN_RCVD 状态的连接,导致半连接队列被塞满,且服务端默认会发 5 个第二次握手数据包,耗费大量 CPU 和内存资源,使得正常的连接请求进不来;

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 怎么建一个支持10万左右TCP连接的服务器

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情