基于网络遥测的数据中心网络自适应精准拥塞控制技术探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:硕博论文网 点击次数:
论文字数:43255 论文编号:sb2025051515204853291 日期:2025-05-23 来源:硕博论文网

本文是一篇软件工程论文,本文开展了基于网络遥测的数据中心网络自适应精准拥塞控制技术研究。
第一章绪论
1.1研究背景及意义
随着信息化时代的到来,以移动支付、物联网、电子商务为代表的数字经济已成为社会经济的重要组成,据中国信通院发布的《全球经济白皮书(2024年)》统计,2023年中美德日韩等5个国家的数字经济总量超33万亿,占GDP比重60%以上,数据正成为社会经济发展的关键生产要素[1]。数据中心作为数据生产、数据存储和数据处理的基础设施,承担着各种社会应用程序的计算与运营服务功能,其重要性日益上升[2]。
数据中心由大量的服务器构成,数据中心网络需要处理这些服务器产生的各种流量[3,4]。数据中心流量有两个突出特点,一是延时容忍度低,例如网络搜索和数据库存储服务的数据流对延迟非常敏感,有关统计显示延迟每增加100毫秒,谷歌搜索流量就会减少0.3%,亚马逊购物网站收入就会减少1%[5];二是并发性高,由于数据中心采用分区/聚合的工作模式,多个节点会突发的向同一个节点发送数据,所以数据中心存在大量多对一模式的通信流量[6,7]。为了保证良好的服务品质,数据中心网络需要高效地处理网络流量[8,9],为用户提供低时延、高带宽和高稳定的性能保障[10]。
然而,近年来数据中心网络流量几何级的增长[11,12],使得网络拥塞问题日益严重。网络拥塞是指数据流量超过网络链路和设备承载能力时,网络设备出口的排队时延增大、丢包率增加的现象[13],网络拥塞引起的数据传输延迟或丢失将导致数据中心网络性能急剧下降甚至崩溃[14,15]。因此,如何高效地控制拥塞成为数据中心网络领域的一个重要课题。
............................
1.2国内外研究现状
拥塞控制方法根据网络反馈信号类型可以分为六类:基于丢包的拥塞控制、基于ECN(Explicit Congestion Notification)的拥塞控制、基于RTT(Round-TripTime)的拥塞控制、基于BDP的拥塞控制、基于链路利用率的拥塞控制和基于复合信号的拥塞控制,其中基于丢包的拥塞控制、基于BDP的拥塞控制和基于复合信号的拥塞控制由于控制周期长、稳定性不好等原因,难以满足数据中心网络需求,因此,当前面向数据中心的拥塞控制主要包括基于ECN的拥塞控制、基于RTT的拥塞控制和基于链路利用率的拥塞控制三类。
(1)基于ECN的拥塞控制
ECN是IP头部DSCP字段后两位,当交换机出口队列深度超过阈值时,会给数据包打上ECN标记,通知终端降低发送速率。基于ECN的拥塞控制代表方案有DCTCP、DCQCN等。
DCTCP[16(]Datacenter TCP)由M.Alizadeh等人提出,发表在SIGCOMM 2010国际会议上。DCTCP把数据中心流量模式概括为三点,一是TCP流量占99%以上;二是大小流并存,小流数量占比大,大流总量占比大;三是小流并发程度高。DCTCP引入ECN信号来检测网络是否拥塞,当交换机端口队列深度超过阈值时,交换机会对端口的数据包进行ECN标记,接收端收到ECN标记的数据包后通过ACK通知发送端,使发送端在丢包之前感知网络拥塞。DCTCP的发送端基于TCP的窗口调节思想,根据ECN标记的频率量化网络拥塞程度,然后乘性改变发送窗口大小。DCTCP相比传统TCP时延低,带宽高,缓冲区占用减少80%以上,处理并发流的能力提升10倍以上。但DCTCP的拥塞检测方法不能量化当前网络拥塞程度,感知粒度粗;DCTCP的速率控制算法收敛速度慢,不能及时减小队列深度、不能充分利用链路带宽,无法满足小流时延和大流带宽需求。
..............................
第二章拥塞控制技术基础知识
2.1控制机制
拥塞控制最早可以追溯到1986年,当时网络交换设备功能单一,拥塞控制只能依靠终端完成,研究者们先后提出了Tahoe[25]、TCP Reno[26,27]、New Reno[28]等方案。随着技术的进步,2001年,RFC 3168[29]将ECN引入拥塞控制,网络设备开始参与拥塞控制,相应的设计方案如DCTCP[16]、DCQCN[17]、HPCC[20]等陆续出现。分析已有拥塞控制技术的机制特征,根据网络交换设备是否参与拥塞控制,拥塞控制机制可以分为隐式反馈和显式反馈机制。
2.1.1隐式反馈机制

软件工程论文怎么写
软件工程论文怎么写

..........................
2.2拥塞检测
2.2.1网络状态采集
网络状态采集主要是利用各种技术或方法获取网络反馈信号,为拥塞判断提供输入,本节先对常用方法进行概述,然后介绍新兴的网络遥测方法。
2.2.1.1常用方法概述
当前,发送端通过反馈采集的网络状态信息主要有丢包、往返时延、可用带宽、ECN标记和路由节点信息(例如节点ID、队列深度、链路利用率、时间戳)。采集方法有以下5种:
利用数据包收发状态:通过数据包收发时间差可以计算往返时延;通过ACK包接收速率可以计算可用带宽;通过ACK包编号可以判断是否丢包。这种方式最基本、最简便,但是能够获取的信息量较少。
利用SDN控制器[30]:SDN网络中,控制器具有全局视图,利用SDN控制器可以从交换设备收集队列深度、时延等路由节点信息。如TCCS方案[31]利用openFlow协议获取交换机队列深度解决TCP incast问题。但当前通过SDN控制器获取网络状态参数的方案会因网络规模和负载的增加而降低数据时效性。利用网络遥测[32]:网络遥测技术实现了数据包转发与网络测量的结合,利用网络遥测可以实时并有选择地收集路由节点信息。如HPCC方案[20]利用网络遥测获取瓶颈节点链路利用率实现精确控制。但网络遥测会占用通信带宽,增加网络通信开销。
利用ECN协议[29]:利用ECN协议,可以获取交换机主动反馈的ECN信息。如DCTCP方案[16]利用ECN标记,实现拥塞状态主动控制,降低传输时延。但此方式部署之后难以动态控制,灵活性较差。
利用跨层信息:数据包在传输中会记录各个网络结构层的信息,利用跨层信息可以获取某些链路状态参数。如蜂窝网络场景下,CQIC[33]、PBE[34]等方案利用物理层信息辅助测量链路可用容量实现性能提升。但此种方式只针对特定网络,通用性差。
................................
第三章 基于网络遥测的轻量级拥塞检测方法研究 ............................ 25
3.1 研究动机 ............................. 25
3.1.1 问题背景 ...................................... 25
3.1.2 问题分析 ................................. 25
第四章 基于链路利用率的速率控制算法研究 ...................... 39
4.1 研究动机 .......................... 39
4.1.1 问题背景 .............................. 39
4.1.2 问题分析 ................................. 39 
第五章 面向公平性策略的流排序算法研究 .......................... 56
5.1 研究动机 ............................ 56
5.1.1 问题背景 ..................................... 56
5.1.2 问题分析 ................................. 57
第五章面向公平性策略的流排序算法研究
5.1研究动机
5.1.1问题背景
数据中心网络中存在各类型的流量,不同的流量对网络性能要求不同,例如,对搜索访问类的小流来说低时延至关重要,一次应用级别的访问可能需要多次网络查询加载才能实现,数据中心的时延会在应用层放大数倍,如果数据中心时延过长,将直接影响应用的经济效益。有关数据显示,延迟每增加400ms,雅虎网站流量收益就会降低9%。对分布式训练、数据存储类的大流来说高带宽非常重要,在大模型分布式训练场景中,一次完整训练所处理的数据量可能超过PB级,吞吐量过低会延长训练周期和效果,提升经济成本。随着大数据、高性能计算技术的发展,大流数量逐渐增多,小流和大流的数量分布趋向均衡,因此,拥塞控制不仅要考虑小流的低时延,还要兼顾大流的高带宽。但是当前主流方案如基于RTT的TIMELY、基于ECN的DCQCN和基于链路利用率的HPCC等在这方面存在不足。以三者的具体表现为例,在Web Search流量50%网络负载下三者的第99分位FCT slowdown分布图如下:

软件工程论文参考
软件工程论文参考

...................................
第六章总结与展望
6.1论文总结
数据中心网络以及应用需求的动态发展,使得已有拥塞控制方法面临诸多新挑战。通过调研,当前数据中心网络领域拥塞控制方法在低时延、高带宽、自适应等方面还存在一些不足。为了进一步提升拥塞控制性能,本文开展了基于网络遥测的数据中心网络自适应精准拥塞控制技术研究,主要做了以下工作:
(1)概括了拥塞控制机制的基本框架,分析了显式反馈和隐式反馈机制的优缺点,从拥塞检测和拥塞控制方面对拥塞控制机制的内容进行了归纳分析,通过数学分析对不同拥塞控制技术的特点进行了对比,为改进拥塞控制方法奠定基础。通过6种拥塞判断算法和速率控制算法的详细分析,提出应对需求多元、动态性强的新兴网络,拥塞控制技术的优化可以从拥塞状态实时准确检测、速率快速精准控制两个方面着手。
(2)围绕数据中心网络拥塞控制中的拥塞检测技术,首先分析了当前存在的问题;然后在HPCC的基础上,提出了基于网络遥测的轻量级拥塞检测方法,通过降低网络状态采集带宽开销、提高拥塞判断算法准确性,进一步提升拥塞控制性能;最后通过实验验证了基于网络遥测的轻量级拥塞检测方法的有效性。
(3)围绕数据中心网络拥塞控制中的速率控制方法,首先调研了当前速率控制在降低时延、缩短流完成时间方面存在的问题,并对HPCC存在的带宽浪费和超参数难设置等问题进行了分析;然后在此的基础上,提出了一种基于链路利用率的速率控制算法,通过提高速率控制的灵敏度、准确性,在保持低队列深度的同时提高链路带宽利用率;最后通过实验验证了有效性。
参考文献(略)


如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关软件工程论文论文
QQ 1429724474 电话 18964107217