赞
踩
AI大模型对网络的需求主要体现在五个方面,即超大规模组网、超高带宽、超低时延、超高稳定性及网络自动化部署。为了应对这五个方面的需求,本文对业内一些主要的应对技术、思路和方案进行了梳理,供读者进行系统优化时做参考,不对具体技术实现细节做过多论述,对应的思维导图如下,仅供参考!
No.1
超大规模组网需求及应对
网络设备容量制约组网规模:400G/800G高速端口开始规模商用
使用大容量、高密度网络设备,51.2Tbps容量芯片开始商用,可倍增设备400G/800G接口的密度,通过增加单个网元容量,减少所需的网络层次,扩展网络规模。
网络拓扑架构制约组网规模:多级CLOS可以支持大规模,但是多跳情况下时延增加
研究使用新型网络拓扑,如Dragonfly(网络直径短,具备低成本、端到端通信跳数少等优点,同等情况下是Fat-tree组网规模的几倍)、Torus(采用多轨网络架构,可以实现整网规模成倍增长,Torus网络维度已从3D进化到了6D)等网络架构或多种拓扑组合使用。
网络性能需求制约组网规模:传统拥塞控制算法无法有效应对Incast流量模型的影响,传统的微突发流量应对策略导致低带宽利用率,拥塞控制算法能力不足限制集群规模扩展
负载均衡算法改进
AI训练的流量模型特征是“少流”和“大流”。解决思路有两个:一个是更细粒度的负载均衡算法(包级别),另一个是网络级负载均衡算法。
拥塞控制算法
\4. 网卡资源不足限制组网规模:RDMA网卡需为每个连接
维护协议状态,进而消耗掉大量的片上缓存,如何减少
QP需求以及优化QP可支持数量成为关键
网卡资源优化措施包括:针对大规模QP部署措施优化,
每连接多路径的能力优化,从RC模式往连接数依赖更小
的模式演进,从go back N重传往选择性重传演进,可编
程能力优化。
No.2
超高带宽需求及应对
1. 实际带宽增加
\2. 有效带宽增加
\3. 减少网络通信量
No.3
超低时延需求及应对
1. 降低静态时延
2. 动态时延
No.4
超高稳定性需求及应对
1. 网络架构冗余设计
基于硬件的快速故障感知能力
2. 基于Telemetry的数据采集机制实现基于硬件的快速故障感知
最小数据采集精度可以达到毫秒级粒度,同时,除基础网络性能数据采集和感知外,覆盖队列吞吐、丢包、PFC、ECN、队列缓存等RoCE网络关键指标项。同时,在采集的性能指标基础之上,提供PFC风暴、死锁故障检测、高速光模块异常检测、队列一致性检测等上层故障、风险识别能力,主动评估、预测网络健康情况。
3. 基于硬件的快速故障收敛
重新定义数据面的故障传递和收敛协议,仅通过数据面,就可以支持全网微秒级路径切。
4. 层次化的网络故障自愈能力
在链路层面,通过充分挖掘网络多路径的资源价值,在最合适的节点以最快的速度实现流量转发路径的切换保护;在设备层面,通过利用节点级保护技术,实现流量的快速重路由;在网络层面,借助自动化和智能化的手段对常见的网络级故障开展根因分析和问题关联,通过快速响应预案的积累形成网络自动止血的能力,确保网络故障恢复指标在可预期的范围内。
No.5
自动化部署需求及应对
1. 即插即用式开局,端到端自动化部署配置能力
2. 自动流控调参和灵活的水线调节
通过网络遥测Telemetry、AI的智能分析与控制(统一的控制器,即AI大脑),实现闭环控制,自动流控调参和灵活的水线调节。
3. 端到端可视化,实现故障的快速定位
通过呈现网络的拥塞状态、负载不均状态等,为自动化调度调优提供数据支持,可实现端到端可视化、自动化运维等,实现故障的快速定位和一键修复的能力。
4. 变更自动化
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。