当前位置:   article > 正文

P4可编程的DPU 让算网生态更加开放融合_dpu nat

dpu nat

2023年6月10日,第三届网络开源技术生态峰会在北京成功召开。中科驭数高级副总裁、CTO卢文岩博士受邀出席本届峰会,并在活动主论坛分享题为《P4可编程的DPU 让算网生态更加开放融合》的主题演讲。

a19c69f092a5c66ab5437a1032ff5a24.jpeg


▲ 中科驭数高级副总裁、CTO卢文岩博士受邀在主论坛发表主题演讲

■ 数据中心“税”与异网融合“税”是当前算网生态的两大痛点

算力,毫无疑问是当前数字经济发展的核心增长力,已经成为像水、电、网一样的基础性生产要素,事关到整个核心要素的升级,是驱动经济社会数字化转型的新引擎。

演讲伊始,卢文岩博士简要介绍了针对当前业界普遍达成共识的分层算力网络结构,并表示统筹云、网、边、端于一体的新一代计算技术已成为算力网络的发展方向。

最上层的云层是各类云计算平台和云服务提供商,提供大规模的计算和存储资源;网层提供云之间的高速连接;边层位于离用户和数据源更近的位置,提供低延迟、高可用性的计算和存储服务;端层是接入侧的设备,是数据的产生和接入点。这一分层结构使得算力网络能够满足不同应用场景的需求,实现云、网、边、端的协同工作。

这一算力网络架构,在发展过程中面临着数据中心“税”与异网融合“税”两大痛点。前者是指在现在的基础设施架构中,虚拟化管理和网络需要占据很多CPU资源。以某公有云厂商网络增强型云主机为例,基于2x25G普通网卡,24核CPU中4核用于虚拟网络功能,1核用于虚拟化管理功能,可用CPU资源不足80%。

而后者的痛点则在于异网融合的过程中,往往需要解决沉重的历史包袱,不同网络协议之间的通信需要大量专用的网络设备完成相应的转换,随着算网规模的扩大,不仅增加了网络管理的复杂性,还限制了算力网络的灵活性和可扩展性。

cd9bba6d13ba377925065a6c8094d388.jpeg

这些挑战和限制,在来自云厂商和芯片厂商的行业专家的演讲中也得到了回应,他们结合各家实践经验,给出了更为具体的阐述。

中国移动研究院副院长段晓东指出,智算中心的发展是整个算力网络体系架构发展的重中之重,如何构筑一个区别于传统运营中心的新型智算中心,在算、存、网、管、效五个方面都有很大的提升和不同。传统的数据中心以CPU为核心的单机双路到GPU为核心的八卡互联,总线结构发生了飞跃变化。存储也从结构化单一到混合协议存储大量非结构数据。网络技术更重要,从普通以太网以10G、20G为核心,现在跃迁到200-400G。异构算力、算力原生,已经成为非常重要的诉求。

腾讯云与边缘网络技术总监陈炜先生在谈到腾讯云在算力网络方面的实践时提及,进入大AI模型时代,整个机房对电和算力的基础设施包括网络带来了新的挑战。堆砌GPU集群,已不再意味着能充分释放算力。极端情况下,网络通信时延会占据整个一次模型训练50%的时间,是非常惊人的数字。同时丢包给整个的网络的吞吐,也会带来50%的下降。

英特尔资深云网络技术专家丁晓艳也表示当前最大的瓶颈在于,随着算网融合、算力运算等各种云网络、边缘网络新应用的发展,以Tofino为代表的P4交换机无法应对随之而来的带宽需求,对于延时和抖动也无法得到保证。

■ DPU是下一代“算力网络”的核心算力芯片

为了解决当前算网生态面临的问题,灵活可编程的网络接入设备是解决此类问题的一个最优解。因此,DPU(Data Processing Unit)作为下一代"算力网络"的核心算力芯片应运而生,能够从硬件层面直接解决底层基础设施层面临的关键问题。

卢文岩博士指出,DPU本质上是一个可编程的Switch,中科驭数在两年前就发现了P4的魅力所在,并在DPU芯片功能定义的研发阶段布局了P4技术。到现在为止,中科驭数DPU芯片已全面支持P4编程,能够在数据中心、网络边缘和终端设备上提供了更大的灵活性和可扩展性;围绕DPU构建的软件开发平台HADOS,也可以为P4提供完善的技术支撑,加速P4技术在SDN网络中的研发落地应用。

02fff2d6177bb4d8304bdcb12c24e8d5.jpeg

P4可编程的DPU优势,首先在于高性能,整个执行下沉到专用硬件逻辑之中,可以有效提升系统的执行效率和处理能力;其次是高度可编程,当前算网融合过程中需要解决各类网络协议的转化和融合问题,DPU具备可编程能力可支撑自定义的场景、支持自定义协议栈快速开发;第三是低数据中心“税”,网络数据面处理完全下沉后可以大幅度降低现有数据中心的数据“税”,P4 runtime管控面也可以下沉到DPU,进一步释放服务器算力。

针对传统P4技术在有状态卸载、多功能核融合两方面存在的缺陷,卢文岩博士着重介绍了中科驭数第三代DPU芯片K2 Pro,并对其中网络架构的处理核展开详细展开说明——K2 Pro在芯片内部专门集成了可编程网络处理引擎以及专用数据分析引擎,不仅可以高效地完成数据增删改查、甚至更复杂的操作,更主要的目的——支持有状态的信息存储和查询,有效提升DPU芯片的性能、灵活性和资源利用效率。

8a9c666071613b114e4e15d2394ae454.jpeg

■ DPU P4技术将为算力网络提供坚实的可编程底座

对于DPU P4技术在算网领域的落地场景,卢文岩博士也作了进一步阐述。DPU P4技术的可编程性和灵活性,使得其在网关、服务器端、防火墙和比较协议等场景的应用中具备更大的优势,网络设备能够根据实际需求动态调整和配置网络协议,实现更高效、智能的数据处理和网络管理。这一特点将为这些应用场景带来更好的性能、安全性和可靠性。

以分布式NAT网关为例,当前公有云/混合云/私有云在与边缘云对接的场景中,受限于各地不同接入条件,存在大量需要NAT转换场景。传统方案中往往使用专有网关设备实现,成本高、性能差。DPU P4解决方案能够灵活支持各种动态与静态地址转换需求。基于高性能硬件,性能提升4倍以上;支持分布式网关部署,可以根据业务情况动态调整;网关DPU与服务器DPU采用相同硬件,可以更好的保护硬件投资。

ea4f08606598f2c24e3b7a930553854e.jpeg

本届网络开源技术生态峰会由中国通信学会指导,中国通信学会开源技术委员会、江苏省未来网络创新研究院主办,SDNLAB社区、阿里云计算有限公司协办。主论坛深入探讨了网络开源技术的发展趋势和未来的挑战,激发了新的思考和创新。相信通过共同努力,DPU P4技术将为算网生态的开放融合带来新的可能性,推动算力网络的发展和创新,为未来的数字化社会提供更强大、更可靠的算力支持。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/93447
推荐阅读
相关标签
  

闽ICP备14008679号