赞
踩
近年来,随着5G、人工智能(AI, artificial intelligence) 和大数据技术的不断革新,智能移动物联网业务的兴起和迅速发展引发了新一轮信息技术革命浪潮,“万物互联”对海量业务数据即时获得、分析和交换的需求日益增长。为支撑海量连接场景下多类型终端的差异化服务质量,5G引入了多种无线接入技术和基于服务的网络架构[1][2]。随着移动通信技术的演进,移动网络形态呈现多样化与异构化以满足各种差异化的业务需求。
当前,全球各地陆续启动了6G研究工作,业界指出“数字孪生,智能泛在”的6G网络发展愿景,同时期望结合AI等技术的发展,满足人们日益增长的高性能网络需求,覆盖全社会的千行百业,实现社会智慧互联和行业数字化转型[3][4]。
6G将充分利用各种频谱资源,比如太赫兹,可见光,结合超大规模天线技术,全双工技术,智能超表面,空天地一体等技术实现全覆盖。然而,6G中层出不穷的新业务对网络的要求也各不相同,这样就会造成网络运维的复杂度增加。此外,现有的商用无线网络已经拥有大量可配置无线参数,面对未来海量设备的接入和快速变化的业务需求,传统的以设备为中心的人工运维的模式难以为继、性能难以保障、用户服务质量难以满足,迫切需要一种更灵活、更简洁的智慧网络,以适配未来6G海量智能业务的高不确定性。
AI作为大数据的重要使能技术,学术界和产业界已经针对AI内生的6G网络展开了研究,并取得了积极的成果[5]。6G期待通过AI内生增强网络架构的适变性,使网络更好地支撑多样化服务和多应用场景,实现网络与用户需求的实时互动,并使网络可以更好地满足用户需求,构建高效的可重构柔性无线网络。知识图谱是人工智能的一个重要分支,机器具有认知能力的基石,在AI领域具有非常重要的地位。知识图谱将人与知识智能地连接起来,能够对各类应用进行智能化升级,为用户带来更智能的应用体验[6]。将知识图谱应用到6G网络中,可以为6G网络提供一种快速便捷的业务和意图检索能力,并利用知识图谱中“庞大”的网络知识库针对业务场景和需求进行推理,生成满足业务需求的智能网络。然而,当前知识图谱在网络智能化方面才处于起步阶段。
知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。知识图谱以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。
知识图谱的逻辑结构可分为模式层与数据层,模式层是核心,数据层是基础。模式层在数据层之上,存储的是根据数据层提炼过的知识,包括实体、关系以及实体的类型和属性等对象之间的联系。数据层主要是由一系列的事实组成,知识以事实(fact)为单位存储在图数据库。如果以“实体-关系-实体”或者“实体-属性-性值”三元组作为事实的基本表达方式,则存储在图数据库中的所有数据将构成庞大的实体关系网络,形成“知识图谱“[6]。
知识图谱主要技术包括知识获取、知识表示、知识存储、知识建模、知识融合、知识计算、知识运维等七个方面,尽管目前已取得了很多成就,但仍在快速演进当中。从应用的角度,知识图谱逐渐向领域或行业知识图谱应用拓展,如金融、医疗、公安、医疗、司法、电商等,同时知识图谱的标准化工作仍在进行中。
新华三深耕网络行业三十余年,在计算、存储、网络、安全等领域有着大量的来自行业、生产、研发、运维等维度的专家和生产资料过程数据。新华三已于2021年7月份将网络通信行业知识贡献到OpenKG上,填补了该行业的空白。https://mp.weixin.qq.com/s/bov41msc-anaAa6qJ5orNA。之后,新华三以当前6G研究为契机,继续研究6G网络行业知识库,并已取得了一系列的进展。
6G的网络知识主要包括三大类:网络架构的知识,网络运维知识,和业务知识。
在网络架构上,相比于5G,6G网络将提供全覆盖,全频谱,全应用,强安全的普适通信,通信的维度从“二维”转向“三维”,利用全频谱将通信从当前的地面通信转向“空天地海”全维度的通信模式,以提供具有广覆盖、大连接、低时延,高可靠性和高精度定位的通信,所以6G相应的网络架构也将发生根本性的变化。
对于网络运维,面对更加复杂的网络架构和众多新的应用场景,当前的运维知识不足以应对未来的网络,而传统的人工运维耗时耗力,所以需要在丰富的运维知识库基础上利用人工智能的方式来实现网络的运维。
在业务和性能的角度,6G的业务将在5G的基础上进行扩展,例如进一步增强的移动宽带(feMBB)、超大规模机器类通信(umMTC)和增强的高可靠低时延通信(euRLLC),长距离高移动性通信(LDHMC)和超低功耗通信(ELPC)、、超高速低时延通信(uHSLLC)和超高数据密度(uHDD等)[4],支持更丰富的业务场景和类型,同时业务的性能也进行了相应的提升,比如feMBB的最大速率从100Mbps提高到1Gbps,euRLLC中可靠性从99.999%提升到99.99999%,时延降低到1ms以下。
然而,网络知识库的获取存在着诸多挑战。虽然当前各标准化组织的标准化文档,比如3GPP,ETSI等的标准,各产业联盟的白皮书,如工业互联网白皮书,智慧港口白皮书等,各科研机构的研究报告和论文可以提供大量的数据,但是这些资料大部分都是基于应用场景介绍使能技术和一些所需的性能指标,不同的资料中虽然场景和性能指标都类似,但是数据结构却不统一。因此造成数据分散,数据结构化程度不高,大量有价值的知识更多是存在于非结构化的文本中。这些数据专业性强、术语繁多,从理解上来看与通用语言理解存在很深的鸿沟,从逻辑上来看场景又十分复杂。而在当时,开源的电子信息或者网络通信行业词库知识(尤其是5G、6G网络知识库)为零,常识知识为零,带标注可训练的数据为零。而要实现6G网络的知识抽取,就必须在众多琐碎的文献资料中不断的分析提炼,在困难中不断破冰。
业务知识库构建
知识处理一定是一个从易到难,从粗到细、从人工到自动的过程。首先,为了构建一个初始的知识库,首要的目标是数据结构化。资料管理通常是树形结构,如新华三官网,以树状结构梳理了产品类型-产品系列-规格型号的关系,在产品规格型号一页,又以表格记录了产品的各种软硬件规格描述。所以,可以使用爬虫系统收集和解析产品之间“isA”和“sameAs”的关系,以无监督+词向量的方式对齐了产品规格特性,最终以模板映射到图上三元组关系。
对于当前的5G业务和未来的6G业务,根据业务的服务等级(SLA),其主要性能包括数据速率,时延,可靠性,抖动,定位精度等方面。5G/6G业务类型涉及多个行业,如娱乐、教育、工业生产、交通、农业等,每种行业的业务的性能各不相同。当前海量文献,如行业标准、论文、白皮书等,对各个行业的业务性能定义的数据格式不同,并且相同行业的业务性能定义也有差异。表 1和表 2分别给出了3GPP标准中定义的工厂自动化的业务性能指标和中国通信行业标准中定义的全连接工厂的业务性能指标。从中可以看出,不同资料中定义的这些业务知识均不具备结构化的性质,绝大部分都是非结构化数据。所以从海量文献中提取6G网络数据并组成网络知识三元组面临巨大的挑战。
为了解决以上存在的5G/6G业务知识库中无结构化数据的问题,我们采用如下步骤并构建知识库:
首先,利用爬虫工具和关键字检索搜集互联网中各种5G/6G相关资料,如白皮书、峰会会议资料、标准文档、应用场景分析等,将其存放在候选资料库中,如图 1所示。注意:未来的候选资料库会随时进行更新。
图 1 5G/6G白皮书以及标准场景文档
其次,利用标记的关键字和数据解析器去解析候选资料库中的文本和表格信息,并将于关键字匹配的相关信息提出来并保存,保存的信息类型是原始的文本和表格。提取的主要数据包括典型应用场景、应用场景的子场景、子场景中的典型业务、典型业务的一些网络需求和性能指标等等。如表 1和表 2中所示。
然后,由于检索解析到的表格形式和数据类型不统一,均属于非结构化数据,并不能直接用于构建业务知识库。所以需要人工进行检查、修改、整理,使形式各样的数据规范化,形成最终的结构化数据,并将上述所有数据均保存到csv文件当中。部分典型的业务子场景如图 2所示,智能电网中场景-子场景-典型业务-性能指标的结构化数据如图 3所示。
图 2 业务子场景
图 3 智能电网业务场景以及性能指标
最后,在业务模型和数据准备完毕之后,利用一个数据映射的文件将模型中的顶点标签,边标签与csv数据对应起来,针对具体业务,解析业务和其具体性能指标,然后将其映射成三元组关系。不同三元组根据实体与实体之间关系,共同形成的知识图谱,最后构成完整的知识图谱。
知识图谱构建示例:知识图谱平台使用的是H3C的图引擎系统。根据上文中介绍的业务场景模型,设计出知识图谱的模型结构如图 4所示。图中模型的圆代表顶点标签,而有向箭头代表边标签,边标签和顶点标签都有其对应的名称。顶点标签共有5个,分别代表基站,网络切片,业务场景,子场景和具体业务。边标签为了便于检索,设定为一个,表示位于边标签的起点的顶点标签与末端的顶点标签是从属的关系。
图 4 知识图谱模型
最终完成的知识图谱的部分可视化图像如图 5所示:
图 5 部分6G知识图谱
图中红色的圆圈对应上述模型中base_stations顶点标签,绿色、蓝色、黄色和紫色分别对应slices顶点标签、scenario顶点标签、sub_scenario顶点标签和service顶点标签,边标签与模型中类似。如此,一个基础的6G业务知识图谱构建完成。
网络知识库构建
根据上文所述,6G网络将是一个3维的网络从而实现全维度的网络覆盖。6G的整体网络架构还处于研究阶段,业界并未一个统一的共识。但是基于当前的5G网络架构推测,未来6G网络也划分成三个层面:核心网,承载网和接入网。核心网基于SDN/NFV技术通过不同的网元实现数据的核心汇聚功能,主要执行接入管理、会话管理、数据汇聚转发、用户鉴权、网络切片管理、策略控制等功能;承载网作为连接核心网和接入网的单元,是6G网络中必不可少的一环,其主要网元包括光纤、核心路由器和交换机等网络传输设备;6G的全维度网络覆盖主要通过接入网来完成,接入网网元可以在地面(地面基站)、海上(海洋基站)、空中(无人机,卫星等)。对于不同的网络实体,其基本属性包括:资源类型、地理位置、IP地址、邻居、接口链路、具备的能力、性能规格等。
对于网络知识库的构建,可以在组网的过程中通过人工的方式手工构建,也可以在网络建设完成并运行之后由各个网元设备自行上报进行构建。当前,我们根据网络仿真工具在网络运行过程中初步构建了接入网网络切片的知识库,其构建过程如下:
首先,配置网络仿真文件,配置文件分为5个部分,分别为基站,切片,移动模式以及客户端以及一些预设参数,其中基站的参数包含了基站的带宽容量,覆盖范围(coverage),以及基站的三维坐标(x, y, z)。而切片参数包括时延容忍度、服务质量等级、带宽保证量、最大带宽、客户优先级等参数。这些仿真输入参数作为知识库的一部分结构化数据。基站和客户端的位置信息如图 12所示,其中橙色为基站,蓝色为客户端,基站包括地面站和空中站。
图 12 基站与客户端3D视图
其次,根据配置的文件执行网络切片的仿真。在仿真过程中的,实时的记录和收集仿真的中间结果和最终的输出结果,包括部分网络性能数据,如客户连接率、网络切片带宽使用率、客户切换率、数据速率、时延等参数。所有的仿真结果数据均会进行搜集,保存成结构化的CSV文件。部分保存后的切片数据如图 13所示。
图 13 提取的切片参数数据
最后,根据输入配置文件和仿真过程中搜集到的结构化数据,同样利用一个数据映射文件将模型中的顶点标签、边标签与csv数据对应起来,然后将网络切片、基站、参数、性能指标等映射成三元组关系。不同三元组根据实体与实体之间关系,共同形成的知识图谱,最后构成完整的网络知识图谱。其中基站和切片的三元组示意图如图 14所示。
图 14 基站-切片三元组
当前搜集的知识图谱数据可以为后续探讨其他人工智能算法的应用提供网络数据,如结合强化学习测试动态的切片算法对网络性能的影响和6G网络生成等,这些目前还在研究过程中。
对于核心网和承载网的网络知识库构建,H3C还在探索阶段,后续将在接入网知识库的基础上,构建出其他网络知识库。
当前,5G已经逐步覆盖到了大部分的个人业务,逐渐向垂直行业进行扩展。作为下一代的移动通信系统,6G的研究和探索才刚刚起步。6G与知识图谱的结构更是处于萌芽阶段,新华三将持续在这个方向上进行探索,并期待与同行的专家一起共筑6G与知识图谱的美好未来。
参考文献
[1] PENG M G, LI Y, ZHAO Z Y, et al. System architecture and key technologies for 5G heterogeneous cloud radio access networks[J]. IEEE Network, 2015, 29(2): 6-14.
[2] 3GPP TS 23.501, System Architecture for the 5G System; Stage 2, 2021.
[3] 中国移动研究院. 2030+愿景与需求报告[S]. 2019.
[4] YOU X H, WANG C X, HUANG J, et al. Towards 6G wireless communication networks: Vision, enabling technologies, and new paradigm shifts. Sci China Inf Sci, vol. 64, no. 1, Jan. 2021, doi: 10.1007/s11432-020-2955-6.
[5] SUN Y H, PENG M G, ZHOU Y C, et al. Application of machine learning in wireless networks: key techniques and open issues[J]. IEEE Communications Surveys & Tutorials, 2019, 21(4): 3072-3108.
[6] 中国电子技术标准化研究院. 知识图谱标准化白皮书, 2019.
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。