赞
踩
转载公众号 | 数字教育
本文发表于《数字教育》2022年第6期(总第48期)理论探索栏目,页码:21-28。
摘要:人工智能技术的不断提升使得教育知识服务向智能化发展。而学科知识图谱作为人工智能重要技术之一,既能优化教育知识的生产方式,又能为多种智能化的知识服务开展提供支撑。为满足当今教育用户多样化、个性化、精准化的需求,本文在分析学科知识图谱的内涵、构建框架基础上,从助力教育知识库形成、辅助智能化知识发现、支撑多项智能教育知识服务开展三个方面讨论了学科知识图谱与教育知识服务的适切性。随后分析了教育知识服务的构成要素,在此基础上构建了基于学科知识图谱的智能化教育知识服务模型,并从需求采集、服务构建、服务应用、服务评估四个阶段对模型进行了阐释,最后提出了模型的相关实施建议。
关键词:学科知识图谱;智能化;教育知识服务
| 全文共9120字,建议阅读时长9分钟 |
引言
人工智能、大数据、知识图谱等技术的出现与应用,为知识服务向智能化发展提供了动力与支撑。学者们开始探索智能技术与知识服务的结合方式,以期通过智能化的知识服务推动领域的发展。孙蒙鸽等从科研智能化的角度认为,智能化的知识服务即采用智能的知识采集、加工、表示、分析、组织等技术对科研数据资源进行知识化处理,从而为研究人员提供研究问题的解决方案,进而提高研发效率[1]。智能技术的广泛应用,不仅引发了科研、商业等领域的知识服务创新风暴,还使教育知识服务发生变革。代杨等认为智能化的知识服务是利用知识图谱、用户画像、人工智能等技术展开数据分析与挖掘,最终实现个性化、精准化的新型服务[2]。田慧君等认为智能化知识服务即以目标用户需求为驱动,根据实际需求,通过人工智能等技术提供有针对性、有效的知识信息资源[3]。
结合上述定义,本研究认为智能化的教育知识服务是指以新时代教育用户需求为导向,以基于智能技术的知识生产和传播为支撑,从而为知识需求者提供以知识为基本单元的教育服务。如何通过智能技术高效地生产、传播教育知识是教育知识服务创新发展的重点内容。学科知识图谱作为人工智能的关键技术,能够实现对海量资源的自动化管理,有效支撑知识的智能化抽取、融合、存储等,并通过建立可视化的知识网络表示知识结构层次,同时在此基础上挖掘知识间的隐性关系并结合用户数据,为智慧语义搜索、智能知识问答等智能化的教育知识服务提供重要的基础性作用[4]。因此,本研究在阐述学科知识图谱的内涵特征、构建流程基础上,探讨学科知识图谱与智能化教育知识服务的适切性,并提出基于学科知识图谱的教育知识服务模型,期望借助其推动教育知识服务发展,助力智慧教育服务体系。
一、学科知识图谱的内涵及构建流程
(一)学科知识图谱内涵
知识图谱一词最早出现于2012年,特指支撑其语义搜索的知识库,随后基于知识图谱的认知智能被广泛应用于各个领域。随着知识图谱在诸多领域的推广与研究,使得教育领域的专家及学者对知识图谱也给予了高度关注,以此衍生出学科知识图谱等概念。但目前学术界对学科知识图谱的定义并未达成一致,依据现有的研究,可以从教学知识组织、教师教学、学生学习三个视角剖析其内涵。
1.教学知识组织
知识图谱是领域知识及知识间关系所联结而成的知识体系,该知识体系是领域中繁杂知识层次化、结构化整合后形成的语义图[5]。
2.教师教学
学科知识图谱是辅助教师合理开展教学设计,恰当安排教学活动,深化新旧知识之间联系的重要参照,教师可以参照学科知识图谱调整学科教学策略、提供个性化答疑和辅导[6]。
3.学生学习
学科知识图谱是帮助学习者把握知识结构、理解知识概念、实现个性化发展的“学习指南”,通过记录学习者的认知动态,学科知识图谱能够引导学习者培养个人能力[7]。
综上所述,本研究认为学科知识图谱是基于多样化异构教育资源构建的以学科知识为节点,以知识关联关系为基础,以支撑精准化、智能化、个性化的教育知识服务高效实现为目标的语义网络图。
(二)学科知识图谱的构建流程
学科知识图谱的构建是智能化教育知识服务开展的基础,因此如何构建学科知识图谱是首要任务。本研究参照已有的构建框架将学科知识图谱的构建流程分为四个环节:数据获取、知识抽取、知识融合及知识加工,同时为解决知识图谱质量较低、知识完整度不高、扩展性较差等问题,需构建知识图谱动态维护机制,因此本研究在此基础上加入质量评估层以提高学科知识图谱的质量[8],如图1所示。
1.数据获取
数据获取是学科知识图谱构建的重要基础,其主要目的是依据选择的数据来源获取与学科相关的数据资源。学科数据的来源包含教育领域和开放领域两部分。教育领域数据是与学科相关的课程标准、教材等,该类型的数据需要通过文字、图片识别等方式获取。开放领域包含结构化数据、半结构化数据、非结构化数据,结构化数据为现有的第三方知识库中的数据,半结构化数据即网页类数据,非结构化数据即学科文献、教育文件等。开放领域的数据一般需要通过爬虫等技术获取。
2.知识抽取
知识抽取是连接数据获取和知识融合的关键枢纽,也是学科知识图谱构建的核心步骤,其目的是对半结构化数据或非结构化数据中的实体、属性及关系三个知识要素进行提取。知识抽取过程主要包含三个步骤即学科知识本体构建、基于众包半自动语义标注、开放领域知识抽取。学科知识本体是形成学科知识体系的核心,但由于当前人工智能技术发展还不够完善,完全自动化的本体构建方式难以保证结果的质量与准确性,纯人工的构建方式消耗时间、资源、人力较多,因此学科专家指导下的半自动本体构建方式更为高效。随后依据已构建的学科本体结构进行众包半自动语义标注形成标注数据,并对本体进一步完善。最后通过机器学习等技术抽取开放领域的学科知识。
3.知识融合
知识融合是知识加工的前提,是多源知识得以整合、汇总的体现。由于不同数据源采取的知识抽取方式不同,知识抽取所得到的知识往往存在冗余和冲突,因此为提升知识的逻辑性和层次性,提高知识图谱的质量,需要在统一标准下对不同数据源的知识实施整合、消歧、加工、更新等操作[9]。融合的知识包含开放领域结构化知识整合后的外源知识,半结构化、非结构化数据抽取的补充知识和学科教育领域的标注知识。知识融合主要包含三个步骤:概念融合、实体对齐、属性对齐[10]。概念融合是将不同来源的知识概念层级结构融合。实体对齐主要包含实体消歧和指代消解。属性对齐是将不同知识的等价属性合并为同一个属性。知识融合后的成果是学科知识的标准化表示即结构化、网络化学科知识图谱雏形。
4.知识加工
知识加工是完善学科知识图谱的关键步骤,该环节主要是提升知识图谱的质量、挖掘知识图谱中的隐性知识[11]。知识加工一般包含本体构建、质量评估与知识推理三个内容,但由于学科知识本体已依据教育领域的数据形成,因此本部分内容包含质量评估与知识推理。质量评估是保障学科知识图谱知识质量的有效手段,该过程需要量化知识的可信度,舍弃质量较低的知识。知识推理则是对知识更进一步的挖掘。经过质量评估后的融合知识即可形成初步的学科知识图谱,但此时的知识图谱仍存在残缺,因此需要依据一定的规则进行完善,从而获取新的知识或隐含关系,并经过质量评估以丰富原有的学科知识图谱。
5.质量评估
质量评估是确保知识图谱高质量发展的有效措施,该过程贯穿知识图谱构建的全周期,是知识图谱得以健康、可持续发展的有力保障。构建前需要专家、教师等多方参与评估数据来源的质量,以此保证信源的专业性和可信度。知识图谱的构建过程中需要对标注样本的质量、优化准则的合理性、模型的适配度进行有效把控,以确保基于机器学习模型的抽取与知识融合的质量,随后还需通过专家设计的高质量规则配合众包的模式对融合后的知识进行有效评估。构建完成后,还需展开错误知识的发现与纠正、过期知识的更新和缺失知识的发现与补全,此过程需要采取“先自动,后人工”的人机协同的方式进行,以保障高效率地提升知识图谱质量[12]。
二、学科知识图谱与教育知识服务的适切性分析
学科知识图谱具有数据类型更丰富、知识关联更全面、挖掘方法更先进、知识发现结果更深入的优点,能够为教育知识的获取、产生、传播提供更为智能化的支撑,因此本部分从助力教育知识库形成、辅助智能化知识发现、支撑多项智能化知识服务开展三个方面分析学科知识图谱与教育知识服务的适切性。
(一)学科知识图谱助力教育知识库形成
学科教育知识库是实现智能化教育知识服务的基础。基于学科知识图谱的知识库能够通过自动化或半自动化的建立方式节省大量的人力、物力资源,以较为高效率的方式实现对海量教育资源的知识抽取、存储、融合、管理,最终形成以节点及节点之间的关联关系组成的具有较强语义处理能力与开放互联能力的高质量知识库。节点内容可以包括文本、图像、视频、课件等多模态的资源,以此促进高质量教育知识的有效传播与共享。
(二)学科知识图谱辅助智能化的知识发现
随着学科领域的不断发展、延伸、细化与交叉,学科的知识体系、知识关联也越来越复杂,这在一定程度上阻碍了学科相关利益者发现隐性知识及关系。学科知识图谱作为一种对多源数据组织、整合的技术,能够支持学科知识间多维度、精细化的知识关联[13],并在此基础上结合深度学习等智能技术,实现知识推理、知识学习路径生成等知识“深”发现,从而有效支持学科知识发现智能化发展。
(三)学科知识图谱为多项智能化教育知识服务的开展提供支撑
智能化的教育知识服务应该包含辅助教育用户提升自身能力、解决学科相关问题的多样化、智能化的服务。学科知识图谱能够通过对多源数据的整合、关联,形成体系化、层次化的学科知识结构体,并在此基础上,结合人工智能、大数据等技术,为智慧搜索、智慧问答、个性化成长路径推荐、个性化资源推荐、个性化数据管理等服务的开展提供支撑,以此满足用户多样化的知识服务需求,从而缩减用户的迷茫期,减轻用户的认知负荷,助力智慧教育服务体系走向智能化、精准化和个性化,促进智慧教育的快速发展。
三、基于学科知识图谱的教育知识服务模型构建
基于学科知识图谱的教育知识服务是驱动智慧教育发展的有效力量,其需要依托学科知识图谱、大数据、深度学习等技术搭建集成教育知识服务中心,对教育资源及用户数据进行处理、整合、分析、可视化,为学科相关利益者(教学者、学习者等)提供智能化的知识服务,并通过服务使用和服务评估,不断提高服务质量,最终满足用户的需求。本研究基于上述定义构建了基于学科知识图谱的教育服务模型,并将其归纳为“一个中心、五种要素、四个环节”,具体情况如图2所示。
(一)一个中心
基于学科知识图谱的教育知识服务中心是知识服务得以实施的支撑,是教育利益相关者满足自身需求的有效工具,是教育资源可视化、结构化呈现的依托,是推动学校、地区和国家智慧教育发展的核心力量。因此,构建基于学科知识图谱的教育知识服务中心是至关重要的。该服务中心需要提供统一信息门户、身份认证等基础支持服务,并有效整合学科教育资源、分析用户行为数据,在双向数据流动的动态特征下持续完善、优化服务中心,最终实现为不同层级的用户提供满足其自身需求的服务。该服务中心的建设需要集合企业、政府、领域专家、教师等多方的力量,以此打造智能时代下支撑教学、学习、科研、决策等活动的服务集成中心,最终通过数据驱动的政策制定、科研探究与实践、教师教学、学生学习促进智慧教育的快速发展。
(二)五种要素
教育服务供给的构成要素包括服务内容、服务主体、服务对象、服务技术、服务环境。在服务环境的依托下,服务主体依据知识图谱等技术和服务内容搭建形成初步的服务中心,为用户提供智慧搜索、智慧问答等基本的智能服务,随后采集用户的多种数据形成用户画像,以此为用户提供更多个性化、适应性的服务。
1.服务内容
服务内容即教育知识,是指从海量教育资源中提取的产物,是构成教育知识服务模型的基本要素。教育领域的知识不仅仅是课本、教案、课程标准等可以被处理整合后直接呈现的显性知识,还应包含服务对象特征、知识学习路径、教学经验、学科发展问题等支撑教育知识服务稳定、健康、可持续发展的隐性知识。
2.服务主体
服务主体是服务的提供方,也是建设、管理服务中心的主要责任人,是服务得以有效施行的推动力量,在服务过程中其不仅是知识的传播者、生产者,也是知识的使用者,通常为教育企业或机构。通过对知识管理与需求分析,服务主体为教育用户提供个性化、精准化的教育服务,同时依据用户的服务体验反馈及时调整服务策略,保障服务有效实施。
3.服务技术
服务技术是指服务过程中对教育知识及用户数据进行相关操作、处理的技术总称,它涉及知识的抽取、融合、推理、发现、存储、呈现等,是支撑服务全过程的核心要素。服务主体依据信息采集、自然语言处理、本体构建、知识图谱、大数据、深度学习等技术实现对教育知识的采集、组织、分析、管理、可视化,从而搭建智慧服务中心。
4.服务对象
服务对象是指服务的接受者,即教师、学生、研究者、决策者等。服务对象不仅是知识有效传播、利用的实践者,也是知识的生产者。通过服务过程中对知识的学习、掌握和利用,从而产生更多过程化和结果化的数据,帮助服务主体衍生更多的隐性知识,并依此挖掘出数据间更为深层次的联系,获得更为精准、有效的服务。
5.服务环境
教育服务的实施需要相应的服务环境支持,即形成与教育服务相关的制度和文化。文化的形成可以增强用户对教育服务的认同,并培养其使用服务满足自身需求的意识,从而形成一定的服务应用氛围。制度的形成可以规范、约束、指导服务供给过程中的实施步骤及职权范围等,从而保障服务模型的良性运转。
(三)四个环节
教育知识服务是以教育用户为中心,以满足用户需求为驱动而进行的一个复杂活动,由此可见用户需求的调研是服务开展的首要条件,随后服务主体需要搭建满足用户需求的服务,最后在应用、评估过程中使服务逐渐趋于完善。因此,本研究将基于学科知识图谱的教育知识服务概括为四个环节,即需求采集、服务构建、服务应用和服务评估,且四者之间依据该逻辑顺序的运行模式形成迭代循环,直至服务高质量达成。
1.需求采集
需求采集是提供高质量、精准化服务的前提。新时代智慧教育不是追逐技术的变革,而是应该注重以技术为支撑的教育服务发展[14]。服务的最终目标即满足用户的需求,因此了解、收集、整合用户的需求是驱动教育知识服务得以有效实现的基础。用户需求主要指管理需求、资源需求、信息需求等,收集方式包含前期调研和中期发现两个阶段。前期调研即在构建服务模式之前通过现状调研、实地考察、交流访谈等方式收集用户的需求,并将其整合、转化为服务需求即服务主体所需提供的服务项目,依据服务需求设计相应的服务模式,以此达成服务搭建和实施的参照。中期发现即在用户体验服务的过程中收集用户相关数据,挖掘用户个性化的需求,以便提供更为精准的服务。总体来说,需求收集是动态性的,即用户的需求并非一成不变,需要依据用户的操作过程及行为路径,及时、有效地调整,以便提供适宜的服务。
2.服务构建
服务构建是教育服务的核心,是对服务模型的有效实现。教育知识服务需要依托智能化平台才能高效开展,并非由服务主体直接提供给服务对象,因此需要依据服务模型的指导建设知识服务中心,以便构建满足用户需求的开放服务功能。服务构建主要包含基础服务和个性化服务。基础服务即构建以知识点及知识关系形成的学科知识图谱将知识内容以结构化、序列化、层级化和可视化方式呈现,帮助用户了解知识结构层级、知识序列顺序,完善、重构自身学科知识体系,掌握知识内涵,探析知识发展脉络,并在此基础上提供智慧搜索、智慧问答等服务。个性化服务的核心为用户过程化数据及其他类型数据的采集、整理、分析,形成动态演化的用户画像。该类型的服务需要利用相关大数据、深度学习等技术将用户画像与学科知识图谱关联结合,从而提供数据驱动的精准化、差异化服务。
3.服务应用
服务应用是服务主体依托服务中心为服务对象所提供实际服务的阶段。学习者通过个性化学习资源推荐等服务提升自身的知识内容与学习效果;教学者以学习者的学情数据与过程数据把握知识的重难点,减少知识的组织,合理地开展教学设计,为学习者提供更加合适的学习路径,着重关注学习者的思维培养与情感交流,同时依据平台所提供的个性化培养路径提升自身综合教学能力;研究者能够及时通过平台及教师了解教学实践过程中的问题,开展相关理论设计与研究,并依托平台进行理论与实践验证,逐渐丰富学科理论研究与实践应用案例。决策者是以教育管理机构、部门为代表的具有分配教育资源、制定学科教学计划的人或组织。依据学校、区域、地方、国家等层面的划分,及时把握了解所属范围内的教学、学习等情况,从而制定出更为精准化、公平化、高效化的决策以提升教学、学习质量。社会公众等其他用户能够依据智能搜索、咨询等服务掌握相关知识。服务应用阶段还需对用户的行为、结果数据进行存储以完善用户画像,提高服务的精准度及个性化。
4.服务评估
尽管服务上线之前会经过一定的服务质量检测,但不可否认的是在服务应用过程中难免出现一些问题,因此需要通过服务对象的应用反馈及行为数据及时、有效地评估服务质量,从而丰富和补充用户需求,优化和改进服务模式。服务供求具有长期动态发展、短期稳定的特征,服务评估需要兼顾动态与静态相结合的原则,以保证服务评估内容、目标等紧跟用户的个人发展需求。因此服务主体需要利用服务中心及时、持续收集用户使用的反馈信息及阶段性的数据,参照相应的教育服务质量评估体系,在遵循科学性、系统性、层次性、整体性等原则的基础上对服务中心为用户提供的各项服务进行质量评估,以判断服务的达成度与用户的满意度,从而整合、分析相关结论,形成服务改进、优化、补充的实施意见,以及时地调整和更新服务内容及模式,最终达到提高教育知识服务质量的目的。
四、基于学科知识图谱的教育知识服务模型实施建议
智能时代教育知识服务的发展已吸引了众多学者的关注,但对学科知识图谱支撑的教育知识服务研究还处于初始阶段,为智能化的教育知识服务得以有效开展,本研究基于服务构建、实施、评估过程提出以下建议。
(一)统一教育知识服务数据标准
制定统一的教育知识服务数据获取、编码、存储标准是数据驱动的教育服务健康、持续发展的基础。现如今尽管数字技术时代的到来使得数据不再是消耗大量运维成本的负资产,但数据冗余较大、收集标准不统一、质量不高、隐私安全得不到保障,这些问题的出现,使得数据价值难以得到有效发挥,因此数据标准的制定显得尤为必要和迫切。统一的教育服务数据标准不仅是教育服务开展的前提,也是减少数据治理成本,保障数据迁移应用的有效措施[15]。同时也是促进基于多学科、跨学科知识图谱的教育知识服务开展的前提。
(二)合理制定教育知识服务规范
教育知识服务涉及的人员、机构、业务较为复杂,为保障其按照既定的标准开展服务的建设、应用与评估,需要政府及服务提供者联合相关利益者合理制定结构完整、层次清晰的教育服务规范。服务建设规范需要规定服务的具体目标、内容范畴、实施流程等,以指导服务的开发;服务应用规范需要说明教育服务主体与学校及政府的对接方式、权责范围、各项服务的使用方式等以降低三者之间协调合作的沟通成本;服务评估规范是政府主导,服务提供者参与制定的限制服务上线门槛、提升服务质量的基础参照。
(三)内外协同提升知识服务质量
服务质量的评估与优化是服务有效达成的保障,但现有的服务优化方法大多依据服务对象的反馈提升服务质量,在一定程度上忽略了服务主体的作用。参考经济学服务利润链模型中提出的“内部服务质量”,可以得出服务企业若要更好地为外部顾客服务,首先必须明确为 “内部顾客”即公司所有内部员工服务的重要性。为此,教育服务企业或机构必须设计有效的激励制度,创造良好的工作环境,尽可能地满足服务主体内部及其他服务构建及评估相关利益者的内在、外在需求,并在此基础结合教育用户的反馈及行为数据以内外协同的方式驱动服务质量的提升,加速服务达成的时限。
参考文献:
[1]孙蒙鸽,韩涛.科研智能化与知识服务:内涵、实现与机遇[J].情报理论与实践,2021,44(10):41-49.
[2]代杨,裴永刚.我国教育出版智能化知识服务转型探析[J].出版广角,2020(14):9-11.
[3]田慧君,管健,朱小冬,等.工程教育知识服务平台的构建与应用研究[J].现代教育技术,2019,29(6):76-82.
[4]李艳燕,张香玲,李新,等.面向智慧教育的学科知识图谱构建与创新应用[J].电化教育研究,2019,40(8):60-69.
[5]丁国柱,余胜泉.基于本体学习算法的学科本体辅助构建研究:以学习元平台语文学科知识本体的构建为例[J].中国电化教育,2015(3):81-89,124.
[6]钟卓,唐烨伟,钟绍春,等.人工智能支持下教育知识图谱模型构建研究[J].电化教育研究,2020,41(4):62-70.
[7]万海鹏,余胜泉.基于学习元平台的学习认知地图构建[J].电化教育研究,2017,38(9):83-88,107.
[8]杨玉基,许斌,胡家威,等.一种准确而高效的领域知识图谱构建方法[J].软件学报,2018,29(10):2931-2947.
[9]杨波,廖怡茗.面向企业动态风险的知识图谱构建与应用研究[J].现代情报,2021,41(3):110-120.
[10]刘峤,李杨,段宏,等.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.
[11]赵雪芹,路鑫雯,李天娥,等.领域知识图谱在非遗档案资源知识组织中的应用探索[J].档案学通讯,2021(3):55-62.
[12]肖仰华,徐波,林欣,等.知识图谱概念与技术[M].北京:电子工业出版社,2020.
[13]胡正银,刘蕾蕾,代冰,等.基于领域知识图谱的生命医学学科知识发现探析[J].数据分析与知识发现,2020,4(11):1-14.
[14]余胜泉,陈璠.智慧教育服务生态体系构建[J].电化教育研究,2021,42(6):5-13,19.
[15]赵成杰,张峰凡,申世越,等.技术治理范式下的教育数据治理[J].数字教育,2021,7(3):15-20.
作者简介:
和文斌(1996— ),男,甘肃兰州人,硕士研究生,研究方向为教育信息化、知识图谱构建;
董永权(1979— ),男,江苏宿迁人,教授、硕士生导师,研究方向为教育信息化、信息集成;
赵成杰(1994— ),男,河南安阳人,硕士研究生,研究方向为教育治理、职业教育;
王惠惠(1995— ),女,江苏徐州人,硕士研究生,研究方向为学习者画像。
OpenKG
OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。
点击阅读原文,进入 OpenKG 网站。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。