赞
踩
目录
当前,不断更迭的智能技术正在加速教育的数字转型与智能升级,变革和重塑未来教育形态。尤其是以ChatGPT、GPT-4等为代表的生成式人工智能技术(Generative AI,GAI或GenAI)具备了通用人工智能(Artificial General Intelligence,AGI)的特征[1-2],正推动着互联网资源生产方式转向人工智能生成内容(AI Generated Content,AIGC)范式[3],使得人工智能在数字化实践中的作用更为凸显。国内一批高科技企业和机构也聚焦生成式人工智能领域,组建强大技术团队加快研发攻关,在国产大语言模型技术和产品等方面取得突破,并在教育等领域推广应用。首批11家国产大语言模型已经通过国家监管部门备案[4],由科大讯飞公司自主研发的星火认知大模型(简称“星火大模型”)于2023年9月5日起正式向全民开放使用,并被MIT科技评论等机构评为“最聪明”的国产大语言模型[5]。生成式人工智能的文本生成、语言理解、知识问答、逻辑推理等方面能力对于教育教学具有极大的应用潜力和价值[6],星火大模型已被接入众多教育产品,形成教学助手、学习助手、心理辅导助手和编程助手等多种典型应用场景,为教育领域的数字化、智能化发展和形态重塑提供支撑。因此,置身于数字化转型背景下,可以更加清晰地看到生成式人工智能技术给教育发展带来的机遇与挑战,更加深刻地理解智能技术之于教育信息化、教育现代化的革命性影响,探索未来教育形态变革创新之路。
近年来,以深度学习技术为核心的生成式人工智能不断取得突破。2014年,生成对抗网络(Generative Adversarial Network,GAN)首次被提出,推动了复杂数据分布上的无监督学习发展[7];2017年,Transformer架构被发表,引入注意力机制处理长序列数据,迅速成为生成式人工智能模型的主流架构[8];2022年,美国OpenAI公司公开发布基于Transformer架构的生成式预训练大语言模型ChatGPT[9];2023年,OpenAI又发布了GPT-4,生成式人工智能逐渐走向成熟。
紧跟国际生成式人工智能发展前沿,国内多家企业和机构加快研发,相继推出大语言模型、产品和相关底层基础设施及服务,掀起了生成式人工智能技术发展的新浪潮。为了规范和引导以大语言模型为代表的生成式人工智能的健康发展,国家网信办等七部门于2023年7月联合发布《生成式人工智能服务管理暂行办法》[10](以下简称《办法》),明确提出“鼓励生成式人工智能创新发展”“鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新”。近年来,国产化大语言模型技术攻关取得了可喜的成绩,首批国产大语言模型服务平台已向全民开放使用。
联合国教科文组织认为,生成式人工智能是一种根据自然语言对话提示词(Prompt)自动生成响应内容的人工智能技术[11]。中国国家互联网信息办公室将生成式人工智能定义为“具有文本、图片、音频、视频等内容生成能力的模型及相关技术”[10]。生成式人工智能技术可以被广泛地应用于不同领域,具有普遍适用性;能够通过不断的创新和学习持续优化,具有进步性;能够促进相关应用技术的创新,具有创新孕育性[12]。可见,生成式人工智能是根据提示词自动生成响应内容的人工智能技术的统称,包括具有内容生成能力的模型和相关技术,具有普遍适用性、进步性和创新性等特征,可用于生成文本、图片、音频、视频等。
在生成式人工智能发展中,技术框架内各要素协同发展和融合创新,是生成式人工智能产业生态链健康发展的关键。生成式人工智能技术框架由基础层、模型层、能力层和应用层组成[13-14],如图1所示。
在上述技术框架中,基础层包含硬件设施、模型生产工具和数据资源等核心要素,提供存储资源、运算资源、合规数据和模型训练平台等,为模型训练与能力提升提供基础支持。模型层由文本大模型、视觉大模型和多模态大模型等构成,用于实现语言理解、信息抽取、图像检测和因果推断等任务处理,支撑上层内容生成能力,是生成式人工智能的“大脑”。能力层是生成式人工智能特定任务能力的实现,为应用层提供音频生成、代码生成、跨模态生成、场景生成、文本生成、图像生成和视频生成等能力。应用层向用户提供面向具体任务需求的知识问答、摘要生成、文稿撰写和情感分析等功能或服务。
作为文本大模型的基础模型,语言模型是生成式人工智能语言能力的引擎,具有理解和生成人类自然语言的能力,能预测词序列的可能性或根据给定输入生成新文本[15]。通常,把参数规模达到百亿或以上、采用Transformer架构的语言模型称为大语言模型(Large Language Model,LLM)[16]。ChatGPT类大语言模型向用户提供自然语言会话交互接口,以提示词作为输入,使用统计模型预测和输出响应结果。以大语言模型为代表的生成式人工智能在模型规模、技术能力、训练方式和应用领域等方面具有显著的特征。
1. 模型规模巨大。大语言模型的参数数量、训练数据集大小等分别达到或超过百亿、TB量级规模,呈现出规模巨大的特点。语言模型的性能依赖于模型的规模,包括参数数量、数据集大小和计算量[17]。大语言模型通过对海量的、大规模的语料库学习,使用巨量参数抽取和表示人类语言规则及其逻辑关系,并进一步根据提取到的语言特征生成符合人类语言习惯的新文本。OpenAI公司的GPT-3模型训练数据量和模型参数量分别达到了5000亿标记(Tokens)和1750亿,华为公司的PanGu-Σ模型参数量更是达到1.085万亿[18]。
2. 技术能力强大。大语言模型具有强大的情景学习、思维链推理和多轮对话等能力[19]。用户发起新的对话时,大语言模型会将之前的对话历史作为上文,再生成一个下文作为新对话的响应,表现出多轮次对话和上下文感知能力。大语言模型能把一个复杂问题分解为多步推理的简单问题进行解决,也能通过自然指令的学习泛化自身能力[20]。
3. 训练方式灵活。ChatGPT类大语言模型灵活地采用了预训练加微调的训练方式[21]。为了解决数据驱动的深度学习模型缺少大规模的标注数据、人工标注代价大和内容生成效果不佳等问题,大语言模型先使用大语料库对模型进行预训练,获得面向通用目的的任务处理基础能力后,再通过来自人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)方法对特定任务进行模型参数微调,达到提升内容生成质量的目的。
4. 应用领域广泛。在混合来源语料库上进行预训练的大语言模型捕捉了丰富的多领域知识,可广泛应用于健康、医疗保健、教育、法律、金融和科学研究等领域任务的处理[16]。ChatGPT能够处理和生成超过25种编程语言和超过100种自然语言文本,提供语言生成、语言翻译、文本摘要生成、代码生成、情报分析等多项服务。由大语言模型驱动的微软Office 365 Copilot可以帮助用户完成整理会议摘要、处理邮件等多种任务[12]。
在人工智能领域,大语言模型作为一种典型的生成式人工智能技术,已经在智能制造、生物医药、科技金融、设计创意、自动驾驶、机器人等多个领域进行了创新应用。星火大模型等国产大语言模型的发展引起了国内外学术界和产业界的广泛关注,为我国教育教学应用实践提供了有力支持。通过探讨国产大语言模型的核心能力及其在教育领域的典型应用场景,可以进一步挖掘其在教育领域的潜力,为提高教育质量和培养创新型人才提供新的思路。
星火大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,在文本生成、语言理解、知识问答、逻辑推理、数学、代码以及多模交互等核心能力上,凸显了国产大语言模型的实力。
1. 多风格、多任务、长文本生成能力。该能力具有高度灵活性、实时性、个性化、多语言支持等特点,能够根据上下文情境和任务需求生成不同风格、结构和主题的文本内容,可以在短时间内快速响应需求和生成长文本,也可以根据用户特征生成个性化文本,并持续优化文本生成质量等。
2. 多层次跨语种语言理解能力。该能力具有高度准确性、多层次理解、多任务处理和多语种等特征。能够理解不同词语、短语和句子的含义,以及它们之间的语法关系;可以根据给定的上下文信息,识别不同词语的词性和用法,理解并解析复杂语言表达;能够捕捉对话或文章逻辑等。
3. 泛领域开放式知识问答能力。通过学习训练数据中不同领域的知识和语言模式,星火大模型可以根据问题上下文和语义信息,分析出问题结构和意图,可以回答生活常识、科学知识、工作技巧、医学知识等不同专业领域的问题。
4. 情境式思维链逻辑推理能力。星火大模型能够通过推断、归纳和演绎等方式,根据给定信息得出一般性的规律或概念;能够通过分析问题的前提条件和假设来推理出答案或解决方案,并给出新的想法和见解;可以使用已有的数据和信息进行推断、预测和验证科学研究中的基本任务等。
5. 多题型可解析数学能力。星火大模型可以理解数学概念、公式和定理,运用数学方法进行计算和推导,包括:根据数学表达式计算结果,理解和执行基本的数学运算;根据数学公式和算法进行计算和推理,处理相对复杂的数学问题;分析数学问题的结构和关系,实现推理和证明。
6. 多功能、多语言代码能力。星火大模型能够理解、解析和生成给定任务描述或要求的、符合语法规则和语义逻辑的计算机程序代码,如智能生成单行或函数级代码建议,根据注释、函数名自动生成代码;审查拼写、语法、逻辑错误,比较与修改新老代码;智能生成目标代码的单元测试用例等。
7. 多模态输入和表达能力。用户与星火大模型交互能实现虚拟人合成、图文理解、文图生成、多模态交互等多模态的输入输出。当用户输入一个图像时,星火大模型可以通过图像识别技术识别出图片的物体、场景等信息,围绕图片素材对用户问题进行响应;或者根据用户的描述,生成符合期望的音频或视频等。
星火大模型在文本生成、语言理解、知识问答、逻辑推理等方面的能力在教育领域具有极大的应用潜力和价值。本研究以基于星火大模型形成的教育教学工具为例,探究生成式人工智能如何赋能师生教学减负和提质增效。
1. 教学助手:提高效率、增强效益
(1) 智能化教学设计。借助星火大模型的深层次语言理解、文本生成能力,教学助手可帮助教师进行智能化教学设计。教师将需要进行设计的课时、班级等信息发送给教学助手,教学助手不仅可以给出单元主题、教学目标等教学设计的标准模块,还能够智能匹配符合新课标的教学任务、教学活动,帮助教师智能生成教学设计。基于星火大模型的图文音、视频等多模态资源检索能力,教学助手可以智能生成互动式教学课件,还可以智能生成情境图片、思维导图,有效提升教师备课效率。通过星火大模型赋能作业设计、教学反思、课题灵感、学生评语、班会设计、家访沟通等多场景应用,进一步减轻教师压力,解放教师生产力,提高教师工作效率。
(2) 仿真式对话科普。一方面,利用数字仿真技术生成类似于真人的虚拟形象,并借助大模型的语言理解和文本生成能力,通过“角色扮演+场景构建”的方式与学生互动,引导学生提问并回答学生的问题,有助于激发学生学习兴趣,提升学生探索创新能力。另一方面,在对话过程中快速识别学生提问中的关键词,并基于大模型的逻辑推理能力,结合过往问答记录、班级学情等准确理解问题,调用海量科普知识库,给出适切、丰富的回答。
2. 学习助手:减轻学习负担、提高学习效果
(1)类人化作文批改。得益于大模型带来的深层次语言理解和对话生成能力的提升,在作文批改方面的批改维度和智能化程度有所提升。在字、词、句使用正确性等基础批改之上,可以对作文进行高级批改,包括篇章结构、写作要素分析等。在批改完成之后,还可以针对性地给出一些优美句式、行文脉络等相关润色建议,并根据作文题目生成多篇范文,作为教师作文教学和学生学习参考的素材。
(2)实时化口语陪练。依托星火大模型强大的语言理解能力、文本生成能力以及语音交互能力,学习机在口语陪练方面取得新的突破。实现多场景的自由开放式对话,帮助学生在真实情境中锻炼口语,提升学生用口语解决生活实际问题的能力。在对话的过程中,助手可以实时针对学生发音、语法中的错误给予指正,并在对话结束后给出整体的评价和优化建议。
(3)启发式答疑辅导。得益于大模型的逻辑思维和语言理解能力的提升,学习机在答疑辅导方面取得突破。学习助手目前可以实现类人“对话式”的互动答疑,通过由浅入深、层层递进的启发式教学,提高学生的思考和探究能力,并加深学生对知识点的掌握程度。
3. 心理辅导助手:增强交互体验、疏导心理压力
借助大模型在智能生成和语言理解方面的能力,心理辅导助手可以通过类人式的自由对话对学生开展心理辅导,在增强交互体验的同时帮助学生及时疏导心理压力,并对心理风险进行预警;可以根据学生提出的问题和回答,判断学生当前的心理状态,调用知识库中的海量心理知识,对学生进行针对性的心理辅导;可以通过智能生成表情包,自适应推荐电影、诗词、历史典故等多模态资源的方式,激发学生兴趣,帮助学生快速调节心情;可以跟踪记录学生的心理状态,并对其存在的心理风险向教师和家长进行预警,提醒教师和家长及时干预,避免学生的心理状态进一步恶化。
4. 编程助手:助力高效编程教学、减轻师生负担
借助大模型在语言理解和逻辑思维方面的能力,可为师生提供编程助手。对学生来说,编程助手可以对已有代码进行实时注释,帮助学生快速、准确理解代码;也可以根据学生的文字要求生成对应代码,并解释代码的原理,帮助学生掌握代码生成的逻辑和方法。同时,学生还可以选择助手的内置题库进行个人练习,编程助手会针对学生的代码进行便捷准确的检错、查错、纠错,帮助学生完成个人编程能力水平检测。对教师来说,编程助手可以帮助教师自动化批改学生提交的程序,逐行给出详细批注与优化建议,评估代码程序在语法性、逻辑性、稳定性以及规范性四类维度上的综合表现,最终生成综合性评语与评级。
生成式人工智能在技术逻辑、技术成果、技术意义等多个方面实现了重大的技术突破和技术变革[22],为教育数字化转型带来了新机遇和新驱力。生成式人工智能与未来教育的深度融合,将重塑人类教育与学习形态,具体表现在教育主体关系、教育环境、教育资源、教学方式、教育评价和伦理治理等方面。
生成式人工智能推动人类与机器合作协同,走向人机共生。人机共生是人机协同的更高级阶段,意味着人类与机器之间“取长补短”,机器对于人类智能不是简单的辅助、增强,而是充分发挥融合潜能,实现更深入、更高层次的交互、协作与共融[23],将人类智能与机器智能有效协调、有机融合为智能整体,形成1+1>2的效果。一方面,生成式人工智能促使人类与机器的关系性质发生改变,两者共同生长并在交叉迭代升级过程中相互启发和赋能,共同创造生成新的教育内容增长点。另一方面,人类与机器的不断发展深化和高层次互动也将持续生成新的数据语料,以人脑启发类脑,赋能人工智能算法,深入解析人机关系交互的教育计算和神经认知机理,从而引起群体智能的涌现[24]。
生成式人工智能促进教育主体关系从“师—生”向“师—生—机”转变。随着机器智能化水平的不断提升,传统“师—生”之间的二元主体关系逐渐被打破,构筑起基于“师—生—机”的三元主体结构[25]。一方面,生成式人工智能对于师生主体具有赋能作用,如可以扮演虚拟专家、智能助教、数据分析助手等角色助力教师专业发展,也可以扮演智能导师、口语学伴、辩论对手等角色促进学生个性化成长,实现“师师有助教,生生有学伴”。另一方面,师生主体要积极拥抱“机器”主体,首先,应“学人工智能”,了解生成式人工智能的基本原理和应用场景,提升技术应用能力;其次,要“用人工智能”,师生掌握合理使用生成式人工智能的方法,实现技术的科学赋能;最后,要“与人工智能一起学”,在借助生成式人工智能提升教学效果的同时,引导技术适应性发展,实现双向互构、深度融合[26]。
教育专有大模型是生成式人工智能赋能教育数字化转型的必然选择。虽然通用的大语言模型对于教育领域的变革与转型具有重要的价值,但大语言模型在教育场景融合应用要求更高的知识准确度、更可控的意识形态与安全性和更适切的面向学科学段的使用方式与内容生成。而将未经专业教育数据集特定训练的现有大语言模型应用于教育领域,存在算法、数据上的偏误问题,可能会影响教师和学生的学术判断和决策[27],产生的知识之间可能存在缺乏明确的联系或结构的问题,也可能会导致对话内容歧视、特定人群歧视等问题[28]。因此,建设和应用高质量、面向教育领域的数据训练教育专有大模型,减少内容创作偏见,提高教育知识生成的准确度、学科学段的适切度和意识形态的可控性与安全性,是生成式人工智能赋能教育数字化转型的必由之路。
教育专有大模型加快推动信息化教学环境智能升级。在通用模型基础上构建教育专有大模型,赋能教学平台、工具应用和产品智能化升级,为教育数字化实践落地与成效发挥提供可靠的环境支撑。如基于教育专有大模型的多轮对话和场景生成能力升级语言学习工具,可实现口语智能评测和语法精准纠错,打造数字虚拟人自由对话情境,大幅提升语言学习工具的有效性、易用性;基于专有大模型多模态能力升级教学工具,可打造语音交互数据分析助手,实现通过语音指令输入数据分析的需求,智能生成课堂教学质量报告、学生学情报告等内容,提高教学工具和产品的智能性等,为提升教学效率和质量提供智能化技术环境保障。
教学资源生产方式从人工创造转向智能生成[26]。数字资源是教育数字化的重要要素,当前我国数字化教学资源开发整体呈现出多方开发主体协同、多类用户参与、多种共享模式共存的资源开发特色,但也存在优质资源体量还不够大、资源类型还不够丰富、资源开发效率有待提高、资源质量难以完全得到保证等瓶颈[29]。生成式人工智能所表现出的对于内容生成的快速性、同步性、多端性智能生成能力,有望通过人机协同参与资源开发以解决当前瓶颈问题,推进教育资源开发的批量化、海量化、高效化,将人力投入转向科学把控与创意生成中。
智能时代,教学资源获取方式从“人找资源”转向“资源找人”[30]。当前,网络上的数字教学资源存在质量参差不齐、资源之间的逻辑关系不明确、资源供给机制不完善等问题,给教学资源的检索、筛选和利用带来了极大挑战,也给师生造成了严重的认知负荷[31]。在教育数字化实践中,如何从注重教学资源的生成转向面向师生需求和资源定制化服务成为用户关注的焦点。生成式人工智能不同于搜索引擎所提供的资源检索,而是通过对数字教学资源的智能化聚合和重组,生成有较好结构框架和语义逻辑的文本结果并进行精准化推送,教学资源获取方式从被动分发到主动推荐,实现需求驱动、个性化资源服务。
激发教学创新潜能,助力教师教学减负和提质增效。当前,教师在工作实践中存在繁重的备、授课及相关工作压力和数字化转型下掌握新技术、新设备所面临的技术门槛双重压力,亟需有效的方法加以解决。生成式人工智能高质量的内容生成能力贴合了教师日常工作需求,在教学设计、课堂教学、课后辅导、作业设计与批改等教学环节均能提供支持,如一键生成教案和课件、拓展课堂知识内容、启发学生自主探索、自动提炼学生作文要点进行批改等,减轻了教师日常工作负担[32]。同时,生成式人工智能降低了人机交互的难度,使用网络平台即可开展对话交互,解决了教师技术压力的问题。
创新对话式学习方式,促进学生个性化学习和高阶思维培养。《基础教育课程教学改革深化行动方案》明确提出要推进“数字化赋能教学质量提升”行动,强调构建数字化背景下的新型学习模式,学习模式逐渐从标准化走向个性化,从被动接受走向主动探究,从供给侧走向适需[33]。生成式人工智能可以发挥其对话式交互特性,从与学生的多轮对话中挖掘学习情境和任务要求,形成文本、图像、视频、音频等多形态的学习材料,为学生学习提供支持。同时,还可以基于学生的学习水平、学习风格、知识背景等特征,向学生推荐适合的学习路径和学习任务,生成定制化的学习支架,提高学生的协作、创造和批判性思维能力[34],激发学生学习动机和潜能,实现更高水平的个性化学习。
在评价理念上,进一步强化从知识本位向“知识+素养”本位的转变。教育评价对于教育发展具有重要的导向作用,面向数字社会人才培养需求,教育的目标是培养能独立思考并有正确价值观和判断力的人,发展核心素养,而不是获取和记忆特定的知识[33],因此要树立“知识+素养”的评价理念。生成式人工智能强大的信息整合能力加速了信息获取和知识传授的过程,传统知识评价难以应对信息过载下的现实需求,在评价实践中要关注学生的信息应用能力和高阶思维能力发展,构建更加全面的综合素养评价体系[31]。同时,生成式人工智能可以回答的陈述性知识本身并不应该是评价重点,真正有效的学习与考核内容应该具备高阶性与开放性,应与真实的问题情境相关,并注重考查学生的创新意识与能力[35]。
在评价内容和方式上,“人际+人机”协作的方式助力综合性评价。针对传统评价多采用结果性评价、依赖评价者个人经验、评价反馈不及时且方式单一等问题,生成式人工智能为评价改进提供了新的赋能手段,强调人际合作、人机协同的综合评价。在评价内容方面,固定式的知识问答转变为开放式的问题解决,学生将通过“人际+人机”的多方互动沟通协作形成综合解决方案,从而使传统以试卷为主的结果评价变成情境化、问题式的综合型评价。在评价方式方面,生成式人工智能发挥其动态性、多模态和伴随式等特征,在师生、生生等人际评价上增加了机器评价的辅助,可以在持续的人机交互对话中进行数据采集、自动化内容批改和评价,综合分析学生的学习情况和表现。
为了更好地鼓励和促进技术革新与有效应用,需建立包容创新、安全可控、审慎发展的政策和制度环境。在国际社会,日本文部科学省于2023年7月率先发布了《初等中等教育阶段生成式人工智能利用暂行指南》《在大学和技术学院的教育方面处理生成式人工智能》等相关政策,对生成式人工智能在教育领域的角色定位及应用方式作出了说明。我国也积极推进教育大模型相关政策标准的制定,如2023年4月,中国信息通信研究院正式启动教育大模型标准编制,为教育大模型应用落地提供参考与指导;2023年7月,全国信息技术标准化委员会等发布相关研究成果,提出构建教育通用人工智能大模型标准体系。
伦理先行的治理框架初步构建,推动生成式人工智能向善发展。在技术不断发展的过程中,国内外积极推动人工智能治理进程,制定了一系列伦理及道德规范。联合国教科文组织于2023年先后发布Generative AI and the future of education、Guidance for generative AI in education and research,提出生成式人工智能可能带来数字鸿沟加剧、知识产权受侵犯、隐私数据泄露和生成内容偏误等风险,建议在教育中使用生成式人工智能要规划适当的法规、政策和人力发展计划。2023年7月,中国国家互联网信息办公室发布《生成式人工智能服务管理暂行办法》,提出提供和使用生成式人工智能服务的具体管理要求。因此,在教育中使用生成式人工智能要制定适当的政策和伦理规范,建立风险防范机制,加强伦理治理和技术监管,引导和规范人工智能技术向上、向善发展,以确保生成式人工智能成为一种真正造福教育工作者和学习者的工具。
生成式人工智能的快速发展为教育数字化转型发展带来了新驱力。本文分析了生成式人工智能的发展现状及内涵特征,以星火大模型为典型案例阐述了国内中文语言大模型的技术能力和多种技术应用场景,讨论了生成式人工智能助力教育主体、环境、资源、教学、评价及伦理治理等方面变革的趋势。随着生成式人工智能国产化进程的不断加速,在教育领域的应用不断深入,将带来新的机遇和挑战。例如教育场景的育人目标在知识准确度、意识形态可控性等方面的高要求,对于教育专有大模型的建设需求更为紧迫;依托生成式人工智能的创新性内容生成、对话情境理解、逻辑语言处理等核心能力,如何引入问题式、对话式教学更好培养学生的创新能力和问题解决能力;基于大模型如何开展以人的发展为中心、“人际+人机”协作的综合评价;人工智能快速发展应用带来的伦理风险,如何有效防范、确保科技向善发展等。这些新场景、新问题需要技术专家、教育专家和广大一线教育工作者认真关注,协同研究和创新,充分发挥人工智能技术最新发展优势,共创未来教育新形态。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。