赞
踩
英伟达近日联合 Hugging Face 和 ServiceNow,发布了名为 StarCoder2 的 LLMs 系列模型。
1、StarCode模型
来自hugging face的网上,StarCoder和StarCoderBase是针对代码语言的模型(代码LLM),模型基于 GitHub 上的许可数据训练而得,训练数据中包括 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter notebook。与 LLaMA 类似,我们基于 1 万亿个词元训练了一个约 15B 参数的模型。此外,我们还针对一个 35B 词元的 Python 数据集对 StarCoderBase 模型进行了微调,从而获得了一个我们称之为 StarCoder 的新模型。
1.1StarCode2是什么?
StarCoder2 是一套面向代码的开放式大语言模型系列,提供3种规模的模型,分别包括 30 亿(3B)、70 亿(7B)和 150 亿(15B)参数。特别地,StarCoder2-15B 模型经过了超过 4 万亿 token 和 600 多种编程语言的训练,基于 The Stack v2 数据集。所有模型均采用分组查询注意力机制(Grouped Query Attention),具备 16384 个 token 的上下文窗口和 4096 个令牌的滑动窗口注意力,并通过“填充中间”(Fill-in-the-Middle)技术进行训练。
(1)starcode-3B:基于 The Stack v2 的 17 种编程语言训练,处理了超过 3 万亿 token。
(2)starcode-7B:基于 The Stack v2 的 17 种编程语言训练,处理了超过 3.5 万亿 token。
(3)starcode-15B:基于 The Stack v2 的 600 多种编程语言训练,处理了超过 4 万亿 token。
现在这个世界上每个人都是程序员
老黄更是语出惊人,学计算机的时代过去了,下个赛道是生命科学,有网络调侃说,黄老板以一己之力,将曾经天坑专业变成热门。
2、编程从娃娃抓起
2.1少儿编程炙手可热
现在很多家长会给学生报课外的编程培训班,一方面是为了跟上时代主流,扩展孩子的特长, 另一方面是参加编信息学奥林匹克竞赛。少儿编程依然成为和舞蹈、足球、游泳等一样的小学生课后的兴趣课之一。
2.2雷军建议:人工智能纳入义务教育
参加本次全国人大会议的全国人大代表、小米集团董事长雷军表示,人工智能正掀起新一轮浪潮。他建议从义务教育阶段普及人工智能素养教育,在九年义务教育阶段设置人工智能通识课程,同时将相关内容纳入中小学社会实践活动。
从教育部公布184所学校入选中小学人工智能教育基地来看,我国已经开始重视对学生人工智能素质的培养。
3、未来人人是程序员
随着编程语言在学生时代逐渐普及,学生对计算机和编程有一定的认识之后,加上编程大模型工具的加持,编程语言未来是否会跟我们的中文、英语等语言一样,成为人人必备的技能之一呢?未来人人是否都是程序员,欢迎大家留言区评论。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。