当前位置:   article > 正文

LLM-大模型训练-步骤(二)-预训练/Pre-Training(1):全参数预训练(Full-Param Pre-Training)【对LLaMA等模型进一步全量参数预训练】【中文无监督学习语料】_大模型预训练方法

大模型预训练方法

GitHub项目KnowLM

一、全参数预训练(Full-Param Pre-training)

  • 使用中文语料对LLaMA等模型进行进一步全量预训练,在尽可能保留原来的英文和代码能力的前提下,进一步提高模型对于中文理解能力和丰富模型的知识储备
  • 该阶段的目的是增强模型的中文能力和知识储备。

 二、无监督学习语料

pt_sample_data.txt

  1. 我们如何在日常生活中减少用水?1. 使用节水装置,如节水淋浴喷头和水龙头。
  2. 2. 使用水箱或水桶收集家庭废水,例如洗碗和洗浴。
  3. 3. 在社区中提高节水意识。
  4. 4. 检查水管和灌溉系统的漏水情况,并及时修复它们。
  5. 5. 洗澡时间缩短,使用低流量淋浴头节约用水。
  6. 6. 收集雨水,用于园艺或其他非饮用目的。
  7. 7. 刷牙或擦手时关掉水龙头。
  8. 8. 减少浇水草坪的时间。
  9. 9. 尽可能多地重复使用灰水(来自洗衣机、浴室水槽和淋浴的水)。
  10. 10. 只购买能源效率高的洗碗机和洗衣机。
  11. 编辑文章,使其更吸引读者。自主机器人是计算机控制的机器,被编程执行特定任务而不需要任何人类输入。自主机器人在各个行业中被越来越广泛地应用,从制造业到医疗保健再到安全。自主机器人是计算机控制的机器,被编程执行特定任务而不需要任何人类输入,从而实现了新的效率、精确度和可靠性水平。自主机器人在各个行业中被越来
声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号