赞
踩
转载链接:https://www.bilibili.com/video/BV1tQ4y1j7KF/?spm_id_from=333.337.search-card.all.click&vd_source=9db31b6f3a0e1a72d163c23959753f5c
大模型高效微调框架LLaMA-Factory技术原理解析 - 郑耀威先生
大模型高效微调框架LLaMA-Factory的技术原理。该框架可以实现低资源的显卡算力弱的同学使用大模型进行微调和调优工作。视频中从模型、优化器、激活值等角度出发,分析了训练大模型所需的显存占用情况,并介绍了BF16和F16两种新的精度来训练模型,从而降低显存占用。该框架在Github上获得了超过7000个Star,受到很多大厂的欢迎和使用。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。