当前位置:   article > 正文

OpenCompass 大模型评测实战(作业)_opencompass数据集

opencompass数据集

1.0使用 OpenCompass 评测 internlm2-chat-1_8b 模型在 C-Eval 数据集上的性能

首先创建开发机,进行环境安装,

  1. studio-conda -o internlm-base -t opencompass
  2. source activate opencompass
  3. git clone -b 0.2.4 https://github.com/open-compass/opencompass
  4. cd opencompass
  5. pip install -r requirements.txt

解压评测数据集到 data/ 处,列出所有跟 InternLM 及 C-Eval 相关的配置,

如果遇到 error,解决方案

  1. pip install protobuf
  2. export MKL_SERVICE_FORCE_INTEL=1
  3. #或
  4. export MKL_THREADING_LAYER=GNU

正常评测后将会看到

2.0自定义数据集客主观评测并提交至OpenCompass官网

构造新的数据集需要修改至少三个文件,一是opencompass/configs/datasets下面,新建相应的脚本;二是opencompass/opencompass/datasets去构建一个新类,并实现一个load函数,负责把新的数据集以csv/json等格式load进来,并返回DatasetDict形式,传出之后,会在刚才configs里面新建的脚本中拼起来,最终进行append;三是要把这个新类在opencompass/opencompass/datasets/__init__.py中进行import。

参考资料

链接:https://blog.csdn.net/weixin_42296932/article/details/138119933

视频地址:https://www.bilibili.com/video/BV1Pm41127jU/

课程文档:https://github.com/InternLM/Tutorial/blob/camp2/opencompass/readme.md

提交指南:OpenCompass平台指引 | 贡献数据集

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/935408
推荐阅读
相关标签
  

闽ICP备14008679号