当前位置:   article > 正文

GLM-4-9B:智谱AI的开源预训练模型_智谱glm-4-9b

智谱glm-4-9b

在人工智能领域,预训练模型的发展日新月异。智谱AI最新推出的开源预训练模型GLM-4-9B,不仅在性能上全面超越LLaMA 3 8B,甚至在多方面能力上比肩GPT 4V。本文将详细介绍GLM-4-9B的特点、性能提升以及其在多模态评测中的卓越表现。

模型概述

时间与地点

  • 时间:2024年6月5日
  • 地点:1785智谱

发布内容

智谱AI于2024年6月5日发布了GLM-4系列中的开源版本GLM-9B,包括:

  • 基座模型:GLM-4-9B
  • Chat模型:不同上下文长度的Chat模型
  • 视觉模型:GLM-4V-9B

性能提升

GLM-4-9B在多个方面实现了显著的性能提升,以下是详细的数据和对比:

速度与价格

  • 速度:更快
  • 价格:更低
  • 性能提升:40%

与LLaMA 3 8B的对比

  • 性能:全面超越LLaMA 3 8B

与GPT 4V的对比

  • 上下文长度:支持1M无损上下文
  • 语言支持:26种语言
  • 函数调用能力提升:40%

GLM-4-9B的卓越性能

在多个数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出超越Llama-3-8B的卓越性能。

多轮对话能力

GLM-4-9B-Chat不仅能够进行多轮对话,还具备以下高级功能:

  • 网页浏览
  • 代码执行
  • 自定义调用(FunctionCall)
  • 长文本推理:支持最大128K上下文

多语言支持

本代模型增加了多语言支持,包括但不限于以下语言:

  • 日语
  • 韩语
  • 德语

GLM-4-9B-Chat-1M模型

智谱AI还推出了支持1M上下文长度的GLM-4-9B-Chat-1M模型,约200万中文字符。

多模态模型GLM-4V-9B

基于GLM-4-9B的多模态模型GLM-4V-9B,具备以下特点:

  • 分辨率:1120*1120高分辨率
  • 中英双语多轮对话能力
  • 多模态评测:在中英文综合能力、感知推理、文字识别、图表理解等多方面表现出超越GPT-4-turbo-2024-04-09、Gemini1.0Pro、Qwen-VL-Max和Claude3Opus的卓越性能。

结论

GLM-4-9B的发布,不仅为人工智能领域带来了新的突破,也为开发者提供了更高效、更强大的工具。智谱AI的开源精神,使得这一模型能够被更广泛地应用和研究,进一步推动人工智能技术的发展。

参考文献

  • 智谱AI官网发布信息
  • 相关评测报告和数据集

GitHub地址GLM-4-9B

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/716517
推荐阅读
相关标签
  

闽ICP备14008679号