MLM之GLM-4-9B：GLM-4-9B的简介、安装和使用方法、案例应用之详细攻略

作者：你好赵伟 | 2024-06-13 06:39:08

踩

背景痛点：目前主流的大语言模型如GPT-3等，在多轮对话能力、多语言能力、长文本理解能力以及对工具和代码调用能力等方面存在一定限制。

解决方案：

>> 在2024年6月5日，智谱AI重磅发布GLM-4系列开源模型，包括GLM-4-9B、GLM-4-9B-Chat等基础模型，以及GLM-4-9B-Chat-1M等支持长文档的模型。

>> GLM-4系列模型通过在预训练阶段采用自回归填空任务，加入额外任务数据，提升了多轮对话、多语言、长文本和工具调用等综合能力。

>> 并发布GLM-4V-9B多模态语言模型，支持视觉理解能力。

核心思路和步骤：

>> 使用自回归任务进行预训练，填空任务让模型学习全面理解上下文。

>> 在预训练阶段加入工具调用和代码执行等额外数据，使模型具备相关能力。

>> 提供开源实现，开放接口和基线，方便其他研究者使用和进一步优化模型。

>> 通过公开任务和数据集，验证模型在各个方面的优异性能，比如多轮对话、多语言、长文本等综合性能超越现有模型。

>> 发布GLM-4V-9B多模态模型，支持视觉理解任务，在评测中也表现出优异成绩。

GLM-4系列试图通过自回归预训练任务和额外数据，提升语言模型在综合能力方面的表现，并开源实现和接口，方便应用和研究。

GLM-4的简介

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中， GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。除了能进行多轮对话，GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用（Function Call）和长文本推理（支持最大 128K 上下文）等高级功能。本代模型增加了多语言支持，支持包括日语，韩语，德语在内的 26 种语言。我们还推出了支持 1M 上下文长度（约 200 万中文字符）的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B。GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力，在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中，GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。

Model List

Model	Type	Seq Length	Download	Online Demo
GLM-4-9B	Base	8K	https://www.wpsshop.cn/w/你好赵伟/article/detail/711270 推荐阅读 article 嵌入式系统软件开发：你需要知道的一切_devops适用于嵌入式开发... 嵌入式系统软件的开发人员工作任务很艰巨。一方面，工作本身具有挑战性——嵌入式系统必须经历多次迭代才能正常运行。另外，当开... 赞踩 article 百度ip段36.110.199.和111.206.198.两个IP段做什么的_111.206.2... 网上查的信息乱七八糟，nslook查询并非蜘蛛。根据实际测试发现。36.110.199.* 百度站长工具抓取xml地图，... 赞踩 article 大模型免费的背后？听BAT、微软、字节、小米等专家共话软件智能研发新实践...... 从 1 元可以购买 100 万 tokens 的震撼优惠到阿里、百度、腾讯等科技巨头纷纷加入这场主力大模型的降价浪潮，甚... 赞踩 article HIVE函数练习_s尚硅谷大数据计数之hive 练习题... 单纯的练习，是从尚硅谷大数据课程之Hive（2019新版）学的，反正我记录的都是我手敲过的。。。1.空字段赋值函数说明：... 赞踩 article 在C#中使用MySqlBackup.NET在CentOS（Linux/Ubuntu）上备份和恢复My... 本文介绍了在C#中构建.NET Core以在CentOS/Linux/Ubuntu上运行以备份和恢复MySQL数据库的步... 赞踩 article Python - Git仓库忽略提交规则 & .gitignore配置_python gitigno... 1. Git忽略文件提交的方法有三种方法可以实现忽略Git中不想提交的文件。1.1 在Git项目中建立 .gitigno... 赞踩 article Kubernetes - CentOS7搭建k8s_v1.18集群高可用（kubeadm/二进制包部... Kubernetes 这个名字源于希腊语，意为“舵手“或”飞行员"。Kubernetes，简称K8s，中间有8个字符用8... 赞踩 article Android Studio修改项目中整体包名_android 更改applicationid... android studio3.0以下：一、取消 Compat empty middle pacages二、rename... 赞踩 article DMDSC部署实践（脚本部署2节点）_dmdsc脚本搭建... DMDSC部署实践（脚本部署2节点）1 环境准备2 自动化工具部署3 测试集群功能可用性_dmdsc脚本搭建dmdsc脚... 赞踩 article Hive日志默认存储在什么位置？_hive的日志在哪... Hive日志默认存储在什么位置？_hive的日志在哪hive的日志在哪在hive-log4j... 赞踩 article 外网流量转发到本地_异地设备数据转发本地上网... 有时候在对接第三方服务时，需要将外网流量转发到本地，方便调试。这个可以使用ssh的远程转发功能实现，关于ssh转发，这... 赞踩 article word文档通配符换行_职场小技巧\|没想到word中的表格就可以排版图片大小... 不知道大家在工作当中有没有遇到这样的情况：在WORD文档中想插入图片，却不能保证大小格式一样怎么办？如果数量较少的话，我... 赞踩 article 分布式锁-Redisson... 和我们本地锁⼀样互斥性是最基本，但是分布式锁需要保证在不同节点的不同线程的互斥。和本地锁⼀样⽀持锁超时，加锁成功之后设置... 赞踩 article SSH协议交互过程... 一、什么是SSH SSH是英文Secure Shell的简写形式。通过使用SSH，你可以把所有传输的数据进行加密，这样"... 赞踩 article 像素蛋糕&Photoshop颜色导出不一致问题分析与解决_像素蛋糕导出慢怎么解决... 那这一定是颜色配置文件出现问题，找到客服表示可以去PS打开看是否与预览也就是最右边图片颜色一致，发现符合客服所说，选择... 赞踩 article 深度学习与大语言模型的关系_语言大模型对深度学习算法的影响... 1. 背景介绍1.1 人工智能的崛起随着计算机技术的飞速发展，人工智能（AI）已经成为了当今科技领域的热门话题。从自动驾... 赞踩 article 论文解读：Deep-Kcr: accurate detection of lysine croton... Deep-Kcr：使用深度学习方法准确检测赖氨酸巴豆酰化位点doi: 10.1093/bib/bbaa255代码链接：h... 赞踩 article 解决https页面下不能加载http资源的问题_网站无法加载外部http资源... 最近因为引入第三方服务，遇到一个https下加载http跨域(js和websocket)的问题，我当时想到有两种方案：1... 赞踩 article GLM4 9B - 环境准备和 vllm 部署_glm4 vllm部署... 这里是视频的笔记，完整的信息请观看视频。6 月 5 日，glm 团队开源了最新的大语言模型，glm4 9b。同时，这次还... 赞踩 article ICRA2020 论文阅读_icra论文怎么看... 1.TextSLAM: Visual SLAM with Planar Text Features.Boying Li,... 赞踩相关标签嵌入式系统嵌入式系统软件开发百度 tcp/ip 服务器 hive .NET Core MySqlBackup.NET git kubernetes 容器云原生数据库 linux sql hadoop 数据仓库 word文档通配符换行怎么设置表格根据窗口自动调整易语言图片插入超级列表框 java redis photoshop ui Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。闽ICP备14008679号