MLM之GLM-4：GLM-4-9B的简介、安装和使用方法、案例应用之详细攻略

作者：人工智能uu | 2024-06-30 23:44:40

踩

glm-4-9b

背景痛点：目前主流的大语言模型如GPT-3等，在多轮对话能力、多语言能力、长文本理解能力以及对工具和代码调用能力等方面存在一定限制。

解决方案：

>> 在2024年6月5日，智谱AI重磅发布GLM-4系列开源模型，包括GLM-4-9B、GLM-4-9B-Chat等基础模型，以及GLM-4-9B-Chat-1M等支持长文档的模型。

>> GLM-4系列模型通过在预训练阶段采用自回归填空任务，加入额外任务数据，提升了多轮对话、多语言、长文本和工具调用等综合能力。

>> 并发布GLM-4V-9B多模态语言模型，支持视觉理解能力。

核心思路和步骤：

>> 使用自回归任务进行预训练，填空任务让模型学习全面理解上下文。

>> 在预训练阶段加入工具调用和代码执行等额外数据，使模型具备相关能力。

>> 提供开源实现，开放接口和基线，方便其他研究者使用和进一步优化模型。

>> 通过公开任务和数据集，验证模型在各个方面的优异性能，比如多轮对话、多语言、长文本等综合性能超越现有模型。

>> 发布GLM-4V-9B多模态模型，支持视觉理解任务，在评测中也表现出优异成绩。

GLM-4系列试图通过自回归预训练任务和额外数据，提升语言模型在综合能力方面的表现，并开源实现和接口，方便应用和研究。

GLM模型系列

LLMs之GLM-130B/ChatGLM-1：《GLM-130B: AN OPEN BILINGUAL PRE-TRAINED MODEL》翻译与解读

LLMs之ChatGLM-2：ChatGLM2-6B的简介、安装、使用方法之详细攻略

LLMs之ChatGLM-3：ChatGLM3/ChatGLM3-6B的简介(多阶段增强+多模态理解+AgentTuning技术)、安装、使用方法之详细攻略

LLMs之GLM-4：GLM-4的简介(全覆盖【对话版即ChatGLM4的+工具调用+多模态文生图】能力→Agent)、安装和使用方法、案例应用之详细攻略

MLM之GLM-4：GLM-4-9B的简介、安装和使用方法、案例应用之详细攻略

GLM模型系列

GLM-4的简介

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中， GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。除了能进行多轮对话，GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用（Function Call）和长文本推理（支持最大 128K 上下文）等高级功能。本代模型增加了多语言支持，支持包括日语，韩语，德语在内的 26 种语言。我们还推出了支持 1M 上下文长度（约 200 万中文字符）的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B。GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力，在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中，GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。

Github地址：https://github.com/THUDM/GLM-4/tree/main

Model List

Model	Type	Seq Length	Download	Online Demo
GLM-4-9B	Base	8K	https://www.wpsshop.cn/w/人工智能uu/article/detail/774402 推荐阅读 article Xilinx zynq EtherCAT LAN9252... 参考开源Ethercat主站 SOEM和IgH的比较 IgH Master 1.5.2 Documentation 中... 赞踩 article 视觉叙事的艺术：StoryDiffusion打造一致性图像/视频故事创作_storydiffusio... 本文提出了一种名为StoryDiffusion的新方法，用于生成一系列内容一致的图像和视频，特别是那些包含主体和复杂细节... 赞踩 article KAN和MLP_kan和mlp区别... 固定的。_kan和mlp区别kan和mlp区别 1.区别： MLP将固定的激活函数放在节... 赞踩 article spring security 如何对密码进行加密_java spring security加密算法... 这是一份最全面、最详细、最高质量的 java面试题，不建议你死记硬背，只要每天复习一遍，有个大概印象就行了。BCrypt... 赞踩 article Mysql分区表查询_mysql 分区查询... Mysql分区表查询_mysql 分区查询mysql 分区查询 -- 查询分区表tes... 赞踩 article 用WxPython打造你的第一个python 桌面应用_python wxpython开发桌面应用... WxPython是Python编程语言的GUI工具包，它基于流行的跨平台库wxWidgets。WxPython提供了一组... 赞踩 article LoRa无线通信技术介绍（一）调制技术... 详细说明LoRa调制的一些基本概念，以及该调制方案在部署固定和移动低功耗真实通信网络时可以提供的优势。_lora无线通信... 赞踩 article m>leetcodem>题目9：m>旋转m>图像（中等）_写下m>一个m>m>nm>'×m的m>矩阵m>,然后m>小美m>每一次将这个m>矩阵m>上下翻转后... m>leetcodem>题目9题目描述给定m>一个m> m>nm> × m>nm> 的二维m>矩阵m>表示m>一个m>图像。将图像顺时针m>旋转m> 90 度。说明：你必须在原... 赞踩 article 2024年鸿蒙最全AudioRenderer开发音频播放功能(ArkTS)(1)，HarmonyOS... 当同优先级或高优先级音频流要使用输出设备时，当前音频流会被中断，应用可以自行响应中断事件并做出处理。具体的音频并发处理方... 赞踩 article c++怎么将两个类的方法集合成一个类的方法_等价类划分测试用例设计方法... 一.方法简介1.定义是把所有可能的输入数据,即程序的输入域划分成若干部分(子集),然后从每一个子集中选取少数具有代表性的... 赞踩 article 如何从github上下载文件并运行_如何打开一个github上下载的app... 执行步骤复制下载路径在本地某一硬盘中创建一个文件夹切换到项目的根目录下 cd 项目名使用npm install命令安装依... 赞踩 article LongRAG：增强长上下文大语言模型的检索增强生成... 在传统的RAG框架中，检索单元通常较短，如100字的维基百科段落。检索器需要在庞大的语料库中搜索，这增加了检索负担。为了... 赞踩 article UE4中UMG与C++交互页面文本修改... 在UE4中，有两种方式创建ui，一种是使用slate的方式，一种是UMG，UMG是slate的封装，是一个可视化的ui编... 赞踩 article 遗传算法c++实现_c++遗传算法... 遗传算法流程遗传算法C++实现这里以类的形式进行实现。具体原理推导以及过程参见遗传算法原理以及Python代码实现。#p... 赞踩 article python聚类分析_python聚类分析商场顾客... 一、导入库import plotly as pyfrom sklearn.cluster import KMeansim... 赞踩 article IOS手机Charles抓包_charles抓包ios... IOS手机连接Charles代理，并配置ssl证书_charles抓包ioscharles抓包ios ... 赞踩 article SVM详解(包含它的参数C为什么影响着分类器行为)-scikit-learn拟合线性和非线性的SVM... 引言这篇文章详细地介绍了SVM背后的原理，它为什么是大间距分类器？分类器的参数C为什么影响着分类器的行为？核函数背后采用... 赞踩 article 鸿蒙开发实战案例--音乐播放器（付源码）_鸿蒙音乐播放器代码... 今天和大家分享的是鸿蒙开发的实战项目：音乐播放器。_鸿蒙音乐播放器代码鸿蒙音乐播放器代码 ... 赞踩 article 基于SSM慧生态农产品批发贸易平台_基于ssm的农产品批发管理系统... 4.系统管理员通过销售查询，商品查询，销售排行等来实现信息查询的管理；通过数据备份与恢复，密码修改，退出系统来实现系统维... 赞踩 article 临近年末，整理了一份 Android 程序员必看的面试合集... 总体来说，面试一般都是基于你的简历来进行的，一般先考察你的基础，然后考察你知识体系的完备程度，接着会考察你的极限，最后还... 赞踩相关标签 zynq ethercat LAN9252 etherlab soem 人工智能计算机视觉 stable diffusion Story Diffusion AIGC AI短视频 AI故事绘本后端 mysql 数据库 sql python 物联网信号处理信息与通信鸿蒙面试学习 c++怎么将两个类的方法集合成一个类的方法 Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。闽ICP备14008679号