赞
踩
现在大模型比较多,平时需要调试对比,就把这些大模型简单一个收集。
不断收集,不断学习
目前,开原模型较多,一些能力弱的,没啥意义
基座模型通常指的是一个通用的、预先训练好的语言模型,如GPT-3.5。这种模型在各种自然语言处理任务中表现出色,可以用作其他更具体任务的基础。对话模型则是专门针对对话系统设计的模型,用于理解和生成对话。这些模型通常会在大规模对话数据上进行预训练,以便更好地理解和生成自然对话。
在实际场景中,通常会使用基座模型进行微调,以适应特定的任务或领域。基座模型已经在大规模的通用语言数据上进行了预训练,因此可以作为一个良好的起点,然后通过微调来使其适应特定的应用场景。
对话模型通常已经在对话数据上进行了预训练,因此在构建对话系统或进行对话相关的任务时,可以使用对话模型进行微调,以使其更好地理解和生成自然对话。
无论是使用基座模型还是对话模型进行微调,都需要根据具体的应用场景和任务需求来选择合适的模型,并进行相应的微调工作
目前主流大模型汇总
简介:整理开源的中文大语言模型,以规模缩小、可试点化部署、成本降低的模型为主,包括基础模型、垂直领域调整及应用、数据集与等教程。
ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:
Chinese-Llama-2系列-三方下载
Atom-7B-Chat-三方下载
Chinese-7b-Chat-三方下载
Llama2-Chinese-13b-Chat-三方下载
Llama2-Chinese-13b-Chat-4bit
本项目开源了中文LLaMA模型和指令精调的Alpaca大模型,以进一步促进大模型在中文NLP社区的开放研究。这些模型在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础语义理解能力。同时,中文Alpaca模型进一步使用了中文指令数据进行精调,显著提升了模型对指令的理解和执行能力。
号称:目前为止最好的 7B 模型
Mistral 7B
性能超越 Llama2-65B
A微调Mistral-8x7B
特征向量提取器,特别是在向量检索,相似度匹配等领域的表现,目前是最先进的模型
BAAI/bge-reranker-base
github网址
3月6日,零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B。Yi-9B 是目前 Yi 系列模型中代码和数学能力最强的模型,实际参数为 8.8B,默认上下文长度4K tokens,是在 Yi-6B (使用了 3.1T tokens 训练)的基础上,使用了 0.8T tokens 进行继续训练。
实体抽取
、关系抽取
、事件抽取
、情感分析
等任务的统一建模,并使得不同任务间具备良好的迁移和泛化能力。为了方便大家使用UIE的强大能力,PaddleNLP借鉴该论文的方法,基于ERNIE 3.0知识增强预训练模型,训练并开源了首个中文通用信息抽取模型UIE。该模型可以支持不限定行业领域和抽取目标的关键信息抽取,实现零样本快速冷启动,并具备优秀的小样本微调能力,快速适配特定的抽取目标。实体识别
、文本分类
、阅读理解
等多种任务。该模型基于Bloomz在数以百计的任务数据上进行指令微调
获得。模型可以在低至16G显存
的显卡上免费使用。藏经阁
在商业知识图谱数据开放基础之上,我们还开放了部分知识图谱技术平台能力,开源了若干知识图谱构建、融合、推理和应用工具,以促进知识图谱技术社区的发展。
DeepKE
DeepKE 是一个支持低资源、长篇章的知识图谱抽取工具,用户可以定制输入的数据集和模型实现命名实体识别、关系抽取、属性抽取等知识图谱构建功能。
NeuralKG
是一个通用的知识图谱神经网络表示学习工具,其包含常用的知识图谱嵌入模型、基于图神经网络的图谱推理模型,以及多个规则增强推理模型
OpenUE
OpenUE是一个轻量级知识图谱抽取工具,其实现了在一个统一通用的框架下实现实体关系、事件识别、以及槽位和意图抽取等多种知识图谱构建任务。
PromptKG
PromptKGC(Incoming)是一个基于Pretrain-Prompt-Fitune预训练范式的知识图谱抽取和补全工具,支持文本生成等多种应用和任务。
FastKGE
是一个轻量级知识图谱表示学习框架,其通过知识图谱蒸馏等方法,实现快速、高效的实体向量学习,可支持知识图谱模型的快速部署,以及在移动、边缘设备应用部署。
TechGPT是“东北大学知识图谱研究组”发布的垂直领域大语言模型。目前在HuggingFace
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。