当前位置:   article > 正文

通用基础大模型汇总_通用大模型

通用大模型

1、Llama

Llama是Meta AI发布的开源大模型,目标是通过开放访问具有人工智能模型、工具和资源,让所有人都有能力跟上AI新一轮创新浪潮。目前据说已经完成了Llama-3的训练,但是在官网上开放的还是Llama-2。Llama已经成为最受欢迎的开源大模型,甚至很多大公司都已经在基于Llama做应用研究。Meta在官网上特意突出了Llama的"Code Copilot"功能,可以按照程序猿的需求描述,自动生成代码,看来Meta对它在这块的能力很有自信。

2、Gemini

Gemini是google的通用大模型,可以同时处理文本、图片、音频、视频,能力上据google内部测试显示,已经可以媲美Chat GPT。不过可惜的是,目前还没有看到其开源的计划。

3、Mistral

Mistral AI 的 Mixtral 8x7B 和 Mistral 7B 尖端模型体现了该公司致力于成为生成式 AI 社区主要支持者的雄心,并将公开可用的模型提升到最先进的性能水平。它的模型虽然小,但是在特定语言的特定场景上,表现非常好。比如Mistral 7B,部署快速,易于定制。虽然很小,但是功能强大,在英语环境下,能够进行文本摘要、结构化、问题解答和代码补全。

4、Stanford AIpaca

斯坦福大学的Alpaca 7B,是一个对 LLaMA 7B 模型进行微调的模型。在对单轮指令跟踪的初步评估中,Alpaca 的行为在质量上与 OpenAI 的 text-davinci-003 相似,同时出人意料地更加廉价。主要目的是为了解决指令遵循模型存在的“可能生成虚假信息”、“传播社会刻板印象并产生有毒信息”的问题。注意:该模型跟Llama一样是开源的,但是禁止商用。

5、Chat GPT-4

Chat GPT-4想必没有人不知道了。它是Open AI最新发布的gpt版本,能够同时处理文字、图片、语音。体验过其语音对话能力的同学,除了反应稍微慢一点,应该都会被其震撼住,通过图灵测试想必一点问题都没有。马斯克曾经表示过,GPT-4已经是一款通用人工智能。最可惜的是,该模型目前没有开源的计划。

6、百川大模型

百川大模型是百川智能公司(由王小川创建)发布的一款大模型(开源并且可以商用),最新的Baichuan2-192K大模型,其上下文窗口长度高达192K,是目前全球最长的上下文窗口。百川大模型基于Transformer架构,参数规模为70亿,同时支持中文和英文。

7、OmnilMM

https://github.com/OpenBMB/OmniLMM

OmniLMM是一系列擅长视觉和语言建模的开源大型多模态模型 (LMM)。该模型处理图像和文本输入并提供高质量的文本输出

8、清华大学CPM-Bee

CPM-Bee是清华大学NLP实验室,联合业界AI公司成立的开源组织OpenBMB,发布的具有重大里程碑意义的大模型。注意,该大模型是开源的,并且可以用于商用。是知名的国产开源大模型。在一些公开的测评结果上,CPM-Bee-10B的效果,已经跟Meta AI开源的全球知名大模型Llama-13B相当了,甚至有过之而无不及。最后也希望国产大模型能越来越厉害!


人工智能大模型越来越火了,离全民大模型的时代不远了,大模型应用场景非常多,不管是做主业还是副业或者别的都行,技多不压身,我这里有一份全套的大模型学习资料,希望给那些想学习大模型的小伙伴们一点帮助!

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签