Llama3 在线试用与本地部署_llama 3试用

作者：神奇cpp | 2024-07-20 22:29:48

踩

llama 3试用

美国当地时间4月18日，Meta 开源了 Llama3 大模型，目前开源版本为 8B 和 70B 。Llama 3 模型相比 Llama 2 具有重大飞跃，并在 8B 和 70B 参数尺度上建立了 LLM 模型的新技术。由于预训练和后训练的改进，Llama3 模型是目前在 8B 和 70B 参数尺度上存在的最好的模型。训练后程序的改进大大降低了错误拒绝率，改善了一致性，增加了模型响应的多样性。我们还看到了推理、代码生成和指令跟踪等功能的极大改进，使 Llama 3 更具可操控性。

简介：

Llama3 是 Meta AI 公司开发的一个基于 transformer 架构的大型语言模型，可以生成人类般的文本，回答问题，甚至进行创作，具有强大的语言理解和生成能力。

特点

大规模参数：Llama3 拥有超过 650 亿个参数，使其能够学习和存储大量的语言知识。
多任务学习：Llama3 可以同时学习多种语言任务，如文本生成、问答、文本分类等。
强大的生成能力：Llama3 可以生成长文本、诗歌、故事等多种形式的文本，具有很强的创作能力。
多语言支持：Llama3 支持多种语言，包括英语、西班牙语、法语、德语、意大利语等。

应用场景

文本生成：Llama3 可以用于自动生成文本，例如生成文章、新闻、产品描述等。
问答系统：Llama3 可以用于构建问答系统，回答用户的问题。
语言翻译：Llama3 可以用于语言翻译，例如将英语翻译成其他语言。
创作工具：Llama3 可以用于创作工具，例如生成诗歌、故事等。

优点

高准确率：Llama3 具有很高的准确率，可以生成高质量的文本。
强大的生成能力：Llama3 可以生成多种形式的文本，具有很强的创作能力。
多语言支持：Llama3 支持多种语言，能够满足不同语言用户的需求。

缺点

计算资源需求高：Llama3 需要强大的计算资源，否则可能无法运行。
需要大量数据：Llama3 需要大量的训练数据，否则可能无法达到理想的效果。

在线试用：

不愧为 AI 浪潮里卖铲子的，NVIDIA 具有其他公司无可比拟的 AI 算力，在线上，给出了 llama3-70b 试用：

也可以通过代码来调用：


from openai import OpenAI
 
client = OpenAI(
  base_url = "https://integrate.api.nvidia.com/v1",
  api_key = "$API_KEY_REQUIRED_IF_EXECUTING_OUTSIDE_NGC"
)
 
completion = client.chat.completions.create(
  model="meta/llama3-70b-instruct",
  messages=[{"role":"user","content":"介绍一下llama3，用中文"}],
  temperature=0.5,
  top_p=1,
  max_tokens=1024,
  stream=True
)
 
for chunk in completion:
  if chunk.choices[0].delta.content is not None:
    print(chunk.choices[0].delta.content, end="")

本地部署：

下载安装Ollama

Ollama是专门为本地化运行大模型设计的软件，可以运行大多数开源大模型，如llama,gemma，qwen等，首先去官网下载Ollama软件：https://ollama.com/ ，最简单的方式是使用Docker 来跑, 此次运行是包括web端的一起运行，所以使用docker-compose打包一起运行以下容器：

ollama/ollama:latest
open-webui:latest

下载模型

在Ollama官方的Models栏目中，找到我们要的模型, 直接访问这个链接：https://ollama.com/library/llama3。

在cmd命令行中运行命令：ollama pull llama3:8b，下载模型。

本地使用

总的来说，Llama3 是一个功能强大且灵活的语言模型，可以应用于多种语言任务和场景。

老徐，2024/4/29

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/神奇cpp/article/detail/858649