[240609] qwen2 发布，在 Ollama 已可用 | 采用语言模型构建通用 AGI（2020年8月）_ollama qwen2

作者：码创造者 | 2024-07-06 17:13:05

踩

ollama qwen2

模型	Qwen2-0.5B	Qwen2-1.5B	Qwen2-7B	Qwen2-72B
参数量	0.49B	1.54B	7.07B	72.71B
非嵌入参数量	0.35B	1.31B	5.98B	70.21B
GQA	支持	支持	支持	支持
绑定嵌入	支持	支持	不支持	不支持
上下文长度	32K	32K	128K	128K

网站提供了四张图片展示 Qwen2 模型在不同任务上的性能表现，包括：
- 代码生成 (HumanEval)
- 常识推理 (MMLU)
- 阅读理解 (TriviaQA)
- 数学推理 (GSM8K)

以上信息均来自 Ollama 网站上关于 Qwen2 模型的介绍页面。

以上文章采用 Gemini Pro 1.5 生成摘要，命令如下:

x jina r 'https://ollama.com/library/qwen2' | \
  @gemini -t 0 '以大纲方式生成一份摘要，列举更多的数据 支撑，用中文'
1
2

这篇文章探讨了利用大型语言模型构建通用人工智能 (AGI) 的可能性。

核心观点:

文章结构:

引言: GPT-3 虽然强大，但并非 AGI。然而，语言模型与其他 AI 系统不同，它能够通过自然语言编码整个世界的知识。
世界模型:
- 语言模型通过不断优化预测下一个词的能力，最终会隐式地学习到世界的运作方式。
- 随着模型规模的扩大，其世界模型的准确性和复杂性也会随之提高。
构建智能体:
- 世界模型本身并不能构成智能体，还需要设定目标和行动策略。
- 可以通过向语言模型提问的方式，获取其对不同行动方案的预期奖励，并利用蒙特卡洛树搜索等方法选择最佳行动。
- 智能体的状态和行动都可以用自然语言表示，并通过专门的模块与外部世界进行交互。
结论:
- 目前的技术水平尚未达到利用语言模型构建 AGI 的程度，但这是一个值得探索的方向。
- 文章中提出的方法依赖于一些假设，例如更大规模的模型将拥有更强的世界模型能力。

数据支撑:

需要进一步探讨的问题:

中文补充:

总结:

这篇文章为利用语言模型构建 AGI 提供了一个新的思路，但同时也提出了一些需要解决的挑战。随着语言模型技术的不断发展，相信未来会有更多相关的研究和应用出现。

以上文章采用 Gemini Pro 1.5 生成摘要，命令如下:

x jina r 'https://bmk.sh/2020/08/17/Building-AGI-Using-Language-Models/' | \
  @gemini -t 0 '以大纲方式生成一份摘要，列举更多的数据支撑，用中文'
1
2

更多内容请查阅 : blog-240609

关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】