【大模型系列】大模型的上下文长度解释与拓展_大模型的文本向量长度

作者：盐析白兔 | 2024-05-12 02:46:25

踩

大模型的文本向量长度

1 什么是大模型的上下文长度？

大模型的上下文长度（Context Length）是指在自然语言处理（NLP）的大型语言模型（Large Language Models，LLM）中，模型在处理输入信息时能够考虑的最大文本量(一次处理的最大tokens数量)。
超长上下文的优势：

超长上下文的挑战：

大模型在持续推理的过程中，需要缓存一个叫做 KV Cache 的数据快，KV Cache 的大小也与序列长度成正比。以 Llama 2 13B 大模型为例，一个 4K 长的序列大约需要 3G 的显存去缓存 KV Cache，16K 的序列则需要 12G，128K 的序列则需要 100G 显存。

在这里插入图片描述
Source: 如何扩展大模型的上下文长度
目前国内外大模型上下文长度支持情况如下：

国内最近(2024)很火的Kimi Chat支持的上下文长度以及拓展到40万tokens。

主要将其分为了Interpolation(插值)和Extrapolation(外推)技术：

其中：

大致可以简单分为以下几种主要的方式：
在这里插入图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/盐析白兔/article/detail/557235