赞
踩
在当前的版本vLLM中实现qwen的长度外推。
在qwen的config.json中,增加如下内容:
config.json
{ "rope_scaling": { "type": "dynamic", "factor": 4.0 } }
dynamic:动态NTK factor:缩放因子,外推长度=原始长度*缩放因子
dynamic
factor