赞
踩
据悉,自 4 月 18 日发布有关 Llama 3 的原始新闻稿以来,Meta AI 一直在暗示 400B 模型的发布。当时它写道:"我们最大的模型参数超过 400B,"并补充说,"在未来几个月内,我们将发布多个具有新功能的模型,包括多模态、多语言对话能力、更长的上下文窗口和更强的整体能力。但目前尚未看到官方发布,而最近外网疯传疑似 Meta Llama 3 405B 的权重发布于HF。
于是,我查了一下 TensorWave,在hf上显示是一家公司,但从Bing上搜索是一家提供AI算力的公司。但是目前该用户已经删除了Meta-Llama-3-405B-Instruct-Up-Merge
相关的信息。
不过,早期的用户已经通过GGML量化了该权重,并发布于HF。但是由于模型过于巨大,我就不做无畏的尝试了,而且我从llama.cpp的issue中了解,目前运行guff仍存在问题,还需官方适配。
https://github.com/ggerganov/llama.cpp/issues/8615
尚不清楚,该模型权重的事件是否属于炒作行为,但却很好地为 Meta 即将发布的 Llama 3 400B 提前预热了一番。
感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。