当前位置:   article > 正文

【全网瞩目】哦,405,什么!405B,疑似最新的 Llama 3 400B流出

【全网瞩目】哦,405,什么!405B,疑似最新的 Llama 3 400B流出

据悉,自 4 月 18 日发布有关 Llama 3 的原始新闻稿以来,Meta AI 一直在暗示 400B 模型的发布。当时它写道:"我们最大的模型参数超过 400B,"并补充说,"在未来几个月内,我们将发布多个具有新功能的模型,包括多模态、多语言对话能力、更长的上下文窗口和更强的整体能力。但目前尚未看到官方发布,而最近外网疯传疑似 Meta Llama 3 405B 的权重发布于HF。

在这里插入图片描述
于是,我查了一下 TensorWave,在hf上显示是一家公司,但从Bing上搜索是一家提供AI算力的公司。但是目前该用户已经删除了Meta-Llama-3-405B-Instruct-Up-Merge相关的信息。

在这里插入图片描述
不过,早期的用户已经通过GGML量化了该权重,并发布于HF。但是由于模型过于巨大,我就不做无畏的尝试了,而且我从llama.cpp的issue中了解,目前运行guff仍存在问题,还需官方适配。

在这里插入图片描述
https://github.com/ggerganov/llama.cpp/issues/8615

在这里插入图片描述

个人观点

尚不清楚,该模型权重的事件是否属于炒作行为,但却很好地为 Meta 即将发布的 Llama 3 400B 提前预热了一番。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/892781
推荐阅读
相关标签
  

闽ICP备14008679号