AI大模型还没有到卷长文的时候

作者：从前慢现在也慢 | 2024-08-22 02:04:06

踩

AI大模型还没有到卷长文的时候

AI风口上，国内大模型技术突飞猛进，很多人都沉浸在用AI来辅助办公，辅助学习等等工具化应用落地，但也有趁着风口想大赚一笔，为了估值什么都敢说的。

前几天，Kimi对外宣称自己的技术狂飙到能读200万字甚至1000万字的长文，至于是否能真的理解和分析这么多字我在这里先打一个大大的问号，毕竟在我让Kimi帮我计算一下从2023年12月10日到2024年6月5日一共过了多少天的时候，它说有198天，最后反复计算又是179 ，主打一个已读乱回。

有人说了，可是他真的能给你总结出红楼梦的相关内容和人物情节，注意这不是Kimi在读红楼，它本身的技术根本做不到。因为Transformer架构下的大模型在本质上决定了它在处理上下文时候是天然具有限制的。每一个新的token在计算的时候，需要跟之前的每一个分词进行一次交互，就像一场聚会上，你要和每个参加活动的人都握手，人越多握手次数越多，可以说是指数级增长。

因此，上下文越长，需要交互的次数和计算的量级越大，200万的上下文长度意味着要投入更多的算力，买更多GPU。但现在面对美国的制裁，全球算力都很昂贵，创业公司谁敢这么干？

还有个方法叫做滑动窗口技术，把200万字的文本截成一段一段，每一段都用一些语言去总结，然后再标记下一段，用更简单的语言去总结。但这么做一定会有信息的丢失，不是完整的理解，对技术要求非常高。很早之前的ChatGPT和Copilot是这么做的，但也没有鼓吹。

而Kimi之所以能快速给你反馈红楼梦的一些信息，是它用了rag检索增强模式，就是通过外部文档的搜索和向量搜索来辅助大模型理解，把各个网络渠道关于红楼梦的解读、评论等等信息总结收集给你而已，省时省力省钱，他没有在读，更何谈理解分析。

当然，舆论说他割韭菜也不仅仅是因为这个，最近关于Kimi母公司月之暗面创始人减持套现的消息也一度让圈内炸开了锅，AI 大模型，一个正在烧钱造梦的产业，创始人在这个阶段选择套现，难道他们的产品是虚假泡沫，要弃船逃生？一个初创公司，成立一年就套现了几个亿的小目标，实属罕见。不过，公司后来否认了这一消息。

Kimi虽然在基础模型的理解生成逻辑等硬性指标上和第一梯队无法相比，但也借此机会火了一把，对于一家初创公司，靠着这把火，又可以融资到很多钱了。就在5月底，阿里巴巴投资了Kimi母公司月之暗面，一笔投资就高达8亿美元，大约59亿人民币，获取月之暗面36%的股权。对于此次阿里投资Kimi，市场纷纷怀疑阿里投资能力，毕竟投资的大润发、苏宁纷纷以巨亏收场······

“他们（月之暗面）在国内大模型上领先，但长远还是要证明自己的价值，至少能追上美国开源。如果能超过开源，他这个团队是真的有价值了。”据每日经济新闻报道，在今年的一次媒体采访中，金沙江创投主管合伙人朱啸虎在肯定杨植麟团队在大模型领域上的技术能力时，对其商业化能力持保留态度。

还是那句话，AI是个很硬核的行业，讲情怀讲噱头甚至偷换概念空喊口号的公司，最后难免“泡沫”的结局。

如何学习AI大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/1014329