赞
踩
当大模型成本逐渐降低,可靠性提升后,这意味着越来越多的业务应用将会与 LLM 结合,为了让这种结合更加顺畅,需要有与现有基础设施相兼容的工具和框架来支撑 LLM 应用开发的快速开发
通用大模型性能评测参见:
一、应用开发平台Maas
1.1 阿里:百炼大模型平台
1.2 百度:千帆大模型平台
1.3 字节跳动:Coze
对比说明可参考: https://mp.weixin.qq.com/s/9v5TdLoGokZqAx-_B_IuZg
二、应用开发平台开源
2.1 Dify: 开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。以下是其核心功能列表:
2.2 FastGPT:一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力
2.3 bisheng(毕昇):一款领先的开源大模型应用开发平台,赋能和加速大模型应用开发落地,帮助用户以最佳体验进入下一代应用开发模式。
------ 完整度的顺序 Dify > FastGPT > 毕昇
2.5 其它
三、智能文档解析
3.1 RAGFlow: 是一款基于深度文档理解构建的开源 RAG 引擎。
3.2 Unstructured: 是一个灵活的Python 库,专门用于处理非结构化数据
3.3 PaddleOCR: 是由百度推出的 OCR 开源项目,旨在提供全面且高效的文字识别和信息提取功能
3.4 EasyOCR:使用很友好的OCR服务
四、BI与DB
****4.1 DB-GPT : 是一个开源的数据库领域大模型框架。目的是构建大模型领域的基础设施,通过开发多模型管理、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。
4.2 Chat2DB: 阿里开源智能的通用数据库SQL客户端和报表工具
****4.3 DefogAI SQLCoder:SQLCoder 是 Defog 团队推出的一款前沿的大语言模型,专门用于将自然语言问题转化为 SQL 查询,这是一个拥有150亿参数的模型。
4.4 BIRD-SQL:由多位作者联合创作,一作是港大,二作是阿里达摩院
4.4 闭源项目参考:
4.5 其它
五、本地部署工具
5.1 ollama: Ollama 是一个开源框架,专门为在本地机器上便捷部署和运行大型语言模型(LLM)而设计
5.2 OpenLLM: OpenLLM 于 2023 年 6 月开源,是一个用于部署大语言模型的框架。其最初的口号是通过一行代码或相对轻松地在不同的大语言模型之间切换,为个人用户提供方便。
简化部署:自动生成 LLM 服务器 Docker 镜像或通过 BentoCloud 部署为无服务器端节点
自由构建:对 LangChain、BentoML 和 Hugging Face 具有一级支持,可以通过将 LLM 与其它模型和服务组合来轻松创建自己的 AI 应用程序
5.3 LM Studio: LM Studio提供了一个简单的可视化LLM安装程序,用户只需几个简单的步骤就可以轻松安装和运行
5.4 Xinference: Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。
六、推理服务框架
LLM推理有很多框架,各有其特点,下表中七个框架的关键点如下图
6.1 vLLM: 适用于大批量Prompt输入,并对推理速度要求高的场景
6.2 Text generation inference: 依赖HuggingFace模型,并且不需要为核心模型增加多个adapter的场景
6.3 CTranslate2:可在CPU上进行推理
6.4 OpenLLM: 为核心模型添加adapter并使用HuggingFace Agents,尤其是不完全依赖PyTorch;
6.5 Ray Serve: 稳定的Pipeline和灵活的部署,它最适合更成熟的项目
6.6 MLC LLM: 可在客户端(边缘计算)(例如,在Android或iPhone平台上)本地部署LLM
6.7 DeepSpeed-MII: 使用DeepSpeed库来部署LLM
6.8 llama.cpp: 是一个纯 C/C++ 实现的模型量化推理工具,具有极高的性能,可以同时在 GPU 和 CPU 环境下运行
七、大模型微调
7.1 LlamaFactory: 北航发布LlamaFactory,零代码大模型微调平台,一键快速实现大模型训练/微调/评估
八、大模型聚合平台
8.1 Hugging Face:Hugging Face 是一个开源的机器学习平台,该平台目前托管了超过320,000个模型和50,000个数据集,成为全球机器学习社区合作开发模型、数据集和应用程序的主要集合地。
九、开发库与工具
十、向量数据库
参考Vector DB Comparison:https://superlinked.com/vector-db-comparison
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。
但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料
包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/1012385
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。