赞
踩
人工智能(AI)是指用普通计算机程序来呈现人类智能的技术。
人工智能的四个主要组成部分是:
- 专家系统:作为专家处理正在审查的情况,并产生预期或预期的绩效。
- 启发式问题解决:包括评估小范围的解决方案,并可能涉及一些猜测,以找到接近最优的解决方案。
- 自然语言处理:在自然语言中实现人机之间的交流。
- 计算机视觉:自动生成识别形状和功能的能力。
人工智能的核心问题包括建构能够跟人类似甚至超卓的推理、知识、计划、学习、交流、感知、移动 、移物、使用工具和操控机械的能力等。
– 引自“维基百科-人工智能”
常见人工智能领域:
机器学习是人工智能的一个子领域,机器学习的目标是设计和开发一些算法和模型,使计算机在不需要明确编程的情况下,从数据中自动分析获得规律,并利用规律对未知数据进行预测。
机器学习可分为两类:
深度学习是机器学习的一种类型。它试图模拟人脑的工作原理,通过神经网络进行学习。深度学习模型由多层神经网络组成,可以处理大量的数据并从中学习复杂的模式。常应用于计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域
强化学习是机器学习的一种类型。根据感知到的状态采取相应的动作,然后环境会给出一个奖励信号,智能体根据这个反馈调整其策略,以期在未来获得更大的奖励。类似人类通过试错逐步优化行为。常应用于游戏、机器人、自动驾驶等领域。
神经网络是指模仿人脑神经元工作方式的算法模型。常见神经网络架构有:
一类具有短期记忆能力的神经网络。其具备短期记忆能力的关键:通过使用带自反馈的神经元,使得网络的输出不仅和当前的输入有关,还和上一时刻的输出相关,于是在处理任意长度的时序数据时,就具有短期记忆能力。
RNN的结构包括输入层、隐藏层和输出层。
限制:
一种前馈神经网络,具有局部连接和权值共享等特点。
CNN由多个卷积层、全连接层和池化层组成(卷积层用于提取图像特征,全连接层用于分类,池化层用于压缩数据和减少过拟合)。
让模型在处理一个序列元素时,能够考虑到序列中所有元素的信息,而不仅仅是相邻的元素。考虑所有元素信息的关键:自注意力机制 + 位置编码。
Transformer模型主要由两部分组成:编码器(Encoder)和解码器(Decoder)。编码器负责将输入序列转换为一系列连续的向量表示,而解码器则利用这些向量表示以及先前生成的输出序列来生成最终的输出。
基于 Transformer 架构进行拆分,可分为三种主流架构:
通常使用深度学习技术,如神经网络,来训练大量的文本数据。大语言模型能够理解和生成人类语言,具有强大的语言结构理解和生成能力。
特点:
预训练是大型语言模型(LLM)的第一步。在预训练阶段,模型使用大量无标签的文本数据进行无监督学习训练,以学习语言知识和世界知识。预训练的目标是让模型具备通用的语言理解能力(词汇、句法和语义的规律)。
微调是预训练后的第二步。在微调阶段,模型使用特定任务的有标签数据(包括人类对模型应该执行的任务描述和期望的输出结果)进行监督学习训练,以适应下游任务。微调的目标是使模型在特定任务上表现良好。
微调技术:
在微调阶段只是将预训练中的知识给引导出来,只告诉了模型什么是好的数据,但没有给出不好的数据,当微调数据有限的情况下,可能会出现“有害性”或“幻觉”问题。而奖励模型就是解决该问题的,奖励模型通过对生成的内容进行打分来筛选出“正确”的数据。
使用奖励模型阶段挑出这些回复中得分较高的回复并再次训练原本的模型。
基于基座模型微调前提:预训练模型和下游任务的差距不大,预训练模型中通常已经包含微调任务中所需要的知识。
基座模型代表:
参考资料:
大模型 | 出品方 | 可选大模型 | 支持独立训练 | 支持微调 | 补充 |
---|---|---|---|---|---|
千帆 | 百度 | ✅ | ✅ | ✅ | 支持独立训练模型(全流程) |
混元 | 腾讯 | ❌ | ❌ | ❌ | 仅提供自家大模型API |
通义 | 阿里 | ✅ | ✅ | ✅ | 支持独立训练模型(阿里云百炼) |
星火 | 讯飞 | ❌ | ❌ | ✅ | 提供自家大模型API |
方舟 | 抖音 | ✅ | ❌ | ✅ | 各大模型API独立收费;支持模型微调(仅支持字节大模型) |
百川 | 百川智能(前搜狗CEO王小川创办) | ❌ | ❌ | ❌ | 仅提供自家大模型API |
文言一心是百度基于文言大模型训练出来的 toC 产品。
千帆大模型是百度将文言大模型+三方大模型打包在一起的 toB 产品。
收费分为六部分:
混元助手:腾讯混元助手
文档:腾讯混元大模型-接口文档
注册即送 10w Token,1 token ≈ 1.8 个中文汉字或 3 个英文字母
文档:腾讯混元大模型-购买指南
通义千问:通义千问
通过标准化的API提供包括模型推理、模型微调训练在内的多种模型服务。
各模型API及收费价格:模型列表_模型服务灵积(DashScope)
基于通义系列大模型和开源大模型的一站式大模型服务平台,提供「生成式大模型的全流程应用工具」和「企业大模型的全链路训练工具。
讯飞星火:讯飞星火认知大模型
支持Web、Android、iOS、Linux、Windows SDK
方舟大模型是 toB 产品,toC 产品为豆包
API 免费 50w Token
文档:产品计费–火山方舟大模型服务平台-火山引擎
收费分两部分:
百川智能:汇聚世界知识 创作妙笔生花-百川智能
文档:百川大模型-接口文档
注册即送 100w Token,1 token ≈ 1.5 个汉字。
文档:百川大模型-价格说明
使用场景分三部分:
Hi,我是“青杉”,您可以通过如下方式关注我:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。