赞
踩
在本章节,我们将深入介绍深度学习的基本原理,着重关注其中的核心概念——神经网络。
近年来,人工智能(Artificial Intelligence, AI)技术取得了长足的发展,其中AI大模型已成为人工智能领域的热门话题。从传统的符号主导型AI到机器学习时代,再到今天深度学习的兴起,AI模型的演变历程让人们看到了人工智能技术的巨大潜力。
深度学习(Deep Learning)是一种以神经网络为基础的机器学习方法。它利用多层神经元网络模拟人类大脑中的学习过程,通过训练数据来优化权重参数,最终实现对复杂输入信号的有效表示和处理。
神经网络(Neural Network, NN)是一种由许多简单单元组成的网络,每个单元称为一个神经元。神经网络的基本思想就是利用大量简单的单位组成复杂的网络模型,模拟人类大脑中的学习和记忆能力。
神经网络模型可以分为输入层、隐藏层和输出层三种基本形式,如图2-1所示。
\tikzstyle{every node}=[draw,circle,minimum size=1.2em,inner sep=0pt] \node (i1) at (0,0) {$x_1$}; \node (i2) at (1,0) {$x_2$}; \node (i3) at (2,0) {$\dots$}; \node (h1) at (0,-1) {$z_1^{(1)}$}; \node (h2) at (1,-1) {$z_2^{(1)}$}; \node (h3) at (2,-1) {$\dots$}; \node (o1) at (0,-2) {$y_1$}; \node (o2) at (1,-2) {$y_2$}; \node (o3) at (2,-2) {$\dots$}; \foreach \from/\to in {i1/h1, i1/h2, i2/h1, i2/h2, i3/h1, i3/h2} \draw [-] (\from) -- (\to); \foreach \from/\to in {h1/o1, h1/o2, h2/o1, h2/o2} \draw [-] (\from) -- (\to); \end{tikzpicture}" alt="" align="middle">
图2-1 简单神经网络示意图
其中,输入层接收外界输入数据,隐藏层负责数据的抽象和表示,输出层产生最终的输出结果。此外,还存在多种特殊的神经网络模型,如卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)等。
前向传播算法是神经网络中最基本的运算过程,包括线性变换和非线性激活函数两个步骤。
对于第l层的隐藏单元,$z_{j}^{ {(l)}}$,它的计算公式如下:
其中,$n^{ {(l-1)}}$表示前一层的神经元数量,$w_{jk}^{ {(l)}}$表示从第(l
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。