Python中的卷积神经网络（CNN）入门_在linux下利用python简单实现cnn

作者：IT小白 | 2024-06-08 20:29:37

踩

在linux下利用python简单实现cnn

卷积神经网络（Convolutional Neural Networks, CNN）是一类特别适用于处理图像数据的深度学习模型。在Python中，我们可以使用流行的深度学习库TensorFlow和Keras来创建和训练一个CNN模型。在本文中，我们将介绍如何使用Keras创建一个简单的CNN模型，并用它对手写数字进行分类。

1. 准备数据集

我们将使用MNIST数据集，这是一个常用的手写数字数据集。Keras库提供了一个方便的函数来加载MNIST数据集。数据集包含60000个训练样本和10000个测试样本，每个样本是一个28x28的灰度图像。

python
复制代码
from tensorflow.keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
1
2
3
4
5

接下来，我们需要对数据进行预处理。我们将图像数据归一化到0-1之间，并将标签数据进行one-hot编码：

python
复制代码
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype("float32") / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype("float32") / 255

from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
1
2
3
4
5
6
7
8
9
10
11
12

2. 创建CNN模型

我们将使用Keras创建一个简单的CNN模型，包括卷积层、池化层、全连接层等。模型的结构如下：

卷积层：使用32个3x3的卷积核，激活函数为ReLU；
池化层：使用2x2的最大池化；
卷积层：使用64个3x3的卷积核，激活函数为ReLU；
池化层：使用2x2的最大池化；
全连接层：包含128个神经元，激活函数为ReLU；
输出层：包含10个神经元，激活函数为softmax。

python
复制代码
from tensorflow.keras import layers
from tensorflow.keras import models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation="relu", input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation="relu"))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(128, activation="relu"))
model.add(layers.Dense(10, activation="softmax"))
1
2
3
4
5
6
7
8
9
10
11
12
13

3. 训练CNN模型

我们将使用训练数据集训练CNN模型，并在测试数据集上评估模型性能。我们将使用交叉熵损失函数和Adam优化器，训练10个epoch。

python
复制代码
model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])

model.fit(train_images, train_labels, epochs=10, batch_size=64)

test_loss, test_acc = model.evaluate(test_images, test_labels)
print("Test accuracy: {:.2f}%".format(test_acc * 100))
1
2
3
4
5
6
7
8

4. 使用CNN模型进行预测

训练好CNN模型后，我们可以用它对新的图像数据进行预测。下面我们将随机选择一个测试图像，并使用模型进行预测。

python
复制代码
import numpy as np
import matplotlib.pyplot as plt

index = np.random.randint(0, len(test_images))
image = test_images[index]

plt.imshow(image.reshape(28, 28), cmap="gray")
plt.show()

predictions = model.predict(np.expand_dims(image, axis=0))
predicted_label = np.argmax(predictions)

print("Predicted label:", predicted_label)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

上述代码将展示一个随机选择的手写数字图像，并输出模型预测的结果。

这就是如何在Python中使用Keras创建和训练一个简单的CNN模型进行手写数字分类。在实际应用中，可以根据需求调整CNN模型的结构和参数以优化性能。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/691063