赞
踩
近来,跑语音情感识别和遗传算法的结合,需要大量的计算,一开始想着用gpu跑能快很多,结果发现调用gpu居然没有只用cpu更快。6代每代5个个体,合着总共30次训练,调用gpu居然比不调用gpu慢了接近一分钟。
不使用gpu:
使用gpu:
数据传输会有很大的开销,而GPU处理数据传输要比CPU慢,而GPU的专长矩阵计算在小规模神经网络中无法明显体现出来。
1.GPU擅长像卷积、填充的矩阵运算,常用于计算机视觉,在语音情感识别中没有太多卷积需要运算,导致时间短板在传输上,gpu节省的时间甚至没有弥补掉传输时间的损耗。
2.模型规模过小,看似和遗传算法相结合规模变大了。但是每一次单独训练的时间都是一样的,在计算时间上,遗传算法可以理解为多次运行同一个训练,即次数*单次训练时间。次数定好了,单次训练时间cpu>gpu.所以对整体来说使用cpu快于gpu。
自己已经开启gpu的项目可以使用如下代码关闭gpu来进行对比:
import os
os.environ["CUDA_VISIBLE_DEVICES"]="-1" ###指定此处为-1即可
#TensorFlow and tf.keras import tensorflow as tf #Helper libraries import numpy as np import matplotlib.pyplot as plt from time import time mnist = tf.keras.datasets.mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train, x_test = x_train / 255.0, x_test / 255.0 #用CPU运算 startTime1 = time() with tf.device('/cpu:0'): model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10, activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) model.fit(x_train, y_train, epochs=10) model.evaluate(x_test, y_test) t1 = time() - startTime1 #用GPU运算 startTime2 = time() with tf.device('/gpu:0'): model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10, activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) model.fit(x_train, y_train, epochs=10) model.evaluate(x_test, y_test) t2 = time() - startTime2 #打印运行时间 print('使用cpu花的时间:', t1) print('使用gpu花的时间:', t2)
结果:
使用cpu花的时间: 52.422937631607056
使用gpu花的时间: 122.77410888671875
#TensorFlow and tf.keras import tensorflow as tf #Helper libraries import numpy as np import matplotlib.pyplot as plt from time import time mnist = tf.keras.datasets.mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train, x_test = x_train / 255.0, x_test / 255.0 #CPU运行 startTime1 = time() with tf.device('/cpu:0'): model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(1000, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(1000, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10, activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) model.fit(x_train, y_train, epochs=10) model.evaluate(x_test, y_test) t1 = time() - startTime1 #GPU运行 startTime2 = time() with tf.device('/gpu:0'): model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(1000, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(1000, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10, activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) model.fit(x_train, y_train, epochs=10) model.evaluate(x_test, y_test) t2 = time() - startTime2 #打印运行时间 print('使用cpu花的时间:', t1) print('使用gpu花的时间:', t2)
结果:
使用cpu花的时间: 390.03080129623413
使用gpu花的时间: 224.40780639648438
后来听师哥说,是语音模型调用调用gpu也会加快速度,怀疑是tensorflow而没用tensorflow-gpu原因。
但是tensorflow2.0以后不就是不区分gpu版本了,抱着试试看的态度,分别装了tensorflow2.80和tensorflow-gpu两个版本,结果没差。(但是以后以防万一,能按tensorflow-gpu尽量不要按tensorflow,毕竟多打三个字母又不费啥)
后来发现就是项目问题
一、如果加宽隐藏层,会减少时间。
二、同样看资源利用率
开启gpu是有一个python项目和pycharm来占用gpu的,只不过占用不多
不开启gpu的话,python项目和pycharm一点gpu资源也没有
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。