搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
从前慢现在也慢
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
亿级用户背后的字节跳动云原生计算最佳实践_字节跳动大数据简介
2
[Git高级教程(二)] 远程仓库版本回退方法_回滚远程分支
3
Elasticsearch 性能调优指南_elasticsearch优化配置
4
Django + Vue前后端分离项目部署
5
C++ new/delete的重载_c++ 如何实现 new 重载
6
如何阻止gradle项目每次都自动下载依赖包到C盘_如何避免gradle每次都要下载
7
幽灵行者ue4崩溃怎么解决?幽灵行者ue4崩溃原因深度解读及全套解决方案
8
Vue2:路由的两种模式history模式和hash模式_vue2项目的路由如何设置为哈希模式
9
EMQX开源版 5.0 共享订阅实现_emq共享订阅测试
10
网页剪报:uTools平台的高效网页到Markdown转换工具_utools markdown 存放
当前位置:
article
> 正文
什么是异构计算_异构计算是什么意思
作者:从前慢现在也慢 | 2024-07-25 16:39:33
赞
踩
异构计算是什么意思
异构计算的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分异构计算近年来得到更多关注,主要是因为通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈。而与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能/芯片面积的比和性能/功耗比都很高,却远远没有得到充分利用。
CPU的设计让其比较擅长于处理不规则数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序。这类程序任务拥有复杂的指令调度、循环、分支、逻辑判断以及执行等步骤。而GPU擅于处理规则数据结构和可预测存取模式。而APU的设计理念则正是让CPU和GPU完美合作,集合两者的长处,用异构计算来达到整体性能的最佳化。
目前,已经有50款领先的应用能够利用AMD APU进行加速,而后续的应用也将陆续到来——异构计算普及的一刻应该是近在咫尺了。
再谈谈现在正在流行的异构计算CPU+GPU。
CPU和GPU的本质区别
CPU的目标是快速执行单一指令流;
CPU将其用于乱序执行、寄存器重命名、分支预测以及巨大的cache上,这些设计都是为了加速单一线程的执行速度
CPU利用cache来降低内存访问延迟
CPU通过大量的cache和分支预测来降低延迟,这些机制消耗了大量的晶体管的电能;
CPU每个核心支持1~2个线程;
CPU切换线程的代价是数百个时钟周期;
CPU通过SIMD(单指令多数据)来处理矢量数据;
Intel的CPU没有集成内存控制器
GPU的目标是快速执行大量的并行指令流。
GPU将晶体管用于处理器阵列、多线程管理、共享内存、内存控制器,
这些设计并不着眼于提高单一线程的执行速度,而是为了使GPU可以同时执行成千上万的线程,
实现线程间通信,并提供极高的内存带宽。
GPU使用cache来放大内存带宽
GPU通过同时运行上千个线程来隐藏延迟,等待内存访问的线程会被切换掉,GPU切换线程不耗时间。
对于支持CUDA的GPU,每个流处理器可以同时处理1024个线程。
GPU切换线程的代价是0,事实上GPU通常每个时钟周期都切换线程。
GPU则使用SIMT(单指令多线程),SIMT的好处是无需开发者费力把数据凑成合适的矢量长度,并且SIMT允许每个线程有不同的分支。
支持CUDA的GPU集成有8个内存控制器,GPU的内存带宽通常是CPU的十倍
CPU的长项是整数计算,GPU的优势则是浮点计算。
对于整机性能而言,CPU和GPU都是性能的保障,合理的搭配才是重中之重,才能给用户带来最强的综合性能。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/881192?site
推荐阅读
article
再谈
异构计算
CPU
+
GPU
_
异构计算
核显...
异构计算
的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系...
赞
踩
article
word2vec
简单
入门
使用、总结
_
word2vec
-
chinese
入门
...
这也是为什么ELMO,GPT,bert问世之后
word2vec
就不再有以前的光环了,因为ELMO,GPT,bert都是用...
赞
踩
article
opencv
学习
_
11
(
模板
匹配
(包括单
模板
和多
模板
))
_
opencv
多角度
模板
匹配
...
模板
匹配
——在一幅图像中
匹配
与
模板
相似的单个或者多个目标(1)目标
匹配
函数:cvMatchTemplate( const...
赞
踩
article
【
Vue
实现将页面转成
PDF
并下载或直接
打印
】_
vue
pdf
打印
...
【代码】【
Vue
实现将页面转成
PDF
并下载或直接
打印
】_
vue
pdf
打印
vue
pdf
打印
...
赞
踩
article
JMeter
中文
使用
手册
_
jmeter
中文帮助
手册
...
1.简介Apache
JMeter
是100%纯java桌面应用程序,被设计用来测试C/S结构的软件(例如web应用程序)...
赞
踩
article
Docker
删除
容器
命令_
docker
销毁
容器
...
【代码】
Docker
删除
容器
命令。_
docker
销毁
容器
docker
销毁
容器
...
赞
踩
article
PHP
利用GD库
实现
图片
合成
功能
方法
_
php
gd 库
合成
图片
...
替换$fontFile变量为实际的字体文件路径,确保该字体支持中文(如simsun.ttc或simhei.ttf)。例如...
赞
踩
article
BLIP2
中
Q
-
former
详解...
Q
uerying Trans
former
,在冻结的视觉模型和大语言模型间进行视觉-语言对齐。为了使
Q
-Former的学习...
赞
踩
article
学习
人工智能
-3条Python命令,从零开始搭建
GPT
,min
GPT
by
Andrej
karpa...
3条Python命令,从零开始搭建
GPT
,min
GPT
by
Andrej
karpathy
。如果你不是深度学习领域的专...
赞
踩
article
基于
Python
+
Django
构建智能
互动
拍照
系统_基于
django
的
图片
...
本系统旨在探索先进的计算机视觉算法在大熊猫主题的
互动
拍照
场景上的应用。系统结合人脸及人体关键点识别,人像分割,目标检测,...
赞
踩
article
VS
code
提示:Error: Unable to
find
git
Error: Unable...
问题出在环境变量!因为,
git
安装完毕,win10默认的是path是C:\Program Files\Git\cmd\g...
赞
踩
article
【
Java
】
Java
中
解码
Base64
数据
的简易指南_
java
base64
解码
...
通过上述示例,我们可以看到如何使用
Java
进行
Base64
解码
,包括处理字符串、字节
数据
以及流式
数据
。在实际应用中,根据...
赞
踩
article
AutoJs4.4
.1
免费版
快速接通
vscode
进行
调试
脚本
...
本文完成autojs
调试
vscode
,作为入门,掌握了之后就可以编写你喜欢的
脚本
了。如果觉得文章对你有用处,记得转发一波...
赞
踩
article
java
微服务
网关
搭建
,
面试题
附答案
_
java
网关
面试题
...
消息中间件合集:MQ(ActiveMQ/RabbitMQ/RocketMQ)+Kafka+笔记最近有好多朋友都去投岗秋招...
赞
踩
article
在
Ubuntu
上
安装
rabbitMq
server
_
libwxgtk3.0
-0v5...
下载Server 描述 下载 基于debian的linux的
安装
包(github) rabbitmq-
server
_3....
赞
踩
article
vue
导出
pdf
...
【代码】
vue
导出
pdf
。_
vue
导出
pdf
vue
导出
pdf
...
赞
踩
article
CPU
-
GPU
异构并行化
APSP
算法
_并行化
floyd
...
CPU
-
GPU
异构并行化
APSP
算法
_并行化
floyd
并行化
floyd
...
赞
踩
article
python
tensorflow
以图
搜图
_GitHub - lomoss/
SearchImage
...
项目介绍:一个简单
以图
搜图
的demo项目,采用vgg16提取特征值,使用Miluvs向量搜索引擎,只有简单几个文件,没有...
赞
踩
article
【高频
面试题
】
微
服务
篇
_
微
服务
面试题
...
服务
与
服务
之间是存在互相调用的情况
服务
雪崩就是一个
服务
失败,导致整条链路的
服务
都失败的情形。解决办法有两种:1.
服务
降...
赞
踩
article
获取
银行
卡
所属
银行
,
验证
银行
卡
号
是否正确...
获取
银行
卡
所属
银行
,
验证
银行
卡
号
是否正确版权声明:本文为博主原创文章,未经博主允许不得转载。需求:用户输入
银行
卡
卡
号
,需...
赞
踩
相关标签
word2vec
人工智能
自然语言处理
opencv
cpp
vue.js
pdf
前端
JMeter中文使用手册
docker
容器
运维
服务器
apache
php
android
开发语言
深度学习
学习
gpt
chatgpt
Andrej karpathy
openAI
python