搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
从前慢现在也慢
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
java监控时间_如何用JProfiler监控Java代码运行时间
2
Java+MYSQL超市管理系统10428-计算机毕业设计(赠源码)_基于mysql毕业设计实例
3
数学建模之预测类几种常见的方法_数学建模预测两年后的数据用什么方法
4
985大学计算机专业保研率排名,这5所985大学,保研率高,值得参考!
5
纯干货|AI辅助写论文的正确打开方式!_论文查ai辅写吗
6
Vant源码解析(三)van-stepper步进器
7
老牛知点所以然-两种安卓两种网络请求框架(ksoap2-android & okhttp)配置https_android ksoap请求过程
8
SVN 版本控制详解,全面解析代码管理利器!_svn版本
9
【最全】MobaXterm免费&;汉化&;专业版的下载&;使用_mobaxterm下载_mobaxterm汉化
10
Windows环境MySQL卸载_windows卸载mysql
当前位置:
article
> 正文
什么是异构计算_异构计算是什么意思
作者:从前慢现在也慢 | 2024-07-25 16:39:33
赞
踩
异构计算是什么意思
异构计算的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分异构计算近年来得到更多关注,主要是因为通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈。而与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能/芯片面积的比和性能/功耗比都很高,却远远没有得到充分利用。
CPU的设计让其比较擅长于处理不规则数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序。这类程序任务拥有复杂的指令调度、循环、分支、逻辑判断以及执行等步骤。而GPU擅于处理规则数据结构和可预测存取模式。而APU的设计理念则正是让CPU和GPU完美合作,集合两者的长处,用异构计算来达到整体性能的最佳化。
目前,已经有50款领先的应用能够利用AMD APU进行加速,而后续的应用也将陆续到来——异构计算普及的一刻应该是近在咫尺了。
再谈谈现在正在流行的异构计算CPU+GPU。
CPU和GPU的本质区别
CPU的目标是快速执行单一指令流;
CPU将其用于乱序执行、寄存器重命名、分支预测以及巨大的cache上,这些设计都是为了加速单一线程的执行速度
CPU利用cache来降低内存访问延迟
CPU通过大量的cache和分支预测来降低延迟,这些机制消耗了大量的晶体管的电能;
CPU每个核心支持1~2个线程;
CPU切换线程的代价是数百个时钟周期;
CPU通过SIMD(单指令多数据)来处理矢量数据;
Intel的CPU没有集成内存控制器
GPU的目标是快速执行大量的并行指令流。
GPU将晶体管用于处理器阵列、多线程管理、共享内存、内存控制器,
这些设计并不着眼于提高单一线程的执行速度,而是为了使GPU可以同时执行成千上万的线程,
实现线程间通信,并提供极高的内存带宽。
GPU使用cache来放大内存带宽
GPU通过同时运行上千个线程来隐藏延迟,等待内存访问的线程会被切换掉,GPU切换线程不耗时间。
对于支持CUDA的GPU,每个流处理器可以同时处理1024个线程。
GPU切换线程的代价是0,事实上GPU通常每个时钟周期都切换线程。
GPU则使用SIMT(单指令多线程),SIMT的好处是无需开发者费力把数据凑成合适的矢量长度,并且SIMT允许每个线程有不同的分支。
支持CUDA的GPU集成有8个内存控制器,GPU的内存带宽通常是CPU的十倍
CPU的长项是整数计算,GPU的优势则是浮点计算。
对于整机性能而言,CPU和GPU都是性能的保障,合理的搭配才是重中之重,才能给用户带来最强的综合性能。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/881192
推荐阅读
article
CUDA
基本
入门教程
...
GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,可以看成是CPU的协处理器,因此当我们在说GPU并行计算时,...
赞
踩
article
新手小白安装 Py
Torch
库(简单详细的流程) 代码报错
Torch
not
compiled
w...
常用的 Python 代码编辑器包括 Jupyter Notebook、PyCharm、Visual Studio Co...
赞
踩
article
VLC
本地
视频
转
NDI
流输出_
vlc
ndi
...
NDI
输出工具:
VLC
工具先安装
VLC
工具,再安装
NDI
5 Tools.exe
VLC
安装32位的,https://...
赞
踩
article
中国
各大
银行
缩写和名字对照
json
数据
,
辛苦整理不易
,
点个赞吧!_全国
银行
名称
及
所在地
数据
...
中国
各大
银行
缩写和
名称
对照的
json
数据
整理自网络
,
包括国有
银行
、股份制商业
银行
和信用社。涉及
中国
四大行、六大国有
银行
和...
赞
踩
article
将
汉语
转换成
拼音
,
实现
拼音
和中文双重登录
_
凸淼卜
义
义
乸...
在一次项目中遇到
,
绝对原创
,
网上有很多不能用
,
如果要转载
,
请注明出处!谢谢! using System.Runtime....
赞
踩
article
如果看待
HarmonyOS
鸿蒙
开闭
源
的
抉择
_
为啥要
开
源
闭
源
两个
鸿蒙
...
8月9日,华为在广东东莞
的
华为松山湖基地召开了2019华为全球开发者大会,正式发布了自主研发
的
操作系统
鸿蒙
。并在后续宣布...
赞
踩
article
算法
力扣刷题
记录
五十六
【501.
二叉
搜索
树中
的
众数
】...
求
众数
方法
算法
力扣刷题
记录
五十六
【501.
二叉
搜索
树中
的
众数
】 ...
赞
踩
article
Python
高级
应用(3)—— 为你
的
项目
添加
验证码
...
验证码
简介
验证码
的
作用:
验证码
在现在来说,是很常见
的
东西,可以一定程度
的
保护网站,比如防止网络爬虫恶意爬取网站数据啊,减...
赞
踩
article
达梦
数据库
CASE
_
SENSITIVE
参数的理解...
CASE
_
SENSITIVE
_
达梦
数据库
case
达梦
数据库
case ...
赞
踩
article
电子
支付
与
结算
总结_
电子
结算
...
电子
支付
与
结算
总结第一章
电子
支付
概述名词解释简答题选择判断题第二章
支付
工具与
支付
方式名词解释简答题第三章 网上银行支...
赞
踩
article
双剑合
璧:
CPU
+
GPU
异构计算
完全解析...
作者:小熊在线-宁道奇 并行计算:让处理的速度变得更快 相对于串行计算,并行计算可以划分成时间并行和空间并行。时间并行即...
赞
踩
article
Git
最佳实践
规范
_
git
提交
命名
规范
...
当我们使用代码版本控制时,我们应该遵循的主要良好实践之一是为分支、
提交
、拉取请求等使用清晰且描述性的名称。
提交
的主题是必...
赞
踩
article
PyCharm
2024
.1新特性探秘:
开发者
的超级动力升级_
pycharm
注册码
2024
...
PyCharm
2024
.1的新特性为Python
开发者
带来了一系列强大的工具和改进,从性能提升到更智能的代码分析,再到...
赞
踩
article
探索优雅的
命令行
艺术
:
Artisan
Menu
...
探索优雅的
命令行
艺术
:
Artisan
Menu
项目地址:https://gitcode.com/DivineOmega/...
赞
踩
article
2.1
数据
文字
的
表示
方式_
数据
结果
进行
文字
描述的方法...
上面提到的二进制数,没有提到符号问题,故是一种无符号数的
表示
。在BCD码中,0~9之间的十进制数的BCD码与二进制数中的...
赞
踩
article
消费
金融
及
物流
概念介绍...
实名认证三要素:验证用户提供的银行卡号码、身份证号码、开户人姓名是否一致。实名认证四要素:验证用户提供的银行卡号码、开户...
赞
踩
article
安卓
手机
autox
.
js
连接电脑
vscode
服务
_
auto
js
vscode
...
好多提示需要将端口通过防火墙放行,没有交怎么放行的。按照下方入站和出站规则都添加好的话就可以放行端口。
_
auto
js
v...
赞
踩
article
【
Chrome
浏览器
插件
开发】
浏览器
插件
运行机制
02之实战开发出一款
Google
浏览器
插件
——含
源码
...
一、
浏览器
插件
配置文件 manifest.json入门每个
浏览器
插件
都有一个 JSON 格式的文件,叫做 manifes...
赞
踩
article
【
SCP
命令
】安全又快捷的
linux
小技巧
scp
命令
_
scp
指定
用户...
NAME:
scp
— 安全复制(远程文件复制程序)
scp
在网络中的主机间进行文件复制。它用 ssh(1) 来传输及验证...
赞
踩
article
json
的
数据结构
...
括起来的字符串(String)、数值(Number)、布尔值(true/false)、 null、对象(Object)或...
赞
踩
相关标签
CUDA
性能优化
并行编程
卷积神经网络
c++
c语言
深度学习
python
pytorch
音视频
json
php
服务器
javascript
string
regex
dao
bing
sun
class
鸿蒙OS
开源
安卓
算法
leetcode