搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
从前慢现在也慢
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
3D-DIC数字图像相关法测量流程介绍-数字图像采集_视觉软件中触发周期是什么意思
2
全网最完整的iperf测试工具使用说明_iperf测试命令详解
3
力扣88.合并两个有序数组(Java)
4
Kaggle入门文档_kaggle帮助文档
5
2020西安面试_线程池 为什么只执行了一个sql就结束了
6
LeetCode-随机链表的复制
7
DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence_vscode continue deepseek-coder-v2
8
JsonConvert.SerializeObject() 输出josn格式 也就是序列化。
9
Python的时间和日期:探索datetime模块
10
Android基础入门教程——8.3.8 Paint API之—— Xfermode与PorterDuff详解(五)_安卓8 paint
当前位置:
article
> 正文
什么是异构计算_异构计算是什么意思
作者:从前慢现在也慢 | 2024-07-25 16:39:33
赞
踩
异构计算是什么意思
异构计算的英文名称是Heterogeneous computing,主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。我们常说的并行计算正是异构计算中的重要组成部分异构计算近年来得到更多关注,主要是因为通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈。而与此同时,GPU等专用计算单元虽然工作频率较低,具有更多的内核数和并行计算能力,总体性能/芯片面积的比和性能/功耗比都很高,却远远没有得到充分利用。
CPU的设计让其比较擅长于处理不规则数据结构和不可预测的存取模式,以及递归算法、分支密集型代码和单线程程序。这类程序任务拥有复杂的指令调度、循环、分支、逻辑判断以及执行等步骤。而GPU擅于处理规则数据结构和可预测存取模式。而APU的设计理念则正是让CPU和GPU完美合作,集合两者的长处,用异构计算来达到整体性能的最佳化。
目前,已经有50款领先的应用能够利用AMD APU进行加速,而后续的应用也将陆续到来——异构计算普及的一刻应该是近在咫尺了。
再谈谈现在正在流行的异构计算CPU+GPU。
CPU和GPU的本质区别
CPU的目标是快速执行单一指令流;
CPU将其用于乱序执行、寄存器重命名、分支预测以及巨大的cache上,这些设计都是为了加速单一线程的执行速度
CPU利用cache来降低内存访问延迟
CPU通过大量的cache和分支预测来降低延迟,这些机制消耗了大量的晶体管的电能;
CPU每个核心支持1~2个线程;
CPU切换线程的代价是数百个时钟周期;
CPU通过SIMD(单指令多数据)来处理矢量数据;
Intel的CPU没有集成内存控制器
GPU的目标是快速执行大量的并行指令流。
GPU将晶体管用于处理器阵列、多线程管理、共享内存、内存控制器,
这些设计并不着眼于提高单一线程的执行速度,而是为了使GPU可以同时执行成千上万的线程,
实现线程间通信,并提供极高的内存带宽。
GPU使用cache来放大内存带宽
GPU通过同时运行上千个线程来隐藏延迟,等待内存访问的线程会被切换掉,GPU切换线程不耗时间。
对于支持CUDA的GPU,每个流处理器可以同时处理1024个线程。
GPU切换线程的代价是0,事实上GPU通常每个时钟周期都切换线程。
GPU则使用SIMT(单指令多线程),SIMT的好处是无需开发者费力把数据凑成合适的矢量长度,并且SIMT允许每个线程有不同的分支。
支持CUDA的GPU集成有8个内存控制器,GPU的内存带宽通常是CPU的十倍
CPU的长项是整数计算,GPU的优势则是浮点计算。
对于整机性能而言,CPU和GPU都是性能的保障,合理的搭配才是重中之重,才能给用户带来最强的综合性能。
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/881192
推荐阅读
article
VS
Code
配置
使用
Python
,超详细
配置
指南,看这一篇就够了_
vscode
python
...
VS
Code
配置
使用
Python
,超详细
配置
指南,看这一篇就够了_
vscode
python
vscode
pytho...
赞
踩
article
国开
电大
多媒体
应用
技术
基础
形考
任务
_
国开
形考
脚本...
形成性考核
任务
1题目:以下不属于计算机综合处理
多媒体
信息的有( )。键盘图形视频文本题目:信息处理和传播
技术
的第四次飞跃...
赞
踩
article
Resnet50
网络
训练
,
测试集上表现很好
,
部署时
准确度
下降严重
_
resnet
验证集
正确率
低...
虽然是个很zhizhang的问题
,
但还是困扰了我好几个小时
,
我先是在
训练
代码上
,
使用val部分的代码单独跑一个数据发现是...
赞
踩
article
MySQL
:
SELECT
语句_
mysql
selcect
...
在
MySQL
中,可以使用
SELECT
语句来查询数据。查询数据是指从数据库中根据需求,使用不同的查询方式来获取不同的...
赞
踩
article
钓
鱼
邮件
演练
方案
有
哪些
?如何模拟一次
演练
_
钓
邮件
专项
演练
方案
...
众所周知,网络
钓
鱼
仍是当今勒索软件载体及数据外泄攻击入侵公司内部的便捷途径。有市场调查报告指出,高达41%的受访企业每日...
赞
踩
article
算法
第十四天
:
leetcode24
.
两
两
交换
链表
中的
节点
...
24.
两
两
交换
链表
中的
节点
的链接如下表所示,若无法直接点击下面的链接进入力扣做题的话,您也可直接复制下面的网址,然后进入...
赞
踩
article
2022网络教育计算机统考-
多媒体技术
操作题_点击
压缩
mytest
.
rar
,在
弹出
的
快捷键中
选择
...
本考试涉及多个WinRAR操作题目,包括解压特定文件到指定文件夹,
压缩
多个文件并设定文件名及密码,以及处理带密码
的
压缩
文...
赞
踩
article
达梦
(DM) SQL
日期
操作及
分析
函数
_
达梦
数据库
时间
函数
...
讲述DM
数据库
中如何实现各种
日期
相关的运算以及如何利用
分析
函数
lead() over() 进行范围问题的处理_
达梦
数...
赞
踩
article
文献阅读:
Language
Models
are
Unsupervised Multitask Le...
文献阅读:
Language
Models
are
Unsupervised Multitask Learners_gpt...
赞
踩
article
李飞飞
高徒
Andrej
Karpathy
用
AI
撰写
内心独白
:我的“进化”之路...
作者 | 白莎莎编辑 | 陈彩娴转自:
AI
科技评论近日,
李飞飞
学生、现任特斯拉
AI
部门高级总监的
Andrej
Kar...
赞
踩
article
RabbitMQ
(二)
:
RabbitMQ
高级
特性
...
RabbitMQ
是目前非常热门的一款消息中间件,不管是互联网大厂还是中小企业都在大量使用。作为一名合格的开发者,有必要了...
赞
踩
article
Ollama
|
搭建
本地
大
模型
,最简单的方法!效果直逼
GPT
_
ollama
本地
搭建
...
开源免费:
Ollama
是一个不收费的开源工具。即插即用:它提供了预装好的大
模型
,免除了复杂的安装和下载流程。用户友好:即...
赞
踩
article
Open
SSL
SSL
_
read
:
Connection
was reset,
errno
1005...
git clone xxx 报错:Open
SSL
SSL
_
read
:
Connection
was reset, err...
赞
踩
article
程序员
做
知识
付费
的
方向和方法_
it
知识
付费
...
综上所述,
程序员
做
知识
付费
需要明确方向、精心准备内容、选择合适
的
平台、制定合理
的
定价策略、进行有效
的
营销推广、提供良好
的
...
赞
踩
article
Oracle
数据
怎么实时
同步
到 DM
DB
达梦
数据
库 亲测干货建议收藏_达梦
数据
库与
oracle
...
的方式也都是先配置源和目标的连接,然后新建任务选择
同步
模式:全量/增量/全量+增量,因为步骤相同,其他就不再贴图说明了。...
赞
踩
article
Hugging
Face
模型
下载
方法小结_
huggingface
.
co
怎么
下载
...
Hugging
Face
模型
快速
下载
方法总结_
huggingface
.
co
怎么
下载
huggingface
.
co
怎么
下载
...
赞
踩
article
运
筹
基础
学
第一章_
运
筹
学
(
operations
research
,
简写or)
系统工程
最重要的理论基...
第一章 导论
运
筹
学
(Operations Research)
系统工程
的最重要的理论基础之一,在美国有人把
运
筹
学
称之为管...
赞
踩
article
4.
uniapp
+
vue3
项目
使用
vuex
_
uniapp
vue3
vuex
...
uniapp
+
vue3
项目
使用
vuex
。这篇文章,既是
使用
的教程,也是用来解决一个实际问题:uView自定义tabbar...
赞
踩
article
【
网络安全
科普】
勒索
病毒
防护
指南...
常规的杀毒软件查找
病毒
的原理一般是对当前计算机上的文件进行特征的检测,检测完成后和现有的
病毒
库中的特征数据进行匹配,如果...
赞
踩
article
DM
达梦
数据库
函数
分析(与
oracle
相应
函数
区别及用法分析)_达梦
数据库
listagg
函数
...
DM
_ROWID
函数
返回表中行的物理地址,这是Oracle中ROWID所不具备的功能。在Oracle中,ROWID直接对...
赞
踩
相关标签
python
log4j
开发语言
opencv
深度学习
人工智能
mysql
数据库
后端
数据库系统
oracle
算法
数据结构
单链表
java
文档资料
DM
达梦数据库
SQL
日期操作函数
分析函数
GPT2
LLM
OpenAI