存储器体系结构学习笔记

作者：IT小白 | 2024-08-29 11:24:58

踩

一路组相联相当于

首发于个人博客

存储器性能评价指标

存储器停顿周期数

存储器的性能直接影响到CPU的性能评价，定义存储器停顿周期数为CPU等待存储器访问而停顿的时钟周期数，由此有CPU执行时间有：
$CPU执行时间=(CPU时钟周期数+存储器停顿时钟周期数) \times 时钟周期时间$
因此需要存储器停顿时钟周期数越小越好，对于这一变量有公式如下：
$存储器停顿周期数 = 缺失数量 \times 缺失代价 = 指令数 \times \frac{产生缺失指令数量}{指令数} \times 缺失代价 \\ = 指令数 \times \frac{存储器访问指令数}{指令总数} \times 缺失率 \times 缺失代价$
其中，缺失率表示存储器访问指令中会产生cache缺失的百分比；缺失代价表示发生cache缺失后为了解决缺失需要消耗的平均时钟周期数。另一种度量指标与时钟周期无关，即为每条指令的平均缺失数：
$平均缺失数=\frac{产生访存缺失的指令数}{指令总数} = 缺失率 \times \frac{存储器访问指令数}{指令总数}$
上述公式与缺失代价无关，缺失率的定义与上文相同

存储器平均访问时间

缓存性能比较好的度量为存储器平均访问时间，即对于每次存储器访问而言需要的平均时间，公式如下：
$存储器平均访问时间 = 命中时间 + 缺失时间 \times 缺失代价$
需要注意的是这一指标仅针对存储器访问指令，因此这是一个间接度量，考虑以下情况：

参数	数据
16KB指令缓存缺失数（每千条指令）	3.82
16KB数据缓存缺失数（每千条指令）	40.9
32KB统一缓存缺失数（每千条指令）	43.3
统一缓存数据访问额外需要时钟周期数	1
存储器访问中指令引用占比	74%
命中周期数/缺失代价	1/100
指令中数据传输指令占比	36%

需要注意的是，缺失数指的是对于所有指令而言产生存储器缺失的次数，而缺失率为相对于所有存储器访问产生缺失的比例。对于16KB的指令缓存，每条指令都会产生一次指令访问，缺失率为：
$缺失率_{指令} = \frac{3.82}{1000 \times 1} = 0.004$
对于16KB的数据缓存，有36%的指令会产生一次存储器访问，因此有：
$缺失率_{数据} = \frac{40.9 }{0.36 \times 1000} = 0.114$
有74%的存储器访问为指令访问，因此总体的缺失率为：
$缺失率_{分裂} = 0.74 \times 0.004 + 0.26 \times 0.114 = 0.0326$
考虑存储器平均访问时间，有：
$存储器平均访问时间_{分裂} = 0.74 \times (1+0.004 \times 200) + 0.26 \times (1 + 0.114\times 200) = 7.52$
对于32KB统一缓存而言，1000条指令一共产生1000次指令访存，其中36%的指令会产生数据访存，如下所示：
$缺失率_{统一} = \frac{43.3}{1000 + 1000 \times 0.36} = 0.0318$
对于统一缓存而言，数据访存指令会产生两种存储器访问，一次指令访问和一次数据访问，而统一缓存仅有端口，因此数据访问需要等待一个时钟周期，因此存储器平均访问时间：
$存储器平均访问时间_{统一} = 0.74 \times (1+0.0318 \times 200) + 0.26 \times (1 + 1 + 0.0318 \times 200) = 7.62$

对CPU性能影响

对于CPU性能而言，有以下公式：
$CPU执行时间=(CPU时钟周期数+存储器停顿时钟周期数) \times 时钟周期时间$
一般认为缓存命中时间作为CPU执行时钟周期数的一个部分，考虑一个以下参数的缓存：

参数	数值
CPU执行周期数	1
缺失代价	200
平均缺失率	2%
每条指令的存储器引用数	1.5
平均缓存缺失数（千条指令）	30

对于以上参数，每千条指令产生的存储访问数为 $1000 \times 1.5 = 150$ ，存储器访问的缺失率为2%，即千条指令产生的存储器缺失数量为 $150 \times 2\%=30$ ，与给出的平均缓存缺失数一致。使用缺失数计算CPU执行时间：
$CPU执行时间 = IC \times (1 + \frac{存储器停顿周期数}{IC}) \times 时钟周期 \\= IC \times (1 + \frac{停顿数}{IC} \times 缺失代价) \times 时钟周期 = IC \times (1+\frac{30}{1000} \times 200) \times 时钟周期 \\ = 7 \times IC \times 时钟周期$
上述分析均对于顺序存储器而言，其每次存储器缺失都会暴露为缺失代价。对于乱序处理器而言，其存储器缺失可能被乱序执行的其他指令掩盖，即有：
$存储器停顿周期 = 缺失数 \times (总缺失代价 - 重叠缺失延迟)$
对于乱序执行的CPU而言，分析比较复杂，若一个时钟周期该CPU没有提交最大可能数目的指令，则认为该CPU发生的了存储器访问缺失。

存储器层次结构

存储器之间的关于存储器层次结构，需要解决以下四个问题：

块的放置：一个块可以放在这一级的什么位置
块的识别：如何找到放置在这一级中的一个块
块的替换：在缺失时应当替换哪个块
块的写入：写入时发生什么

块的放置

首先定义组的概念，一个组是存储器中的一段连续空间，可以容纳多个（整数个）块。取一个存储器中组的数量为m，每个组可以容纳的块的数量为n，有以下关系：
$存储器容量 = m \times n \times 块大小$
任何来自某个地址的块只能被放置在一个特定的组中，这种方法被称为组相联，一个组中可以容纳n个块，即为n-路组相联。块首先被映射到组，组编号为：
$组编号 = 块地址 \% m$
随后，这个块可以被放置在这个组中的任意块地址位置。即对于一个块地址为A的块而言，对应的组编号为 $G = A\%m$ ，其可以被放置在这个编号为G的组中的任意有效的块起始地址位置。如下图所示：

ch2_cache_group.png

对于组相联，有两种特殊情况：

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/1022211