赞
踩
本文的主要内容是操作系统中虚拟内存的基础知识,包括虚拟内存的基本概念、请求分页管理方式、页面置换算法以及页面分配策略,对比理解记忆请求分页管理方式与一般分页管理方式的不同,重点掌握五种页面置换算法的思想以及页面分配策略中的内容。
前面介绍过的传统存储管理中包括连续分配和非连续分配,连续分配包括单一连续分配、固定分区分配和动态分区分配,非连续分配包括基本分页存储管理、基本分段存储管理和基本段页式存储管理。
连续分配和非连续分配有两个特性,即一次性和驻留性。
一次性指的是作业必须一次性全部装入内存后才能开始运行,这会造成两个问题:①作业很大时,不能全部装入内存,导致大作业无法运行;②当大量作业要求运行时,由于内存无法容纳所有作业,因此只有少量作业能运行,导致多道程序并发度下降。
驻留性指的是一旦作业被装入内存,就会一直驻留在内存中,直至作业运行结束,而在实际中,在一个时间段内,只需要访问作业的一小部分数据即可正常运行,这就导致了内存中会驻留大量的、暂时用不到的数据,浪费了宝贵的内存资源。
连续分配和非连续分配中会遇到一些缺点,这些缺点可以用虚拟存储技术解决,虚拟存储技术依据的是局部性原理。
局部性原理有时间局部性和空间局部性。
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行,如果某个数据被访问过,不久之后该数据很可能再次被访问,因为程序中会存在大量的循环。
空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问,因为很多数据在内存中都是连续存放的。
高速缓冲技术的思想:将近期会频繁访问到的数据放到更高速的存储器中,暂时用不到的数据放在更低速存储器中。这就涉及到了计算机中存储器的层次结构,如下图所示。
结合计算机中存储器的层次结构和局部性原理,在程序装入时,可以将程序中很快会用到的部分装入内存,暂时用不到的部分留在外存,并开始让程序执行,在程序执行的过程中,当所访问的信息不在内存时,由操作系统负责将所需的信息从外存调入内存,然后继续执行程序,若内存空间不够,由操作系统负责将内存中暂时用不到的信息换出到外存。这样在操作系统的管理下,在用户看来似乎有一个比实际内存大得多的内存,这就是虚拟内存(实际的物理内存没有变化,只是在逻辑上进行了扩充)。
虚拟内存的最大容量是由计算机的地址结构,也就是 CPU 的寻址范围确定的;虚拟内存的实际容量=min(内存和外存容量之和,CPU 的寻址范围)。
举例:某计算机地址结构为32位,按字节编址,内存大小为512MB,外存大小为2GB。
则虚拟内存的最大容量为
2
32
2^{32}
232 B=4 GB
虚拟内存的实际容量 = min(
2
32
2^{32}
232 B,512MB+2GB)=2GB+512MB
虚拟内存的主要特征:
多次性:无需在作业运行时一次性全部装入内存,而是允许被分成多次调入内存。
对换性:在作业运行时无需一直常驻内存,而是允许在作业运行过程中,将作业换入和换出。
虚拟性:从逻辑上扩充了内存的容量,使用户看到的内存容量远大于实际的容量。
虚拟内存技术允许一个作业分多次调入内存,如果采用连续分配方式,会不方便实现,因此,虚拟内存的实现技术需要建立在离散分配的内存管理方式基础上。
虚拟内存的实现对应的技术分别是请求分页存储管理、请求分段存储管理和请求段页式存储管理。与传统的非连续分配存储管理的主要区别是,从外存调入内存时,操作系统要提供请求调页/段功能,在将内存中的信息换出到外存时,操作系统要提供页/段置换功能。
对虚拟内存的基本概念这部分内容简单的总结一下,如下图所示。
与基本分页管理相比,请求分页管理中,为了实现“请求调页”,操作系统需要知道每个页面是否已经调入内存,如果还没调入,那么也需要知道该页面在外存中存放的位置。
当内存空间不够时,要实现“页面置换”,操作系统需要通过某些指标来决定到底换出哪个页面,有的页面没有被修改过,就不用再浪费时间写回外存,有的页面修改过,就需要将外存中的旧数据覆盖,因此,操作系统也需要记录各个页面是否被修改的信息。
请求分页管理方式中的页表机制如下图所示。
在请求分页系统中,每当要访问的页面不在内存时,便产生一个缺页中断,然后由操作系统的缺页中断处理程序处理中断。此时缺页的进程阻塞并放入到阻塞队列里,调页完成后再将其唤醒,放回就绪队列。
如果内存中有空闲块,则为进程分配一个空闲块,将所缺页面装入该块,并修改页表中相应的页表项。
如果内存中没有空闲块,则由页面置换算法选择一个页面淘汰,若该页面在内存期间被修改过,则要将其写回外存,未修改过的页面不用写回外存。
缺页中断是因为当前执行的指令想要访问的目标页面未调入内存而产生的,因此属于内中断,缺页中断属于内中断中的故障,之前介绍过内中断的分类,如下图所示。
需要注意的是,一条指令在执行期间,可能会产生多次缺页中断。
请求分页管理方式与基本分页存储管理地址变换的不同之处有:
①请求调页,在查到页表项时进行判断;
②页面置换,需要调入页面,但没有空闲内存时进行;
③需要修改请求页表中新增的表项。
请求分页管理方式中的地址变换流程如下图所示。
在具有快表机构的请求分页系统中,访问一个逻辑地址时,若发生缺页,则地址变换的步骤是:查快表(未命中)——>查慢表(发现未调入内存)——>调页(调入的页面对应的表项会直接加入快表)——>查快表(命中)——>访问目标内存单元。
对请求分页管理方式这部分内容简单的总结一下,如下图所示。
前面已经提到过,操作系统负责将内存中暂时用不到的信息换出到外存,这个过程就需要页面置换算法决定换出哪个页面。
由于页面的换入和换出需要磁盘 I/O,会有较大的开销,因此好的页面置换算法应该追求更少的缺页率。
页面置换算法有最佳置换算法(OPT)、先进先出置换算法(FIFO)、最近最久未使用置换算法(LRU)、时钟置换算法(CLOCK)以及改进型的时钟置换算法。
最佳置换算法(OPT,Optimal) 是每次选择淘汰的页面将是以后永不使用或者在最长时间内不再被访问的页面,这样可以保证最低的缺页率。
最佳置换算法的举例如下图所示。
需要注意的是,缺页时未必会发生页面置换,如果还有可用的空闲内存块,就不会发生页面置换。如上图例子中的前三个页面的访问,虽然有缺页,但是有空闲的内存块,因此不会发生页面置换。
最佳置换算法可以保证最低的缺页率,但实际上,只有在进程执行的过程中才能知道接下来会访问到的是哪个页面,操作系统是无法提前预判页面的访问序列的,因此,最佳置换算法是无法实现的。
先进先出置换算法(FIFO,First In First Out) 每次选择淘汰的页面是最早进入内存的页面。 其实现方法是:把调入内存的页面根据调入的先后顺序排成一个队列,需要换出页面时选择队头页面即可,队列的最大长度取决于系统为进程分配了多少个内存块。
先进先出置换算法的举例如下图所示。
将上面例子的内存块数改为4如下图所示。
通过上面两个例子的对比发现,随着分配内存块数的增多,缺页次数不减反增,这就是 Belady 异常。
Belady 异常:当为进程分配的物理块数增大时,缺页次数不减反增的异常现象。
只有先进先出置换算法才会产生 Belady 异常,该算法虽然实现简单,但是其与进程实际运行时的规律不适应,因为先进入的页面也有可能最经常被访问,因此算法性能较差。
最近最久未使用置换算法(LRU,Least Recently Used) 每次淘汰的页面是最近最久未使用的页面。其实现方法是:赋予每个页面对应的页表项中,用访问字段记录该页面自上次被访问以来所经历的时间 t,当需要淘汰一个页面时,选择现有页面中 t 值最大的,也就是最近最久未使用的页面。
最近最久未使用置换算法的举例如下图所示。
最近最久未使用置换算法的性能是最接近最佳置换算法的,但是其实现需要专门的硬件支持,虽然算法性能好,但实现困难,开销大。
时钟置换算法(CLOCK)也称为最近未用算法(NRU,Not Recently Used),它是一种性能和开销较均衡的算法。
简单的时钟置换算法实现方法:为每个页面设置一个访问位,再将内存中的页面都通过链接指针链接成一个循环队列,当某页被访问时,其访问位置为1。当需要淘汰一个页面时,只需要检查页的访问位,如果是0,就选择该页换出,如果是1,则将它置为0,暂不换出,继续检查下一个页面,若第一轮扫描中所有的页面都是1,则将这些页面的访问位依次置为0后,再进行第二轮的扫描。这样,第二轮扫描中一定有访问位为0的页面,因此简单的时钟置换算法选择一个淘汰页面最多会经过两轮扫描。
时钟置换算法的举例如下图所示。
需要注意的是,时钟置换算法中,置换完成后指针会停留在刚刚发生页面置换的下一个页面,下次扫描时就会从指针所指向的页面开始扫描。
简单的时钟置换算法仅考虑到一个页面最近是否被访问过,事实上,如果被淘汰的页面没有被修改过,就不需要执行 I/O 操作写回外存,只有被淘汰的页面被修改过时,才需要写回外存。所以除了考虑一个页面最近有没有被访问过之外,操作系统还应考虑页面有没有被修改过,在其他条件都相同时,应优先淘汰没有修改过的页面,避免 I/O 操作,这就是改进型的时钟置换算法的思想。
增加修改位以后,若修改位为0,表示页面没有被修改过,若修改位为1,表示页面被修改过。
为了方便讨论,用 (访问位,修改位) 的形式表示各页面的状态,例如(1,1)表示一个页面近期被访问过,且被修改过。
改进型的时钟置换算法的算法规则:将所有可能被置换的页面排成一个循环队列。
第一轮:从当前位置开始扫描到第一个(0,0)的帧用于替换,本轮扫描不修改任何标志位。第一优先级:最近没访问,且没修改的页面。
第二轮:若第一轮扫描失败,则重新扫描,查找第一个(0,1)的帧用于替换,本轮将所有扫描过的帧访问位设为 0。第二优先级:最近没访问,但修改过的页面。
第三轮:若第二轮扫描失败,则重新扫描,查找第一个(0,0)的帧用于替换,本轮扫描不修改任何标志位。第三优先级:最近访问过,但没修改的页面。
第四轮:若第三轮扫描失败,则重新扫描,查找第一个(0,1)的帧用于替换。 第四优先级:最近访问过,且修改过的页面。
由于第二轮已将所有帧的访问位设为 0,因此经过第三轮、第四轮扫描一定会有一个帧被选中,因此改进型CLOCK置换算法选择一个淘汰页面最多会进行四轮扫描。
注意:扫描轮次越靠前所淘汰的就是备选淘汰页面中优先级最高的。
对页面置换算法这部分内容简单的总结一下,如下表所示。
驻留集:指请求分页存储管理中给进程分配的物理块的集合。
在采用了虚拟存储技术的系统中,驻留集大小一般小于进程的总大小。如果驻留集太小,会导致缺页频繁,系统要花大量的时间来处理缺页,而实际用于进程推进的时间很少;如果驻留集太大,又会导致多道程序并发度下降,资源利用率降低,所以选择合适的驻留集大小很重要。
固定分配:操作系统为每个进程分配一组固定数目的物理块,在进程运行期间不再改变,即驻留集的大小不变。
可变分配:先为每个进程分配一定数目的物理块,在进程运行期间,可以根据情况做适当的增加或减少,即驻留集大小可变。
局部置换:发生缺页时只能选进程自己的物理块进行置换。
全局置换:可以将操作系统保留的空闲物理块分配给缺页进程,也可以将别的进程持有的物理块置换到外存,再分配给缺页进程。
固定分配、全局置换这种方式是不存在的,因为全局置换意味着一个进程拥有的物理块数量必然会改变,因此不可能是固定分配。
固定分配局部置换:系统为每个进程分配一定数量的物理块,在整个运行期间都不改变。若进程在运行中发生缺页,则只能从该进程在内存中的页面中选出一页换出,然后再调入需要的页面。这种策略的缺点是很难在刚开始就确定应为每个进程分配多少个物理块才算合理。采用这种策略的系统可以根据进程大小、优先级、或是根据程序员给出的参数来确定为一个进程分配的内存块数。
可变分配全局置换:刚开始会为每个进程分配一定数量的物理块。操作系统会保持一个空闲物理块队列,当某进程发生缺页时,从空闲物理块中取出一块分配给该进程,若已无空闲物理块,则可选择一个未锁定的页面换出外存,再将该物理块分配给缺页的进程。采用这种策略时,只要某进程发生缺页,都将获得新的物理块,仅当空闲物理块用完时,系统才选择一个未锁定的页面调出,被选择调出的页可能是系统中任何一个进程中的页,因此这个被选中的进程拥有的物理块会减少,缺页率会增加。
可变分配局部置换:刚开始会为每个进程分配一定数量的物理块。当某进程发生缺页时,只允许从该进程自己的物理块中选出一个进行换出外存,如果进程在运行中频繁地缺页,系统会为该进程多分配几个物理块,直至该进程缺页率趋势适当程度,反之,如果进程在运行中缺页率特别低,则可适当减少分配给该进程的物理块。
在可变分配全局置换中,只要缺页就给分配新的物理块;在可变分配局部置换中,要根据发生缺页的频率来动态地增加或减少进程的物理块。
关于何时调入页面有两种策略,即预调页策略和请求调页策略。
①预调页策略:根据局部性原理,主要是空间局部性原理,一次调入若干个相邻的页面可能比一次调入一个页面更高效,但如果提前调入的页面中大多数都没被访问过,则这种策略又是低效的。因此可以预测不久之后可能访问到的页面,将它们预先调入内存。这种策略主要用于进程的首次调入,在程序运行之前就调入,由程序员指出应该先调入哪些部分。
②请求调页策略:进程在运行期间发现缺页时才将所缺页面调入内存,这种策略下调入的页面一定会被访问到,但由于每次只能调入一页,而每次调页都要磁盘 I/O 操作,因此 I/O 开销较大。
关于何处调入页面有三种方式,即系统拥有足够的对换区空间、系统缺少足够的对换区空间和 UNIX 方式。
①系统拥有足够的对换区空间:页面的调入调出都是在内存与对换区之间进行的,这样可以保证页面的调入和调出速度很快,在进程运行前,需要将进程相关的数据从文件区复制到对换区,如下图所示。
②系统缺少足够的对换区空间:凡是不会被修改的数据都直接从文件区调入,由于这些页面不会被修改, 因此换出时不必写回磁盘,下次需要时再从文件区调入即可,对于可能被修改的部分, 换出时需写回磁盘对换区,下次需要时再从对换区调入,如下图所示。
③UNIX 方式:运行之前进程有关的数据全部放在文件区,故未使用过的页面都可以从文件区调入,若被使用过的页面需要换出,则写回对换区,下次需要时从对换区调入,如下图所示。
抖动也称为颠簸,它是指刚刚换出的页面马上又要换入内存,刚刚换入的页面马上又要换出外存,这种频繁的页面调度行为称为抖动(颠簸)。产生抖动的主要原因是进程频繁访问的页面数目高于可用的物理块数,也就是分配给进程的物理块不够。
为进程分配的物理块太少,会使进程发生抖动现象,为进程分配的物理块太多,又会降低系统整体的并发度,降低某些资源的利用率。
工作集:指在某段时间间隔里,进程实际访问页面的集合。
工作集的举例如下图所示。
需要注意的是,工作集大小可能小于窗口尺寸,在实际应用中,操作系统可以统计进程的工作集大小,根据工作集大小给进程分配若干内存块。比如:窗口尺寸为5,但经过一段时间的监测发现某进程的工作集最大为3,那么说明该进程有很好的局部性,可以给这个进程分配3个以上的内存块即可满足进程的运行需要。
一般来说,驻留集大小不能小于工作集大小,否则进程运行过程中将频繁缺页。
基于局部性原理,进程在一段时间内访问的页面与不久之后会访问的页面是有相关性的,因此可以根据进程近期访问的页面集合来设计一种页面置换算法——选择一个不在工作集中的页面进行淘汰。
对页面分配策略这部分内容简单的总结一下,如下图所示。
以上就是操作系统——虚拟内存的所有内容了,重点学习并掌握页面置换算法中的最佳置换算法(OPT)、先进先出置换算法(FIFO)、最近最久未使用置换算法(LRU)、时钟置换算法(CLOCK)以及改进型的时钟置换算法的思想。
参考视频:
虚拟内存的基本概念
请求分页管理方式
页面置换算法
页面分配策略
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。