赞
踩
物理机器是由CPU、内存和I/O 设备等一组资源构成的实体。虚拟机也一样,由虚拟CPU,虚拟内存和虚拟IO设备组成。VMM(VM Monitor)按照与传统OS并发执行用户进程的相似方式,仲裁对所有共享资源的访问。
在虚拟化平台上,虚拟机(guest VM)所使用的多个虚拟CPU(以下称vCPU)可能共享同一个物理CPU(以下简称pCPU)的。VMM负责vCPU的调度,当一个vCPU被调度到获得pCPU的使用权后,基于该vCPU运行的guest OS 又可以调度OS中的各个线程/进程了。也就是说,guest OS 中的各个线程 / 进程分时复用了vCPU,而各个vCPU又分时复用了pCPU。
为了从硬件上提供对vCPU调度和切换的支持,Intel 推出了被称为VT-x(Virtualization Technology for x86)的虚拟化扩展技术,用户可通过VMXON / VMXOFF 指令打开/ 关闭这个功能。AMD也推出AMD-V的对应技术。
在Linux中,从用户空间trap到内核空间可以通过system call 或者 interrupt / exception。以system call 基于x86 的实现为例,早期x86 提供的trap方式是int 0x80 这样的software interrupt 机制,而后改为了 SYSENTER / SYSEXIT的指令对,现在则已经被速度更快的SYSCALL / SYSRET 取代了。
传统的x86架构的运行级别有4种,从ring0 到 ring3,ring0是最高特权级,通常用于操作系统内核,ring3是最低特权级,通常用于用户程序。ring1 最初本来设定为运行驱动程序,但在使用宏内核的Linux中,驱动程序也和内核一样运行于ring0 级别,因而ring1和 ring2 通常不被使用。
而x86开始从支持硬件支持虚拟化扩展,也就是上文提到的VMM,按照VMM运行的特权级应该比OS更高,可是OS已经是ring 0了,可以想到常规的解决办法有两个:
因为之前操作系统的实现都是基于ring 0的,调到ring1 势必会造成很多的不兼容,需要进行OS代码改动量较大。
2. 增加一个ring -1 级别给VMM用。你说要是x86 最开始把ring3 设为最高级,ring0设置为最低级,那直接弄一个ring 4 给VMM 就可以了,可x86诞生之初怎么会预料到后来虚拟化扩展呢。不过这使用负数ring -1 怎么看都是别扭吧。
为了解决这个难题,x86采用的办法是增加一个root mode,大概原理是这样的:
对于KVM 这种基于host OS的,如果只有host OS运行于root mode,host上的Apps(userspace)运行在non-root mode的ring3 级别,那么host userspace 到host kernel的切换就和guest VM 向VMM 的切换一样了。
所以,最终的实现是root mode里也有 ring0 到 ring3 共4个级别,也就是说 root mode和ring是正交的关系。
对于KVM,其基于host OS 也就是(Linux内核)运行在root mode的ring0 级别,host userspace 运行在root mode的ring3 级别,还是ring 0 和ring 3和 Linux传统用法一样,因此对Linux来说不用做什么大的修改。guest OS 和 guest Apps则分别运行在non-root mode的ring 0 和 ring3。
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。