赞
踩
Java虚拟机把描述类的二进制流冲.Class文件中读到内存中,并在这个过程对加载的数据进行校验、转换解析、初始化,最终形成可以被Java虚拟机直接使用的java类型,这个过程叫做虚拟机的类加载机制。类的加载会把类的数据结构信息存放于方法区,并在堆区创建一个java.lang.Class对象,用来封装该类在方法区的数据结构,该类对应的java.lang.Class对象就是类加载的最终产品;Java程序员可以通过该类对应的java.lang.Class对象的接口,访问该类在方法区内的数据结构。
类的加载并不需要在某个类第一次被使用时才被类加载器加载,当JVM预知到某个类将要被使用时就可以对它进行预加载,如果在加载类的过程中发生错误,或文件校验失败等问题,类加载器会在程序首次主动使用该类时报告异常(LinkageError),换句话说,如果这个类在程序运行期间如果一直没有被调用,那么关于该.class文件 错误/损坏 的问题就不会被报告。
类加载的.class文件存在的形式:
一个类从.Class中开始被加载到内存中直到被卸载一共包括7个阶段:加载、验证、准备、解析、初始化、使用、卸载,其中验证、准备、解析被统称为连接。
加载、验证、准备、初始化等阶段时按序开始的,而为了支持Java语言的动态绑定特性,解析可以在初始化前开始也可以在初始化之后开始;需要注意的是,这里提到的概念是按序开始,而非按序进行,这些环节的执行通常都是并发的关系,而非串行,也就是说只知道他们什么时候开始,而不能确定谁先完成,这些阶段会交叉进行,经常会在一个阶段执行的过程中去调用或激活另一个阶段。
加载阶段需要做如下三件事:
当加载完成后,方法区会保存该类的数据结构,而堆区也会保存一个封装了方法区数据结构的java.lang.Class对象。
加载阶段是开发人员可控程度较高的阶段,它既可以由JVM默认的类加载器来完成,也可以由java开发人员自定义的类加载器来完成(从ZIP压缩吧、网络、数据库等等来源获取二进制流)。
验证是连接阶段的第一步,它是为了确保被加载的类的正确性
这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
验证阶段大致会完成4个阶段的检验动作:
验证字节流是否符合Class文件格式的规范;例如:
文件格式验证是基于二进制流的,文件格式验证之后的验证都是基于方法区存储的数据结构的,通过验证后的二进制流才被允许进入JVM方法区。
对字节码描述的信息进行语义分析例如,要求其必须满足JAVA语法规范;
上一环节的元数据验证是针对类层次的验证,而本环节的字节码验证则是基于类的方法体进行验证的。字节码验证是验证过程中复杂的阶段,它的工作是通过数据流分析和控制流分析,从而确定程序语义是否合法、是否符合逻辑。
符号引用确保解析动作能正确执行,它发生在虚拟机将符号引用转化为直接引用的时候;这个转化将在连接–解析解析阶段发生。类似之前的验证,符号引用验证可以看作是对类自身以外的各类信息进行匹配性校验,可理解成:检验该类是否缺少或者被禁止访问他所依赖的某些外部类、方法、字段等等资源。其中校验内容有:
验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用 -Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。
为类的静态变量分配内存(static 定义的类变量,而不包括实例变量),并将其初始化为默认值,
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,JDK8之前这些内存都将在方法区中分配,JDK8中他们会对着Class对象一起被存放于Java堆中。对于该阶段有以下几点需要注意:
这里所设置的初始值通常情况下是数据类型默认的零值(如0、0L、null、false等),而不是被在Java代码中被显式地赋予的值。
假设一个类变量的定义为: public static int value=3;
那么变量value在准备阶段过后的初始值为0,而不是3,因为这时候尚未开始执行任何Java方法,而把value赋值为3的 putstatic指令是在程序编译后,存放于类构造器 ()方法之中的,所以把value赋值为3的动作将在初始化阶段才会执行。
这里还需要注意如下几点:
对于同时被static和final修饰的常量,必须在声明的时候就为其显式地赋值,否则编译时不通过;
而只被final修饰的常量则既可以在声明时显式地为其赋值,也可以在类初始化时显式地为其赋值;
对于引用数据类型reference来说,如数组引用、对象引用等,如果没有对其进行显式地赋值而直接使用,系统都会为其赋予默认的零值,即null。
如果在数组初始化时没有对数组中的各元素赋值,那么其中的元素将根据对应的数据类型而被赋予默认的零值。
如果类字段的字段属性表中存在 ConstantValue属性,即同时被final和static修饰,那么在准备阶段变量value就会被初始化为ConstValue属性所指定的值。
假设类变量value被定义为: public static final int value=3;
编译时Javac将会为value生成ConstantValue属性,在准备阶段虚拟机就会根据 ConstantValue的设置将value赋值为3。可以理解为static final常量在编译期就将其结果放入了调用它的类的常量池中
解析阶段把类中的符号引用转换为直接引用
它是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行,他们对应常量池中的8种常量类型( CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info、CONSTANT_InterfaceMethodref_info、CONSTANT_MethodType_info、CONSTANT_MethodHandle_info、CONSTANT_Dynamic_info、CONSTANT_InvokeDynamic_info )。
以下为前四种解析的过程
假设当前代码的类面是D,需要加载一个从未被解析过的,“符号引用N”描述的一个类或接口 C,需要如下步骤:
类D是否拥有类C访问权限需要满足如下规则中任意一条:
解析一个从未被解析过的字段符号引用,首先需要对字段表内class_index项中索引的CONSTANT_Class_info符号引用进行解析,也就是字段所属的类或接口的符号引用;解析成功后,我们把这个字段所属的类/接口 用字母C 表示(例如要解析的字段是类C的域: X),根据《JVM规范》,后续需要对C 进行如下操作:
需要对方法表内class_index项中索引的方法所属的类或接口的符号引用进行解析;解析成功后,我们把这个方法所属的类/接口 用字母C 表示(例如要解析的方法是类C的 X()方法 ),根据《JVM规范》,后续需要对C 进行如下操作:
如果在查找成功并返回后,对该方法进行访问权限验证时,如果发现对该方法不具备访问权限,那么将会抛出异常:java.lang.IllegalAccessError.
接口方法解析与类方法解析异同如下:
初始化阶段之前的所有类加载动作,除了用户可以自定义类加载器外,其余的动作都由JAVA虚拟机进行主导,而到了初始化阶段Java虚拟机将真正开始执行类中编写的Java程序代码,将主导权移交应用程序。
初始化为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。
在Java中对类变量进行初始值设定有两种方式:
由于在准备阶段,类变量已经分配内存,并赋值为默认值(0,NULL、、、);而在初始化阶段则会根据程序开发人员制定的主观计划去初始化类变量和其它资源。
可以理解为:初始化阶段就是执行类构造器< client >()方法的过程。
关于< client >()方法
public Class Test{
private static int a = 1;
private static int c;
static{
a = 3;//可以执行
b = a + 1;//可以执行
c = a + 2;//可以执行
c = b + 1;//错误,b定义于static之后,只能复制,不能访问
}
private static int b;
}
public Class Test{ public static void main(String[] args){ System.out.println(Son.B); //输出值: 2 而非 1 , 因为Parent的 < client > () 方法 要比 // Son 的 < client > () 方法 先执行,那么已知 < client > () 方法 包括静态语句块 //所以Parent 的 static {} 块 执行完之后 ,才会 到子类中进行赋值: B = A (A : 2) } } Class Son extend Parent{ public static int B = A; } Class Parent{ public static int A = 1; static { A = 2; } }
public Class Test{ public static void main(String[] args){ System.out.println(Son.C); //执行 Son的 < client > () 方法 System.out.println(Son.B); // B = A + 998,此时先执行Parent 的 < client > () 方法, // 然后执行 Son 的 < client > () 方法 System.out.println(Son.A); // 执行 Parent的 < client > () 方法 } } interface Son extends Parent{ public static int B = A + 998; public static int C = 100; public void sonDoAnyThding(); } interface Parent{ public static int A = 2; public void parentDoAnyThing(); }
JVM初始化步骤
类初始化时机:只有当对类的主动使用的时候才会导致类的初始化,类的主动使用包括以下六种:
类加载器只用于实现: “通过类的全限定名来获取描述该类的二进制流” 的操作,但是他在java程序中起到的作用却远超类加载阶段。对于任意一个类,都必须由加载它的类加载器和这个类一起共同确立一个唯一性的组合,每一个类加载器都有一个独立的类名称空间用来记录它加载的类。这个组合的约束体现在如下例子中,例如要比较两个类是否相等,那么他们必须由同一个加载器加载,即便这两个类加载的二进制流来源相同,如果他们使用了不同的类加载器,那么即认为他们不是相同的两个类。
JVM双亲委派模型中存在如下的各类加载器:
假如应用程序中有一个类 com.jvm.loadear.TestLoad,那么默认他是被应用程序类加载器加载的,加载的结果是com.jvm.loadear.TestLoad.Class_app(_app为自定义标识,与实际无关),与此同时用户自定义了一个类加载器–Self Class Loader,使用该加载器加载类com.jvm.loadear.TestLoad的结果是com.jvm.loadear.TestLoad.Class_self,虽然加载的类来自同一个全限定命名空间下相同的二进制流,那么他们就不是同一个类 ,那么对于他们的实例对象:testLoad_app 和 testLoad_self,存在如下结果:
testLoad_self instanceof com.jvm.loadear.TestLoad_app = false;
testLoad_app instanceof com.jvm.loadear.TestLoad_self = false;
从JVM的视角看,类加载器分为两种:
从开发人员的视角看,Java一直保持着三层类加载器、双亲委派的类加载架构。
如下为类加载器双亲委派模型,虽然上层加载器称为下层加载器的父加载器;需要注意的是下图是他们的协同工作的流程图,而不代表他们是父-子类的关系,他们是通过组合来实现对父加载器代码的复用。
应用程序都是由这三种类加载器互相配合进行加载的,如果有必要,我们还可以加入自定义的类加载器。因为JVM自带的ClassLoader只是懂得从本地文件系统加载标准的java class文件,因此如果编写了自己的ClassLoader,便可以做到如下几点:
在执行非置信代码之前,自动验证数字签名。
动态地创建符合用户特定需要的定制化构建类。
从特定的场所取得java class,例如数据库中和网络中。
双亲委派模型的工作流程是:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把请求委托给父加载器去完成,依次向上,因此,所有的类加载请求最终都应该被传递到顶层的启动类加载器中,只有当父加载器在它的搜索范围中没有找到所需的类时,即无法完成该加载,子加载器才会尝试自己去加载该类。
1、当应用程序类加载器 Application Class Loader加载一个class时,它首先不会自己去尝试加载这个类,而是把类加载请求委派给父类加载器:拓展类加载器 Extension Class Loader去完成。
2、当拓展类加载器 Extension Class Loader加载一个class时,它首先也不会自己去尝试加载这个类,而是把类加载请求委派给启动类加载器 Bootstrap Class Loader去完成。
3、如果启动类加载器 Bootstrap Class Loader加载失败(例如在 $JAVA_HOME/jre/lib里未查找到该class),则会向下使用:拓展类加载器 Extension Class Loader来尝试加载;
4、若拓展类加载器 Extension Class Loader也加载失败,则会使用应用程序类加载器 Application Class Loader来加载,如果应用程序类加载器 Application Class Loader也加载失败,则会报出异常ClassNotFoundException。
可以理解成,一个类加载器收到类加载器的请求时,首先会将该请求传递给自己的父加载器,直至顶层的启动类加载器:Bootstrap Class Loader。如果顶层的,启动类加载器无法加载类,则重新将该请求退回给它的子加载器,以此类推,如果最底层的应用程序类加载器也无法加载类时抛出异常: ClassNotFoundException。
结合类与加载器形成唯一确定组合的关系,那么使用双亲委派模型显而易见的好处是:
当一个类加载器负责加载某个Class时,该Class所依赖的和引用的其他Class也将由该类加载器负责载入,除非显示使用另外一个类加载器来载入。
父类委托,先让父类加载器试图加载该类,只有在父类加载器无法加载该类时才尝试从自己的类路径中加载该类。
缓存机制,缓存机制将会保证所有加载过的Class都会被缓存,当程序中需要使用某个Class时,类加载器先从缓存区寻找该Class,只有缓存区不存在,系统才会读取该类对应的二进制数据,并将其转换成Class对象,存入缓存区。这就是为什么修改了Class后,必须重启JVM,程序的修改才会生效。
类加载有三种方式:
区别与联系:
Class.forName():将类的.class文件加载到jvm中之外,还会对类进行解释,执行类中的static块;
ClassLoader.loadClass():只干一件事情,就是将.class文件加载到jvm中,不会执行static中的内容,只有在newInstance才会去执行static块。
Class.forName(name,initialize,loader) 带参函数也可控制是否加载static块。
Class.forName("Test2", false, loader);// 不加载static块
// 此时,只有创建类的对象,才会去加载static块 。
通常情况下,我们都是直接使用系统类加载器。但是,有的时候,我们也需要自定义类加载器。比如应用是通过网络来传输 Java类的字节码,为保证安全性,这些字节码经过了加密处理,这时系统类加载器就无法对其进行加载,这样则需要自定义类加载器来实现。
自定义类加载器一般都是继承自 ClassLoader类,从上面对 loadClass方法来分析来看,我们只需要重写 findClass 方法即可。
自定义类加载器的核心在于对字节码文件的获取,如果是加密的字节码则需要在该类中对文件进行解密。
本文主要参考 《深入理解Java虚拟机一书》
在其基础上我进行了修改,修改了一些内容,也加上了一些我自己的理解。
如有谬误,请务必指正。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。