赞
踩
前端编译器:代表性的产品有JDK的Javac、Eclipse JDT中的增量式编译器。
即时编译器:HotSpot虚拟机中的C1、C2编译器,Graal编译器。
提前编译器:JDK的Jaotc、GNU Compiler for thr Java(GCJ)、Excelsior JET。
Javac编译器本身就是由Java语言编写的程序。工作过程可以分为三个步骤:
1.解析和填充符号表过程
2.插入式注解处理器的注解处理过程
3.语义分析与字节码生成过程
词法、语法分析
词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记,如“int a = b + 2”这句代码包含了6个标记,分别是int、a、=、b、+、2,虽然关键字int由3个字符构成,但是它只是一个Token,不可再拆分。在Javac的源码中,词法分析过程com.sun.tools.javac.parser.Scanner类来实现。
语法分析是根据Token序列构造抽象语法树的过程,抽象语法树(Abstract Syntax Tree,AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个阶段都代表着程序代码中的一个语法结构(Construct),例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。
填充符号表
符号表(Symbol Table)是由一组符号地址和符号信息构成的表格,读者可以把它想象成哈希表中K-V值对的形式(实际上符号表不一定是哈希表实现,可以是有序号表、树状符号表、栈结构符号表等)。符号表中所登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码。在目标代码生成阶段,当对符号名进行地质分配时,符号表是地址分配的依据。
在JDK1.5之后,Java语言提供了对注解(Annotation)的支持,这些注解与普通的Java代码一样,是在运行期间发挥作用的。在JDK1.6中实现了JSR-269规范,提供了一组插入式注解处理器的标准API在编译期间对注解进行处理,我们可以把它看做是一组编译器的插件,在这些插件里面,可以读取、修改、添加抽象语法树中的任意元素。如果这些插件在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止,每一次循环称为一个Round。
有了编译器注解处理的标准API后,代码才有可能干涉编译器的行为,由于语法树中的任意元素,甚至包括代码注释都可以在插件之中访问到,所以通过插入式注解处理器实现的插件在功能上有很大的发挥空间。只要有足够的创意,程序员可以使用插入式注解处理器来实现许多原本只能在编码中完成的事情。
语法分析之后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查。举个例子,假设有如下的3个变量定义语句:
int a=1;
boolean b=false;
char c=2;
下列操作是后续可能会出现的:
int d=a+c;
int d=b+c;
char d=a+c;
后续代码中如果出现了以上3种赋值运算的话,那它们都能构成结构正确的语法树,但是只有第一种的写法在语义上是没有问题的,能够通过编译,其余两种在Java语言中是不合逻辑的,无法编译(是否合乎语义逻辑必须限定在具体的语言与具体的上下文环境之中才有意义。如在C语言中,a、b、c的上下文定义不变,第2、3种写法都是可以正确编译)。所以我们就需要进行语义分析,javac编译器中语义分析包括三个步骤:标注检查、数据及控制流分析、解语法糖。
标注检查
Javac的编译过程中,语义分析过程分为标注检查以及数据及控制流分析两个步骤。标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。在标注检查步骤中,还有一个重要的动作称为常量折叠。
数据及控制流分析
数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题。编译时期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,但校验范围有所区别,有一些校验项只有在编译期或运行期才能进行。
语法糖(System Sugar),也成糖衣语法,是由英国计算机科学家彼得-约翰-兰达(Peter J.Landin)发明的一个术语,指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。通常来说,使用语法糖能够增加程序的可读性,从而减少程序代码出粗的机会。
Java在现代编程语言之中属于“低糖语言”(相对于C#及许多其他JVM语言来说),尤其是JDK1.5之前的版本,“低糖”语法也是Java语言被怀疑已经“落后”的一个表面理由。Java中最常用的语法糖主要是前面提到过的泛型(泛型并不一定都是语法糖实现,如C#的泛型就是直接由CLP支持的)、变长参数、自动装箱/拆箱等,虚拟机运行时不支持这些语法,它们在编译阶段还原回简单地基础语法结构,这个过程称为解语法糖。
字节码生成是Javac编译过程的最后一个阶段,在Javac源码里面由com.sun.tools.javac.jvm.Gen类来完成。字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。
Java语法糖主要包括泛型擦除、自动装箱和自动拆箱、以及遍历循环和条件编译。
关于泛型擦除之前在Java疯狂讲义的笔记中进行了详细的实验,在这儿不重复呈现了,点我了解。书上还提到了当泛型遇见重载的情况,下面这种情况编译是不通过的,数List和List编译之后都被擦除了,变成了同一种的类型List。书上说如果为下面这两个方法添加了不同的返回值,方法重载就可以成功(不过我用IDEA不行…不同的编译器要求可能不太一样),在这里解释一下为什么加了不同返回值怎么就行了呢。Class文件方法表(method_info)的数据结构时曾经提到过,方法重载要求方法具备不同的特征签名,返回值并不包含在方法的特征签名中,所以返回值不参与重载选择,但是在Class文件格式之中,只要描述符不是完全一致的两个方法就可以共存。也就是说两个方法如果有相同的名称和特征签名,但返回值不同,那它们也是可以合法地共存于一个Class文件中的。
public static void method(List<String> list) {
System.out.println("invoke method(List<String> list)");
}
public static void method(List<Integer> list) {
System.out.println("invoke method(List<Integer> list)");
}
举例。
public class Test06 {
public static void main(String []args){
List<Integer> list = Arrays.asList(1, 2, 3, 4);
int sum = 0;
for(int i : list){
sum += i;
}
System.out.println(sum);
}
}
经过语法糖拆解后的代码:
public class Test06 { public static void main(String[] args) { List list = Arrays.asList(new Integer[]{ Integer.valueOf(1), Integer.valueOf(2), Integer.valueOf(3), Integer.valueOf(4) }); int sum = 0; for(Iterator localIterator = list.iterator(); localIterator.hasNext();){ int i = ((Integer) localIterator.next()).intValue(); sum += i; } System.out.println(sum); } }
自动装箱:
Integer a=1;
Integer a=new Integer
自动拆箱:
Integer a=1;
int i=a+2;
Integer a=new Integer(1);
int i=a.intValue()+2;
遍历循环:
List<Integer> list = Arrays.asList(1, 2, 3, 4);
for(int i : list){
}
List list = Arrays.asList(new Integer[]{
Integer.valueOf(1),
Integer.valueOf(2),
Integer.valueOf(3),
Integer.valueOf(4)
});
for(Iterator localIterator = list.iterator(); localIterator.hasNext();){
}
Java语言中条件编译的实现,也是Java语言的一颗语法糖,根据布尔常量值的真假,编译器将会把分支中不成立的代码块消除掉,这一工作将在编译器解除语法糖阶段(com.sun.tools.javac.comp.Lower类中)完成。由于这种条件编译的实现方式使用了if语句,所以它必须遵循最基本的Java语法,只能写在方法体内部,因此它只能实现语句基本块(Block)级别的条件编译,而没有办法实现根据条件调整整个Java类的结构。
只能使用条件为常量的if语句才能进行条件编译,如果使用常量与其它带有条件判断能力的语句搭配,则可能在控制流分析中提示错误,被拒绝编译。
public static void main(String[] args){
if(true){
System.out.println("block 1");
}else{
System.out.println("block 2");
}
}
编译后Class文件的反编译结果,
public static void main(String[] args){
System.out.println("block 1");
}
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。