赞
踩
本周还是在家办公的一周,下面的图就是我在家的工位,图中显示器下面的两本书分别是《深入理解Java虚拟机》的第2版和第3版。也就是本文的主角。
你的手边有第2版吗?
来,翻到第57页。这里面有个“坑”,看看你当时发现了没,有没有在这页做笔记呢?
没有也没关系,我带你先回顾一下这一页的内容,再让你看看我三年前第一次看这书的时候做的笔记。
第2版57页讲了啥?
也许你根本就没看过《深入理解Java虚拟机(第2版)》这本书。但是你一定见过位于本书第57页的示例代码:
由于JDK 6常量池位于方法区,JDK 7以后常量池位于堆中,所以用两个版本的jdk跑上面的代码就会出现神奇的事情。甚至用JDK 8来跑,也会出现你想不到的结果。且听我慢慢道来。
先说一下intern是干啥的。
该方法的作用是把首次遇到的字符串加载到常量池中。
再看一下intern的注释:
其中标记了☆的红框翻译过来就是:对于任意两个字符串 s 和 t,当且仅当 s.equals(t) 为 true 时,s.intern() == t.intern() 才为 true。
回到最开始的代码中。引用第三版的描述如下:
这段代码在JDK 6中运行,会得到两个false,而在JDK 7中运行,会得到一个true和一个false。
产生差异的原因是:在JDK 6中,intern()方法会把首次遇到的字符串实例复制到永久代的字符串常量池中存储,返回的也是永久代里面这个字符串实例的引用,而由StringBuilder创建的字符串实例在Java堆上,所以必然不是同一个引用,将返回false。
而JDK 1.7(以及部分其他虚拟机,例如JRocki)的intern()实现就不需要再拷贝字符串的实例到永久代了,既然字符串常量池已经移到了Java堆中,那只需要在常量池里记录一下首次出现的实例引用即可,因此intern()返回的引用和由StringBuilder创建的那个字符串实例就是同一个。
对str2比较返回false是因为“java”这个字符串在执行StringBuilder.toString()之前已经出现过,字符串常量池中已经有它的引用了,不符合intern()方法要求“首次出现”的原则,而“计算机软件”这个字符串则是首次出现的,因此返回true。
挖坑不填,坑哭读者
读到这里你有没有一些不惑呢?有没有感觉到一丝丝不对呢?
我们再看看原文:
为什么在JDK 7里面会返回fasle,上面红框框起来的部分是关键答案:
因为“java”这个字符串在执行StringBuilder.toString()之前已经出现过。
这句话就是“坑”,已经出现过?在哪出现的,你倒是告诉我啊!我当时的内心想法和下面的老大哥是一样一样的:
我第一次看这本书是在2016年,看这个地方的时候,我就百思不得其解,在哪就出现过了呀?
当时也不知道是在哪个写的似是而非的博客里面找到“java是关键字,已存在常量池中”这句“骚话”。还正正经经的抄了上去,虽然是错误的描述,虽然字是丑了点......
你当年或者现在看的时候有这个疑惑吗?
之后我又完整的看过几次这本书,我清楚的记得,我再一次看到这里的时候我就觉得“java是关键字,已存在常量池中”这个描述是不对的,所以我在后面打了一把叉,再次去找了相关资料,找到了sun.misc.version,终于解决了“在哪出现的”这个问题。
第3版注脚填坑
这个2013年(第二版出版那年)挖下的坑,在2016年10月1日,就被R大在知乎上给填上了。R大的这个回答也被作者周志明写在了2019年底出版的《深入理解Java虚拟机(第三版)》的注脚里面:
里面的RednaxelaFX就是R大,一个把虚拟机玩到极致,凭一己之力撑起了知乎java半边天的男人,后面我会详细介绍一下的。
你只要了解到一点就行:他的回答,就是权威。
在R大的这个知乎回答中,帮周志明大大填了这个坑,我强烈建议你一定要去看看,链接如下:
https://www.zhihu.com/question/51102308/answer/124441115
R大帮忙填坑
我这里只是结合R大的回答和个人的一点点经验,谈谈自己的认知。
在2016年我读这本书的时候,我才刚刚大学毕业,刚从新手村出来。当时的我对于这个问题是绝对没有任何思路的,必须直接在网上查询答案。
现在的我,略有一点经验,再次遇到这个问题,就算没看书中的描述、R大的回答,我肯定也会想到:在书中的示例里面,第二个输出false,说明调用main方法之前,肯定在字符串常量池里面已经有了这个“java”字符串了。
怎么验证一下呢?
我们在main方法的第一行打上一个断点,debug运行程序后,可以看到Memory,然后过滤出String,如下:
然后双击过滤出来的java.lang.String,可以看到下图:
在这个页面我们可以继续过滤:
果然,在程序还没执行第14行之前,“java”已经出现了。
从这个结果我们可以推断出:Java标准库在JVM启动过程中加载的部分,可能里面就有类里有引用“java”字符串字面量,这个字面量被初次引用的时候就会被intern,加入到字符串常量池中去。
而到底是哪个类导致了这个“java”字符串被intern的呢?R大主要就是回答了这个问题。
我截取一下R大最终的答案,具体探索的过程去看他的回答吧,很强很硬核:
我们可以看到sum.misc.Version里面的launcher_name字段的值就是“java”:
而根据R大的回答,我们可以找到java.lang.System类:
根据System类的注释我们可以知道,它是由虚拟机自动调用的。而其initializeSystemClass方法会调用sun.misc.Version.init()方法。
到此就真相大白了。
Java标准库在JVM启动过程中会调用sun.misc.Version的init()方法。所以sun.misc.Version会进行类加载的操作,而类加载的初始化时,会对静态常量字段进行真正的赋值操作,但是,sun.misc.Version的launcher_name字段是final,引用的字符串“java”准备阶段就被intern到了字符串常量池里面了。
可以在心里在默默的复习一下类加载的过程:加载、验证、准备、解析和初始化这五个阶段哦。
另外书中给出的示例代码也有一定的局限性,R大是这样说的:
其实这事情很简单:首先,这个行为必然是要针对某个具体的JDK/JRE实现来讨论的,因为Java语言规范/JVM规范/Java SE标准库的JavaDoc(也是Java SE平台规范的一部分)都没有、也不会强制指定哪个类里一定要引用“java”这个字符串常量,而且它必须是第一个使得“java”被intern的类 --- 规定这个也太无聊了。
比如这个示例我在JDK8u212-b03上跑出来,就是两个true:
在这个版本里面,sun.misc.Version的launcher_name变成了“openjdk”:
那么根据我们之前的猜测,把程序成下面这样的,效果就是一样的了:
万变不离其宗,现在你知道为什么这里用openjdk返回也是false了吧。
知其然,还要知其所以然。
想知道更多?扫描下面的二维码关注我
后台回复”加群“获取公众号专属群聊入口
【精彩推荐】
朕已阅
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。