这篇文章提出了两种方法来定位java应用程序中的性能瓶颈,而且提供了一些用于改善Java性能的建议。按照这种方法,您就会在新的java.nio包中看到一些类。 我做咨询时,最常听到的有关java的抱怨就是"它实在太慢了"、"它实在太耗费资源了"或者"它的性能是一个问题"。实际上,这些评论常常是缺乏依据的;许多人认为java的低劣性能是特定的。 当然,Java 程序可能会速度很慢、消耗内存并且使用起来很痛苦。但是,程序可以使用C++、Visual Basic、Smalltalk、Pascal、Ada或者C#来编写。那并不意味着编程语言或者运行环境很糟糕;或许这恰恰意味着开发者写代码的时候并没有考虑性能的副作用。一个编写校好的Java程序与使用其他语言编写的程序在性能方面通常是相当的,而且如果使用JDK 1.3 和1.4的性能改善, 它的性能可能会更好。 很重要的一点:可感知的性能是很关键的标准。如果您的代码看起来不能足够快的运行或者显示,它实际有多快、有多高效或者多优秀就变得无关紧要了。同样,拙劣的代码,其速度有时候也可能会惊人的快,不过维护它可就是一件棘手的事情。实际上,我们应该努力使代码同时具备两种品质:既优秀,又有良好性能来满足我们的客户需求。 为了能使您更易于接近上述目标,我将和您一起浏览性能改善流程。为了更好的进行解释,我将使用java.nio包中类的代码包括进来,这会在如何更高效使用这些类方面为您提供额外的提示。 性能改善流程 假设您自己编写或者继承了一个性能很差的应用程序,同时您的老板已经给您下了最后通牒,要求最迟下周完工上交,那么您将怎么办呢? 我设想您不会采取逃之夭夭的态度。您肯定想确定并解决性能问题。那么您又该从何处着手呢? 我强烈建议您使用下列的性能改善流程: 1.确定什么样的性能级别是足够好的; 2.在您所有的目标平台上进行测试; 3.如果所有目标平台的性能都相当不错,请停下来;不要忽略进行;也不要集中$200 ; 4.剖析您的应用以找到瓶颈; 5.重新构建或者重新编写代码来消除瓶颈; 6.返回步骤2 为了更好的说明这个流程,我们来看一个具体的例子。这个例子主要是关于AWT (Abstract Windowing Toolkit) 图形的,这是因为图形程序的性能改善更易于察觉而且编写起来更会引人入胜。 应用流程 下面的程序读取一系列的文件并对文件中字母a到z出现频率进行统计。它以柱状图的形式显示字母的出现频率;柱状图在读取一个文件之后就会得以更新。 检查下面的代码并在您认为的可改善之处加以标示。然后继续来看一下您自己的直觉判断是否正确。 import java.awt.Color; import java.awt.Component; import java.awt.Dimension; import java.awt.Graphics; import java.awt.Frame; import java.io.IOException; import java.io.FileInputStream; public class Letters extends Component { long[] countArray = new long[26]; static char[] letterArray = {'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o', 'p','q','r','s','t','u','v','w','x','y','z'}; /** * Find the number of occurrences of each letter of the * alphabet in the named file. The result is returned * as a 26-element array of long elements. * Of course, this will only work for the English alphabet. */ void countCharacters (String filename) throws IOException { System.out.println ("...reading " + filename); FileInputStream fis = new FileInputStream (filename); int tmp; while ((tmp = fis.read()) != -1) { char c = Character.toLowerCase((char)tmp); int pos = c - 'a'; if ((pos >= 0) && (pos <= 25)) { ++countArray[pos]; } } fis.close(); } /** * Draw a histogram of the letter frequency. * This method is triggered by repaint(), or by * window manager repaint events. */ public void paint (Graphics g) { long maxCount = 0; for (int i=0; i maxCount) maxCount = countArray[i]; } Dimension d = getSize(); double yScale = ((double)d.height) / ((double)maxCount); int barWidth = (int)d.width / countArray.length; int x = 0; for (int j=0; j 这个程序的问题究竟是什么?我们又该如何来解决?我们还是按照流程来进行吧 步骤1: 确定什么样的性能级别是足够好的 如果程序能在10秒左右的时间里完成读取和处理javax.swing 包中的HTML文档,我自己就会武断的认为性能已经足够不错了。实际中,外部和政治因素经常会决定性能目标,这一点或许仍然是武断的。 步骤2: 在您所有的目标平台上进行测试; 我手边有两个工作站而且两个上面都运行JDK 1.4 。一个快速的Pentium 运行Windows (平台 A)而另一稍慢的运行Linux (平台 B)。在这两个平台上进行的测试表明读取并处理HTML文档平台A需要大约140秒的时间,而平台B需要153秒。唉,这两个离足够好这一目标还有好大差距。 步骤 3: 如果性能相当不错,请停下来; 我们并没有能够达到性能目标,因此我们仍要继续进行优化。 步骤 4: 剖析应用程序 您可使用多种方式剖析您的应用程序。许多剖析工具具有GUI (图形用户界面)前端;价格从免费到数千美元不等。请参见 Resources 进行选择。Sun Microsystems' JDK 就包含了进行剖析的hprof 工具,我也将使用该工具来说明剖析过程。 Hprof剖析器允许您对应用程序中感兴趣的进行追踪,这其中包括对象创建统计和方法配置文件。这个例子中我将使用方法剖析。对象创建信息在定位内存漏洞和碎片帐集问题方面是非常有价值的。为了获得hprof 选项列表,键入java -Xrunhprof:help. 在这个例子中,我使用java -Xrunhprof:cpu=samples,depth=15 Letters. 这将保证输出一个文件(java.hprof.txt),其中包含了线程生命周期和每一方法所需花费时间的估计值信息。默认情况下,在程序结束时生成这个估计值。您也可以通过输入 运行程序在java.hprof.txt生成如下的输出: CPU SAMPLES BEGIN (total = 3245) Sun Jul 14 18:18:03 2002 rank self accum count trace method 1 52.30% 52.30% 1697 25 sun.awt.windows.WToolkit.eventLoop 2 45.30% 97.60% 1470 41 java.io.FileInputStream.read 3 0.52% 98.12% 17 45 java.awt.EventQueue.postEventPrivate ... CPU SAMPLES END 这个例子中是按照顺序排列,最常使用的方法位于起始之处。通常您会关注最初的5到10项。现在我们将忽略第一项。通过在剖析输出中搜索字符串TRACE我们就可以找到第二项的相关信息。 TRACE 41: java.io.FileInputStream.read(FileInputStream.java:Native method) Letters.countCharacters(Letters.java:27) Letters.main(Letters.java:71) 我们花费了大量时间来调用countCharacters()中的FileInputStream.read()。看起来这是一个应该进行修改的地方。 如果您使用方法剖析技术找到了一个可疑的方法,您将会有好几个选项: 1.优化方法-使用更好的算法; 2.尽量减少调用该方法 3.根本就不调用该方法 步骤5: 重新构建或者重新编写代码来消除瓶颈 请您仔细观察一下代码,您就会发现输入是没有缓冲的。缓冲还是很有帮助的。使用BufferedInputStream就可以很容易的添加缓冲: ...import java.io.BufferedInputStream; ... void countCharacters (String filename) throws IOException { BufferedInputStream bis = new BufferedInputStream(new FileInputStream (filename)); int tmp; while ((tmp = bis.read()) != -1) { char c = Character.toLowerCase((char)tmp); int pos = c - 'a'; if ((pos >= 0) && (pos <= 25)) { ++countArray[pos]; } } bis.close(); ... 步骤6: 返回步骤2 对修改后的代码进行测试,产生如下结果: ● 平台 A: 时间在3.3 和 5.8 秒之间 ● 平台B: 时间在18.6 和19.2 秒之间 虽然还不是足够好,但是已经好多了。让我们进行最优化; |