这个阶段有必要问这样一些问题:
应用程序能告诉我它看到哪些是瓶颈?拿Oracle作例子,一个Oracle数据库管理员应该知道BSTAT/ESTATS是什么以及如何运行和理解它们。还是那句话,从应用程序的角度来看问题,BSTATS/ESTATS可以显示限制了Oralce性能的瓶颈,这可以作为进一步分析的指导。
大部分的时间花在哪里,是内核还是用户进程?通过vmstat、mpstat、sar、ps、prstat可以回答这个问题。
具有相近类型的所有资源是否同样繁忙?这个问题的意义在于寻找资源的不平等分布。比如,一个磁盘可能是瓶颈所在,或者一个CPU会比其他CPU更忙。对CPU,看mpstat。对磁盘,用iostat。哪个或哪些进程在使用最多的资源?用这些命令可以看到使用CPU和内存最多的进程:
ps-eopid,pcpu,args|sort+1n
CPU百分比:
ps-eopid,vsz,args|sort+1n
K字节的虚拟内存:
/usr/ucb/psaux|more
输出被排序,使用CPU和内存最多的进程排在上面。
Solaris8操作环境提供了prstat,它给出CPU和内存使用情况的一个动态注解。prstat-cvm的输出结果非常有用。
我们现在来看看怎用使常见的Solaris命令来开始性能分析。
vmstat命令是简单的。这里我们可以看到一个对于正在执行的应用程序,CPU能力不足的例子。
%vmstat15
procsmemorypagediskfaultscpu
rbwswapfreeremfpipofrdesrm0m1m2m3insycsussyid
450028872161821043707449645508026101531579798361309
580028313124640859835825632110492000014134797102769310
550028309445606426496563806012100001441462798969310
5700282770448760481872368000121001016064316116066340
560028247124751268576045617360261001015844939108668320
580028134004705678566733323740355000016765112111470300
6010281671249464786172067310110703023296131106764360
5800281755248392458552109960146000013576724105971290
vmstat输出的第一行总是可以忽略。在"procs"下面标着"r"的一列是等待获得CPU的进程运行队列中的进程数。"id"列是CPU空闲时间。这台机器没有足够的CPU资源以满足进程运行的需要,这可以从它的大部分CPU时间花在用户空间里看出来(看"us"列)。
这里有两种办法可供采用——第一,增加更多的CPU,或者第二,对应用程序的代码作性能分析看看是不是应用程序的某部分可以优化。对代码片断作优化可能会需要非常大量的努力——而且有时候收到的效果很少。在关系到时间的时候,最好在考虑你可能的“投资回报时现实一点。
标签: