一个系统和它的应用程序的功能正确性问题与性能问题之间的边界往往是一个灰色地带。整个系统挂起与进程挂起的问题不在本文讨论范围之内。如果你怀疑系统的功能不正确,而不是性能问题,那么给你的SUN解决方案中心打电话以找到一个解决问题的方法。高性能系统的前提是它的功能首先要正确。
作为你积极的维护计划的一部分,检查/var/adm/messages中有没有比如磁盘重试之类的硬件问题或者有没有额外的消息产生也是很有价值的。
察看系统的历史信息也非常有价值;如果你的系统曾经有过更好的性能,画一条时间曲线详细记录何时第一次发现性能变差以及从什么时候开始性能一直很差。
2.知道你的系统在正常情况下会怎样
保存你的系统是如何正常运转的样例是一个好主意。你可以很容易地收集和保存每月的性能数据,比如:
*stat类:vmstat,mpstat,iostat,vxstat,sar
ps的输出以显示哪些进程在运行(在Solaris8操作环境下是prstat)。另外,有不少商业的和无支持的产品都可以用来做性能监测。一个免费的无支持的可选产品是SEToolkit(要获得其各种版本的信息,请看SunPerformanceSEToolkitpage)。SEToolkit报告磁盘活动、CPU利用情况、TCP和网络连接、内存,以及其他更多信息。在我们的经验里,它安装方便,不需要重启系统,并且生成容易理解的图形显示。
很多这类产品都存在一个共同的问题,就是对不同的硬件配置有不同的门限值。例如,特定的门限值对于400-MHz的系统可能显得太过,会让这个系统慢得象是在爬一样,但是对于一个900-MHz的系统却可能是可以接受的。
3.寻找性能瓶颈
一旦你已经定义了需要解决的性能问题,下一步骤就是缩小范围到瓶颈产生的地方。
标签: