使用Gnu gprof进行Linux平台下的程序分析

时间:2007-03-06 15:06:38   来源:51CTO.com  作者:  点击:次  出处:技术无忧
关键字:函数 Dot 语言 源代码 Cflow

Gprof 简介:

Gprof功能:打印出程序运行中各个函数消耗的时间,可以帮助程序员找出众多函数中耗时最多的函数。产生程序运行时候的函数调用关系,包括调用次数,可以帮助程序员分析程序的运行流程。

  
 
 
  
有了函数的调用关系,这会让开发人员大大提高工作效率,不用费心地去一点点找出程序的运行流程,这对小程序来说可能效果不是很明显,但对于有几万,几十万代码量的工程来说,效率是毋庸置疑的!而且这个功能对于维护旧代码或者是分析Open Source来说那是相当诱人的,有了调用图,对程序的运行框架也就有了一个大体了解,知道了程序的“骨架“,分析它也就不会再那么茫然,尤其是对自己不熟悉的代码和Open Source。费话不多说了,让我们开始我们的分析之旅吧!

Gprof 实现原理:

通过在编译和链接你的程序的时候(使用 -pg 编译和链接选项),gcc 在你应用程序的每个函数中都加入了一个名为mcount ( or  “_mcount”  , or  “__mcount” , 依赖于编译器或操作系统)的函数,也就是说你的应用程序里的每一个函数都会调用mcount, 而mcount 会在内存中保存一张函数调用图,并通过函数调用堆栈的形式查找子函数和父函数的地址。这张调用图也保存了所有与函数相关的调用时间,调用次数等等的所有信息。

Gprof基本用法:

1. 使用 -pg 编译和链接你的应用程序。

2. 执行你的应用程序使之生成供gprof 分析的数据。

3. 使用gprof 程序分析你的应用程序生成的数据。

Gprof 简单使用:

让我们简单的举个例子来看看Gprof是如何使用的。

1.打开linux终端。新建一个test.c文件,并生用-pg 编译和链接该文件。 test.c 文件内容如下: #include "stdio.h"#include "stdlib.h"void a(){  printf("\t\t+---call a() function\n");}void c(){  printf("\t\t+---call c() function\n");}int b(){printf("\t+--- call b() function\n");a();c();return 0;}int main(){  printf(" main() function()\n");  b();}


命令行里面输入下面命令,没加-c选项,gcc 会默认进行编译并链接生成a.out: [linux /home/test]$gcc -pg test.c


如果没有编译错误,gcc会在当前目录下生成一个a.out文件,当然你也可以使用 –o 选项给生成的文件起一个别的名字,像 gcc –pg test.c –o test , 则gcc会生成一个名为test的可执行文件,在命令行下输入[linux /home/test]$./test , 就可以执行该程序了,记住一定要加上 ./ 否则程序看上去可能是执行,可是什么输出都没有。

2.执行你的应用程序使之生成供gprof 分析的数据。  命令行里面输入: [linux /home/test]$a.outmain() function()+--- call b() function+---call a() function+---call c() function[linux /home/test]$
你会在当前目录下看到一个gmon.out 文件, 这个文件就是供gprof 分析使用的。

3.使用gprof 程序分析你的应用程序生成的数据。

命令行里面输入: [linux /home/test]$ gprof -b a.out gmon.out | less
由于gprof输出的信息比较多,这里使用了 less 命令,该命令可以让我们通过上下方向建查看gprof产生的输出,| 表示gprof -b a.out gmon.out 的输出作为 less的输入。下面是我从gprof输出中摘抄出的与我们有关的一些详细信息。 %     cumulative    self              self     totaltime   seconds     seconds    calls  Ts/call  Ts/call  name0.00      0.00     0.00        1     0.00     0.00  a0.00      0.00     0.00        1     0.00     0.00  b0.00      0.00     0.00        1     0.00     0.00  cCall graphgranularity: each sample hit covers 4 byte(s) no time propagatedindex % time    self  children    called     name0.00    0.00       1/1           b [2][1]      0.0    0.00    0.00       1         a [1]-----------------------------------------------0.00    0.00       1/1           main [10][2]      0.0    0.00    0.00       1         b [2]0.00    0.00       1/1           a [1]0.00    0.00       1/1           c [3]-----------------------------------------------0.00    0.00       1/1           b [2][3]      0.0    0.00    0.00       1         c [3]


 1/3    1 2 3 ›› ›|

文章评论

共有 0 位网友发表了评论 此处只显示部分留言 点击查看完整评论页面