使用Gnu gprof进行Linux平台下的程序分析

时间:2007-03-06 15:06:38   来源:51CTO.com  作者:  点击:次  出处:技术无忧
关键字:函数 Dot 语言 源代码 Cflow


从上面的输出我们能明显的看出来,main 调用了 b 函数, 而b 函数分别调用了a 和 c 函数。由于我们的函数只是简单的输出了一个字串,故每个函数的消耗时间都是0 秒。

gprof产生的信息解释如下:

 0c62720dd13f3f1cb1f8440cfff72441.png
gprof产生的信息解释
常用的Gprof 命令选项解释:

-b不再输出统计图表中每个字段的详细描述。

-p 只输出函数的调用图(Call graph 的那部分信息)。

-q 只输出函数的时间消耗列表。

-E Name不再输出函数Name 及其子函数的调用图,此标志类似于 -e 标志,但它在总时间和百分比时间的计算中排除了由函数Name 及其子函数所用的时间。

-e Name 不再输出函数Name 及其子函数的调用图(除非它们有未被限制的其它父函数)。可以给定多个 -e 标志。一个 -e 标志只能指定一个函数。

-F Name 输出函数Name 及其子函数的调用图,它类似于 -f 标志,但它在总时间和百分比时间计算中仅使用所打印的例程的时间。可以指定多个 -F 标志。一个 -F 标志只能指定一个函数。-F 标志覆盖 -E 标志。

-f Name输出函数Name 及其子函数的调用图。可以指定多个 -f 标志。一个 -f 标志只能指定一个函数。

-z 显示使用次数为零的例程(按照调用计数和累积时间计算)。

到这为止你可能对gprof 有了一个比较感性的认识了,你可能会问如何用它去分析一个真正的Open Source 呢!下面就让我们去用gprof去分析一个Open Source,看看如何去在真实的环境中使用它。

使用Gprof 分析 Cflow开源项目

CFlow 是程序流程分析工具,该工具可以通过分析C源代码,产生程序调用图!有点跟Gprof差不多,不过CFlow是通过源代码进行的静态分析并且 不能分析C++ 程序,你可以到http://www.gnu.org/software/cflow/去下载源代码。

假设你已经下载了该源代码(cflow-1.1.tar.gz),并把它放置在/home目录下,让我们看看如何在这个应用上使用gprof。

1. 使用 -pg 编译和链接该应用程序,请输入下列命令。   [linux /home/]tar zxvf cflow-1.1.tar.gz[linux /home/cflow-1.1/src]$./configure[linux /home]$make CFLAGS=-pg LDFLAGS=-pg 
如果没有出错你会在/home/cflow-1.1/src 目录下发行一个名为cflow的可执行文件,这就是我们加入-pg编译选项后编译出来的可以产生供gprof提取信息的可执行文件。记住一定要在编译和链接的时候都使用-pg选项,否则可能不会产生gmon.out文件。对于cflow项目,CFLAGS=-pg 是设置它的编译选项,LDFLAGS=-pg是设置它的链接选项。当然你也可以直接修改它的Makefile来达到上述相同的目的,不过一定要记住编译和链接都要使用-pg选项。

2. 运行cflow 程序使之生成gmon.out 文件供gprof使用。 [linux /home/cflow-1.1/src]$cflow parser.c
查看/home/cflow-1.1/src目录下有没有产生gmon.out文件,如果没有请重复第一步,并确认你已经在编译和链接程序的时候使用了-pg 选项。Cflow的使用请参考http://www.gnu.org/software/cflow/manual/cflow.html

3. 使用gprof分析程序

[linux /home/cflow-1.1/src]$gprof -b cflow gmon.out | less

恭喜你,不出意外你会在屏幕上看到gprof的输出,函数消耗时间和函数调用图,下面是我从我的输出中摘抄出来的一小段。 %   cumulative   self              self     totaltime   seconds   seconds    calls  Ts/call  Ts/call  name0.00      0.00     0.00   118262     0.00     0.00  include_symbol0.00      0.00     0.00    92896     0.00     0.00  is_printable0.00      0.00     0.00    28704     0.00     0.00  set_level_mark0.00      0.00     0.00    28703     0.00     0.00  is_last0.00      0.00     0.00    19615     0.00     0.00  auto_processor0.00      0.00     0.00    15494     0.00     0.00  gnu_output_handler0.00      0.00     0.00    12286     0.00     0.00  delete_parm_processor0.00      0.00     0.00     7728     0.00     0.00  newline0.00      0.00     0.00     7728     0.00     0.00  print_function_name0.00      0.00     0.00     7728     0.00     0.00  print_level。。。。。。。。。。。。Call graphgranularity: each sample hit covers 4 byte(s) no time propagatedindex % time    self  children   called     name[1]      0.0    0.00    0.00     79+855   [1]0.00    0.00    166     dcl  [52]0.00    0.00    163     parse_dcl  [53]0.00    0.00    150     dirdcl  [56]0.00    0.00    129     parse_declaration  [63]0.00    0.00     98     parse_variable_declaration  [66]0.00    0.00     63     maybe_parm_list  [69]0.00    0.00     63    parse_function_declaration  [70]0.00    0.00     39    func_body  [74]。。。。。。。。。。。。


通过分析%time你就知道了那个函数消耗的时间最多,你可以根据这个输出信息做有目的的优化,不过cflow执行的速度是在是太快了,以至%time都是0 (消耗时间是以秒为单位进行统计的)。

生成图形化的函数调用图

1.Graphviz 工具

   技术无忧.com


文章评论

共有 0 位网友发表了评论 此处只显示部分留言 点击查看完整评论页面

300x250广告位招租