1. 前言

对于Git项目开发,有一些可视化的工具,如gitk,giggle等,来查看项目的开发历史。但对于大型的项目,这些简单的可视化工具远远不足以了解项目完整的开发历史,一些定量的统计数据(如每日提交量,行数等)更能反映项目的开发进程和活跃性。今天给大家推荐的这款工具:GitStats,它能生成如下的一些统计数据,并且可以图表形式进行展示对比。

2. 进一步了解Gitstats

进一步来讲,Gitstats它是一个git仓库分析软件,它可以检查仓库并生成历史数据的统计信息。可以帮助你查看git仓库的提交状态,根据不同维度分析计算,并自动生成数据图表。

官网介绍:http://gitstats.sourceforge.net/

当前GitStats所生成统计信息常用分为如下几类:

  • 常规的统计:文件总数,行数,提交量,作者数。
  • 活跃性:每天中每小时的、每周中每天的、每周中每小时的、每年中每月的、每年的提交量。
  • 作者数:列举所有的作者(提交数,第一次提交日期,最近一次的提交日期),并按月和年来划分。
  • 文件数:按日期划分,按扩展名名划分。
  • 行数:按日期划分。

3. 命令行安装

安装使用非常简单,如果是ubuntu,直接apt-get 即可,下面介绍几款不同操作系统下的安装方式。

Ubuntu:

apt-get install gitstats

CentOS:

yum install gitstats

Mac:

brew install --HEAD homebrew/head-only/gitstats

如果是Mac,那还得装个gnuPlot,GitStats在Windows下使用时需要安装有Python、Git,Gnuplot。

  • Python:GitStats本身就是一个python脚本,windows下我们需要用python命令来运行GitStats。
  • Git:这个不用解释也知道是必须的。
  • Gnuplot:Gnuplot一个命令行的交互式绘图工具。

4. 源码安装及使用

打开gitbash或者其他git客户端,输入如下命令:

git clone git://http://github.com/hoxu/gitstats.git

下载完成后,进入gitstats目录,将gitstats拷贝为gitstats.py文件

$ cp gitstats gitstats.py

然后执行统计命令

$ python gitstats.py ../xxx_pro/ ./test

  • ../xxx_pro/ 为工程所在目录。
  • ./test 为结果文件目录。
  • 完成后,进入test目录,双击index.html文件查看统计结果。

5. 具体实操

为了便于读者能直观感受到,下面通过具体实操,带大家来领略gitstats的作用,以Requests项目为例。

1、下载克隆Requests源码到本地。

git clone https://github.com/psf/requests.git

2、进入到gitstats目录,并将gitstats拷贝为gitstats.py文件,参考上述第4小节介绍。

cp gitstats gitstats.py

3、查看gitstats目录结构

➜ gitstats git:(master) ✗ tree -L 1

.

├── Makefile

├── arrow-down.gif

├── arrow-none.gif

├── arrow-up.gif

├── doc

├── gitstats

├── gitstats.css

├── gitstats.py

├── sortable.js

└── test

2 directories, 8 files

4、执行统计命令:

python gitstats.py ../requests ./test

5、统计执行结束后,在本地生成了test结果目录,目录生成的文件结构如下所示。


gitlab 统计所有mergerRequest的代码行数 git 统计每人提交代码行数_git统计每个人的代码行数


打开index.html报告,如下图所示。首先,在gitstats上提供了全局的统计数据报告,包括:

  • 报告产生时间及产生所花费的时间:如花费了11秒
  • 报告所覆盖的时间:如2011年02月14日至2019年11月23日
  • 年龄:该repo的年纪,如“3206天,其中1400天是活跃天.”
  • 文件数及代码:如:101个文件,2万5千行代码。
  • 作者数:如645,每个作者平均提交次数9.2次。


gitlab 统计所有mergerRequest的代码行数 git 统计每人提交代码行数_Python_02


除此之外,还包括了:

1. 时间维度的效率分析:每天中每小时的、每周中每天的、每周中每小时的、每年中每月的、每年的提交量。


gitlab 统计所有mergerRequest的代码行数 git 统计每人提交代码行数_git_03


gitlab 统计所有mergerRequest的代码行数 git 统计每人提交代码行数_python_04


2. 提交者维度的活跃度统计:列举所有的作者(提交数,第一次提交日期,最近一次的提交日期),并按月和年来划分。


gitlab 统计所有mergerRequest的代码行数 git 统计每人提交代码行数_git_05


3. 按照文件数:按日期划分,按扩展名名划分。


gitlab 统计所有mergerRequest的代码行数 git 统计每人提交代码行数_Python_06


4. 根据提交行数或提交的tag来统计。