在上一篇文章中,留下了一些的问题:

  • Graph对象中的一些字段是怎么被初始化的?在使用Graph对象的topologicalSort方法的时候,需要用到这些字段,比如m_nodes以及m_independentNodes这两个集合,它们分别存放的是所有的节点的引用以及所有独立节点的引用。
  • Graph对象是如何使用的,即方法调用栈的上层是如何调用Graph中的topologicalSort方法的。
  • 关于环路检测算法的实现,用于在发现循环依赖的时候,检测出具体的循环依赖路径。

  本文就对上述的几个问题作出解释: 

环路检测算法

先来看看算法的实现:

public class Tarjan<T> {
  int m_index = 0;
  private Stack<T> m_s;
  Map<T, Integer> m_indices = Maps.newHashMap();
  Map<T, Integer> m_lowlinks = Maps.newHashMap(); //
  private List<T> m_cycle;  
  public Tarjan(Graph<T> graph, T start){
    m_s = new Stack<T>();
    run(graph, start);
  }
  private void run(Graph<T> graph, T v) {
    m_indices.put(v, m_index);
    m_lowlinks.put(v, m_index);
    m_index++;
    m_s.push(v);
    for (T vprime : graph.getPredecessors(v)){
      if (! m_indices.containsKey(v prime)) {
        run(graph, vprime);
        int min = Math.min(m_lowlinks.get(v),m_lowlinks.get(vprime));
        m_lowlinks.put(v, min);
      }
      else if (m_s.contains(v prime)) {
        m_lowlinks.put(v,Math.min(m_lowlinks.get(v), m_indices.get(vprime)));
      }
    }
    if (m_lowlinks.get(v) == m_indices.get(v)){
      m_cycle = Lists.newArrayList();
      T n;
      do {
        n = m_s.pop();
        m_cycle.add(n);
      } while (! n.equals(v));
    }
  }
  public List<T> getCycle() {
    return m_cycle;
  }
}

这里实现的实际上是Tarjan判断强连通子图的算法,因为对于有向cycle,它一定是强连通的,所以在我们的场景中使用这个算法是没问题的,但是在细节上,上面的实现存在一点小瑕疵,即最后只能maintain一个cycle,如果在依赖关系中存在多个cycle的话,是无法将它们全部记录下来的。当然,这个算法的实现是为了提示用户存在循环依赖,而不是为了输出所有的循环依赖。

另外,在上面的实现中,和Tarjan SCC算法的实现也不是完全一致的,比如,是对当前node的所有前驱结点进行检查,而不是像Tarjan SCC中,是对所有的可达节点进行检查。这样做也是为了加快算法的执行速度,即在存在循环依赖的情况下,尽量减少循环的次数,只需要保证至少能够检测到一个环即可。 

Graph对象的初始化以及使用

我们再来回顾一下那个stacktrace:


annotation processing is not support看出具体循环依赖的 检测循环依赖_代码分析

 

可以发现,调用Graph中的拓扑排序方法的是MethodHelper类中的静态方法topologicalSort,而后者又被该类中的几个静态方法调用,所以,为了弄清楚Graph中的数据是如何准备的,我们需要对这个类进行探究: 

MethodHelper.topologicalSort方法

private static Graph<ITestNGMethod> topologicalSort(ITestNGMethod[] methods,
      List<ITestNGMethod> sequentialList, List<ITestNGMethod> parallelList) {
    Graph<ITestNGMethod> result = new Graph<ITestNGMethod>();  // 首先创建一个Graph类,Graph类中只有一个默认的constructor
    if (methods.length == 0) {  
      return result;   //如果传入的methods数组长度为0,直接返回了空的graph
    }
    // Create the graph
    for (ITestNGMethod m : methods) {
      result.addNode(m);    //对于每个方法instance,添加到graph中
      List<ITestNGMethod> predecessors = Lists.newArrayList();  //获得该方法依赖的方法,获得该方法依赖的group名字,返回的都是string数组
      String[] methodsDependedUpon = m.getMethodsDependedUpon();
      String[] groupsDependedUpon = m.getGroupsDependedUpon();
      if (methodsDependedUpon.length > 0) {   //如果存在依赖的方法
        ITestNGMethod[] methodsNamed =
          MethodHelper.findDependedUponMethods(m,methods);  // 通过该静态方法找到相应的method instances
        for (ITestNGMethod pred : methodsNamed){
         predecessors.add(pred);   //将找到的依赖方法添加到pred list中
        }
      }
      if (groupsDependedUpon.length > 0) {
        for (String group : groupsDependedUpon){ // 对于每个组,找到组中的方法
          ITestNGMethod[] methodsThatBelongToGroup =
            MethodGroupsHelper.findMethodsThatBelongToGroup(m, methods, group);
          for (ITestNGMethod pred : methodsThatBelongToGroup) {
            predecessors.add(pred); // 将找到的依赖方法添加到pred list中
          }
        }
      }
      for (ITestNGMethod predecessor : predecessors) {
        result.addPredecessor(m, predecessor);  // 将pred list中的方法instance添加到graph中
      }
    }
    result.topologicalSort();    //调用Graph的TS方法
    sequentialList.addAll(result.getStrictlySortedNodes());    //对于存在依赖关系的方法需要顺序运行
    parallelList.addAll(result.getIndependentNodes());    //对于不存在任何依赖的方法可以并发运行
    return result;
}

 以上代码的几个关键步骤:

  • 对于每个ITestNGMethod对象的操作:
  • 添加到Graph中,通过addNode方法
  • 创建一个list,用来维护该方法依赖的方法
  • 获得该方法依赖的所有方法,添加到上一步创建的list中
  • 根据dependsOnMethod找到依赖方法
  • 根据dependsOnGroup找到依赖方法
  • 将上一步修改后的list添加到graph中,通过addPredecessor方法
  • 待所有的ITestNGMethod对象都被处理完毕后,调用Graph对象的拓扑排序方法
  • 如果拓扑排序没有出现错误,获取结果,分别添加到Sequential和Parallel list中 

在上面的分析中,出现了SequentialList以及Parallel List这两个集合,它们分别用于顺序执行和并发执行。并发执行是TestNG中一个很重要,同时也十分新颖的功能。我们总是希望最大限度的提高程序的并发度,对于测试用例的运行,也不例外。由于硬件的发展,并发/并行计算是未来的趋势之一。TestNG中对于并发运行功能的实现,以后会有介绍。 

在上一篇文章中,介绍了Graph类的工作原理,但是对于其中数据的来源和准备,当时我们暂时忽略了,那么现在我们可以详细探究一下,Graph中的数据是如何准备的:

主要通过两个方法:

addNode以及addPredecessor

由于Graph是一个泛型类,这里的参数都用T来表示类型,为了方便理解,不妨把这个T就当成TestNG中的用来表示方法的ITestNGMethod接口类型。

public void addNode(T tm) {
    ppp("ADDING NODE " + tm + "" + tm.hashCode());
    m_nodes.put(tm, new Node<T>(tm)); // Initially, all the nodes are put in theindependent list as well
  }

该方法的实现十分简单,就是向m_nodes集合中添加一个entry,注意这个entry的类型是<Method,Node<Method>> 

public void addPredecessor(T tm, T predecessor) {
    Node<T> node = findNode(tm);  // 首先看看是否能够得到tm对象对应的Node
    if (null == node) {
      throw new TestNGException("Non-existing node: " + tm); //如果没有找到,明显是发生了错误,代表这个tm在m_nodes中根本就不存在
    }
    else {
      node.addPredecessor(predecessor);  // 这里在node上调用了addPredecessor方法
      addNeighbor(tm, predecessor);   //这个方法的作用暂时还没有看到,搜索了整个workspace都没有找到相应的用途,估计是作者为了扩展什么功能而预留的
      // Remove these two nodes from theindependent list
      if (null == m_independentNodes) {  // 如果独立节点集合还没有初始化
        m_independentNodes = Maps.newHashMap();
        for (T k : m_nodes.keySet()) { // 将现有的所有方法instance以及对应的Node对象添加到独立map
          m_independentNodes.put(k,m_nodes.get(k));  
        }
      }  // 移除非独立的节点,包括tm对象本身以及它依赖的节点,因此该集合中最后剩下的就是完全独立的节点了
      m_independentNodes.remove(predecessor);           
      m_independentNodes.remove(tm);   
      ppp("  REMOVED " + predecessor + " FROMINDEPENDENT OBJECTS");
    }
  }

 然后我们再看看上面方法的调用者

MethodHelper.sortMethods方法

private static List<ITestNGMethod> sortMethods(boolean forTests,
      List<ITestNGMethod>allMethods, IAnnotationFinder finder) {
    List<ITestNGMethod>sl = Lists.newArrayList();  // 用来保存只能顺序执行的methods
    List<ITestNGMethod>pl = Lists.newArrayList(); // 用来保存可以并行执行的methods
    ITestNGMethod[] allMethodsArray =allMethods.toArray(new ITestNGMethod[allMethods.size()]);
 
     // 下面这个if块的功能在于:对属于beforeXXX系列的configuration方法,在调用顺序上进行修正
    if (!forTests && allMethodsArray.length > 0) { 
      ITestNGMethod m = allMethodsArray[0];
      boolean before = m.isBeforeClassConfiguration()
          || m.isBeforeMethodConfiguration() || m.isBeforeSuiteConfiguration()
          || m.isBeforeTestConfiguration();    //查看该config方法是不是beforeXXX方法
      MethodInheritance.fixMethodInheritance(allMethodsArray, before);
    }  // 调用之前的topologicalSort方法进行拓扑排序,将sequential list和parallel list构造好
    topologicalSort(allMethodsArray, sl, pl); 
    List<ITestNGMethod> result = Lists.newArrayList();
    result.addAll(sl);
    result.addAll(pl);  // 将sl和pl中的ref全部添加到result中,该result集合也就表示了所有需要执行的方法
    return result;
  }

 因此,在TestNG对于依赖关系检测的拓扑排序中,主要有两个功能:

  • 检测依赖关系的正确性,即不存在任何形式的循环依赖
  • 在保证正确性的前提下,将方法分类,分成只能顺序运行的方法以及可以并发运行的方法

 以上,就是对TestNG中依赖关系相关核心代码的分析。其核心思想还是使用拓扑排序来建立依赖关系。在以后的系列文章中,还会介绍TestNG是如何实现并发运行测试方法,以及一些其他内容,比如,TestNG的几个常用的扩展点,Method Selector机制,各种Listener等等。