在科研和生产实践中,人们往往要做许多次实验来进行某项研究。实验条件一般包括很多因素,当因素的值不同时,实验的结果也不一样。如果想把每个因素的每个值都要实验一遍,总实验数就等于各因素的值的个数的乘积,而这个数往往很大,超过了可接受的成本。
例如,假设某个实验由A,B,C,D四个因素,每个因素都有10个不同的取值,那么如果想把每个因素都考虑到,我们需要做 101010*10=10000次实验。
为了减少实验数目,我们必须选出那些最有代表性的例子。于是,就要用到了正交表法(Orthogonal Array Testing Strategy)。
正交表的基本数学性质
设正交表的强度为S, 则正交表有以下数学性质:
- 1、 正交性:正交性有两个含义
- ⑴在最后S列中,每列因素的一个水平值与其他列中的每个水平值相碰一次且只碰一次。换句话说,最后S列构成的子表是满的。因此,正交表的记录个数=最后S列的水平数的乘积。
- ⑵在相同位置的任意S列,其构成的S维有序数对的集合中没有重复元素。特别的,当因素的水平数都相等时,对每个由S 列构成的集合N, 这个集合N将S维空间(既该S列的笛卡儿乘积)中的每个点都遍历一次且只遍历一次,形象的说,就是”既不重又不漏”,。而因素不等的情况时,则最后S 列的集合必然是满的。也就是⑴中所说的情况。
由此看出强度的作用,强度就象一个筛子,筛选出解空间中符合S维正交性原则的所有记录,当S=1时,只遍历最后一个变量的所有取值。当S=因素个数时,得到的便是整个解空间。
- 2、均匀性:每个因素的水平值在表中的出现的次数是均匀的,对最后的S列中的每一列(他们必然是满的),每个水平值出现的次数相等。
正交试验设计测试用例
正交表是一种筛选实验用例的方法。在介绍其具体内容前,我们先引入几个基本概念
- ⑴因素个数Factors,以后在本文中用F代替,因素就对应着正交表中的一列
- ⑵水平数Levels,以后简写为L。他的含义就是每个因素可取值的个数,注意这里我们不关心每个具体的值是多少,关心的是其个数。
变量的具体取值我们称做水平值,在与水平数不发生混淆的情况下,简称水平,用变量名+编号表示。比如,一个因素A可能有三个水平,则可记为A1,A2,A3. - ⑶强度Strength,以后简写为S:强度是构造正交表的一个最重要的指标,具体含义我们会在后面详细解释,这里只简单的说一下,正交表的核心性质就是后S个因素的每个水平值要相互碰一次且只碰一次。
- ⑷次数(Runs):最后生成的正交表的记录行数,一行记录也就是一次实验。
- ⑸正交表的符号表示:先以字母L打头,下标r表示记录数,
括号中为具有相同水平数的因子数的项的连乘记。
给几个具体的例子:
- ⑴设有3个因素A,B,C,每个因素的水平数均为3时,生成的正交表为L27(33)(取强度等于3的情况),记录数27=333
- ⑵设有5因素,每个因素的水平数分别2,2,2,3,3时,不同强度S的生成正交表分别为:
- s=2时,结果为
录数为最后两个变量的水平数乘积3*3=9 - s=3时,结果为
记录数为最后三个变量的水平数乘积233=18
手工构造正交表
看一个具体例子:设有4个变量A,B,C,D, 前三个变量的水平数为3,最后一个变量的水平为4,那么,根据不同的强度,可得到不同的正交表。强度s=2时,首先得到基本正交表
可以看出C的每个水平值与D的每个水平值各碰一次且仅碰一次。而A、B的每个水平出现的次数也很均匀。并且任何在相同位置的两列组成的有序数对没有重复值。
为了保持取值的均匀性,用因素的水平值循环填充为0的项,得到最终的正交表为
红色数字就是我们用水平值循环填充后的结果。类似的我们可以得到强度为3的正交表
记录数为433=36.
由此可见,手动构造正交表并不是一个容易的事情,因此我们提供了一个基于正交版设计测试用例的小工具。