正交试验设计 – 12Reads管理百科

什么是正交试验设计

正交试验设计是研究多因素多水平的又一种设计方法，它是根据正交性从全面试验中挑选出部分有代表性的点进行试验，这些有代表性的点具备了“均匀分散，齐整可比”的特点，正交试验设计是分式析因设计的主要方法。是一种高效率、快速、经济的实验设计方法。

日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格，称为正交表。例如作一个三因素三水平的实验，按全面实验要求，须进行33 = 27种组合的实验，且尚未考虑每一组合的重复数。若按L9(3)3正交表安排实验，只需作9次，按L18(3)7正交表进行18次实验，显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。

正交表是一整套规则的设计表格，用 L为正交表的代号，n为试验的次数，t为水平数，c为列数，也就是可能安排最多的因素个数。例如L9(34)，它表示需作9次实验，最多可观察4个因素，每个因素均为3水平。一个正交表中也可以各列的水平数不相等，我们称它为混合型正交表，如L，此表的5列中，有1列为4水平，4列为2水平。

正交试验设计表

正交试验设计表•正交试验因素水平表

•正交试验设计方案及试验结果

•极差分析表(或指标与因素关系图)

•方差分析表(简单分析时可无)

正交表的性质

(1)每一列中，不同的数字出现的次数相等。例如在两水平正交表中，任何一列都有数码“1”与“2”，且任何一列中它们出现的次数是相等的；如在三水平正交表中，任何一列都有“1”、“2”、“3”，且在任一列的出现数均相等。

(2)任意两列中数字的排列方式齐全而且均衡。例如在两水平正交表中，任何两列(同一横行内)有序对子共有4种： (1，1)、(1，2)、(2，1)、(2，2)。每种对数出现次数相等。在三水平情况下，任何两列(同一横行内)有序对共有9种，1.1、1.2、 1.3、2.1、2.2、2.3、3.1、3.2、3.3，且每对出现数也均相等。

以上两点充分的体现了正交表的两大优越性，即“均匀分散性，整齐可比”。通俗的说，每个因素的每个水平与另一个因素各水平各碰一次，这就是正交性。

正交表的获得由专门的算法，对应用者来说，不必深究。

正交试验设计的安排

正交试验设计的关键在与试验因素的安排。通常，在不考虑交互作用的情况下，可以自由的将各个因素安排在正交表的各列，只要不在同一列安排两个因素即可（否则会出现混杂）。但是当要考虑交互作用时，就会受到一定的限制，如果任意安排，将会导致交互效应与其它效应混杂的情况。

因素所在列是随意的，但是一旦安排完成，试验方案即确定，之后的试验以及后续分析将根据这以安排进行，不能再改变。对于部分表，如L18（2*3^7）则没有交互作用列，如果需要考虑交互作用需要选择其它的正交表。

正交试验设计的极差分析

在完成试验收集完数据后，将要进行的是极差分析。

极差分析就是在考虑A因素是，认为其它因素对结果的影响是均衡的，从而认为，A因素各水平的差异是由于A因素本身引起的。

用极差法分析正交试验结果应引出以下几个结论：

①在试验范围内，各列对试验指标的影响从大到小的排队。

某列的极差最大，表示该列的数值在试验范围内变化时，使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队，就是各列极差D的数值从大到小的排队。

②试验指标随各因素的变化趋势。

③使试验指标最好的适宜的操作条件（适宜的因素水平搭配）。

④对所得结论和进一步研究方向的讨论。

较优条件选择

各因素的好水平加在一起，是否就是较优试验条件呢？理论上，如果各因素都不受其它因素的水平变动影响的，那么，把各因素的优水平简单地组合起来就是较好试验条件。但是，实际上选取较好生产条件时，还要考虑因素的主次，以便在同样满足指标要求的情况下，对于一些比较次要的因素按照优质、高产、低消耗的原则选取水平，得到更为结合试验实际要求的较好生产条件。

以上介绍如何分析各因素水平的变动对指标的影响。讨论A因素时，不管其它因素处在什么水平，只从A的极差就可判断它所起作用的大小。对其它因素也作同样的分析，在此基础上选取谙因素的较优水平。

实践中发现，有时不仅因素的水平变化对指标有影响，而且，有些因素间各水平的联合指配对指标也产生影响，这种联合搭配作用称为交互作用。而交互作用应该在试验设计时考虑到。

正交试验分析方法

一、直接对比法

直接对比法就是对试验结果进行简单的直接对比。直接对比法虽然对试验结果给出了一定的说明，但是这个说明是定性的，而且不能肯定地告诉我们最佳的成分组合。显然这种分析方法虽然简单，但是不能令人满意。

二、直观分析法

直观分析法是通过对每一因素的平均极差来分析问题。所谓极差就是平均效果中最大值和最小值的差。有了极差，就可以找到影响指标的主要因素，并可以帮助我们找到最佳因素水平组合。

正交试验设计的基本思想

考虑进行一个三因素、每个因素有三个水平的试验。如果作全面试验，需作33 = 27次。

若从27次试验中选取一部分试验，常将A和B分别固定在A1和B1水平上，与C的三个水平进行搭配，A1B1C1,A1B1C2,A1B1C3。作完这3次试验后，若A1B1C3最优，则取定C3这个水平，让A1和C3固定，再分别与B因素的三个水平搭配，A1B1C3,A1B2C3,A1B3C3。这3次试验作完以后，若A1B2C3最优，取定B2,C3这两个水平，再作两次试验A2B2C3,A3B2C3,然后与一起比较，若A3B2C3最优，则可断言A3B2C3是我们欲选取的最佳水平组合。这样仅作了7次试验就选出了最佳水平组合。

我们发现，这些试验结果都分布在立方体的一角，代表性较差，所以按上述方法选出的试验水平组合并不是真正的最佳组合。

如果进行正交试验设计，利用正交表安排试验，对于三因素三水平的试验来说，需要作9次试验，用“Δ”表示，标在图中。如果每个平面都表示一个水平，共有九个平面，可以看到每个平面上都有三个“Δ”点，立方体的每条直线上都有一个“Δ”点，并且这些“Δ”点是均衡地分布着，因此这9次试验的代表性很强，能较全面地反映出全面试验的结果，这就是正交实验设计所特有的均衡分散性。我们正是利用这一特性来合理的设计和安排试验，以便通过尽可能少的试验次数，找出最佳水平组合。

正交试验设计的过程

1)确定试验因素及水平数;

2)选用合适的正交表;

3)列出试验方案及试验结果;

4)对正交试验设计结果进行分析，包括极差分析和方差分析;

5)确定最优或较优因素水平组合。

正交试验设计法与遗传算法的联系

（1）正交试验设计法是遗传算法的一种特例，即正交试验设计法是一种初始种群固定的、只使用定向变异算子的、只进化一代的遗传算法。

（2）遗传算法的步骤比正交试验设计法复杂，所需的试验次数也要多于正交试验设计法的试验次数，但它产生的解要优于正交试验设计法产生的解。

（3）遗传算法的隐并行性使得它在处理交互作用项时，效率比正交试验设计法要高。

（4）正交试验设计法可解决一般遗传算法中的最小欺骗问题。