- •СОДЕРЖАНИЕ
- •ЛЕКЦИЯ 7
- •7.1. Системы случайных величин. Функция и плотность распределения системы двух случайных величин. Условные законы распределения
- •7.2. Стохастическая связь. Ковариация. Коэффициент корреляции. Регрессия
- •7.3. Выборочный коэффициент корреляции. Проверка гипотезы об отсутствии корреляции
- •7.4. Приближенная регрессия. Метод наименьших квадратов
- •ЛЕКЦИЯ 8
- •8.1. Линейная регрессия от одного параметра
- •8.2. Регрессионный анализ
- •8.2.1. Проверка адекватности приближенного уравнения регрессии эксперименту
- •8.2.2. Оценка значимости коэффициентов уравнения регрессии
- •8.3. Оценка тесноты нелинейной связи
- •8.4. Аппроксимация. Параболическая регрессия
- •8.5. Приведение некоторых функциональных зависимостей к линейному виду
- •8.6. Метод множественной корреляции
- •ЛЕКЦИЯ 9
- •9.2. Двухфакторный дисперсионный анализ
- •ЛЕКЦИЯ 10
- •10.1. Планирование эксперимента при дисперсионном анализе
- •ЛЕКЦИЯ 11
- •11.1. Матрица планирования полного факторного эксперимента типа 23
- •ЛЕКЦИЯ 12
- •12.2. Описание функции отклика в области, близкой к экстремуму. Композиционные планы Бокса-Уилсона
- •12.3. Ортогональные планы второго порядка, расчет коэффицентов уравнения регрессии
ЛЕКЦИЯ 11
Матрица планирования ПФЭ 23. Проверка значимости коэффициентов и адекватности уравнения регрессии, полученных при обработке результатов ПФЭ 22 и 23. Дробный факторный эксперимент. Планы типа 2k-1.
11.1. Матрица планирования полного факторного эксперимента типа 23
Рассмотрим планирование ПФЭ типа 23, при котором исследуется влияние на результат опыта уже трех факторов. При реализации такого ПФЭ требуется выполнить N = 8 опытов. Проведем кодирование факторов по уравнениям (10.11) – (10.12). План проведения опытов представлен в табл. 11, геометрически в безразмерном масштабе он может быть интерпретирован в виде восьми вершин куба (рис. 2).
|
|
|
|
Таблица 11 |
||
|
Полный факторный эксперимент 23 |
|
|
|||
№ |
Факторы в безразмерном масштабе |
Выход |
|
|||
опыта |
|
|
|
продукта, y |
|
|
x1 |
x2 |
x3 |
||||
|
|
|
||||
1 |
–1 |
–1 |
–1 |
y1 |
|
|
2 |
+1 |
–1 |
–1 |
y2 |
|
|
3 |
–1 |
+1 |
–1 |
y3 |
|
|
4 |
+1 |
+1 |
–1 |
y4 |
|
|
5 |
–1 |
–1 |
+1 |
y5 |
|
|
6 |
+1 |
–1 |
+1 |
y6 |
|
|
7 |
–1 |
+1 |
+1 |
y7 |
|
|
8 |
+1 |
+1 |
+1 |
y8 |
|
Уравнение регрессии с учетом эффектов взаимодействия факторов запишется в следующем виде:
|
|
|
y =b0 |
+ b1x1 + b2 x2 + b3 x3 + b12 x1x2 |
+ b13 x1x3 + |
|
+ b23x2 x3 + b123 x1x2 x3 , |
(11.1) |
где коэффициенты b12, b13 и b23 характеризуют эффекты парного взаимодействия, b123 — эффект тройного взаимодействия.
Для нахождения коэффициентов уравнения (11.1) необходимо составить расширенную матрицу планирования ПФЭ с фиктивной переменной, представленную в табл. 12.
45
Рис. 2. Полный факторный эксперимент 23
Таблица 12
Расширенная матрица планирования ПФЭ типа 23
№ |
x0 |
x1 |
x2 |
x3 |
x1x2 |
x1x3 |
x2x3 |
x1x2x3 |
y |
1 |
+1 |
–1 |
–1 |
–1 |
+1 |
+1 |
+1 |
–1 |
y1 |
2 |
+1 |
+1 |
–1 |
–1 |
–1 |
–1 |
+1 |
+1 |
y2 |
3 |
+1 |
–1 |
+1 |
–1 |
–1 |
+1 |
–1 |
+1 |
y3 |
4 |
+1 |
+1 |
+1 |
–1 |
+1 |
–1 |
–1 |
–1 |
y4 |
5 |
+1 |
–1 |
–1 |
+1 |
+1 |
–1 |
–1 |
+1 |
y5 |
6 |
+1 |
+1 |
–1 |
+1 |
–1 |
+1 |
–1 |
–1 |
y6 |
7 |
+1 |
–1 |
+1 |
+1 |
–1 |
–1 |
+1 |
–1 |
y7 |
8 |
+1 |
+1 |
+1 |
+1 |
+1 |
+1 |
+1 |
+1 |
y8 |
Как и при ПФЭ 22, коэффициенты уравнения регрессии (11.1) определяются скалярным произведением столбца y на соответствующий столбец факторов или их взаимодействий в безразмерном масштабе, деленным на число опытов в матрице планирования (см. уравнения
(10.14) и (10.18)).
Так, например, коэффициент b123 рассчитывается по следующему выражению:
b |
= |
1 |
[− y |
+ y |
2 |
+ y |
3 |
− y |
4 |
+ y |
5 |
− y |
6 |
− y |
7 |
+ y |
8 |
]. |
(11.2) |
|
|||||||||||||||||||
123 |
|
8 |
1 |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
46
11.2. Проверка значимости коэффициентов и адекватности
уравнения регрессии, полученных при обработке результатов ПФЭ 22 и 23
Для оценки значимости коэффициентов уравнения регрессии и проверки адекватности уравнения эксперименту достаточно провести серию параллельных опытов, выполненных при каком-то одном сочетании факторов.
Пусть в центре плана (в точках (z1o , z2o ) и (z1o , z2o , z3o ) для ПФЭ 22 и 23 соответственно) проведена серия из m опытов. Тогда выборочная дисперсия воспроизводимости, характеризующая влияние случайных факторов, равна
m
∑(yuo − yo )2
sвоспр2 |
= |
u =1 |
|
, |
(11.3) |
|
m −1 |
||||
|
|
|
|
|
где yuo — результат u-го опыта (u = 1, 2, …, m), yo — среднее значе-
ние серии опытов. В математической статистике доказывается, что для спланированных экспериментов все коэффициенты уравнений регрессии определяются с одинаковой точностью, равной
s (bj ) = |
sвоспр |
. |
(11.4) |
|
N |
||||
|
|
|
Значимость коэффициентов проверяется по критерию Стъюдента. В условиях нулевой гипотезы Н0: βj = 0; отношение абсолютной величины коэффициента к его ошибке имеет распределение Стъюдента. Для каждого коэффициента определяется t-отношение:
t j = |
bj |
= |
bj |
N , |
(11.5) |
|
s (bj ) |
sвоспр |
|||||
|
|
|
|
которое сравнивается с табличным значением критерия Стъюдента tp(f ) для выбранного уровня значимости р (обычно 0,05) и числа степеней свободы f = m – 1. Если для рассматриваемого коэффициента tj > tp(f ), то он значимо отличается от нуля. Выборочные коэффициенты, для которых tj ≤ tp(f ), незначимы, и их следует исключить из уравнения регрессии.
Допустим, при проверке значимости коэффициентов уравнения (11.1) оказалось, что все коэффициенты, характеризующие эффекты взаимодействия факторов, незначимы. После их исключения получаем линейное уравнение регрессии
47
|
|
|
y = b0 |
+b1x1 +b2 x2 +b3x3 , |
(11.6) |
при этом значения b0, b1, b2 и b3 не требуется вычислять заново из-за того, что коэффициенты уравнения некоррелированы между собой.
В отличие от классического регрессионного анализа, исключение незначимого коэффициента не сказывается на величинах остальных коэффициентов уравнения регрессии, а сами выборочные коэффициенты, полученные при реализации ПФЭ, являются несмешанными оценками теоретических коэффициентов.
Адекватность уравнения проверяется по критерию Фишера
F = (sад2 |
sвоспр2 |
), |
(11.7) |
Дисперсия адекватности (остаточная дисперсия) равна
|
|
1 |
N |
|
|
sад2 = sост2 = |
|
∑( yi − yi )2 , |
(11.8) |
||
N |
− l |
||||
|
|
|
i = |
1 |
|
где l — число значимых коэффициентов (для рассматриваемого случая l = 4). Уравнение адекватно описывает эксперимент, если
F ≤ F1− p ( f1, f2 ) , |
(11.9) |
где F1-p (f1, f2) — табличное значение критерия Фишера для р = 0,05 и чисел степеней свободы f1 = fад = N – l и f2 = fвоспр = m – 1.
Рассмотрим также схему проведения регрессионного анализа для спланированного эксперимента в случае, когда каждый опыт в матрице планирования повторялся m раз. В качестве примера используем ПФЭ 23; при получении уравнения регрессии ограничимся линейным приближением (уравнение (11.6)). Матрица планирования такого эксперимента представлена в табл. 13.
Для каждого сочетания уровней факторов определяется среднее значение измеряемой величины и выборочная дисперсия:
|
|
|
i = |
1 |
|
m |
yiu , |
(11.10) |
||||
|
|
y |
∑ |
|||||||||
|
|
|
m |
|||||||||
|
|
|
|
|
|
|
u =1 |
|
|
|
|
|
si2 = |
1 |
|
|
m |
|
(yiu − |
|
i )2 . |
(11.11) |
|||
|
∑ |
y |
||||||||||
m −1 |
||||||||||||
|
|
|
|
|
u =1 |
|
|
|
|
|
48
Таблица 13
Матрица планирования ПФЭ 23 в условиях линейной модели
содинаковым числом параллельных опытов при каждом сочетании уровней факторов
№ |
x0 |
x1 |
x2 |
x3 |
y |
|
|
|
|
|
i |
si2 |
y |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+1 |
–1 |
–1 |
–1 |
y11, y12, …, y1m |
|
|
|
|
|
1 |
s12 |
|
|
y |
||||||||||
2 |
+1 |
+1 |
–1 |
–1 |
y21 y22, …, y2m |
|
|
|
2 |
s22 |
||
|
|
y |
||||||||||
3 |
+1 |
–1 |
+1 |
–1 |
y31, y32, …, y3m |
|
|
|
|
3 |
s32 |
|
|
|
y |
||||||||||
4 |
+1 |
+1 |
+1 |
–1 |
y41, y42, …, y4m |
|
|
|
4 |
s42 |
||
|
|
y |
||||||||||
5 |
+1 |
–1 |
–1 |
+1 |
y51, y52, …, y5m |
|
|
|
5 |
s52 |
||
|
|
y |
||||||||||
6 |
+1 |
+1 |
–1 |
+1 |
y61, y62, …, y6m |
|
|
|
6 |
s62 |
||
|
|
y |
||||||||||
7 |
+1 |
–1 |
+1 |
+1 |
y71, y72, …, y7m |
|
|
|
7 |
s72 |
||
|
|
y |
||||||||||
8 |
+1 |
+1 |
+1 |
+1 |
y81, y82, …, y8m |
|
|
|
|
8 |
s82 |
|
|
|
y |
Однородность дисперсий проверяется по критерию Кохрена. Отношение максимальной дисперсии к сумме всех дисперсий
s2
G = Nmax (11.12)
∑si2
i =1
сравнивается с табличным значением G1-p ( f1, f2) для р = 0,05 и чисел
степеней свободы f1 = m – 1 и f2 = N. Если G ≤ G1-p ( f1, f2), то выборочные дисперсии однородны. Тогда наилучшей оценкой дисперсии вос-
производимости будет средневзвешенная дисперсия
N
sвоспр2 = N1 ∑si2 (11.13)
i =1
с числом степеней свободы fвоспр = N (m – 1).
Коэффициенты уравнения регрессии определяются по формуле
N
bj = 1 ∑x ji yi . (11.14)
N i =1
Поскольку дисперсия среднего в m раз меньше дисперсии единичного измерения, т. е.
s2 ( y) = sвоспр2 |
m , |
(11.15) |
то выборочные среднеквадратичные отклонения коэффициентов рассчитываются следующим образом:
49
|
sвоспр |
|
1 |
N |
|
|
|
|
s(b j ) = |
= |
∑ |
si2 . |
(11.16) |
||||
Nm |
N m |
|||||||
|
|
|
|
i = |
1 |
|
|
Значимость коэффициентов проверяется по критерию Стъюдента: если
t j = |
|
bj |
|
> t p ( f ) , |
(11.17) |
|
|
|
|
||||
s (bj ) |
||||||
|
|
|
где tp(f ) — табличное значение критерия Стъюдента для р = 0,05 и числа степеней свободы f = N (m – 1), то коэффициент значимо отличается от нуля.
Адекватность уравнения регрессии эксперименту проверяется по критерию Фишера. Дисперсия адекватности равна
|
N |
|
|
|
|
|
|
|
m∑( |
|
i − yi ) 2 |
|
|
||
y |
|
|
|||||
sад2 = |
i = |
1 |
|
|
|
, |
(11.18) |
|
|
N − l |
|||||
|
|
|
|
|
где l — число значимых коэффициентов в уравнении регрессии. Уравнение адекватно эксперименту, если
s2
F = 2 ад ≤ F1− p ( fад, fвоспр) , (11.19)
sвоспр
где F1-p (fад, fвоспр) — табличное значение критерия Фишера для р = 0,05 и чисел степеней свободы fад = N – l и fвоспр = N (m – 1). В противном случае для описания результатов эксперимента необходимо увеличить
порядок аппроксимирующего полинома.
11.3. Дробный факторный эксперимент. Планы типа 2k-1
Число необходимых опытов в условиях линейной модели существенно сокращается при проведении дробных факторных экспериментов (дробных реплик от ПФЭ). В качестве реплики обычно используется полный факторный эксперимент для меньшего числа факторов. При этом вычисление коэффициентов уравнения и оценка их значимости проводится так же, как и в рассмотренных выше примерах ПФЭ 22 и 23. Число опытов в дробной реплике должно быть больше или равно числу неизвестных коэффициентов в уравнении регрессии.
50
Спланируем дробный факторный эксперимент для получения линейного уравнения регрессии небольшого участка поверхности отклика при трех независимых факторах:
|
|
|
y = b0 |
+b1x1 +b2 x2 +b3x3 . |
(11.20) |
Постановка ПФЭ 23 требует проведения 8 опытов. Для решения же поставленной задачи можно ограничиться 4 опытами, если в матрице планирования ПФЭ 22 (табл. 10, лекция 10) использовать столбец х1х2 в качестве плана для х3. Матрица планирования такого сокращенного эксперимента — ДФЭ типа 23-1, или полуреплики от ПФЭ 23, — представлена в табл. 14.
|
|
|
|
|
Таблица 14 |
|
Матрица планирования ДФЭ типа 23-1 |
|
|||
№ опыта |
х0 |
х1 |
х2 |
х3 |
y |
1 |
+1 |
–1 |
–1 |
+1 |
y1 |
2 |
+1 |
–1 |
+1 |
–1 |
y2 |
3 |
+1 |
+1 |
–1 |
–1 |
y3 |
4 |
+1 |
+1 |
+1 |
+1 |
y4 |
Проведение ДФЭ по предложенной схеме позволяет оценить свободный член и три коэффициента при линейных членах уравнения (11.20), однако при этом они будут являться несмешанными оценками теоретических коэффициентов только в том случае, если генеральные коэффициенты регрессии при парных взаимодействиях равны нулю. В противном случае найденные выборочные коэффициенты будут смешанными оценками теоретических:
b1 →β1 +β23, b2 →β2 +β13, b3 →β3 +β12 . |
(11.21) |
Генеральные коэффициенты не могут быть оценены по отдельности на основании только 4 опытов, поскольку при этом столбцы для линейных членов и парных произведений одинаковы (например, элементы вычисленного столбца для произведения х2х3 в точности совпадут с элементами столбца х1). Чтобы определить, оценкой суммы каких именно генеральных коэффициентов явяются выборочные коэффициенты, удобно пользоваться генерирующим соотношением
x3 = x1x2 , |
(11.22) |
в общем случае означающим, какой именно столбец ПФЭ 2k был использован в качестве плана для введения (k + 1)-го фактора в ДФЭ. При умножении обоих частей (11.22) на x3, получаем
51
x2 |
= x x |
2 |
x . |
(11.23) |
3 |
1 |
3 |
|
|
Единичный столбец |
|
|
|
|
I = x1x2 x3 |
(11.24) |
называется определяющим контрастом и позволяет определить, элементы каких столбцов в расширенной матрице планирования одинаковы. Умножая I по очереди на x1, x2 и x3, получаем
x |
= x2 x |
2 |
x |
|
= x |
2 |
x |
, |
x |
2 |
= x x |
2 x |
= x x |
, |
||||||
1 |
1 |
3 |
|
|
3 |
|
x2 |
|
1 |
2 |
3 |
1 |
3 |
|
||||||
|
|
|
|
x |
= x x |
= x x |
, |
|
|
|
|
(11.25) |
||||||||
|
|
|
|
|
3 |
|
|
1 |
|
2 |
3 |
|
1 |
2 |
|
|
|
|
|
|
в точности соответствующих системе смешанных оценок (11.21). При постановке ДФЭ с числом факторов k ≥ 4 в зависимости от
генерирующего соотношения выборочные коэффициенты регрессии оказываются смешанными оценками того или иного сочетания генеральных коэффициентов. Поэтому важно заранее определиться с тем, какая информация является наиболее важной в данном исследовании, и в зависимости от поставленной задачи подобрать нужную дробную реплику.
Рассмотрим, например, планирование ДФЭ типа 24-1, представляющего собой полуреплику от ПФЭ 24. В качестве реплики используем ПФЭ 23 (табл. 12). Используем два генерирующих соотношения:
x4 = x1x2 x3 , |
(11.26) |
|
x4 = x1x3 . |
(11.27) |
|
Для соотношения (11.26) определяющим контрастом будет |
|
|
I = x1x2 x3x4 . |
(11.28) |
|
Тогда |
|
|
x1 = x2 x3x4 , b1 →β1 +β234; |
x2 = x1x3x4 , b2 →β2 +β134 ; |
|
x3 = x1x2 x4 , b3 →β3 +β124; |
x4 = x1x2 x3, b4 →β4 +β123 ; |
|
x1x2 = x3x4 , b12 →β12 +β34; x1x3 = x2 x4 , b13 →β13 +β24 ; |
|
|
x1x4 = x2 x3, b14 →β14 +β23 . |
(11.29) |
В реальных задачах влияние тройных взаимодействий обычно равно нулю. Следовательно, генерирующее соотношение (11.26) следует использовать, если наибольший интерес представляют оценки для линейных эффектов.
Для соотношения (11.27) определяющим контрастом будет
I = x1x3x4 . |
(11.30) |
Тогда
52
x1 = x3x4 , b1 →β1 +β34; x2 = x1x2 x3x4 , b2 →β2 +β1234 ; |
|
|
x3 = x1x4 , b3 →β3 +β14; |
x4 = x1x3, b4 →β4 +β13 ; |
|
x1x2 = x2 x3x4 , b12 →β12 +β234; |
x2 x3 = x1x2 x4 , b23 →β23 +β124 ; |
|
x2 x4 = x1x2 x3, b24 →β24 +β123 . |
(11.31) |
Следовательно, дробную реплику с генерирующим соотношением x4 = x1x3 следует использовать, если наибольший интерес представляют эффекты парных взаимодействий.
В общем случае число опытов в дробной реплике должно удовлетворять следующему соотношению:
k +1 ≤ N < 2k , |
(11.32) |
где k — число факторов. Если число опытов равно числу определяемых коэффициентов в линейном уравнении регрессии (N = k + 1), дробная реплика представляет собой линейный насыщенный план, для которого все линейные эффекты смешаны с эффектами взаимодействия. Число степеней свободы остаточной дисперсии в таких планах равно нулю, поэтому для проверки адекватности линейного уравнения необходимо проведение дополнительных опытов.
Итак, рассмотренные двухуровневые планы ПФЭ 2k и ДФЭ 2k-1 обладают следующими свойствами: вычисления просты; все коэффициенты регрессии определяются независимо друг от друга и с одинаковой и минимальной дисперсией; каждый коэффициент рассчитывается по результатам всех опытов.
53