Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Решение некоторых многоэкстремальных задач методом сужающихся окрестностей

..pdf
Скачиваний:
3
Добавлен:
12.11.2023
Размер:
12.71 Mб
Скачать

Рис. 24.

Т а б л и ц а 3.2

Вид метрики

Н аименьш ее

Н аибольш ее

а 3

Среднее

значение ос

значение 3

2

значение

 

Транспозиционная

и з

350,41

175,77

108,43

Алфавитная

5,64

23,08

14,36

11,18

Цепная

9,85

659,78

334,82

248,07

Инверсная

5,39

734,26

369,82

267,64

Лексикографическая

5,73

14,75

10,24

9,81

92

функционала при этом равно 267,64. В случае лексикографической

метрики получаем картину,

распределения, представленную на

рис. 24. Здесь математическое

ожидание равно 9,81. На рис. 25

и 26 показаны гистограммы для случаев алфавитной и цепной метрик

соответственно. Средние значения

g (р) при

этом

равны 11,18

и 248, 07. Результаты исследования

сведены в

табл.

3.2.

Представляется, что теоремы о сдвиге математического ожида­ ния можно значительно обобщить. Интуитивно ясно, что при любом законе распределения его усечение на интервал (о, Ь) будет иметь меньшее математическое ожидание М, чем среднее значение т основного закона, если середина интервала (а, в) сдвинута влево относительно т.

Однако строгое доказательство этого утверждения пока удалось провести лишь для нормального закона распределения, а в ослаб­

ленном виде для логнорд>ального.

 

 

 

§ 3. Уменьшение дисперсии

 

 

 

Рассмотрим, какие изменения происходят с дисперсией

слу­

чайной величины при

переходе

от нормального

распределения

к его усечению на некоторый интервал.

закону

(3.2),

Пусть случайная величина

г

распределена по

а случайная величина

у — по

закону (3.5). Как

известно,

дис­

персия величины г равна о3. Вычислим дисперсию величины у.

По

определению

d (у) =

((У -

(у)?) - (у2) - (у)2.

 

(3.39)

 

 

 

 

Из

соотношения

(3.18)

следует

 

 

 

(у)2 =

т2 +

У2 am

ехр (— Л2) — ехр (— В2)

,

 

 

 

 

 

Уп"

Е(В)— Е(А)

"т*

 

 

+

а2 .

ехр (— 24») — 2exp (— 42 — В*)-+ exp (— 2В2)

(3.40)

 

2п

 

 

[£ (В) — Е (4)]2

 

где числа Л и В определяются по формуле (3.16),

 

 

 

Второй момент случайной величины у определим как

 

 

«•> -

I л и » W -

 

 

 

Для вычисления этого интеграла воспользуемся заменой перемен­

ной (3.14). Получим

 

 

 

 

в

 

 

 

(У2) — уЛ - J (У~2 аи + т)2ехр (— и2) du.

(3.41)

Учитывая

соотношение (3.16),

находим

 

 

2

в

в

 

(&) =

р

1 “2 ехР ( ~ “а) du + 2^ - - ° т j и ехр (— (и2) du -f

93

 

 

 

 

au =

?2 ( ы2 exp (— u2)du -+•

 

 

 

 

 

 

VnP {

 

 

 

+

[exp ( - A2) -

exp ( -

В2)] + Л ? - [ Е ( В ) - Е (A)].

(3.42)

V n P

 

 

 

 

 

 

 

 

Необходимо вычислить

 

 

 

 

 

 

 

 

 

a

и2 exp (— и2) du.

 

 

 

 

 

 

У

 

 

 

 

 

 

 

 

 

 

 

 

Воспользуемся интегрированием

по

частям:

 

 

в

 

 

 

 

 

 

 

В

 

]* и2 exp (— u?)du = --- Y u ехР (— иа) |5 + *4“ I ехР

3

 

 

 

 

 

 

 

Л

 

=

Л е х р ( - 4 ^ - Д е х р ( - В2) +

/ я . [£ (fl) _ Е (Д)]>

(3.43)

Из соотношений

(3.42)

и (3.43) получаем

 

 

 

 

<у‘> - ° ’ +

у х

А ехр (— Л2) — В ехр (— В2)

 

 

 

Е ( В ) - Е

(Л)

 

 

,

V 2 a m

ехр (— А 2) —

ехр (— В 2)

, тЛ

(3.44)

 

+ _ 7 й

 

Е ( В ) - Е ( А ) ,

 

+ т '

 

 

 

 

Вследствие формул (3.39), (3.40) и (3.44) находим

 

d(y) = a2 +

а2

А ехр (— Л2) — В

ехр (— В 2)

 

 

 

 

■утг

'

Е ( В ) - Е ( А )

 

 

 

 

ехр (— 2Л2) — 2 ехр (— А 2 — В 2)

+

ехр (— 2В2)

(3.45)

 

 

 

( Е ( Б ) - Е ( А ) I2

 

 

 

 

 

 

 

 

Теорема

3.3.

Дисперсия случайной величины у, распределен­

ной по закону (3.5), не превосходит дисперсии случайной величины

г, распределенной по нормальному закону

(3.2).

величины

г

Д о к а з а т е л ь с т в о .

Поскольку

дисперсия

равняется о2, из формулы (3.45) следует, что

для доказательства

теоремы достаточно

проверить справедливость

неравенства

 

 

о2

А ехр (— <42) — В ехр (— В2)

^

 

 

 

W

 

Е ( В ) - Е ( А )

 

 

<

 

 

а 2

ехр (— 2А 2) — 2 ехр (— А 2 — В2) +

ехр (— 2В2)

 

 

 

[ Е (В) — Е (Л)]2

 

 

 

 

Поскольку Е (х)

монотонно

возрастающая

функция

и- В >

А,

это неравенство

эквивалентно следующему:

 

 

 

 

А ехр (— А2) В ехр (— В2) <

 

 

ехр (— 2Л2) — 2 ехр (— А 2 — В2) +

ехр (— 2В2)

(3.46)

^

 

2 / i t

[ Е (В) — Е (Л)]

 

 

 

 

 

 

 

 

 

94

Пользуясь определением (3.10) функции Я (ж), переписываем нера­ венство (3.46) в виде

в

 

(е~А‘ е~в‘)2 2 (Ае~А‘Ве~т) j er-*'dx> 0.

(3.47)

Таким образом, доказательство теоремы сведено к доказательству

неравенства

(3.47).

 

Рассмотрим прежде всего случай, когда

 

 

В > А > 0.

(3.48)

Введем функцию

 

 

в

 

и (А,

В) = (е~Аг — e r * f — 2 (Ae~At Ве~В!) J е~хЧх.

(3.49)

 

А

 

Дифференцируя эту функцию по В при фиксированном Л, полу­ чаем

dUав = ^Ве-в*(егА* ег~В2)— 2 (АегАг Вег~вг)етвг

в

— 2e-B*(2B*— \ ) \ e - x'dx.

А

Разделив правую часть этого равенства на положительную величину 2е~в\ получим новую функцию

 

 

в

v (А, В) = 2Ве~Аг— Вег* — Ае~А‘ (2В2— 1) J e~x,dx,

 

 

А

причем знаки функций о (Л, В) и ди^

совпадают.

Дифференцируя функцию v (А, В) по

В при

фиксированном

А, находим

 

 

дх>(*'в В) = 2 (е~А' — 2В J <r-x‘dx^ .

Рассмотрим функцию

 

 

в

 

 

w (Л, В) = е~А*— 2В j e~xtdx,

 

А

 

 

знак которой совпадает со знаком функции

Art t А

Л )

Легко видеть, что при В > 0 она является монотонно убываю­ щей функцией от В. При этом

w (Л, Л) = erAi > 0,

(3.50)

lim w (Л, В) = — оо.

(3.51)

В-+ оо

 

95

Вследствие непрерывности функции а» (Л, В) из формул (3.50)

и (3.51) следует существование числа В0 такого, что

 

 

w{A,

В0) =

0,

 

 

 

 

причем В0 > А.

В0 функция v(A, В), как функция

Следовательно, при А < В <

от В, монотонно возрастает, а при В >

В0 она монотонно убывает,

 

поскольку ее производная меня­

 

ет знак с плюса на минус.

 

 

 

Нетрудно

видеть, что

 

 

 

 

 

v(A,

Л) =

0,

 

 

 

 

lim v(A,

В) = — оо.

 

 

 

 

В-*-со

 

 

 

 

 

Поэтому функция v {А, В)

име­

 

ет

вид,

представленный

на

 

рис.

27.

образом,

существует

 

 

Таким

Рис. 27.

точка Вг такая, что при А <

В <

<

Bt

выполнено

неравенство

 

v (А, В )> 0 , а при В >• Вх спра­

ведливо о (Л, В) < 0.

Поскольку

знак функции v(A, В) совпадает

со знаком производной от функции и (А, В) по В, то и (А, В),

как

функция от В,

монотонно возрастает при В <

Вх и монотонно убы­

вает при В >

В1# Значит, минимальные значения функция и (А, В)

принимает при В = Л и В = -f

оо.

 

 

Поскольку

и (А, А) = 0, для доказательства неравенства (3.47)

при условии

(3.48)

достаточно

проверить

справедливость

не­

равенства

 

 

 

И т«(Л ,

В )> 0 .

(3.52)

 

 

 

 

 

 

 

 

В-+СО

 

 

 

Вследствие

определения

(3.49)

со

 

 

 

 

 

 

 

 

 

 

 

lim и (А,

В) = е -24*— 2Ае~А‘ [ e~x'dx.

 

 

 

В-*°°

 

 

А

 

 

Рассмотрим

функцию

 

 

 

 

 

 

 

q (A )~ e ~ * — 2A $tr*dx.

(3.53)

Нетрудно видеть, что знак функции q (Л) совпадает со знаком пре­ дыдущего выражения. Имеем

- Т Г 1 ------

(3.54)

 

Следовательно, функция q (Л) монотонно

убывает. Покажем,

что

(3.55)

Н т ?(Л) = 0.

Л-*оо

 

96

Условие

(3.56)

lim e~Af = 0

А-+оо

очевидно, а предел второго слагаемого в правой части (3.53) вы­

числим

G использованием

правила

Лопиталя

 

 

 

оо

 

 

 

 

 

 

со

f

e~*'dx

 

 

 

 

lim f e-^dx =

lim - — -----=

lim ~

e . - =

lim 2A2e^A* = 0.

A -¥OO

j

/4-*00

*

Л-*оо

* ■

/4-VOO

 

A

 

2 A

 

 

2 A 2

(3.57)

 

 

 

 

 

 

 

Из формул (3.56) и (3.57) вытекает соотношение (3.55), а из (3.54) и (3.55) следует, что функция q(A) всюду неотрицательна. Поэтому справедливо неравенство (3.52), а значит и основное нера­ венство (3.47).

Напомним, что проведенное доказательство неравенства (3.47) опирается на неравенство (3.48).

Рассмотрим случай, когда

 

5 > 0 > А

(3.58)

При этом неравенство (3.47) является очевидным. В самом деле, если верно (3.58), то в левую часть неравенства (3.46) входит отри­ цательная величина, а в правую — положительная. Между тем неравенства (3.46) и (3.47) эквивалентны.

Наконец, рассмотрим ситуацию, когда

А < В <

0.

 

(3.59)

Вследствие четности функции е-* имеем

 

 

в

— А

 

 

 

J er-^dx =

|

e~x'dx.

 

(3.60)

А

 

 

 

 

С учетом соотношений (3.49) и (3.60) находим

 

и (А, В) = [е—<—«* —

 

 

— А

 

 

 

2 ((— В) e-t-BY(— А) е_(_'4)!|

J

e~x‘dx = u(— B, — А).

(3.61)

 

—в

 

 

 

Неравенство (3.59) можно переписать в виде

А > — В > 0.

Из этого неравенства и соотношения (3.61) еледует неравенство и (— В, — Л )> 0.

Теорема доказана.

Сделаем некоторые замечания по поводу теоремы 3.3. Утверждается, что дисперсия величины у не превосходит дис­

персии величины г. В случае, когда интервал (а,Ь) конечен, из струк­

7

9—961

97

туры доказательства теоремы 3.3 следует, что между дисперсиями имеем строгое неравенство. Действительно, функция ди (А, В)/дВ на некотором интервале строго положительна. Значит, функция f(A, В) строго монотонно возрастает по переменной В при условии, что в начале интервала она равна нулю. Следовательно, неравенство (3.47) можно заменить следующим:

ь

{е~аге~ь*)2— 2 (ае~а2be~b°) Це~хЧх > 0.

а

Интуитивно ясно, что уменьшение дисперсии будет происходить при усечении любого закона распределения. Однако получить строгое доказательство этого факта нам пока удалось только для нормального закона.

Факт уменьшения дисперсии известен также и для следующего вырожденного случая. Как известно, для случайной величины

распределенной по

закону

Коши

 

о (2 ) =

Р II <

z) = -J- +

arctg ■г-а ,

дисперсия не существует. Между тем, для усеченного закона Коши дисперсия является конечной величиной (см., например, Г251), Большое количество просчитанных примеров, а также некого* рые интуитивные соображения дают возможность предположить, что справедливо следующее утверждение, более сильное, чем тео­

рема 3.3.

 

 

величина,

распределенная, по

закону

Пусть tji — случайная

 

0

 

 

 

 

если г >

а19

 

Pi (г) =

 

f e x p f - ^ f l dxt

если ах < г <

blf

 

VbioPi I

У[

\ V 2 a )

J

 

 

 

 

где

 

 

 

 

,

если г >

blt

 

 

 

 

 

 

 

 

 

 

а у2— случайная

величина,

распределенная

по закону

 

 

 

0

 

 

 

,

если

г <

а2,

 

Р*{г)

7Ё

р- Ь [ - ( 1^

dx,

если

а2 <

г <

62,

 

 

 

г >

Ь2,

 

где

1

 

 

 

,

если

 

 

 

 

 

 

 

 

 

 

Если выполнено неравенство ах < о, С 6, < Ьъ дисперсия случай­ ной величины у2 меньше, чем дисперсия случайной величины уг.

Иными словами, дисперсия уменьшается не только при переходе от основного закона распределения к его усечению, но и при пере­ ходе от одного усеченного закона распределения к другому, если интервал, на котором сосредотачивается закон, уменьшается.

К сожалению,

доказательство этого утверждения, сводящееся

к доказательству

неравенства

Г Л ехр (— А\) В2ехр (— В\)

2 У п [

Е (Bj) Е (Л*)

^Г ехр (— Al) — ехр (— в|) I2

<l Е ( В 0 - Е ( Л 0

где

Е(ВО -В (АО

Г ехр (— А\) — ехр (— В\)

]2

J •

JЕ ( В , ) - Е ( А[1)

 

Л

_ агт t D

т

л

а 2 т

р ^2 т

~

V2 а

D l~~

V2o '

2 “

У2о ’

2 ~ У Т ~

нам

не

удалось

провести.

 

 

 

Проиллюстрируем уменьшение дисперсии следующим численным

примером. В

качестве модельного выберем функционал (3.38),

в котором п =

84, а числа М{ заданы в табл. 3.1.

Проведем анализ значений функционала (3.38) в соответствии со схемой, приведенной в § 2 данной главы. При этом будем вычис­

лять выборочные дисперсии, точ­

 

 

Т а б л и ц а 3.3

нее стандартные

отклонения,

 

 

 

получаемых результатов.

 

 

 

 

 

Стандартное отклонение, вы­

 

М ет р ц КСД

С тан дарт­

численное

после

1000

бросков

 

ное о т ­

 

 

 

клонение

чистого случайного

поиска, со­

 

 

 

 

 

ставляет

123,1.

Выберем пере­

 

 

 

 

64,46

становку

р0 в качестве

центра

Транспозиционная

 

окрестности и рассмотрим выбор­

Алфавитная

 

 

3,27

ки в 1000 значений функционала

Цепная

 

153,16

Инверсная

 

135,30

(3.38) при

условии,

что переста­

Лексикографическая

 

3,64

новки выбираются из шара ради­

 

 

 

 

 

уса пять. В табл. 3.3 приведены

 

 

Т а б л и ц а

3.4

 

 

 

 

 

 

 

 

 

 

 

Значения дисперсии при радиусах шара

 

М етрика

50

25

10

5

3

2

1

 

 

Цепная

 

135,25

134,90

136,85

151,80

157,93

153,74

0,00

Лексикографиче­

4,09

3,55

2,96

3,69

3,01

1,00

1,31.

ская

 

Алфавитная

134,31

32,70

8,36

3,08

2,79

0,82

0,41

Инверсная

 

134,39

133,58

143,01

137,97

136,38

138,98

136,36

Транспозиционная

120,17

105,37

79,54

63,85

50,63

45,09

40,80

7*

90

стандартные отклонения полученных выборок при различных мет­ ризациях пространства перестановок.

В табл. 3.4 иллюстрируется зависимость дисперсии от радиуса шара. Центр шара, по-прежнему, находится в перестановке р0, а выборочные дисперсии определяются на основе 1000 вычислений значений функционала (3.38).

§ 4. Метод сужающихся окрестностей

Рассмотрим функционалы, заданные на множестве перестано* вок, для которых их значения распределены по нормальному за­ кону (3.2). Пусть лучшее из полученных значений функционала равно h. Тогда вероятность появления новых улучшений определя­

ется как

А

или с учетом обозначения (ЗЛО)

(3.62)

Вероятность РЛ появления новых улучшений является лучшей характеристикой любого стохастического метода поиска минимума функционала f.

Как показано в предыдущих параграфах, при выборе переста­ новок, на которых рассматривается функционал /, из различных щаров в пространстве перестановок происходят изменения в па­ раметрах т и о закона распределения.

В связи с этим изменяется и вероятность (3.62). Характер этих изменений является основным критерием при определении направ­ ления поиска в предлагаемом методеминимизации, который мы Назвали методом сужающихся окрестностей.

Метод сужающихся окрестностей сводится к проведению несколь­ ких режимов поиска. Первый режим представляет собой «слепой* случайный поиск. Произвольным образом генерируются перестанов­ ки р из пространства П и вычисляются значения функционала f(p). Этот процесс продолжается определенное число шагов, после чего выбирается лучшее значение f* функционала / и соответствую­ щая ему перестановка р*. Все полученные значения функционала рассматриваются как наблюденные значения случайной величиньц

По ним подсчитываются выборочное математическое ожидание т

и выборочная дисперсия а2. Затем, пользуясь гипотезой о характере района распределения, вычисляем вероятность P f получить значение функционала лучшее, чем f*. Перед первым прохождением режима по­

лагаем Р = 0. Если окажется, что Р >• Р, то полагаем Р равным

Р, а режим повторяем. Если же, напротив, Р < Р, то происходит переход к следующему режиму.

100

Соседние файлы в папке книги