Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Решение некоторых многоэкстремальных задач методом сужающихся окрестностей

..pdf

Скачиваний:

Добавлен:

12.11.2023

Размер:

12.71 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 2110 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

Рис. 24.

Т а б л и ц а 3.2

Вид метрики	Н аименьш ее	Н аибольш ее	а 3	Среднее
Вид метрики	значение ос	значение 3	2	значение
	значение ос	значение 3	2	значение
Транспозиционная	и з	350,41	175,77	108,43
Алфавитная	5,64	23,08	14,36	11,18
Цепная	9,85	659,78	334,82	248,07
Инверсная	5,39	734,26	369,82	267,64
Лексикографическая	5,73	14,75	10,24	9,81

функционала при этом равно 267,64. В случае лексикографической
метрики получаем картину,	распределения, представленную на
рис. 24. Здесь математическое	ожидание равно 9,81. На рис. 25

и 26 показаны гистограммы для случаев алфавитной и цепной метрик

соответственно. Средние значения	g (р) при	этом	равны 11,18
и 248, 07. Результаты исследования	сведены в	табл.	3.2.

Представляется, что теоремы о сдвиге математического ожида ния можно значительно обобщить. Интуитивно ясно, что при любом законе распределения его усечение на интервал (о, Ь) будет иметь меньшее математическое ожидание М, чем среднее значение т основного закона, если середина интервала (а, в) сдвинута влево относительно т.

Однако строгое доказательство этого утверждения пока удалось провести лишь для нормального закона распределения, а в ослаб

ленном виде для логнорд>ального.
§ 3. Уменьшение дисперсии
Рассмотрим, какие изменения происходят с дисперсией					слу
чайной величины при	переходе		от нормального	распределения
к его усечению на некоторый интервал.				закону	(3.2),
Пусть случайная величина		г	распределена по
а случайная величина	у — по	закону (3.5). Как		известно,	дис

персия величины г равна о3. Вычислим дисперсию величины у.

По	определению		d (у) =	((У -	(у)?) - (у2) - (у)2.		(3.39)
			d (у) =	((У -	(у)?) - (у2) - (у)2.		(3.39)
Из	соотношения		(3.18)	следует
	(у)2 =		т2 +	У2 am	ехр (— Л2) — ехр (— В2)	,
				Уп"	Е(В)— Е(А)	"т*
	+	а2 .	ехр (— 24») — 2exp (— 42 — В*)-+ exp (— 2В2)				(3.40)
	+	2п			[£ (В) — Е (4)]2		(3.40)
где числа Л и В определяются по формуле (3.16),
	Второй момент случайной величины у определим как
	«•> -	I л и » W -

Для вычисления этого интеграла воспользуемся заменой перемен
ной (3.14). Получим
		в
	(У2) — уЛ - J (У~2 аи + т)2ехр (— и2) du.			(3.41)
Учитывая	соотношение (3.16),		находим
	2	в	в
(&) =	р	1 “2 ехР ( ~ “а) du + 2^ - - ° т j и ехр (— (и2) du -f

				au =	?2 ■( ы2 exp (— u2)du -+•
					VnP {
+	[exp ( - A2) -			exp ( -	В2)] + Л ? - [ Е ( В ) - Е (A)].				(3.42)
V n P
Необходимо вычислить
			a	и2 exp (— и2) du.
			У	и2 exp (— и2) du.
			У
Воспользуемся интегрированием					по	частям:
в								В
]* и2 exp (— u?)du = --- Y u ехР (— иа) \|5 + *4“ I ехР									“
3								Л
=	Л е х р ( - 4 ^ - Д е х р ( - В2) +					/ я . [£ (fl) _ Е (Д)]>			(3.43)
Из соотношений		(3.42)	и (3.43) получаем
	<у‘> - ° ’ +		у х	А ехр (— Л2) — В ехр (— В2)
	<у‘> - ° ’ +		у х		Е ( В ) - Е		(Л)
	,	V 2 a m	ехр (— А 2) —			ехр (— В 2)		, тЛ	(3.44)
	+ _ 7 й			Е ( В ) - Е ( А ) ,				+ т '	(3.44)
	+ _ 7 й			Е ( В ) - Е ( А ) ,				+ т '
Вследствие формул (3.39), (3.40) и (3.44) находим
d(y) = a2 +			а2	А ехр (— Л2) — В			ехр (— В 2)
			■утг	'	Е ( В ) - Е ( А )
		ехр (— 2Л2) — 2 ехр (— А 2 — В 2)					+	ехр (— 2В2)	(3.45)
	2я			( Е ( Б ) - Е ( А ) I2					(3.45)
	2я			( Е ( Б ) - Е ( А ) I2
Теорема	3.3.	Дисперсия случайной величины у, распределен

ной по закону (3.5), не превосходит дисперсии случайной величины

г, распределенной по нормальному закону				(3.2).			величины	г
Д о к а з а т е л ь с т в о .			Поскольку	дисперсия
равняется о2, из формулы (3.45) следует, что						для доказательства
теоремы достаточно		проверить справедливость				неравенства
	о2	А ехр (— <42) — В ехр (— В2)				^
	W		Е ( В ) - Е ( А )			<
а 2	ехр (— 2А 2) — 2 ехр (— А 2 — В2) +					ехр (— 2В2)
2я			[ Е (В) — Е (Л)]2
Поскольку Е (х)	монотонно		возрастающая		функция		и- В >	А,
это неравенство	эквивалентно следующему:
	А ехр (— А2) — В ехр (— В2) <
ехр (— 2Л2) — 2 ехр (— А 2 — В2) +					ехр (— 2В2)		(3.46)
^		2 / i t	[ Е (В) — Е (Л)]

Пользуясь определением (3.10) функции Я (ж), переписываем нера венство (3.46) в виде

в
(е~А‘ — е~в‘)2 — 2 (Ае~А‘— Ве~т) j er-*'dx> 0.	(3.47)

Таким образом, доказательство теоремы сведено к доказательству

неравенства	(3.47).
Рассмотрим прежде всего случай, когда
	В > А > 0.	(3.48)
Введем функцию
	в
и (А,	В) = (е~Аг — e r * f — 2 (Ae~At — Ве~В!) J е~хЧх.	(3.49)
	А

Дифференцируя эту функцию по В при фиксированном Л, полу чаем

dUав = ^Ве-в*(егА*— ег~В2)— 2 (АегАг — Вег~вг)етвг —

— 2e-B*(2B*— \ ) \ e - x'dx.

Разделив правую часть этого равенства на положительную величину 2е~в\ получим новую функцию

		в
v (А, В) = 2Ве~Аг— Вег* — Ае~А‘ — (2В2— 1) J e~x,dx,
		А
причем знаки функций о (Л, В) и ди^	совпадают.
Дифференцируя функцию v (А, В) по	В при	фиксированном
А, находим
дх>(*'в В) = 2 (е~А' — 2В J <r-x‘dx^ .
Рассмотрим функцию
в
w (Л, В) = е~А*— 2В j e~xtdx,
А
знак которой совпадает со знаком функции	Art t А	Л )
знак которой совпадает со знаком функции	—	•

Легко видеть, что при В > 0 она является монотонно убываю щей функцией от В. При этом

w (Л, Л) = erAi > 0,	(3.50)
lim w (Л, В) = — оо.	(3.51)
В-+ оо

Вследствие непрерывности функции а» (Л, В) из формул (3.50)

и (3.51) следует существование числа В0 такого, что
w{A,	В0) =	0,
причем В0 > А.	В0 функция v(A, В), как функция
Следовательно, при А < В <
от В, монотонно возрастает, а при В >			В0 она монотонно убывает,
	поскольку ее производная меня
	ет знак с плюса на минус.
		Нетрудно			видеть, что
				v(A,	Л) =	0,
			lim v(A,		В) = — оо.
			В-*-со
	Поэтому функция v {А, В)						име
	ет	вид,		представленный			на
	рис.		27.	образом,		существует
		Таким
Рис. 27.	точка Вг такая, что при А <						В <
	<	Bt	выполнено			неравенство
	v (А, В )> 0 , а при В >• Вх спра

ведливо о (Л, В) < 0.			Поскольку		знак функции v(A, В) совпадает
со знаком производной от функции и (А, В) по В, то и (А, В),							как
функция от В,		монотонно возрастает при В <				Вх и монотонно убы
вает при В >		В1# Значит, минимальные значения функция и (А, В)
принимает при В = Л и В = -f					оо.
Поскольку		и (А, А) = 0, для доказательства неравенства (3.47)
при условии		(3.48)	достаточно		проверить	справедливость	не
равенства				И т«(Л ,	В )> 0 .	(3.52)

				В-+СО
Вследствие	определения			(3.49)	со

		lim и (А,		В) = е -24*— 2Ае~А‘ [ e~x'dx.
		В-*°°			А
Рассмотрим	функцию
		q (A )~ e ~ * — 2A $tr*dx.				(3.53)

Нетрудно видеть, что знак функции q (Л) совпадает со знаком пре дыдущего выражения. Имеем

- Т Г 1 ------	(3.54)
- Т Г 1 ------
Следовательно, функция q (Л) монотонно	убывает. Покажем,
что	(3.55)
Н т ?(Л) = 0.	(3.55)
Л-*оо

Условие	(3.56)
lim e~Af = 0

А-+оо

очевидно, а предел второго слагаемого в правой части (3.53) вы

числим	G использованием		правила		Лопиталя
		оо
	со	f	e~*'dx
lim 2А f e-^dx =		lim - — -----=		lim ~		e . - =	lim 2A2e^A* = 0.
A -¥OO	j	/4-*00	*	•	Л-*оо	* ■	/4-VOO
	A		2 A			2 A 2	(3.57)
							(3.57)

Из формул (3.56) и (3.57) вытекает соотношение (3.55), а из (3.54) и (3.55) следует, что функция q(A) всюду неотрицательна. Поэтому справедливо неравенство (3.52), а значит и основное нера венство (3.47).

Напомним, что проведенное доказательство неравенства (3.47) опирается на неравенство (3.48).

Рассмотрим случай, когда
5 > 0 > А	(3.58)

При этом неравенство (3.47) является очевидным. В самом деле, если верно (3.58), то в левую часть неравенства (3.46) входит отри цательная величина, а в правую — положительная. Между тем неравенства (3.46) и (3.47) эквивалентны.

Наконец, рассмотрим ситуацию, когда

А < В <		0.		(3.59)
Вследствие четности функции е-* имеем
в	— А
J er-^dx =	\|	e~x'dx.		(3.60)
А
С учетом соотношений (3.49) и (3.60) находим
и (А, В) = [е—<—«* —			—
	— А
— 2 ((— В) e-t-BY — (— А) е_(_'4)!\|	J	e~x‘dx = u(— B, — А).		(3.61)
	—в

Неравенство (3.59) можно переписать в виде

— А > — В > 0.

Из этого неравенства и соотношения (3.61) еледует неравенство и (— В, — Л )> 0.

Теорема доказана.

Сделаем некоторые замечания по поводу теоремы 3.3. Утверждается, что дисперсия величины у не превосходит дис

персии величины г. В случае, когда интервал (а,Ь) конечен, из струк

9—961

туры доказательства теоремы 3.3 следует, что между дисперсиями имеем строгое неравенство. Действительно, функция ди (А, В)/дВ на некотором интервале строго положительна. Значит, функция f(A, В) строго монотонно возрастает по переменной В при условии, что в начале интервала она равна нулю. Следовательно, неравенство (3.47) можно заменить следующим:

{е~аг— е~ь*)2— 2 (ае~а2— be~b°) Це~хЧх > 0.

Интуитивно ясно, что уменьшение дисперсии будет происходить при усечении любого закона распределения. Однако получить строгое доказательство этого факта нам пока удалось только для нормального закона.

Факт уменьшения дисперсии известен также и для следующего вырожденного случая. Как известно, для случайной величины

распределенной по	закону	Коши
о (2 ) =	Р II <	z) = -J- +	arctg ■г-а — ,

дисперсия не существует. Между тем, для усеченного закона Коши дисперсия является конечной величиной (см., например, Г251), Большое количество просчитанных примеров, а также некого* рые интуитивные соображения дают возможность предположить, что справедливо следующее утверждение, более сильное, чем тео

рема 3.3.			величина,		распределенная, по				закону
Пусть tji — случайная			величина,		распределенная, по				закону
	0					если г >		а19
Pi (г) =		f e x p f - ^ f l dxt				если ах < г <			blf
	VbioPi I		У[	\ V 2 a )	J
где					,	если г >		blt
где
а у2— случайная		величина,		распределенная		по закону
	0				,	если	г <	а2,
Р*{г)	7Ё	р- Ь [ - ( 1^			dx,	если	а2 <	г <	62,
	7Ё	р- Ь [ - ( 1^					г >	Ь2,
где	1				,	если	г >	Ь2,
где

Если выполнено неравенство ах < о, С 6, < Ьъ дисперсия случай ной величины у2 меньше, чем дисперсия случайной величины уг.

Иными словами, дисперсия уменьшается не только при переходе от основного закона распределения к его усечению, но и при пере ходе от одного усеченного закона распределения к другому, если интервал, на котором сосредотачивается закон, уменьшается.

К сожалению,	доказательство этого утверждения, сводящееся
к доказательству	неравенства

„Г Л ехр (— А\) — В2ехр (— В\)

2 У п [

Е (Bj) — Е (Л*)

^Г ехр (— Al) — ехр (— в|) I2

<l Е ( В 0 - Е ( Л 0

где

Е(ВО -В (АО

Г ехр (— А\) — ехр (— В\)	]2	J •
JЕ ( В , ) - Е ( А[1)		J •

Л	_ аг— т t D			— т	л	а 2 — т	р ^2 — т
Л	~	V2 а ’	D l~~	V2o '	2 “	У2о ’	2 ~ У Т ~
нам	не	удалось	провести.

Проиллюстрируем уменьшение дисперсии следующим численным

примером. В	качестве модельного выберем функционал (3.38),
в котором п =	84, а числа М{ заданы в табл. 3.1.

Проведем анализ значений функционала (3.38) в соответствии со схемой, приведенной в § 2 данной главы. При этом будем вычис

лять выборочные дисперсии, точ								Т а б л и ц а 3.3
нее стандартные			отклонения,
получаемых результатов.
Стандартное отклонение, вы						М ет р ц КСД		С тан дарт
численное	после	1000		бросков				ное о т
								клонение
чистого случайного			поиска, со
ставляет	123,1.	Выберем пере							64,46
становку	р0 в качестве			центра	Транспозиционная
окрестности и рассмотрим выбор					Алфавитная				3,27
ки в 1000 значений функционала					Цепная			153,16
					Инверсная			135,30
(3.38) при	условии,		что переста		Лексикографическая				3,64
новки выбираются из шара ради
уса пять. В табл. 3.3 приведены							Т а б л и ц а		3.4

				Значения дисперсии при радиусах шара
М етрика		50		25	10	5	3	2	1

Цепная		135,25		134,90	136,85	151,80	157,93	153,74	0,00
Лексикографиче		4,09		3,55	2,96	3,69	3,01	1,00	1,31.
ская
Алфавитная		134,31		32,70	8,36	3,08	2,79	0,82	0,41
Инверсная		134,39		133,58	143,01	137,97	136,38	138,98	136,36
Транспозиционная		120,17		105,37	79,54	63,85	50,63	45,09	40,80

стандартные отклонения полученных выборок при различных мет ризациях пространства перестановок.

В табл. 3.4 иллюстрируется зависимость дисперсии от радиуса шара. Центр шара, по-прежнему, находится в перестановке р0, а выборочные дисперсии определяются на основе 1000 вычислений значений функционала (3.38).

§ 4. Метод сужающихся окрестностей

Рассмотрим функционалы, заданные на множестве перестано* вок, для которых их значения распределены по нормальному за кону (3.2). Пусть лучшее из полученных значений функционала равно h. Тогда вероятность появления новых улучшений определя

ется как

или с учетом обозначения (ЗЛО)

(3.62)

Вероятность РЛ появления новых улучшений является лучшей характеристикой любого стохастического метода поиска минимума функционала f.

Как показано в предыдущих параграфах, при выборе переста новок, на которых рассматривается функционал /, из различных щаров в пространстве перестановок происходят изменения в па раметрах т и о закона распределения.

В связи с этим изменяется и вероятность (3.62). Характер этих изменений является основным критерием при определении направ ления поиска в предлагаемом методеминимизации, который мы Назвали методом сужающихся окрестностей.

Метод сужающихся окрестностей сводится к проведению несколь ких режимов поиска. Первый режим представляет собой «слепой* случайный поиск. Произвольным образом генерируются перестанов ки р из пространства П и вычисляются значения функционала f(p). Этот процесс продолжается определенное число шагов, после чего выбирается лучшее значение f* функционала / и соответствую щая ему перестановка р*. Все полученные значения функционала рассматриваются как наблюденные значения случайной величиньц

По ним подсчитываются выборочное математическое ожидание т

и выборочная дисперсия а2. Затем, пользуясь гипотезой о характере района распределения, вычисляем вероятность P f получить значение функционала лучшее, чем f*. Перед первым прохождением режима по

лагаем Р = 0. Если окажется, что Р >• Р, то полагаем Р равным

Р, а режим повторяем. Если же, напротив, Р < Р, то происходит переход к следующему режиму.

100

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 2110 11 12 13 14 15 16 17 18 19 20 21 > Следующая >>>

Соседние файлы в папке книги