- •А.Ю. Крюков, Б.Ф. Потапов
- •Крюков, А.Ю.
- •СОДЕРЖАНИЕ
- •ПРЕДИСЛОВИЕ
- •ВВЕДЕНИЕ
- •1.1. СУЩНОСТЬ И НАЗНАЧЕНИЕ МОДЕЛИРОВАНИЯ
- •1.1.1. Понятие о моделировании и свойства моделей
- •1.1.2. Цели моделирования
- •1.1.3. Виды моделирования и классификация моделей
- •1.2.1. Общие положения и основные определения
- •1.2.2. Структура математической модели и ее построение
- •1.2.3. Иерархия математических моделей
- •1.2.5. Классификация математических моделей
- •1.2.6. Геометрическое представление математических моделей
- •1.3. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
- •2.1. МОДЕЛИ МИКРОУРОВНЯ
- •2.2. МОДЕЛИ МАКРОУРОВНЯ
- •2.2.1. Общая характеристика моделей, их структура и сущность
- •1. Компонентные уравнения
- •2. Топологические уравнения
- •Компонентные и топологические уравнения электрической системы
- •2.2.5. Задания для самостоятельной работы
- •2.3. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
- •3.2.1. Общие принципы моделирования полей
- •3.2.2. Особенности построения моделей
- •3.2.3. Модели стационарных полей
- •3.2.4. Модели нестационарных полей
- •3.2.7. Задание для самостоятельной работы
- •3.3. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
- •4.1.1. Надежность объектов как комплексное свойство
- •4.1.2. Классификация отказов и временные понятия
- •4.3.1. Основные понятия, определения и положения
- •4.3.2. Основные характеристики случайных величин
- •4.4. ПОКАЗАТЕЛИ НАДЕЖНОСТИ
- •4.4.1. Показатели безотказности
- •4.6.1. Общая характеристика и виды моделей
- •4.6.2. Распределения, используемые в теории надежности
- •4.6.3. Композиция законов распределения
- •4.6.4. Задание для самостоятельной работы
- •4.7 ПОТОКИ ОТКАЗОВ И ВОССТАНОВЛЕНИЙ
- •4.8. РАСЧЕТ НАДЕЖНОСТИ ТЕХНИЧЕСКИХ СИСТЕМ
- •4.8.1. Общие положения
- •4.8.2. Модели параметрических отказов
- •5.1. ОСНОВЫ ТЕОРИИ ГРАФОВ И СЕТЕВЫЕ МОДЕЛИ
- •5.1.1. Общие замечания, основные понятия и определения
- •5.1.2. Решение задачи о максимальном потоке
- •5.1.3. Потоки минимальной стоимости
- •5.1.4. Практические примеры сетевых задач
- •5.1.5. Некоторые обобщения по сетевым задачам
- •5.1.6. Альтернативные методы решения сетевых задач
- •5.2.1. Основные положения
- •5.2.2. Структура принятия решения
- •5.2.4. Пример применения классических критериев
- •6.1.1. Постановка задач оптимизации и критерии
- •оптимальности
- •6.1.2. Многокритериальные задачи оптимизации
- •6.1.3. Классификация методов оптимизации
- •6.2. РЕГУЛЯРНЫЕ МЕТОДЫ ОПТИМИЗАЦИИ
- •6.2.1. Методы математического анализа
- •6.2.2. Понятие о вариационном исчислении
- •6.2.3. Принцип максимума Понтрягина
- •6.2.4. Метод динамического программирования
- •6.3. ПРЯМЫЕ МЕТОДЫ ОПТИМИЗАЦИИ
- •6.3.2. Минимаксные стратегии одномерного поиска
- •6.3.4. Многомерные методы безусловной оптимизации
- •6.3.7. Заключение по прямым методам оптимизации
- •7 1. ОБЩИЕ ПОЛОЖЕНИЯ
- •ЗАКЛЮЧЕНИЕ
- •Учебное издание
- •Учебное пособие
Функционалы могут быть заданы в параметрической фор ме I{W(x), Z(x)). Наконец, могут быть рассмотрены задачи с под вижными границами, когда точки а и b не заданы точно, а лежат на некоторых поверхностях, и некоторые иные задачи.
Сложность вариационного исчисления, да и ряда других примыкающих математических дисциплин, состоит в том, что функции, сопоставляющие аргумент с некоторым значением, сами рассматриваются как аргументы других отображений - функционалов. При этом характер зависимости, которую функ ция представляет, не является существенным. Учитывая эту сложность, функции, рассматриваемые как аргументы некоторо го функционала, называют точками. Это аналогично тому, как мы часто называем точкой аргумент действительной функции действительного переменного.
6.2.3. Принцип максимума Понтрягина
Данный метод используется при решении задач, для кото рых непригодны классические методы вариационного исчисле ния. В частности, применяется для отыскания оптимальных ре шений в классе функций, имеющих бесконечные производные, а также точки разрыва первого рода. Такие функции представ ляют значительный практический интерес для задач автомати ческого регулирования и управления процессами и объектами, в частности, при поиске решений, оптимальных по быстродей ствию. Для уяснения областей практического приложения мето да введем некоторые понятия и определения.
Управляемый объект - это некоторая машина, модель, прибор, процесс, конструкция и т.п., снабженная «рулями». При этом под «рулем» понимается любой фактор, дающий воз можность влиять на движение объекта.
Имея дело с управляемым объектом, мы всегда стремимся так манипулировать «рулями», чтобы, исходя из определенного
начального состояния, достичь некоторого желаемого состоя ния, т.е. реализовать цель управления. Если, скажем, речь идет о запуске спутника, то нужно рассчитать режим работы двига телей ракеты-носителя, который обеспечит доставку спутника на желаемую орбиту.
Как правило, существует бесконечное число способов управлять объектом так, чтобы добиться желаемого результата. В связи с этим и возникает задача не просто как-то реализовать цель управления, а найти тот способ управления, который в оп ределенном смысле является наилучшим, оптимальным. Такова в общих чертах задача оптимального управления. Перейдем к ее математическому описанию (рис. 6 .7).
Будем рассматривать объ- |
щ |
||
ект, состояние которого в фикси- |
|
||
рованный момент времени описы |
|
||
вается набором из к чисел JCь..., х*- |
|
||
фазовых |
координат. |
Движение |
|
объекта проявляется в том, что его |
|
||
фазовые |
координаты меняются |
Рис. 6.7. К постановке |
|
стечением времени |
т.е. фазовый |
задач оптимального |
|
вектор является вектор-функцией |
управления |
||
независимого переменного t. |
|
Предположим, что положение «рулей» описывается в ка
ждый момент времени набором из т чисел и\9 |
ит ~ управ |
ляющих параметров, составляющих вектор |
управления |
и = (z/j, ..., ит). Манипулирование «рулями» означает выбор век тор-функции u(t\ называемой управлением.
В реальном объекте «рули» не могут занимать совершен но произвольные положения из-за конструктивных особенно стей и других условий. Это значит, что в пространстве В? управляющих параметров выделено некоторое множество U,
называемое областью управления.
Будем предполагать, что закон движения представляет со бой систему дифференциальных уравнений
dxx |
_ |
|
|
|
1 |
(6.25) |
|
I t |
|
- f\(t>x\>X2’—>Xk’U\’U2’—>Um) |
|
|
|
||
dx |
= f k(t,xl,X2,"--,Xk,4,U2,....,Um), |
|
|
- £ |
|
где (x н и - функции времени: хк= xk(t), ит= u„,{t)).
В векторной форме систему (6.25) можно записать так:
|
X\ |
|
" . |
ft |
dx |
X2 |
; u = |
« 2 |
Л |
|
|
(6.26) |
||
j f 5 ^ 5 , * |
|
; / = |
||
at |
|
|
|
|
|
Xk |
|
« ш |
/ * |
Решение системы (6.25) при заданном управлении u(t), как и определяемую этим решением кривую в фазовом пространст ве, называют фазовой траекторией, соответствующей этому управлению. Начальные условия в задачах оптимального управ ления часто называют начальным состоянием.
Объект, математическая модель которого задается сис темой уравнений (6.36), является управляемым, что выражается в следующем. Если выбрано (допустимое) управление и(/),
/G [t\, ti] то подстановка его в (6.25) приводит к нормальной
системе обыкновенных дифференциальных уравнений, записан ной в векторной форме (6.26).
Таким образом, задача оптимального управления состоит в том, чтобы найти такое управление u{t), реализующее цель и удовлетворяющее уравнениям (6.36), для которого функционал
h |
|
I(x)= \f(x,u,t)dt |
(6.27) |
'l |
|
принимает наименьшее возможное значение.
При этом управление и(/) называют оптимальным управле нием, соответствующую фазовую траекторию х (/) - оптимальной траекторией, а процесс (x(l), u(t)) —оптимальным процессом.
В основу метода решения задач по определению опти мальных траекторий может быть положен так называемый принцип максимума, разработанный Л.С. Понтрягиным с со трудниками.
Рассмотрим принцип максимума для задачи оптимального управления в предположении, что фазовые ограничения отсут
ствуют, т.е. для системы с законом движения |
|
|
x = f { x , u ), |
(6.28) |
|
где фазовый вектор x(t) = (дт|(г),. |
х„(/))т может принимать лю |
|
бые значения. |
|
|
Считаем, что на вектор управления u{t) наложены ограни |
||
чения |
|
|
"(О е U, t е |
[ б, *2], |
(6.29) |
где U ~ произвольное множество. Управления, удовлетворяю щие (6.29), будем называть допустимыми.
Представленная формулировка отличается от формули ровки задач классического вариационного исчисления следую щими особенностями:
1) в качестве независимой переменной используется вре мя t, что четко определяет ориентацию метода на решение ди намических задач;
2) для обозначения фазовых координат вместо W в (6.18) вводятся переменные JC(0 , а вместо производных фазовых коор
динат W - управления и (щ, иг,-, ит).
Один из методов реализации принципа максимума для ав тономной системы управления заключается в том, что с помо щью ряда преобразований для решения задачи вводится система дифференциальных уравнений:
(6.30)
где % - вспомогательные функции, с помощью которых можно определить вектор оптимальных управлений u(t); Н - функция Понтрягина, определяемая из выражения
# (¥ ,* ,« ) = £ % / ( * ,« ) • |
(6-31) |
/=i
Согласно принципу максимума, оптимальное управление должно доставлять максимум функции Н.
Обозначим и*(/), x*(t) и xP*(t) оптимальное управление, оптимальную фазовую траекторию и вектор вспомогательных функций, соответствующий оптимальному управлению и, сле довательно, максимальному значению Н* функции Понтрягина
соответственно. |
|
|
|
|
|
U, |
Из автономности |
системы |
|||
|
(6.28) следует, |
что |
свойства |
||
|
управлений |
не |
изменяются |
при |
|
|
сдвиге вдоль оси t (рис. 6 .8). По |
||||
|
этому мы можем из оптимальных |
||||
О t\t\+h t2 t2+h^ |
управлений |
выбирать такое, |
для |
||
которого t\ |
фиксированно, |
а /2 |
|||
Рис. 6.8. Иллюстрация |
свободно меняется. |
|
|
||
свойства автономности |
Рассмотрим пример (задачу |
||||
|
оптимального |
быстродействия) |
|||
|
для системы |
|
|
|
|
|
= х2+ 1 |
|
|
(6.32) |
|
х2 = - х + и |
|
|
|||
|
|
|
|
||
с областью управления |
|
|
|
|
|
U= {и е Л : |ц|< 1}, |
|
|
(6.32, а) |
||
начальным состоянием |
|
|
|
|
|
*i(M |
=x2(/i) = 0 |
|
|
(6.32, б) |
|
и конечным состоянием |
|
|
|
|
|
xi(h) = 0, x2(t2) = -4. |
|
|
(6.32, в) |
Составим функцию Н : |
|
|
|
Н= %(*;, + 1) + Ч^-*, + иу |
(6.33) |
||
Для сопряженных переменных 'Р, и |
с учетом (6.43) по- |
||
лучаем: |
|
|
|
|
|
|
(6.34) |
Согласно принципу максимума, с учетом (6.32, а), (6.32, б) |
|||
и (6.32, в) имеем: |
|
|
|
Н* = % - (х2+ 1) - |
• дс, + |
• signT*. |
(6.35) |
Решая систему (6.34), получим: |
|
|
|
'p 2 = Csin(/-C2), |
|
(6.36) |
|
где С\ > О, С2 - постоянные интегрирования. |
|
||
Значит, оптимальное управление имеет вид |
|
||
и {t) = s ig n ^ /) = signsin(/-C2) . |
(6.37) |
Из представления (6.37) вытекает следующее:
1) при оптимальном процессе управление в любой момент времени принимает одно из своих предельных значений: 1 или - 1; 2 ) переход от одного значения к другому, или, как гово рят, переключение, происходит через интервал времени, рав
ный к. Исключение может составлять только первый участок движения: первое переключение определяется значением посто янной С\ и может произойти через интервал времени, меньший п.
Эти выводы фактически исчерпывают ту информацию, которую можно получить о структуре оптимального управления из принципа максимума. Для полного решения задачи необхо димо найти постоянные С\ и С2, а для этого нужны, например, начальные условия для функций ¥,(/). Но эти условия не могут задаваться произвольно, так как однозначно определяют функ цию У2(/) и, следовательно, управление u(t) = signT2(/) и фазо вую траекторию x(t). Однако процесс (x(l), и(/)) должен удовле
творять также краевым условиям задачи, которые еще не были учтены. Таким образом, начальные условия для Ч'Х/) должны вытекать из краевых условий задачи.
Завершить решение задачи можно следующим образом. Найдем совокупность траекторий, соответствующих постоян ным управлениям, равным предельным значениям ±1. Очевид но, что искомая траектория состоит из дуг траекторий, соответ ствующих этим постоянным управлениям. При этом дуги траек торий стыкуются так, чтобы удовлетворялись краевые условия. Тогда все параметры оптимального процесса будут полностью определены.
Итак, найдем траектории, соответствующие управлению и = 1 и м= -1. Для этого в систему (6.32) подставим эти значе ния. Интегрируя и учитывая краевые условия, приходим к урав нению окружностей с центрами в точках Oi(l, - 1) и Ог(-1, - 1):
(х,- 1 ) 2 |
+ (х2 |
+ 1)2 |
= 2 , |
|
(6.38) |
(*1 + 1)2 |
+ (*2 |
+ 1)2 |
|
= 2, |
(6.39) |
(х, - I )2 |
+ (х2 +1)2 |
|
=10, |
(6.40) |
|
(JC, +1)2 |
+ (х2 +1)2 |
|
= 10. |
(6.41) |
Рис. 6.9. Оптимальная траектория движения
Анализируя начальные ус ловия и возможные моменты пе реключения управлений (с и = - 1 на и = 1 и наоборот), можно по лучить оптимальную траекторию движения точки, представленную на рис. 6.9 жирной линией.
Приведенный пример пока зывает, какие трудности возни кают в случае применения мето да, базирующегося на принципе максимума. Главная трудность состоит в том, что возникает