Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическое моделирование процессов в машиностроении..pdf
Скачиваний:
46
Добавлен:
15.11.2022
Размер:
14.87 Mб
Скачать

Функционалы могут быть заданы в параметрической фор­ ме I{W(x), Z(x)). Наконец, могут быть рассмотрены задачи с под­ вижными границами, когда точки а и b не заданы точно, а лежат на некоторых поверхностях, и некоторые иные задачи.

Сложность вариационного исчисления, да и ряда других примыкающих математических дисциплин, состоит в том, что функции, сопоставляющие аргумент с некоторым значением, сами рассматриваются как аргументы других отображений - функционалов. При этом характер зависимости, которую функ­ ция представляет, не является существенным. Учитывая эту сложность, функции, рассматриваемые как аргументы некоторо­ го функционала, называют точками. Это аналогично тому, как мы часто называем точкой аргумент действительной функции действительного переменного.

6.2.3. Принцип максимума Понтрягина

Данный метод используется при решении задач, для кото­ рых непригодны классические методы вариационного исчисле­ ния. В частности, применяется для отыскания оптимальных ре­ шений в классе функций, имеющих бесконечные производные, а также точки разрыва первого рода. Такие функции представ­ ляют значительный практический интерес для задач автомати­ ческого регулирования и управления процессами и объектами, в частности, при поиске решений, оптимальных по быстродей­ ствию. Для уяснения областей практического приложения мето­ да введем некоторые понятия и определения.

Управляемый объект - это некоторая машина, модель, прибор, процесс, конструкция и т.п., снабженная «рулями». При этом под «рулем» понимается любой фактор, дающий воз­ можность влиять на движение объекта.

Имея дело с управляемым объектом, мы всегда стремимся так манипулировать «рулями», чтобы, исходя из определенного

начального состояния, достичь некоторого желаемого состоя­ ния, т.е. реализовать цель управления. Если, скажем, речь идет о запуске спутника, то нужно рассчитать режим работы двига­ телей ракеты-носителя, который обеспечит доставку спутника на желаемую орбиту.

Как правило, существует бесконечное число способов управлять объектом так, чтобы добиться желаемого результата. В связи с этим и возникает задача не просто как-то реализовать цель управления, а найти тот способ управления, который в оп­ ределенном смысле является наилучшим, оптимальным. Такова в общих чертах задача оптимального управления. Перейдем к ее математическому описанию (рис. 6 .7).

Будем рассматривать объ-

щ

ект, состояние которого в фикси-

 

рованный момент времени описы­

 

вается набором из к чисел JCь..., х*-

 

фазовых

координат.

Движение

 

объекта проявляется в том, что его

 

фазовые

координаты меняются

Рис. 6.7. К постановке

стечением времени

т.е. фазовый

задач оптимального

вектор является вектор-функцией

управления

независимого переменного t.

 

Предположим, что положение «рулей» описывается в ка­

ждый момент времени набором из т чисел и\9

ит ~ управ­

ляющих параметров, составляющих вектор

управления

и = (z/j, ..., ит). Манипулирование «рулями» означает выбор век­ тор-функции u(t\ называемой управлением.

В реальном объекте «рули» не могут занимать совершен­ но произвольные положения из-за конструктивных особенно­ стей и других условий. Это значит, что в пространстве В? управляющих параметров выделено некоторое множество U,

называемое областью управления.

Будем предполагать, что закон движения представляет со­ бой систему дифференциальных уравнений

dxx

_

 

 

1

(6.25)

I t

 

- f\(t>x\>X2’—>Xk’U\’U2’—>Um)

 

 

dx

= f k(t,xl,X2,"--,Xk,4,U2,....,Um),

 

- £

 

где (x н и - функции времени: хк= xk(t), ит= u„,{t)).

В векторной форме систему (6.25) можно записать так:

 

X\

 

" .

ft

dx

X2

; u =

« 2

Л

 

 

(6.26)

j f 5 ^ 5 , *

 

; / =

at

 

 

 

 

 

Xk

 

« ш

/ *

Решение системы (6.25) при заданном управлении u(t), как и определяемую этим решением кривую в фазовом пространст­ ве, называют фазовой траекторией, соответствующей этому управлению. Начальные условия в задачах оптимального управ­ ления часто называют начальным состоянием.

Объект, математическая модель которого задается сис­ темой уравнений (6.36), является управляемым, что выражается в следующем. Если выбрано (допустимое) управление и(/),

/G [t\, ti] то подстановка его в (6.25) приводит к нормальной

системе обыкновенных дифференциальных уравнений, записан­ ной в векторной форме (6.26).

Таким образом, задача оптимального управления состоит в том, чтобы найти такое управление u{t), реализующее цель и удовлетворяющее уравнениям (6.36), для которого функционал

h

 

I(x)= \f(x,u,t)dt

(6.27)

'l

 

принимает наименьшее возможное значение.

При этом управление и(/) называют оптимальным управле­ нием, соответствующую фазовую траекторию х (/) - оптимальной траекторией, а процесс (x(l), u(t)) —оптимальным процессом.

В основу метода решения задач по определению опти­ мальных траекторий может быть положен так называемый принцип максимума, разработанный Л.С. Понтрягиным с со­ трудниками.

Рассмотрим принцип максимума для задачи оптимального управления в предположении, что фазовые ограничения отсут­

ствуют, т.е. для системы с законом движения

 

x = f { x , u ),

(6.28)

где фазовый вектор x(t) = (дт|(г),.

х„(/))т может принимать лю­

бые значения.

 

 

Считаем, что на вектор управления u{t) наложены ограни­

чения

 

 

"(О е U, t е

[ б, *2],

(6.29)

где U ~ произвольное множество. Управления, удовлетворяю­ щие (6.29), будем называть допустимыми.

Представленная формулировка отличается от формули­ ровки задач классического вариационного исчисления следую­ щими особенностями:

1) в качестве независимой переменной используется вре­ мя t, что четко определяет ориентацию метода на решение ди­ намических задач;

2) для обозначения фазовых координат вместо W в (6.18) вводятся переменные JC(0 , а вместо производных фазовых коор­

динат W - управления и (щ, иг,-, ит).

Один из методов реализации принципа максимума для ав­ тономной системы управления заключается в том, что с помо­ щью ряда преобразований для решения задачи вводится система дифференциальных уравнений:

(6.30)

где % - вспомогательные функции, с помощью которых можно определить вектор оптимальных управлений u(t); Н - функция Понтрягина, определяемая из выражения

# (¥ ,* ,« ) = £ % / ( * ,« ) •

(6-31)

/=i

Согласно принципу максимума, оптимальное управление должно доставлять максимум функции Н.

Обозначим и*(/), x*(t) и xP*(t) оптимальное управление, оптимальную фазовую траекторию и вектор вспомогательных функций, соответствующий оптимальному управлению и, сле­ довательно, максимальному значению Н* функции Понтрягина

соответственно.

 

 

 

 

 

U,

Из автономности

системы

 

(6.28) следует,

что

свойства

 

управлений

не

изменяются

при

 

сдвиге вдоль оси t (рис. 6 .8). По­

 

этому мы можем из оптимальных

О t\t\+h t2 t2+h^

управлений

выбирать такое,

для

которого t\

фиксированно,

а /2

Рис. 6.8. Иллюстрация

свободно меняется.

 

 

свойства автономности

Рассмотрим пример (задачу

 

оптимального

быстродействия)

 

для системы

 

 

 

 

 

= х2+ 1

 

 

(6.32)

х2 = - х + и

 

 

 

 

 

 

с областью управления

 

 

 

 

 

U= {и е Л : |ц|< 1},

 

 

(6.32, а)

начальным состоянием

 

 

 

 

 

*i(M

=x2(/i) = 0

 

 

(6.32, б)

и конечным состоянием

 

 

 

 

 

xi(h) = 0, x2(t2) = -4.

 

 

(6.32, в)

Составим функцию Н :

 

 

 

Н= %(*;, + 1) + Ч^-*, + иу

(6.33)

Для сопряженных переменных 'Р, и

с учетом (6.43) по-

лучаем:

 

 

 

 

 

 

(6.34)

Согласно принципу максимума, с учетом (6.32, а), (6.32, б)

и (6.32, в) имеем:

 

 

 

Н* = % - (х2+ 1) -

• дс, +

• signT*.

(6.35)

Решая систему (6.34), получим:

 

 

'p 2 = Csin(/-C2),

 

(6.36)

где С\ > О, С2 - постоянные интегрирования.

 

Значит, оптимальное управление имеет вид

 

и {t) = s ig n ^ /) = signsin(/-C2) .

(6.37)

Из представления (6.37) вытекает следующее:

1) при оптимальном процессе управление в любой момент времени принимает одно из своих предельных значений: 1 или - 1; 2 ) переход от одного значения к другому, или, как гово­ рят, переключение, происходит через интервал времени, рав­

ный к. Исключение может составлять только первый участок движения: первое переключение определяется значением посто­ янной С\ и может произойти через интервал времени, меньший п.

Эти выводы фактически исчерпывают ту информацию, которую можно получить о структуре оптимального управления из принципа максимума. Для полного решения задачи необхо­ димо найти постоянные С\ и С2, а для этого нужны, например, начальные условия для функций ¥,(/). Но эти условия не могут задаваться произвольно, так как однозначно определяют функ­ цию У2(/) и, следовательно, управление u(t) = signT2(/) и фазо­ вую траекторию x(t). Однако процесс (x(l), и(/)) должен удовле­

творять также краевым условиям задачи, которые еще не были учтены. Таким образом, начальные условия для Ч'Х/) должны вытекать из краевых условий задачи.

Завершить решение задачи можно следующим образом. Найдем совокупность траекторий, соответствующих постоян­ ным управлениям, равным предельным значениям ±1. Очевид­ но, что искомая траектория состоит из дуг траекторий, соответ­ ствующих этим постоянным управлениям. При этом дуги траек­ торий стыкуются так, чтобы удовлетворялись краевые условия. Тогда все параметры оптимального процесса будут полностью определены.

Итак, найдем траектории, соответствующие управлению и = 1 и м= -1. Для этого в систему (6.32) подставим эти значе­ ния. Интегрируя и учитывая краевые условия, приходим к урав­ нению окружностей с центрами в точках Oi(l, - 1) и Ог(-1, - 1):

(х,- 1 ) 2

+ (х2

+ 1)2

= 2 ,

 

(6.38)

(*1 + 1)2

+ (*2

+ 1)2

 

= 2,

(6.39)

(х, - I )2

+ (х2 +1)2

 

=10,

(6.40)

(JC, +1)2

+ (х2 +1)2

 

= 10.

(6.41)

Рис. 6.9. Оптимальная траектория движения

Анализируя начальные ус­ ловия и возможные моменты пе­ реключения управлений (с и = - 1 на и = 1 и наоборот), можно по­ лучить оптимальную траекторию движения точки, представленную на рис. 6.9 жирной линией.

Приведенный пример пока­ зывает, какие трудности возни­ кают в случае применения мето­ да, базирующегося на принципе максимума. Главная трудность состоит в том, что возникает

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]