https://electroinfo.net

girniy.ru 1
Управление динамическими системами


Лекция 5

Математическая модель управляемого динамического объекта

В задачах астродинамики и космонавтики управляемым динамическим объектом является космический аппарат (спутник, космический телескоп, межпланетная станция и т.п.), который имеет все характеристики твёрдого тела (масса, момент инерции …). Движение может быть записано в виде системы нелинейных дифференциальных уравнений. Эти уравнения включают в себя компоненты вектора состояния и вешние силы (гравитационные, силы трения, силы светового давления), которые являются функциями компонент вектора состояния. Кроме того, уравнения включают в себя и активные силы (тягу), которые мы называем управлениями. В общем виде, уравнения можно записать так . (5.1)

Используя векторно-матричную запись, эту систему можно записать короче

(5.2)

Как мы уже договорились, в дальнейшем, векторно-матричные величины и функции мы не будем выделять жирным шрифтом.

В общем виде получить решение системы нелинейных уравнений, а значит и отклик управляемого динамического объекта на действия сил управления невозможно. На практике, если такое решение необходимо, прибегают к приёмам численного интегрирования. Однако, в ряде важных частных случаев эту систему можно упростить, и получить все необходимые сведения о требуемом законе управления и об управляемости системы.

Импульсное управление

В астродинамических задачах построения траекторий межпланетных перелётов чаще всего пользуются импульсным воздействием на летательный аппарат. В точке космического пространства, где необходимо изменить величину скорости и/или направления полёта, на короткое время включается двигатель. Продолжительностью работы двигателя можно регулировать степень воздействия на управляемый объект. Поскольку время работы двигателя достаточно мало по сравнению с отрезками времени, за которые изменения координат можно считать существенным, можно говорить о бесконечно малой продолжительности с бесконечно большой амплитудой управляющего воздействия. Другими словами, сигнал управления можно считать -функцией. Пусть Момент будем включать в область определения -функции, так что .


Предположим, что управление линейной системой осуществляется последовательными импульсами в моменты Построим решение системы – фазовую траекторию, составленную из отдельных отрезков ,, и вообще

. (5.3)

Очевидно, что поэтому

(5.4)

Если нас интересуют значения вектора состояния только в моменты действия импульса на управляемый объект, то полагая



получим уравнение дискретной системы

(5.5)


Дискретизация непрерывного управления


Непрерывную систему можно представить дискретной путём квантования непрерывного сигнала управления по времени. Полагая u(t) на отрезке постоянной величиной, равной u(k) получим

(5.6)

Обозначив будем иметь (5.7)



Полученное уравнение по форме совпадает с (5.5) , но входная матрица В(к) в последнем уравнении имеет другой смысл. В данном представлении наименее обоснованным является выбор значения u(k) на каждом элементарном отрезке времени. Потеря точности, которая неизбежно имеет место при замене непрерывно изменяющего сигнала на постоянную величину, чем меньше шаг разбиения фазовой траектории на элементарные отрезки.

Вернёмся к исходному уравнению системы с непрерывным временем:


Пусть на отрезке мы можем заменить производную отношением элементарных приращений. Тогда для малых значений будем иметь . Полученное уравнение есть уравнение дискретной системы. Однако, чтобы привести его к принятой в нашем изложении форме, нужно обозначить

(5.8)

Управление дискретной системой

Рассмотрим дискретную систему



решение которой определяется, как мы видели, выражением



Выберем для вектора состояния систему отсчёта таким образом, чтобы выполнялось равенство В принципе, это требование можно и не выдвигать, если от вектора перейти к вектору . Таким образом не в ущерб строгости последовательность значений вектора состояния можно определить формулой

(5.9)

Представим себе, что на N-ом шаге достигается цель управления: вектор состояния принимает заданное значение

(5.10)

В полученной системе уравнений неизвестными являются только члены последовательности вектора управления. Если размерность вектора состояния равна п, а размерность вектора управления – l , то число уравнений в этой системе равно п , а число неизвестных - Nl . Если решение этой системы существует, то должно выполняться условие , то есть число неизвестных должно быть не меньше числа уравнений. В противном случае система может быть несовместной. Если выполняется строгое равенство числа уравнений и неизвестных, то решение может быть единственным. При п существует бесчисленное множество решений, переводящих систему из состояния x(0)=0 в состояние x(N ) за N шагов.


Пример 1

Дана дискретная система



Начальные условия: Требуется выбрать управления таким образом, чтобы за N шагов перевести систему из начального состояния заданную точку на фазовой траектории:

Для однозначного решения требуется 3 шага, так как имеем дело с тремя уравнениями и одной компонентой управления : n=3, l=1. Определим матрицы А и В: Вычислим переходные матрицы:

Выполним необходимые вычисления



Следовательно, для определения последовательности имеем систему из трех уравнений, которая в матричной форме выглядит так

После элементарных выкладок, получим

Число шагов в задаче управления может быть любым, но не меньше, чем n/l. При N>n/l возникает проблема неоднозначности решения задачи управления. Эта проблема может быть преодолена , если будем искать решение с дополнительным условием, например, с минимальной нормой. По сути это означает , что энергия управления будет минимальной.

Критерии управляемости

Управляемость линейной нестационарной системы

Линейная нестационарная система в непрерывном времени подчиняется уравнению: а дискретная – уравнению в конечных разностях: Мы видели, что второй тип динамической системы можно рассматривать как частный случай первого, поэтому в дальнейшем мы чаще всего будем обращаться к системе с непрерывным временем.


Динамическая система называется управляемой в момент если найдётся такое значение и такая функция u(t) (последовательность {u(k)}) на интервале из состояния в любое заданное состояние .

Система, управляемая для любого момента времени в указанном интервале, называется вполне управляемой.

Рассмотрим линейную систему, решение которой имеет вид

(5.11)

Если задано управление u(t), то имеем дело с прямой задачей динамики, которая сводится к интегрированию дифференциального уравнения. В задаче управления, напротив, нам известны начальное и конечное значения вектора состояния, а определить требуется действующую на объект силу. Поиск управления является обратной задачей динамики.

Интуитивно легко понять, что поскольку нам заданы только начальная и конечная точки фазовой траектории, то, возможно, существуют множество траекторий, соединяющих эти точки, а следовательно и множество функций u(t). Таким образом, интегральное уравнение для u(t):

(5.12)

имеет множество решений. Попробуем определить такой закон управления, который соответствовал бы минимальной затрате энергии.

Вектор u(t) имеет l компонент:

. Энергией управления называется интеграл от суммы квадратов составляющих вектора управления

(5.13)

Варьируя составляющие вектора управления, определим минимум функционала Е при условии, что управление строго подчиняется интегральному уравнению (5.12). Другими словами, решим задачу на условный экстремум.


Образуем функционал

где векторный множитель Лагранжа. Теперь, чтобы определить u(t), нам нужно продифференцировать скалярную величину J по вектору и.

Напомним основные правила дифференцирования скалярной величины по вектору. Рассмотри величину у, которая представляет собой скалярное произведение вектора а на вектор х :



Продифференцируем у по каждой составляющей вектора х, а результат расположим в виде столбца (форма записи вектора)



Итак, если дифференцируемая переменная стоит справа от множителя (матрицы-строки), то эта матрица транспонируется, если слева - записывается без изменений.

Следуя этому правилу, получим



Следовательно



Равенство нулю приведённого интеграла обязательно будет иметь место, если подынтегральное выражение тождественно равно нулю (условие достаточное, но не необходимое). При этом

. (5.14)

Остаётся определить множитель Лагранжа. Поставляя полученное выражение в уравнение (5.12) , будем иметь



Введём обозначение

(5.15)

Нетрудно убедиться, что эта матрица квадратная размера (пхп) и симметрическая. Если её определитель не равен нулю, то она неособая. В таком случае она обращается, что позволяет определить множитель Лагранжа


Следовательно, управление, соответствующее минимальной энергии согласно (5.14), имеет вид


(5.16)

Таким образом, управление, переводящее динамическую систему из состояния в состояние существует, то есть система управляема, если матрица (5.15), которую мы называем грамианом управляемости, - неособая .

Математические исследования показали, что грамиан управляемости позволяет судить не только о принципиальной возможности управления системой, но и о качестве управления.

Поставляя найденный вектор управления в формулу для энергии управления (5.13), после необходимых выкладок, получим

(5.17)

Теорема Для того, чтобы нестационарная система была вполне управляемой необходимо и достаточно, чтобы нашёлся такой момент , для которого определитель грамиана отличен от нуля.

Достаточность мы уже доказали, а необходимость в данном изложении мы доказывать не будем. Скажем лишь, что доказательство ведётся от противного: предполагается, что определитель равен нулю, но система вполне управляема. Рассуждения приводят к противоречию: сумма квадратов составляющих вектора равна нулю, что невозможно, если этот вектор не тождественно равен нулю, что противоречит условию теоремы.