Е. Э. СТРАШИНИН
ОСНОВЫ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ЧАСТЬ I
ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
1
Министерство образования Российской Федерации Уральский государственный технический университет
Е. Э. СТРАШИНИН
ОСНОВЫ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ЧАСТЬ I
ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ УЧЕБНОЕ ПОСОБИЕ Научный редактор – профессор, канд. техн. наук Д.В.Астрецов
ЕКАТЕРИНБУРГ 2000 2
УДК 519.71:681.51
Рецензенты: Кафедра автоматизации производственных процессов Уральской государственной горно-геологической академии, проф. В.А.Лукас, зав. кафедрой доктор техн. наук проф. Э.С.Лапин, протокол заседания кафедра от 22 февраля 2000 года. Зав. лабораторией Института электрофизики УрО РАН, доктор физмат. Наук А.М.Искольдский.
Автор: Е..Э.Страшинин Основы теории автоматического управления, Часть 1. Линейные непрерывные системы управления.: Учебное пособие / Е.Э.Страшинин. Екатеринбург: УГТУ, 2000 Предлагаемое учебное пособие содержит первую часть конспекта лекций по двухсеместровому курсу теории автоматического управления, читаемому автором на радиотехническом факультете Уральского государственного технического университета. Первая часть посвящена линейным непрерывным системам управления. Во второй части будут рассмотрены нелинейные и импульсные системы.
3
© Уральский государственный технический университет, 2000 ОТ АВТОРА Вашему вниманию предлагается промежуточная версия первой части конспекта лекций Е.Э.Страшинина по курсу "Теория автоматического управления" - Линейные непрерывные системы автоматического управления. Конспект составлен на базе лекций, читавшихся для студентов специальности 210100 - Управление и информатика в технических системах. Он может быть полезен также для студентов специальности 220100 - Вычислительные машины, комплексы, системы и сети. Автор стремился в некоторой степени восполнить дефицит учебной литературы в области представления основ теории автоматического управления в терминах пространства состояний – то, что уже на протяжении последних двадцати лет называется Современной теорией управления. В Пособии этот подход неразрывно связан с традиционной, классической теорией автоматического управления. Стали классическими прекрасные учебники А.А. Воронова ([16], [17]), А.В. Нетушила ([14], [15]), А.А. Красовского и Г.С. Поспелова [7], В.А. Бесекерского и Е.П. Попова [2]. Некоторая лаконичность в изложении традиционной теории обусловлена наличием достаточно обширного перечня соответствующей учебной литературы и ограничениями на объём Пособия. Автор выражает глубокую признательность студентам группы Р371 Е.Заводчикову, С.Быкову, И.Варнаваскому, А.Головко, А.Муковнину, А.Орлову, Б.Павлову, К.Павлову, А.Сосунову, которые провели очень большую работу по подготовке электронной версии и редактированию конспекта, Валентине Александровне Табуевой и Дмитрию Вячеславовичу Астрецову, которые взяли на себя труд прочитать рукопись и сделать чрезвычайно полезные для автора замечания. Автор заранее благодарен за критические замечания и предложения по совершенствованию Пособия, которые можно направить на кафедру АИТ УГТУ-УПИ или по электронной почте по адресу
[email protected]
4
1. Введение в теорию автоматического управления На рубеже XVIII-XIX веков в эпоху промышленного переворота в Европе начинается новый этап развития автоматики, связанный с внедрением ее в промышленность. 1765 год знаменуется постройкой регулятора уровня котла паровой машины И.И. Ползунова. В 1784 году появляется центробежный регулятор скорости паровой машины Уатта. В это время формируется ряд важных принципов автоматики: принцип регулирования по отклонению Ползунова- Уатта и принцип регулирования по нагрузке Понселе. Первый из них развился в концепцию обратной связи, второй - в теорию инвариантности (Г.В. Щипанов, Н.Н. Лузин, Б.Н. Петров). Идея регулирования по нагрузке может быть проиллюстрирована на примере генератора с последовательным (сериесным) возбуждением (рис.1.1). При изменении нагрузки меняется ток возбуждения, который соответствующим изменением магнитного потока компенсирует дополнительное падение напряжения на внутреннем сопротивлении якоря генератора. Однако, если при этом по каким-либо причинам изменяется скорость вращения якоря генератора, то застабилизировать напряжение на нагрузке в этой схеме уже не удается.
OB1
U B1
Г
Ia
RH ОB2
RП Рис.1.1. Пример регулирования по возмущению От этого недостатка свободна схема, приведенная на рис. 1.2, именно вследствие использования принципа обратной связи. В этой схеме входной потенциометр служит для задания (коэффициент α 1 ) величины стабилизируемого напряжения; потенциометр, подключенный к якорю генератора, позволяет регулировать коэффициент обратной связи α 2 . В этом случае, в отличие от систем регулирования по возмущению, не важно, какая именно причина вызвала изменение регулируемой величины. При изменении напряжения на щётках генератора в соответствии с электрической схемой изменяется напряжение на обмотке воз5
буждения. При отрицательном знаке обратной связи знак приращения напряжения возбуждения противоположен знаку изменения напряжения якоря генератора. В итоге результирующая величина отклонения напряжения генератора уменьшается по сравнению с соответствующим уходом напряжения в системе без обратной связи. +
–
Uз
U0 –
α1
α2
Г
UB +
RH U oc
Рис.1.2. Стабилизация напряжения генератора с использованием обратной связи На этом же принципе построена приведенная на рис.1.3 система стабилизации скорости паровой машины Уатта. На рис.1.4 представлена её функциональная схема. В данной системе с увеличением нагрузочного момента M H падают обороты турбины ω , что приводит к уменьшению расстояния 2 r между грузиками центробежного регулятора. Вследствие этого заслонка поднимается (увеличивается расстояние S ) и растет расход пара Q , подаваемого в турбину. Это приводит к росту числа оборотов турбины ω , а следовательно, к компенсации нагрузочного момента M H . При изменении нагрузки на валу паровой машины после окончания переходных процессов сохраняется так называемая статическая ошибка. Если бы это было не так, то грузики центробежного регулятора, а вместе с ними и заслонка заняли своё первоначальное положение, и не изменившееся в результате количество подаваемого в турбину пара не смогло бы уравновесить изменившийся момент нагрузки. Такая система называется статической. Работа её осуществляется именно за счёт наличия статической ошибки. Рассматриваемая система относится к классу систем прямого действия, то есть таких, в которых для реализации регулятора не используются дополнительные источники энергии. В данном случае это плохо, потому что для мощных установок перемещение тяжёлой заслонки потребует неразумно громоздкого и тяжёлого центробежного регулятора.
6
нагрузка
ω
ТУРБИНА (объект)
MH
ω
H
r
Δl1
Δl2
Задатчик скорости (гайка со взаимнообратной резьбой)
Q
расход пара
S- раскрытие заслонки
Рис. 1.3. Система стабилизации скорости паровой машины
Таким образом, система является статической системой прямого действия. Введём следующие определения: Статической системой называют систему, работающую за счет статической ошибки; Системой прямого действия называют систему, регулятор которой не имеет собственных источников энергии. Описание системы управления может быть представлено в графическом виде. Функциональной схемой называется блок-схема, каждый элемент которой отображает некоторый физический элемент (группу физических элементов) рассматриваемой системы. 7
Структурной схемой называется блок-схема, каждый элемент которой отображает некоторый математический оператор (группу операторов), описывающий рассматриваемую систему. Использование функциональных и структурных схем позволяет более наглядно представить взаимосвязь между отдельными основными и промежуточными переменными объектов и систем управления
MH “Рычаг”
S
Исполнительный механизм
r
Центробежный регулятор
Q
Объект:
Турбина
ω
l1 Задающее устройство
ϕ
З
Регулятор
Рис.1. 4. Функциональная схема системы стабилизации скорости турбины Типовая функциональная схема системы автоматического управления (САУ) представлена на рис.1.5, где: u – управляющий сигнал; y – управляемый сигнал; f – возмущающее воздействие. Кружок с четырьмя секторами является сумматором, причём сигнал, поступающий на зачернённый сектор, изменяет свой знак (вычитается). f Исполнительный механизм
Преобразующие и согласующие устр.
u
y
Объект управления
Корректирующее устройство
Датчик
Задающее устройство Автоматическое управляющее устройство (регулятор)
Рис.1.5. Типовая функциональная САУ
8
Рассмотрим вариант системы стабилизации скорости турбины, в котором сделана попытка устранить недостатки, присущие рассмотренной выше статической системе прямого действия. На Рис.1.6 показан регулятор для этой системы.
ω
r Δlзол
Δl1
Масляный насос
Силовой цилиндр
Δlсц
Золотник
Q
S Рис.1.6. Регулятор системы стабилизации скорости турбины с использованием гидравлического усилителя
9
Для этого в систему введен гидравлический усилитель, включающий в себя золотник, силовой цилиндр и масляный насос. Такая система, в которой энергия регулятора потребляется от отдельного источника, называется системой непрямого действия. При заданной скорости расстояние между грузиками центробежного регулятора равно номинальному значению ( r = r0 ), положение плеча золотника l ЗОЛ также равно номинальному значению ( l ЗОЛ = l ЗОЛ 0 ), при этом поршень золотника полностью перекрывает выходные отверстия, следовательно, положение поршня силового цилиндра неизменно. С увеличением нагрузочного момента M H падают обороты турбины ω , что приводит к уменьшению расстояния r между грузиками центробежного регулятора. В результате изменяется положение поршенька золотника. Это, в свою очередь, приводит к перемещению поршня силового цилиндра, а, следовательно, и к дополнительному приоткрытию заслонки S . Соответственно увеличивается расход пара, возрастает скорость оборотов турбины ω и увеличивается расстояние r . Статика (установившееся состояние) в системе возможна только тогда, когда l 2 = l 20 , то есть, когда полностью перекрыты перепускные отверстия золотникового устройства. Теоретически в этой системе статическая ошибка равна нулю, то есть данная система является астатической. В ней отсутствует статическая связь между скоростью и положением заслонки. Рассмотрим упрощенные уравнения системы. Начнём с уравнения объекта. Очевидно, что изменение скорости турбины может происходить лишь в тех случаях, когда нарушается равновесие между движущим моментом турбины M T и моментом нагрузки M H :
J
d Δω = ΔM T − ΔM Н , dt
(1.1)
где J – суммарный момент инерции, приведённый к валу турбины. С целью упрощения в уравнении (1.1) использованы приращения скорости и моментов. Более подробно такой подход будет рассмотрен в разделе, посвященном линеаризации систем. Будем полагать, что приращение момента турбины пропорционально приращению количества подаваемого пара
ΔMT = K T ΔQ . Запишем уравнение центробежного регулятора. Полагая, что сами отклонения скорости и вызванные ими приращения внутренних переменных регулятора малы, мы можем выразить все зависимости в линейном виде. Тогда приращение скорости раскрытия грузиков и изменение положения поршенька золотника будут связаны линейными зависимостями: 10
Δr = K ω ⋅ Δω ; Δl зол = −K r ⋅ Δr .
(1.2)
Составляя уравнение гидравлического усилителя, учтём, что скорость перемещения поршня силового цилиндра пропорциональна величине открытия перепускных отверстий золотника, то есть приращению Δl зол :
dΔl сц dt
= K зол ⋅ Δl зол .
(1.3)
Приращение координаты штока силового цилиндра повлечет за собой изменение положения заслонки и, следовательно, изменение количества подаваемого в турбину пара:
ΔQ = K сц ⋅ Δl сц .
(1.4)
Продифференцировав уравнение (1.4) и, учитывая уравнения для центробежного регулятора (1.2) и гидравлического усилителя (1.3), получим уравнение для регулятора:
dΔQ = −K P ⋅ Δω , dt
(1.5)
где K P = K СЦ ⋅ K Зол ⋅ K r ⋅ K ω - коэффициент регулятора. Запишем совместно уравнения объекта и регулятора
⎧ d Δω ⎪ dt = K q ⋅ ΔQ − K H ⋅ ΔM H , ⎨ dΔQ ⎪ = −K P ⋅ Δω dt ⎩ продифференцируем первое уравнение и подставим в него второе:
d 2 Δω d Δω d ΔM H = K ( − K ⋅ ) − K . q P H dt dt 2 dt При условии постоянства нагрузки, получаем уравнение свободного движения всей системы
d 2 Δω + K ⋅ Δω = 0 , dt 2
(1.6)
где
K = KP ⋅ Kq . Соответствующее характеристическое уравнение имеет вид: 11
λ2 + K = 0 , его корни -
λ1,2 = ± j K . Таким образом, решение уравнения (1.6) имеет вид:
Δω (t ) = C1e λ1t + C2e λ2 t = A ⋅ Sin( K ⋅ t + ϕ ) ,
(1.7)
где A и ϕ определяются начальными условиями. В результате решения получили, что в данной системе в принципе не существует установившегося (статического) состояния. Следовательно, система неработоспособна. С целью успокоения незатухающих колебаний (1.7) введём в систему демпфер (рис.1.7) и рассмотрим, что в ней происходит при изменении нагрузки. С увеличением нагрузочного момента M H уменьшается скорость вращения турбины ω , что приводит к уменьшению расстояния r между грузиками центробежного регулятора. Это влечет за собой изменение положения поршенька золотника Δl зол , а, следовательно, и изменение положения поршня силового цилиндра. При этом одновременно происходит два процесса. Во-первых, вместе со штоком силового цилиндра опускаются поршень и цилиндр демпфера, уменьшая первоначальное изменение Δl зол . Скорость перемещения поршня демпфера относительно его цилиндра невелика и регулируется с помощью специального дросселя Др. Во-вторых, приоткрывается заслонка, увеличивая количество подаваемого в турбину пара, и начинает расти скорость ω . За счёт первого движения поршни золотника могут перекрыть перепускные отверстия ещё до восстановления номинального значения ω . В то же время пружины стремятся вернуть демпфер в исходное положение, и, в конечном итоге, Δl 2 стремится к нулю. Теперь уже перепускные отверстия золотника будут перекрыты только при номинальной скорости. Следовательно, система с демпфером, как и предыдущая, является астатической. Рассмотрим, как повлияло введение демпфера на незатухающие колебания, выявленные в предыдущем варианте системы. Считая отклонения от номинального режима малыми, запишем уравнения элементов регулятора. Как и раньше,
Δr = K ω Δω ;
Δl 1 = −K r ⋅ Δr ;
d l сц = K зол ⋅ Δl зол . dt
(1.8) (1.9)
12
В отличие от предыдущей системы, в данном случае положение штока золотника зависит не только от центробежного регулятора, но и от демпфера:
n
Демпфер
Др
r
Задающее устройство
lзол l2
l1
Силовой цилиндр
Золотник
Q Δl сц S Рис.1.7. Регулятор системы стабилизации скорости турбины с использованием успокоительного демпфера 13
Δl зол = K 1 ⋅ Δl 1 − K 2 ⋅ Δl 2 .
(1.10)
Упрощенные уравнения демпфера основываются на равенстве сил пружин:
ΔFпр = K пр ⋅ Δl 2 и сил, связанных с перемещением поршня демпфера относительно корпуса:
Fд = K д
d (l сц − l 2 ) . dt
Переходя к преобразованиям Лапласа при нулевых начальных условиях, запишем равенство этих сил в виде:
K д p ⋅ ( Δl сц − Δl 2 ) = K пр ⋅ Δl 2 , или
Kд K ⋅ pΔl 2 + Δl 2 = д ⋅ pΔl сц . K пр K пр Таким образом, изображения перемещений штока силового цилиндра и корпуса демпфера связаны соотношением:
Δl 2 =
Tд p ⋅ Δl сц , Tд p + 1
(1.11)
где постоянная времени демпфера
Tд = K д K пр . Из (1.9) и (1.10) следует:
p ⋅ Δl сц = K зол ⋅ (K 1Δl 1 − K 2 Δl 2 ) а с учётом (1.11) получаем
p ⋅ Δl сц = K зол ⋅ (K 1Δl 1 − K 2
Tд p Δl сц ) , Tд p + 1
откуда
⎛ Tд ⎞ ⎜⎜1 + K зол K 2 ⎟⎟ ⋅ p ⋅ Δl сц = K зол K 1Δl 1 . Tд p + 1⎠ ⎝
(1.12)
Используя равенства (1.8), (1.12) и (1.4) получим связь между входом регулятора Δω и его выходом ΔQ :
14
T1p + 1 K q рег pΔQ = K зол K1( −K r Kω )Δω , Tд p + 1
(1.13)
где
K qрег =
Tд 1+ K зол K 2Tд ; T1 = . 1+ K зол K 2Tд K сц
Если T1 << Tд , то (1.13) упрощается:
K q рег ⋅ p ΔQ = −K ω рег Δω . Tд p + 1 Это равенство можно разрешить относительно ΔQ :
ΔQ = −
Kω рег (Tд p + 1) Δω . K q рег ⋅ p
Введём обозначения
K рег пропорц . =
K ω регTд K q рег
; K рег интегр . =
K ω рег K q рег
и окончательно получим уравнение регулятора, в котором выходная величина ΔQ формируется как сумма пропорциональной и интегральной составляющих ошибки стабилизации Δω :
ΔQ = −K рег пропорц. ⋅ Δω − K рег интегр.
Δω . p
(1.14)
Запишем уравнение объекта (турбины) относительно изображений по Лапласу его входной и выходной переменных:
p ⋅ Δω = K q ΔQ − K H ΔM H .
(1.15)
Продифференцируем последнее равенство и подставим в него уравнение регулятора (1.14). В результате получим уравнение системы в целом:
p 2 Δω + K q K рег пропорц . ⋅ p ⋅ Δω + K q K рег интегр. Δω = −K H ⋅ p ⋅ ΔM H . (1.16) Корни соответствующего характеристического уравнения
p1,2 = −0.5K q K рег пропорц ± (0.5K q K рег пропорц ) 2 − K q K рег интегр всегда имеют отрицательные вещественные части. Это означает, что в отличие от предыдущего случая свободная составляющая решения уравнения (1.16) с течением времени стремится к нулю. Таким образом, 15
введение демпфера позволило получить устойчивую, работоспособную систему. Разработчики первых систем автоматического регулирования столкнулись со случаями катастрофической неустойчивости, на первый взгляд, безукоризненных систем. В 1845 году братья Вильям и Вернер Сименсы предложили метод регулирования по производной. Существо их предложения можно пояснить на примере следящей системы, функциональная схема которой приведена на рис.1.8. На рис.1.9 представлен фрагмент переходных процессов по выходной координате ϕ вых , рассогласованию (ошибке) ε и производной рассогласования ε& . Хотя в точках А1 и А2, В1 и В2 отклонение выходной координаты от входной соответственно равны, управлявшее воздействия на объект должны быть различными, так как в точках А1 и В2 выходная координата движется к требуемому значению, а в точках В1 и А2 - удаляется от него. Учитывая инерционные свойства объекта, целесообразно в формирователе закона управления реализовать управлявшее воздействие U, пропорциональное сумме α 1ε + α 2ε& . Добавление сигнала производной уменьшит абсолютную величину управления в т.т. А.1 и В2 и увеличит её в точках B1 и A2. Распространение автоматических регуляторов вызвало потребность в разработке теоретически обоснованных методов их расчета. В 1866 году выходит в свет статья Максвелла "О регуляторах". В 1876 году появилась работа, оказавшая большое влияние на науку о регулировании труд профессора И.А. Вышнеградского "Об общей теории регуляторов". В этой работе было выведено условие устойчивости для линейных систем третьего порядка и даны конкретные указания о том, как влияют конструктивные параметры на устойчивость. И.А. Вышнеградский явился основоположником классической теории регулирования. Работы Вышнеградского были продолжены словацким учёным А. Стодолой. По его просьбе швейцарский математик А. Гурвиц в 1895 году ввел алгебраические условия устойчивости для линейных систем любого порядка. Долгое время оставалась неизвестной инженерам аналогичная работа Рауса, выполненная им еще в 1877 году по просьбе Максвелла.
ϕ
з
Формирователь закона управления
U
Исполнительный механизм
δ
Объект
ϕ
вых
Рис.1.8. Функциональная схема следящей системы
Лишь впоследствии, с развитием вычислительной техники, стало ясно, что критерий Рауса обладает гораздо большей алгоритмической и вычислительной мощностью и весьма удобен для использования на ЭВМ. 16
Рис. 1.9. К введению производной ошибки в закон регулирования. Большой вклад в теорию автоматического регулирования внес известный русский ученый Н.Е. Жуковский. В 1880 году вышла его работа "О прочности движения". Он читал лекции по теории регуляторов в Московском университете, Математическом обществе и Московском техническом училище. В 1909 году вышел его учебник по классической теории регулирования - "Теория регулирования хода машин". Основы общей теории устойчивости динамических систем были заложены выдающимся русским учёным А.М. Ляпуновым. В своей докторской диссертации в 1892 году им впервые были сформулированы условия устойчивости решений обыкновенных дифференциальных уравнений, дано строгое определение понятия устойчивости, разработаны два основных метода исследования устойчивости: первый метод Ляпунова исследования устойчивости в малом и второй, прямой метод исследования устойчивости в большом. В те годы, по-видимому, еще никто не подозревал о будущей роли теории А.М. Ляпунова в общей теории управления. Лишь в 40-50 годах его теоремы заработали в полную силу. В 1932 году американский учёный Найквист разработал теорию устойчивости усилителей с обратной связью. В 1936 году молодой советский 17
ученый А.В. Михайлов распространил критерии Найквиста на системы автоматического регулирования и предложил свой собственный критерии устойчивости, который с тех пор называется его именем. В 1937 году вышла большая работа советских учёных А.А. Андронова, С.Э. Хайкина и других по теории нелинейных колебаний, где впервые были введены понятия периодических режимов, автоколебаний, фазового пространства. Сороковые годы нашего столетия отмечены бурным развитием частотных методов, и большую роль в их пропаганде и внедрении в практику проектирования в нашей стране сыграл профессор В.В. Солодовников и его ученики, в это же время Н. Винер и А.Н. Колмогоров создают теорию синтеза статистически оптимальных систем. В 1948 году К.Ф. Теодорчиком в СССР и в I950 году Ивенсом в США закладываются основы теории корневых годографов. В 50-60 годы закладывается новое перспективное направлении - теория оптимального управления. У истоков этой теории стояли советские ученые А.А. Фельдбаум, Л.С. Понтрягин, А.М. Летов, Е.А. Барбашин, А.А. Красовский, Н.Н. Красовский, американские учёные Р. Беллман, Р. Калман и другие. В 60-е годы М.А. Айзерманом и В.М. Поповым разрабатывается теория абсолютной устойчивости нелинейных систем. Большой вклад в теорию импульсных и цифровых систем автоматического управления внесли Ю.Ту, Я.З. Цыпкин, Л.Т. Кузин, Э. Джури. В.С. Пугачёв обогатил теорию управления разработкой вопросов статистической динамики. Родоначальником теории дифференциальных игр является академик Н.Н. Красовский. Свердловские математики ведут продуктивную работу в области распознавания образов и управления в условиях неопределённости. Всемирно известны работы российских учёных Б.Н. Петрова и С.В. Емельянова в области теории и практики адаптивных систем. Теория автоматического управления (ТАУ) – это наука, которая, абстрагируясь от конкретного исполнения различных объектов и систем АУ, изучает особенности установившихся и динамических режимов этих систем и предлагает методы проектирования управления, обеспечивающего выполнение требований, предъявляемых к ходу управляемого технологического процесса. По принципу формирования управления системы автоматического управления (САУ) подразделяется на: разомкнутые, замкнутые, комбинированные. По цели управления САУ подразделяют на: системы стабилизации, системы программного управления, следящие системы. 18
ТАУ работает с математическими моделями объектов системы управления, сочетает анализ и синтез. По математическому описанию и по свойствам САУ подразделяются на следующие типы: обыкновенные системы – системы, которые описываются дифференциальными или разностными уравнениями с сосредоточенными параметрами; системы с распределенными параметрами; непрерывные системы – системы, все координаты (переменные) которых являются непрерывными функциями времени; дискретные системы – системы, в которых хотя бы одна из координат (переменных) является импульсной (дискретной или решётчатой) функцией времени; детерминированные системы – системы с постоянными или изменяющимися известным (детерминированным) образом параметрами; стохастические системы – системы, параметры которых изменяются во времени случайным образом; линейные системы – системы, которые описываются линейными дифференциальными или разностными уравнениями; нелинейные системы– системы, которые описываются нелинейными дифференциальными или разностными уравнениями; традиционные одноуровневые системы – системы с регулированием только основных переменных; системы с адаптивным управлением, в которых кроме основного контура с отрицательной обратной связью имеется контур, оценивающий текущие параметры управляемого объекта и соответствующим образом изменяющий управляющее воздействие или перестраиваемые параметры регулятора; оптимальные системы. Более подробная и обстоятельная классификация систем автоматического управления приведена в обширной литературе по теории управления В частности, можно порекомендовать учебник А.А. Красовского и Г.С. Поспелова [7].
19
2. Методы анализа непрерывных систем 2.1. Понятие пространства состояний С точки зрения анализа и синтеза систем все переменные, характеризующие объект управления (рис.2.1) или имеющие к нему отношение, делятся на три группы.
f1
f2
fnf
u1 u2
y1 y2
unu
x1, x2 ,K, xnx
y ny
Рис.2. 1. Объект управления 1.Входные воздействия, представляющие сигналы, генерируемые системами, внешними по отношению к исследуемому объекту, и влияющие на его поведение. Внешние сигналы разделяют на сигналы управляющие - u1, u 2 ,K, u nu и возмущающие - f1, f2 ,K, fnf . 2.Выходные переменные, или переменные, позволяющие описать некоторые аспекты поведения объекта, представляющие интерес для исследователя или потребителя результатов функционирования объекта y 1, y 2 ,K, y ny . 3.Переменные состояния, или промежуточные переменные x1, x 2 ,K, x nx , характеризующие динамическое поведение исследуемого объекта или системы. Для удобства оперирования с многомерными величинами совокупность управляющих переменных представляют в виде вектора управлеr
r
ния u . Аналогичным образом вводятся понятия вектора возмущения f , r r вектора выхода y и вектора состояния x :
⎛ u1 ⎞ ⎜ ⎟ r ⎜ u2 ⎟ u = ⎜ ⎟, L ⎜ ⎟ ⎜u ⎟ ⎝ nu ⎠
⎛ f1 ⎞ ⎜ ⎟ r ⎜ f2 ⎟ f = ⎜ ⎟, ... ⎜ ⎟ ⎜f ⎟ ⎝ nf ⎠
⎛ y1 ⎞ ⎜ ⎟ r ⎜ y2 ⎟ , y =⎜ ... ⎟ ⎜ ⎟ ⎜ yn ⎟ ⎝ y⎠
⎛ x1 ⎞ ⎜ ⎟ r ⎜ x2 ⎟ x = ⎜ ⎟. ... ⎜ ⎟ ⎜x ⎟ ⎝ nx ⎠ 20
r
Множество всех значений, которые может принять вектор u в момент времени t , образует пространство управления. Аналогично вводятся понятия пространства возмущений, пространства выходов и пространства состояний. В любой момент времени t состояние системы r является функцией
r
r
начального состояния x(t 0 ) и векторов u(t 0 , t ) и f (t 0 , t ) . Если известно,
как изменялись эти векторы на интервале [t 0 , t ] , то однозначно может
r
быть определено состояние системы x(t ) :
r r r r x(t ) = F { x(t 0 ), u(t 0 , t ), f (t 0 , t )} .
(2.1-1)
Вектор выхода в момент времени t является функцией тех же переменных:
r r r y (t ) = Ψ { x(t 0 ), u(t 0 , t ), f (t 0 , t )} .
(2.1-2)
Состояние системы отделяет будущее от прошлого, так что состояние содержит всю информацию, необходимую для определения реакции объекта на произвольный входной сигнал. Понятие состояния является основным исходным понятием и, следовательно, не может быть определено более полно, чем, например, слово "множество" в математике. Наибольшее, что можно сделать, это сформулировать свойства, какими должна обладать система, поведение которой отвечает понятию состояния. Основным свойством состояния является то, что будущие значения его не зависят от характера достижения системой её текущего состояния. Состояние системы в данный момент времени, а также текущее и будущие значения её входов единственным образом определяют настоящее и будущие значения её состояния и выходов. Уравнение (2.1-1) называют уравнением состояния системы, а уравнение (2.1-2) - уравнением выхода. Если объект описывается дифференциальным уравнением, то уравнения (2.1-1) и (2.1-2) превращается в
r r r r& r r x (t ) = F { x (t ),u(t ), f (t ), t } , x (t 0 ) = x 0 ; r r r r y (t ) = Ψ { x(t ), u(t ), f (t ), t ,v (t )} ,
(2.1-3) (2.1-4)
r
где дополнительно введён вектор ошибок измерений v (t ) . Как правило, выбор состояния естественным образом следует из физического устройства системы, а уравнение (2.1-3), называемое дифференциальным уравнением состояния, обычно следует из элементарных физических законов, которыми определяется её поведение.
21
2.2. Линеаризация исходных уравнений Почти все реальные объекты и системы автоматического управления являются нелинейными. Однако, среди нелинейных функций F и Ψ часто встречаются такие, которые при определённых допущениях в рабочей области функционирования системы могут быть заменены линейными. В качестве примера такого случая представлена элементарная функция на рис.2.2. В данном случае возможна линеаризация, так как если точка A перемещается на небольшие расстояния по кривой V2 = f (V1 ) , то этот участок кривой можно заменить отрезком прямой. В то же время, нелинейная функция на рис.2.3 не допускает подобную замену, если в процессе работы системы происходит изменение уровня выходного сигнала V2 . Системы с такого типа функциями называют существенно нелинейными. Их исследованию будет посвящен специальный раздел пособия. Ниже будет рассмотрен класс систем, допускающих линеаризацию.
V2
V2 A
V1
V1 Рис. 2.2. Линеаризуемая нелинейность
Рис. 2.3. Существенная нелинейность
Пусть режим функционирования r объекта определяется некоторой траекторией по вектору управления u0 (t ) , а действительная реализация
r u(t ) близка к ней:
r r r u ( t ) = u 0 ( t ) + Δu ( t ) .
(2.2-1)
При этом решение уравнения (2.1-3) можно записать в виде
r
r r r x (t ) = x 0 ( t ) + Δx (t ) ,
(2.2-2)
r
где x 0 (t ) – решение уравнения (2.1-3) при u = u 0 (t ) .
r
Назовём функционирование объекта (системы) при u = u 0 (t ) базо-
r r r вым режимом. Переменные Δx(t ), Δu (t ), Δf (t ) – это отклонения от соответствующих переменных в базовом режиме. r r Подставим теперь выражения для x (t ) и u(t ) в исходное дифференциальное уравнение состояний 22
r r& r& r r r r r x 0 (t ) + Δx(t ) = F { x 0 (t ) + Δx(t ), u 0 (t ) + Δu(t ), f0 (t ) + Δf (t ), t } и разложим функцию F в ряд Тейлора:
r r r r r r r r r x& 0 (t ) + Δx& (t ) = F { x 0 ,u 0 , f0 , t } + J x { x 0 ,u 0 , f0 , t } Δx + r r r r r r r r + J U { x 0 , u 0 , f0 , t } Δu + J f { x 0 , u 0 , f0 , t } Δf + R .
(2.2-3)
Здесь R – остаточный член, содержащий высшие степени приращений, r r и им можно пренебречь, J x , J u , J f – матрицы Якоби функции F для x , u
r иf .
Элемент матрицы Якоби определяется как соответствующая частная производная ( J x ) ik =
dFi . Например, для системы второго порядка dx k
соответствующее слагаемое в правой части (2.2-3) имеет вид
⎡ ∂F1 r ⎢ ∂x 1 J x ⋅ Δx = ⎢ ⎢ ∂F2 ⎢⎣ ∂x 1
∂F1 ⎤ ∂F1 ⎡ ∂F1 ⎤ Δ Δ + x x 2 1 ⎥ ∂x 2 ⎥ ⎡ Δx1 ⎤ ⎢ ∂x1 ∂x 2 =⎢ ⎥⋅ ⎥, ∂F2 ⎥ ⎢⎣Δx 2 ⎥⎦ ⎢ ∂F2 ∂F2 Δx1 + Δx 2 ⎥ ⎢⎣ ∂x1 ⎥⎦ ∂x 2 ⎥⎦ ∂x 2
Пренебрегая в (2.2-3) остаточным членом R и учитывая уравнение для базового режима, получим:
r r& r r r r r r r r r r r Δx(t ) = J x { x 0 , u 0 , f0 , t } Δx + J U { x 0 , u 0 , f0 , t } Δu + J f { x 0 , u 0 , f0 , t } Δf . (2.2-4) Введем обозначения:
{ { {
} } }
r r r A(t ) = J x x 0 (t ), u 0 (t ), f0 (t ), t ; r r r B(t ) = J u x 0 (t ), u 0 (t ), f0 (t ), t ; r r r r G(t ) = J f x 0 (t ), u 0 (t ), f0 (t ), t Δf (t ) . В результате получим: Линейное дифференциальное векторно-матричное уравнение с переменными параметрами (коэффициентами)
r r& r r Δx (t ) = A(t ) ⋅ Δx (t ) + B(t ) ⋅ Δu (t ) + G(t ) ⋅ Δf (t ) ,
(2.2-5)
Аналогичным образом проведем линеаризацию уравнения выхода: 23
r r r r Δy (t ) = C(t ) ⋅ Δx (t ) + D(t ) ⋅ Δu (t ) + Δv (t ) .
(2.2-6)
Впредь, рассматривая линейные модели системы, будем опускать символ Δ при записи приращений соответствующих векторов. Таким образом, линеаризованные уравнения объекта (системы) примут вид
r r r r x& (t ) = A(t )x (t ) + B(t )u(t ) + G(t )f (t ) ; r r r r y (t ) = C(t )x (t ) + D(t )u(t ) + v (t ) .
(2.2-7) (2.2-8)
Ha рис. 2.4 приведена структурная схема, являющаяся графическим изображением уравнений (2.2-7) и (2.2-8).
D(t ) r u (t ) r f (t )
B(t )
G(t )
∫ A(t )
r x (t )
r y (t )
C(t ) r v (t )
Рис. 2.4. Обобщённая структурная схема объекта управления В качестве примера рассмотрим смесительный бак, который наполняется с помощью двух потоков, имеющих переменные мгновенные расходы F1 (t ) и F2 (t ) (рис. 2.5). Оба входных потока содержат растворимое вещество с неизменными концентрациями C1 и C2 . Выходной поток имеет массовую скорость истечения (мгновенный расход) F (t ) . Предполагается, что содержимое бака перемешивается так, что концентрация выходного потока равна концентрации C out (t ) в баке.
24
F1(t)
F2(t) - расход
C1
C2- концентрация Cout(t)
h(t)
V(t) – объем выход
F(t),Cout(t)
Рис. 2.5. Смесительный бак Запишем уравнения баланса масс в баке. Для полной массы:
dV (t ) = F1(t ) + F2 (t ) − F (t ). dt
(2.2-9)
Для массы растворённого вещества:
d {Cout (t )V (t )} = C1F1(t ) + C2F2 (t ) − Cout (t )F (t ). dt
(2.2-10)
Мгновенный расход выходного потока при естественном истечении зависит от уровня жидкости в баке h(t ) следующим образом:
F (t ) = k h(t ) ,
(2.2-11)
где k - некоторая константа. Это следует из уравнения Бернулли, которое описывает энергетический баланс жидкости перед сливным отверстием и после него. Потенциальная энергия жидкости перед сливным отверстием пропорциональна h . При истечении из бака энергия жидкости превращается в кинетическую энергию потока, пропорциональную квадрату скорости υ . Приравнивая эти энергии, получаем υ = kυ h . Расход F пропорционален произведению скорости истечения на площадь сливного отверстия, откуда и следует (2.2-11). Если бак имеет постоянную по высоте площадь поперечного сечения S , то 2
F (t ) = k
V (t ) . S
(2.2-12)
Тогда из (2.2-9) и (2.2-10) получаем: 25
dV (t ) V (t ) , = F1(t ) + F2 (t ) − k dt S d V (t ) {C(t )V (t )} = C1F1(t ) + C2F2 (t ) − Cout (t )k . dt S Выберем в качестве базового режима установившееся состояние (статику), когда все величины являются постоянными - F10 , F20 , F0 ,C0 ,V0 . При этом из предыдущих уравнений получаем
0 = F10 + F20 − F0 , 0 = C1F10 + C2F20 − C0F0 .
F0 = k
V0 . S
При известных F10 и F20 эти уравнения могут быть разрешены относительно F0 ,V0 и C0 :
F02 C F + C2 F20 . F0 = F10 + F20 ; V0 = S 2 ; C0 = 1 10 K F0 Предположим теперь, что возникли отклонения от установившегося состояния
F1(t ) = F10 + ΔF1(t ) , F2 (t ) = F20 + ΔF2 (t ) и, как следствие,
F (t ) = F0 + ΔF (t ), V (t ) = V0 + ΔV (t ) ; Cout (t ) = C0 + ΔC(t ) . Если эти отклонения невелики, то можно провести линеаризацию нелинейных дифференциальных уравнений объекта. Сначала линеаризуем уравнение для полной массы
V + ΔV (t ) d {V0 (t ) + ΔV (t )} = F10 + ΔF1(t ) + F20 + ΔF2 (t ) − k 0 . dt S Используем разложение нелинейной функции в ряд Тейлора и учтём, что: 26
d V dV
|
V =V0
⋅ΔV0 =
1 1 ΔV . 2 V0
Тогда
V k ΔV (t ) ΔV& (t ) = F10 + ΔF1(t ) + F20 + ΔF2 (t ) − k 0 − ⋅ + R(t ). S S 2 V0 Учитывая уравнение статики, и пренебрегая остаточным членом, получим:
ΔV& (t ) = ΔF1(t ) + ΔF2 (t ) − Введём параметр Θ =
k ⋅ ΔV (t ). 2 SV0
(2.2-13)
V0 , называемый временем заполнения баF0
ка. Тогда, учитывая (2.2-12), получим
1 k . = 2 SV0 2Θ
(2.2-14)
Кроме того, отметим, что
ΔV k ΔV = = ΔF . 2 SV0 2Θ
(2.2-15)
Таким образом, вместо (2.2-13) запишем
1 ΔV& (t ) = ΔF1 (t ) + ΔF2 (t ) − ⋅ ΔV (t ). 2Θ
(2.2-16)
Проведем аналогичные действия для уравнения баланса масс растворённого вещества.
d { [C0 + ΔC(t )] [V0 + ΔV (t )] } = dt = C1 [F10 + ΔF1 (t )] + C2 [F20 + ΔF2 (t )] − [C0 + ΔC(t )]k
V0 + ΔV (t ) . S
После разложения в ряд Тейлора получим
V0C& (t ) + C 0V& (t ) = C1F10 + C1ΔF1 (t ) + C 2 F20 + C 2 ΔF2 (t ) − − C0 k
V0 V C0 k − k 0 ΔC (t ) − ΔV (t ) − R(t ). S S 2 V0 S 27
Учтём уравнения статики и отбросим остаточный член:
V0C& (t ) + C 0V& (t ) = C1ΔF1 (t ) + C 2 ΔF2 (t ) − −k
V0 k V0 ΔC(t ) − C 0 ΔV (t ). S 2V0 S
Подставим в это уравнение V& (t ) из (2.2-16). Получим:
C V0 ΔC& = C1ΔF1 (t ) + C2 ΔF2 (t ) − F0 ΔC(t ) − 0 ΔV (t ) − 2Θ − C0 ΔF1 (t ) − C0 ΔF2 (t ) −
C0 ΔV (t ) . 2Θ
Таким образом, в результате линеаризации мы получили систему следующих дифференциальных уравнений, которые описывают процессы в смесительном баке:
1 ⎧ & V t F t F t Δ = Δ + Δ − ΔV ( t ) ( ) ( ) ( ) 1 2 ⎪ 2Θ ⎪ ⎨ ⎪ΔC& (t ) = − 1 ΔC(t ) + C1 − C0 ΔF (t ) + C2 − C0 ΔF (t ) . 1 2 ⎪⎩ V0 V0 Θ
(2.2-17)
На этом завершён для данного примера первый этап разработки составлено математическое описание объекта и в результате линеаризации получена его линейная модель. Далее это описание нужно представить в удобной форме - в виде векторно-матричных дифференциальных уравнений и в виде структурной схемы. Представим математическое описание объекта в виде векторноматричных дифференциальных уравнений. Введем обозначения:
⎡ ΔF ⎤ Δ F t ( ) r ⎡ 1 ⎤ r ⎡ΔV (t )⎤ r u t = ; ( ) ; y (t ) = ⎢ ΔC ⎥ . x (t ) = ⎢ ⎢ ⎥ ⎥ ⎢ ⎥ ⎣ ΔC(t )⎦ ⎣ΔF2 (t )⎦ ⎣⎢ΔV ⎦⎥ Теперь систему уравнений (2.2-17) можно записать в векторноматричном виде:
r r r x& (t ) = Ax (t ) + Bu(t ) r r y (t ) = Cx (t ), где:
28
⎡− 1 ⎢ A = ⎢ 2Θ ⎢ 0 ⎣
0 ⎤⎥ ⎡ 1 ; B = ⎢C1 − C0 1⎥ − ⎥ ⎣⎢ V0 Θ⎦
1 ⎤ C 2 − C0 ⎥ ; V0 ⎦⎥
⎡ 1 0⎤ ⎢ 2Θ ⎥ C = ⎢ 0 1⎥ . ⎢ ⎥ 1 0 ⎢ ⎥ ⎣ ⎦
Структурная схема объекта представлена на рис.2 6
ΔV
ΔF1
∫ 1 2Θ
ΔF2
C1 − C0 V0
1 Θ
C0 − C 2 V0
∫
ΔF
ΔC
Рис. 2.6. Структурная схема смесительного бака как объекта управления На основании полученных дифференциальных уравнений и структурной схемы можно провести предварительный анализ свойств объекта и сделать следующие выводы. 1. Изменение любой из входных переменных ΔF1 и ΔF2 приводит к одновременному изменению всех выходных переменных ΔV , ΔF и ΔC . Это особенно наглядно следует из наличия перекрёстных связей на структурной схеме объекта. 2. При ступенчатом изменении любой из входных переменных каждая из выходных переменных изменяется по экспоненциальному закону, причём темп изменения концентрации ΔC вдвое медленнее темпа изменения объёма ΔV . Предметом отдельного рассмотрения при проектировании системы управления (СУ) должен стать анализ диапазонов изменения переменных объекта, в которых сохраняется адекватность линейной модели. Прежде, чем закончить рассмотрение данного примера, имеет смысл продемонстрировать некоторые последующие действия разработчика в части синтеза алгоритмов управления. Перед разработчиком 29
среди прочих встанут следующие две задачи. Одна из них - обеспечение заданных требований по длительности и качеству процессов в системе, то есть её динамических свойств. Рассмотрению соответствующих вопросов посвящён третий раздел настоящего пособия. Вторая задача - обеспечение возможности независимого управления объёмом и концентрацией. Введём понятие командных сигналов по требуемым концентрации - Δrc и объёму - Δrv . В статике производные всех переменных должны быть равны нулю, и как следует из структурной схемы и дифференциальных уравнений объекта, должны выполняться равенства:
1 ⋅ ΔVуст = 0 ; 2Θ C − C2 C − C0 1 − ΔC уст + 1 ΔF1 − 0 ΔF2 = 0 . Θ V0 V0 V Отсюда, с учётом равенства Θ = 0 , получаем F0 ΔF1 + ΔF2 −
ΔVуст = 2Θ( ΔF1 + ΔF2 ) ; ΔCуст =
C1 − C0 C − C2 ΔF1 − 0 ΔF2 . F0 F0
(2.2-18) (2.2-19)
Для компенсации перекрёстных связей в объекте введём перекрёстные связи в регуляторе:
ΔF1 = aVF 1ΔrV + aCF 1ΔrC ; ΔF2 = aVF 2 ΔrV + aCF 2 ΔrC . Подставим эти выражения в (2.2-18) и (2.2-19):
ΔVуст = 2Θ((aVF 1 + aVF 2 )ΔrV + (aCF 1 + aCF 2 )ΔrC ) ; ΔC уст = (
(2.2-20)
C1 − C0 C − C2 aVF 1 − 0 aVF 2 )ΔrV + F0 F0
+(
C1 − C0 C − C2 aCF 1 − 0 aCF 2 )ΔrC . F0 F0
(2.2-21)
Для того, чтобы установившееся значение объёма жидкости в баке ΔVуст определялось только командным сигналом ΔrV и не зависело от
ΔrC , а выходная концентрация ΔCуст определялась только командным 30
сигналом ΔrC и не зависела от, ΔrV , в равенстве (2.2-20) приравняем к нулю коэффициент при ΔrC , а коэффициент при ΔrV приравняем к единице. В равенстве (2.2-21) приравняем к нулю коэффициент при ΔrV , а коэффициент при ΔrC приравняем к единице. В результате решения получившейся системы уравнений получим:
aVF 1 = aCF 1 =
1 C0 − C2 1 C1 − C 0 ; aVF 2 = ; 2Θ C1 − C 2 2Θ C1 − C 2 F0 ; C1 − C 2
aCF 2 = −
F0 . C1 − C 2
(2.2-22)
. В итоге получаем представленную на рис.2.7 структурную схему системы управления смесительным баком, в которой обеспечена развязка каналов. Последнее означает, что командный сигнал ΔrV влияет только на изменение объёма жидкости в баке, а командный сигнал ΔrC только на изменение концентрации. Объём жидкости в баке связан с расходом выходного потока ΔF коэффициентом пропорциональности 2Θ , поэтому регулирование первого можно рассматривать как регулирование второго.
ΔrV
1 C0 − C2 2Θ C1 − C 2
ΔF1
ΔV
1 C1 − C 0 2Θ C1 − C 2
ΔF
ОБЪЕКТ
F0 C1 − C2
ΔrC
F0 C1 − C2
ΔF2
ΔC
Рис. 2.7 Система управления смесительным баком с развязанными каналами.
31
2.3. Линейные системы, заданные обыкновенными дифференциальными уравнениями в нормальной форме Коши 2.3.1. Однородные дифференциальные уравнения Рассмотрим, прежде всего, решение однородного векторно-матричного дифференциального уравнения:
r r x& (t ) = A(t )x (t ) ,
(2.3-1)
r
где каждому начальному условию x(t 0 ) соответствует одно и только одно решение дифференциального уравнения. Будем полагать, что матрица A(t ) непрерывна на промежутке t ∈ [0, ∞] . Множество всех решений образует n-мерное векторное пространство. Среди множества решений всегда может быть выбрано n линейно независимых. Это может быть сделано следующим образом. Зададим начальные усr ловия x i (t ) , где i = 1, 2,K, n , совпадающие с базисными векторами
r r r ei пространства R n , то есть x i (t 0 ) = ei . Из свойства единственности
решений дифференциальных уравнений (через любую точку пространства состояний проходит одна и только одна траектория) следует линейная независимость решений с указанными начальными условиями. Матрица X (t )[n×n ] , столбцами которой являются n линейно независимых решений системы (2.3-1), называется фундаментальной матрицей этой системы дифференциальных уравнений. Поскольку каждый столбец фундаментальной матрицы является решением системы (2.3-1), то фундаментальная матрица удовлетворяет уравнению:
X& (t ) = A(t ) ⋅ X (t ) , при начальных условиях X 0 = X (t 0 ) . (2.3-2) По определению в любой момент времени столбцы этой матрицы линейно независимы, значит ее определитель (определитель Вронского) не равен нулю. на промежутке t ∈ [0, ∞] . Так как определитель матрицы
X не равен нулю, то существует обратная матрица X −1(t ) . Матрица
Φ(t , t 0 ) = X (t ) ⋅ X −1(t 0 )
(2.3-3)
называется переходной матрицей уравнения (2.3-1) или переходной матрицей, соответствующей матрице A(t ) . Переходная матрица является определяющей при анализе и решении дифференциальных уравнений и собственно в теории управления. Поэтому ниже приводятся ос32
новные её свойства, в основном, непосредственно вытекающие из определения этой матрицы. 1) Переходная матрица при совпадающих значениях первого и второго аргумента становится единичной матрицей:
Φ(t , t 0 ) t =t0 = Φ(t 0 , t 0 ) = X (t 0 ) ⋅ X −1 (t 0 ) = E . 2) При любых значениях аргументов t 1, t 2 переходная матрица Φ(t1, t 2 ) не вырождена и её определитель не равен нулю:
Ф( t 1 , t 2 ) ≠ 0 . 3) Обращение матрицы Φ(t , t 0 ) эквивалентно изменению порядка аргументов исходной матрицы:
Φ −1(t , t 0 ) = [X (t ) ⋅ X −1 (t 0 )] = X (t 0 ) ⋅ X −1 (t ) = Φ(t 0 , t ) . −1
4) Если в качестве фундаментальной матрицы начальных условий принять единичную матрицу, X (t 0 ) = E то при всех прочих t переходная матрица будет совпадать с фундаментальной матрицей. Ф(t , t 0 ) = X (t ) . Но X (t ) – это решение матричного дифференциального уравнения (2.3-2). Поэтому переходная матрица может быть определена как решение матричного дифференциального уравнения:
Ф& (t , t 0 ) = A(t ) ⋅ Ф(t, t 0 ),
Φ( t 0 , t 0 ) = E .
(2.3-4)
5) Переходная матрица определяет решение однородного векторноматричного дифференциального уравнения (2.3-1), удовлетвоr r ряющее начальному условию x (t ) t =t = x (t 0 ) :
r r x (t ) = Ф ( t , t 0 ) ⋅ x ( t 0 ) .
0
(2.3-5)
Это действительно так, ибо, во-первых, при t = t 0
r r Ф( t 0 , t 0 ) ⋅ x ( t 0 ) = x ( t 0 ) ,
во-вторых, с учетом свойства (4):
r r r r d {Ф(t, t 0 )x (t 0 )} = Ф& (t, t 0 )x (t 0 ) = A(t )Ф(t , t 0 )x(t 0 ) = A(t )x (t ) . dt 6) Из предыдущего свойства следует один из способов определения переходной матрицы. Обозначим через ϕ i , j (t , t 0 ) элемент i-ой строки и j-ого столбца переходной матрицы и запишем равенство (2.3-5) в развернутом виде:
33
⎡ x1 (t ) ⎤ ⎡ϕ 11 (t , t 0 ) ⎢ x (t )⎥ ⎢ϕ (t , t ) ⎢ 2 ⎥ ⎢ 21 0 ⎢ ... ⎥ ⎢ ... ⎢ ⎥ = ⎢ϕ ( t , t ) ( ) x t ⎢ i ⎥ ⎢ i1 0 ⎢ ... ⎥ ⎢ ... ⎢ ⎥ ⎢ ⎣ x n (t )⎦ ⎢⎣ϕ n1 (t , t 0 )
ϕ 12 (t, t 0 ) ... ϕ 1 j (t , t 0 ) ... ϕ 1n (t , t 0 ) ⎤ ⎡ x1 (t 0 ) ⎤ ϕ 22 (t , t 0 ) ... ϕ 2 j (t, t 0 ) ... ϕ 2 n (t, t 0 )⎥⎥ ⎢ x 2 (t 0 )⎥ ⎢ ⎥
... ϕ i 2 (t , t 0 ) ... ϕ n 2 (t , t 0 )
... ... ... ϕ ij (t , t 0 ) ... ... ... ϕ nj (t , t 0 )
... ... ⎥ ⎢ ... ⎥ , ⎥⋅ ... ϕ in (t , t 0 ) ⎥ ⎢⎢ x j (t 0 )⎥⎥ ... ... ⎥ ⎢ ... ⎥ ⎥ ⎢ ⎥ ... ϕ nn (t, t 0 )⎥⎦ ⎣ x n (t 0 )⎦
откуда следует выражение для i-й координаты вектора состояния:
x i (t ) = ϕ i ,1(t, t 0 )x1(t 0 ) + K + ϕ i , j (t , t 0 )x j (t 0 ) + K + ϕ i ,n (t , t 0 )x n (t 0 ). Если положить начальные условия по всем координатам вектора стояния, кроме j-й, нулевыми, а по j-й - единичными, то есть
x k (t 0 ) = 0 , при k = 1, 2,K, n k ≠ j и x j = 1,
(2.3-6)
то элемент i-й строки и j-го столбца матрицы Φ(t , t 0 ) можно определить как процесс по i-й координате вектора состояния
ϕ i , j (t , t 0 ) = x i (t ).
(2.3-7)
7) К переходной функции применимо правило композиции:
Φ(t 2 , t 0 ) = Φ(t 2 , t1 ) ⋅ Φ(t1, t 0 ).
(2.3-8)
Действительно, решение уравнения (2.3-1) в момент t1 при начальr ных условиях x (t 0 ) имеет вид:
r r x (t1 ) = Ф(t1, t 0 )x (t 0 ).
Если теперь этот результат принять за новые начальные условия, то к моменту времени t 2 будем иметь:
r r r x(t 2 ) = Ф(t 2 , t1 )x(t1 ) = Ф(t 2 , t1 ) ⋅ Ф(t1, t 0 )x(t 0 ).
8) Переходная матрица может быть вычислена с помощью ряда Пеано, или матрицианта матрицы A :
Φ(t , t 0 ) = M ( A) = E + Q( A) + Q( A ⋅ Q( A)) + Q( A ⋅ Q( A ⋅ Q( A))) + K, где t
Q( A) = ∫ A(τ )dτ . t0
Для того, чтобы получить этот результат, проинтегрируем дифференциальное уравнение (2.3-1): 34
t r r r x(t ) = x(t 0 ) + ∫ A(τ 1 )x (τ 1 )dτ 1 . t0
Теперь повторим эту процедуру многократно, учитывая что: τ1 r r r x (τ 1 ) = x(t 0 ) + ∫ A(τ 2 )x (τ 2 )dτ 2 . t0
Тогда получим: τ1 t t r r r r x (t ) = x (t 0 ) + ∫ A(τ 1 )dτ 1x (t 0 ) + ∫ A(τ 1 ) ∫ A(τ 2 )dτ 2dτ 1x (t 0 ) + t0
t0
t
τ1
τ2
t0
t0
t0
t0
r + ∫ A(τ 1 ) ∫ A(τ 2 ) ∫ A(τ 3 )d (τ 3 )d (τ 2 )d (τ 1 )x (t 0 ) + ... = t
t
τ1
t0
t0
t0
r = {E + ∫ A(τ 1 )dτ 1 + ∫ A(τ 1 ) ∫ A(τ 2 )dτ 2dτ 1 + ...} x (t 0 ) Если объект – стационарный и матрица А состоит из постоянных и независящих от времени элементов, то матрициант матрицы А (или ряд Пеано) превращается в выражение для матричной экспоненты:
A 2 (t − t 0 ) 2 A 3 (t − t 0 )3 Ф(t , t 0 ) = E + A(t − t 0 ) + + + ... = 2! 3! = exp( A(t − t 0 )) = e A( t −t0 ) .
(2.3-9)
Очевидно, что в стационарном случае переходная матрица является уже функцией только одного аргумента, равного разности начального и текущего (конечного) времени:
Φ(t , t 0 ) = Φ(t − t 0 ) = e AΔt .
(2.3-10)
Переходная матрица для стационарного объекта обладает рядом дополнительных замечательных свойств, трансформирующихся из соответствующих свойств переходной матрицы для нестационарного объекта : из 1) - Ф(0) = E ; из 3) - Ф ( Δt ) = Ф( − Δt ) = e −1
(2.3-11) − A⋅Δt
;
(2.3-12)
dФ(t − t 0 ) 2 A 2 (t − t 0 ) 3 A 3 ( t − t 0 ) 2 из 4) =0+A+ + + ... = dt 2! 3! = A ⋅Ф(t − t 0 ) = A ⋅ e A( t −t0 ) = e A( t −t0 ) ⋅ A ;
(2.3-13) 35
из 5) - решение однородного дифференциального уравнения имеет вид:
r r x ( t ) = e A ( t −t 0 ) ⋅ x ( t 0 ) ;
из 7) - Ф( k ⋅ Δt ) = Ф ⋅ ( Δt ) . k
(2.3-14) (2.3-15)
2.3.2. Решение неоднородных векторно-матричных дифференциальных уравнений Ранее были получены выражения для определения решений однородного дифференциального уравнения нестационарной:
r r x (t ) = Ф ( t , t 0 ) ⋅ x ( t 0 )
(2.3-5)
r r x (t ) = e A ( t − t 0 ) ⋅ x (t 0 )
(2.3-14)
и стационарной
систем. Используем эти результаты для определения решения неоднородного линейного векторно-матричного уравнения, соответствующего (2.2-7):
r r r x& = A(t ) ⋅ x(t ) + B(t ) ⋅ u (t ) .
(2.3-16)
Произведем замену:
r r x ( t ) = Ф( t , t 0 ) ⋅ z ( t )
(2.3-17)
и продифференцируем это выражение:
r r r x& (t ) = Ф& (t , t 0 ) ⋅ z(t ) + Ф(t, t 0 ) ⋅ z& (t ) = r r = A(t ) ⋅ Ф(t , t 0 ) ⋅ z(t ) + Ф(t , t 0 ) ⋅ z& (t ) . Сопоставляя это выражение с предыдущим, получим
r r Ф(t , t 0 ) ⋅ z& (t ) = B(t ) ⋅ u (t ) , откуда
r r z& (t ) = Ф(t 0 , t ) ⋅ B(t ) ⋅ u (t ) , или, интегрируя, t r r r z(t ) = z(t 0 ) + ∫ Ф(t 0 ,τ )B(τ ) ⋅ u(τ )dτ . t0
Из (2.3-17) видно, что
r r z (t 0 ) = x (t 0 ) .
36
В итоге получаем выражение для решения векторно-матричного линейного неоднородного дифференциального уравнения, известное под названием формулы Коши t r r r x(t ) = Ф(t , t 0 ) ⋅ x(t 0 ) + ∫ Ф(t ,τ )B(τ )u(τ )dτ .
(2.3-18)
t0
2.4. Некоторые сведения из теории матриц 2.4.1. Собственные числа, характеристический полином, присоединенная матрица r Умножение квадратной матрицы A на некоторый вектор x дает новый r вектор z , который, в общем случае, иначе ориентирован в пространстве и имеет другую длину по сравнению с исходным вектором. Однако, существуют и такие векторы, которые при выполнении этой операции меняют только свою длину, но не меняют направления, то есть
r r Av = λv ,
(2.4-1)
где λ - это вещественная или комплексная скалярная величина, называемая собственным значением (характеристическим числом) матрицы r A , а вектор v называется собственным вектором этой матрицы. В развёрнутом виде уравнение (2.4-1) имеет следующий вид:
⎧ a11v 1 + a12v 1 + K + a1n v n = λv 1 ⎪a v + a v + K + a v = λv ⎪ 21 1 22 1 2n n 2 . ⎨ K K K K K K K K K K K K K ⎪ ⎪⎩an1v 1 + an 2v 1 + K + ann v n = λv n Очевидно, что для существования ненулевых v i необходимо выполнение условия:
det( λE − A) ≡ λE − A = 0 .
(2.4-2)
Это уравнение называют характеристическим, или вековым уравнением матрицы A . Левая часть этого уравнения называется характеристическим полиномом, которая является степенным полиномом от λ, и степень его равна размеру n матрицы A .
ϕ A (λ ) =| λE − A |= λn + α 1λn −1 + α 2 λn − 2 + K + α n −1λ1 + α n .
(2.4-3)
Таким образом, каждая квадратная матрица A имеет n собственных значений λ1, λ2, K , λn, , которые могут быть определены путём решения 37
характеристического уравнения с использованием стандартного математического обеспечения на цифровых вычислительных машинах. Алгебраическая кратность корня λ – это его кратность как корня характеристического уравнения. Геометрическая кратность корня λ – это количество линейно независимых решений уравнения (2.4-2), или количество линейно независимых r векторов v , связанных с данным λ . Если λ не является собственным значением матрицы A , то существует −1 матрица ( λE − A) . По правилу определения обратных матриц
(λE − A)−1 =
I (λ ) , λE − A
(2.4-4)
где I ( λ ) называется присоединённой матрицей для матрицы A . Ее элементы определяются как алгебраические дополнения элементов T матрицы ( λE − A) . Здесь символ Т означает транспонирование. Присоединённая матрица - это матричный полином степени n-1:
I (λ ) = Eλn −1 + I1λn −2 + K + I n − 2 λ + I n −1 ,
(2.4-5)
где E – единичная матрица [n × n ]. Если все собственные числа матрицы A различны, то собственные векторы матрицы A могут быть выбраны пропорциональными любым ненулевым столбцам матрицы I ( λi ) , i = 1, 2 , ... , n . ПРИМЕР 2.4-1. Пусть объект задан структурной схемой, приведённой на рис.2.8.
u
x3
x1
x2
2
3
Рис.2.8. Структурная схема к примеру 2.4-1 Ему соответствует система уравнений
x&1 = −3 x1 + x 2 ; x& 2 = −2 x 2 + x 3 ; x& 3 = − x 3 + u , или в матричном виде 38
r r x& (t ) = Ax (t ) + Bu (t ) , где
0⎤ ⎡− 3 1 ⎡0⎤ A = ⎢ 0 − 2 1 ⎥ ; B = ⎢0⎥ . ⎢ ⎥ ⎢ ⎥ ⎢⎣ 0 ⎢⎣ 1⎥⎦ 0 − 1⎥⎦ Для этих исходных данных получаем характеристический полином
P (λ ) =
λ +3
−1
0
λ +2
0
0
0 − 1 = λ3 + 6λ2 + 11λ + 6 .
λ +1
Ему соответствуют собственные числа
λ1 = −1, λ2 = −2, λ3 = −3. Найдем присоединенную матрицу
λ +1 1 ⎡(λ + 2)(λ + 1) ⎤ ⎥= λ I (λ ) = ⎢ +3 0 (λ + 3)(λ + 1) ⎢ ⎥ ⎢⎣ 0 0 (λ + 3)(λ + 2)⎥⎦ ⎡2 1 1⎤ ⎡3 1 0⎤ 2 ⎢ ⎥ ⎢ ⎥ = E3 λ + 0 4 1 λ + 0 3 3 . ⎢ ⎥ ⎢ ⎥ ⎢⎣0 0 6⎥⎦ ⎢⎣0 0 5⎥⎦ Найдём собственные векторы матрицы A : ⎡2 − 2 1⎤ ⎡0 0 1⎤ ⎡0 − 1 1⎤ I (λ1 ) = ⎢0 0 2⎥; I (λ2 ) = ⎢0 − 1 1⎥; I (λ3 ) = ⎢0 0 0⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣0 0 0⎥⎦ ⎢⎣0 0 2⎥⎦ ⎢⎣0 0 0⎥⎦ и можно выбрать
⎡ 1⎤ ⎡ 1⎤ ⎡1⎤ r ⎢ ⎥ r ⎢ ⎥ r ⎢ ⎥ v1 = 2 ; v 2 = 1 ; v 3 = 0 . ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣0⎥⎦ ⎣⎢0⎥⎦ ⎣⎢2⎦⎥ Полученный результат нетрудно проверить прямой подстановкой в (2.41). Имеется ряд алгоритмов для определения коэффициентов характеристического полинома и присоединенной матрицы. Один из наиболее 39
употребимых - это алгоритм Фаддеева - Леверье. Он состоит в следующей последовательности вычислений: A1=A;
α1=− SpA1 ;
A2=AI1;
α 2 = − SpA2 ;
1 2
I1=A1+α1E; I2=A2+α2 E;
.......................................... An-1=AIn-2;
An=AIn-1;
α n −1 = −
1 SpAn −1 ; In-1=An-1+αν−1 E; n −1 1 n
α n = − SpAn ;
In=An+α n E=0;
Здесь через SpA обозначен след матрицы A , то есть сумма ее диагональных элементов: n
SpA = ∑ aii . i =1
Последнее равенство процедуры используется для контроля точности вычислений. Для объекта, приведенного в примере 2.4-1,
1⎤ ⎡− 9 1 ⎡− 6 A2 = ⎢ 0 − 8 3 ⎥; A3 = ⎢ 0 ⎢ ⎥ ⎢ ⎢⎣ 0 ⎥ ⎢⎣ 0 0 − 5⎦ Если матрица A не вырожденна, то из
0 ⎤ −6 0 ⎥. ⎥ 0 − 6⎥⎦ 0
промежуточных результатов алгоритма Фаддеева - Леверье, учитывая, что
An = −α n E, получаем
A −1 = −
1
αn
I n −1 .
(2.4-6)
Для рассматриваемого примера
⎡2 1 1⎤ 1 A −1 = − ⎢0 3 3⎥ . ⎥ 6⎢ ⎢⎣0 0 6⎥⎦
40
В вырожденном случае α n = 0 . Иллюстрацией этого может служить объект, структурная схема которого приведена на рис.2.9. u x3 x2 x1
2 Рис.2.9. Структурная схема. Вариант с α n = 0 2.4.2. Собственные значения и собственные векторы транспонированной матрицы Собственные значения транспонированной матрицы, это такие λ , для которых система уравнений
r r A d = λd T
(2.4-7)
имеет нетривиальные решения, т.е. когда
λE − AT = 0 .
(2.4-8)
Решение этого алгебраического уравнения дает n значений собственных чисел λ1 , λ2 , ... , λn . Так как определитель квадратной матрицы и её транспонированной матрицы равны, то собственные числа матриц A и AT также равны. Таким образом, собственному числу
r тор v i
λi соответствует собственный векr
матрицы A и собственный вектор d i матрицы A . Если транспонировать обе части уравнения (2.4-7), то получим: T
rT rT d A = λd . (2.4-9) r В связи с этим векторr d называют левым собственным вектором матрицы A , в отличие от v , который, в таком случае, называют правым собственным вектором. Для i -го собственного числа и i -го левого собственного вектора соответственно
r r d iT A = λi d iT .
r
Умножим обе части этого равенства справа на вектор v j :
rT r rT r d i Av j = λi d i v j .
(2.4-10)
Учитывая свойства собственных векторов, в результате получаем уравнение 41
rT r rT r d i λ j v j = λi d i v j , которое преобразуется к виду
rT r d i v j (λ j − λi ) = 0 .
(2.4-11)
Полагаем, что все собственные числа матрицы A различны. Тогдаrдля i ≠ j имеем λi ≠ λ j и из равенства (2.4-11) следует, что векторы d iT и
r v j взаимно ортогональны: r r d iT v j = 0 , i ≠ j . (2.4-12) r Это означает то, что d i ортогонален ( n − 1) - мерной гиперплоскости, с r базисом, образованным векторами v j для всех j ≠ i .
В качестве примера на рисунке 2.10 показан один из вариантов взаимного расположения правых и левых собственных векторов некоторой матрицы r A для случая n = 3 . Здесь хорошо видно, что каждый из век-
r
торов d i ортогонален всем векторам v i при j ≠ i .
r d2
r v2
r d1
r v1 r d3
r v3
Рис. 2.10. Пример взаимного расположения правых и левых собственных векторов Теперь рассмотрим случай, когда i = j . При этом скалярные произведения векторов
r r di и v i
не должны быть равны нулю. Если предположить,
r rT r что d i v i = 0 , то придется утверждать, что вектор d i ортогонален всему r r r n – мерному пространству с базисом v 1,v 2 , K ,v n . Но этого не может быть, так как вектор разом,
r di
сам принадлежит этому пространству. Таким об-
rT r d i v i ≠ 0 для i = 1, 2 , ... , n .
(2.4-13)
42
В связи с тем, что собственные векторы можно выбирать с точностью до постоянного (в том числе комплексного) сомножителя, то наборы, иначе
{}
r r говоря, базисы {v } и d формируют так, чтобы для i = 1, 2 , ... , n выполнялось условие
r r d iT v i = 1 для i = 1, 2 , ... , n .
(2.4-14)
Отметим ещё одно важное свойство собственных векторов: Если матрица A не имеет кратных собственных чисел, то все её собственные векторы линейно независимы, то есть образуют базис n в пространстве R . Это нетрудно доказать. Действительно, предположим сначала, что среди собственных векторов матрицы A первые два являются линейно зависимыми, то есть 2
r
∑γ v = 0, i
i =1
(2.4-15)
i
где ни один из коэффициентов уравнение слева на A , получим 2
r
γ 1 и γ 2 не равен нулю. Умножив это
∑γ λ v = 0. i
i =1
i
λ2 :
Теперь умножим (2.4-15) на 2
(2.4-16)
i
r
∑γ λ v = 0 . i
i =1
2
(2.4-17)
i
Вычтем (2.4-17) из (2.4-16) и в результате получим
r
γ 1(λ1 − λ2 )v 1 = 0 .
r
Из того, что λ1 ≠ λ2 и γ 1 ≠ 0 следует v 1 = 0 , чего не может быть, следовательно, первые два собственных вектора не могут быть линейно зависимыми. Теперь предположим, что число линейно зависимых векторов равно r > 2 , то есть r
r
∑ γ v = 0 , γ ≠ 0 : i = 1, 2, ..., r . i =1
i
i
i
Умножив это уравнение слева на A , получим r
r
∑γ λ v = 0. i =1
Умножим (2.4-18) на
i
i
i
(2.4-18)
λr :
r
r
∑γ λ v = 0 . i =1
i
r
i
(2.4-19) 43
Вычтем (2.4-19) из (2.4-18) и в результате будем иметь
r
r −1
∑ γ (λ − λ )v = 0 . i =1
i
i
r
i
Получается, что число линейно зависимых векторов r − 1 < r . Если согласиться с этим, то дойдём до r = 2 , и круг замкнулся. Таким образом, действительно, все собственные векторы матрицы A являются линейно независимыми, поэтому матрица r r r r V = [v 1 , v 2 , ... , v n ], построенная из векторов базиса {v }, т.е. из правых собственных векторов матрицы A , является невырожденной. Эта матрица называется модальной матрицей. Из перечисленных выше свойств для правых и левых собственных векторов следует равенство:
D TV = E , или DT = V −1 .
(2.4-20)
DT - матрица, строки которой, являются транспонированными векторами r двойственного базиса d , т.е. левыми собственными векторами матрицы A : r ⎡d1T ⎤ ⎢ rT ⎥ d DT = ⎢ 2 ⎥ . (2.4-21) ⎢⋅ ⋅ ⋅⎥ ⎢ rT ⎥ ⎣⎢d n ⎦⎥
{}
2.4.3. Определение функции от матрицы через её левые и правые собственные векторы Все n систем уравнений
r r Av i = λi v i ,
i = 1,2,..., n
могут быть записаны с использованием блочных матриц:
r [ Av 1
r Av 2
r r Av n ] = [λ1v 1
...
r
λ2v 2
r ... λnv n ] .
Учтем, что
r [ Av 1 и
r Av 2 r
... r
[λ1v 1 λ2v 2
r Av n ] = AV , r L λn v n ] =
44
⎡v 11 v 12 ⎢v v 22 = ⎢ 21 ⎢L L ⎢v ⎣ n1 v n 2
L v 1n ⎤ ⎡λ1 0 L v 2 n ⎥ ⎢ 0 λ2 ⎥⋅⎢ L L ⎥ ⎢L L L v nn ⎥⎦ ⎢⎣ 0 0
0⎤ L 0⎥ ⎥ = VΛ , L L⎥ L λn ⎥⎦ L
где Λ - диагональная матрица собственных чисел. Таким образом, получено равенство
AV = VΛ , или
A = V ΛD T .
(2.4-22)
Преобразование A = TCT , где T - произвольная невырожденная матрица, называется преобразованием подобия. Одно из основных свойств этого преобразования заключается в том, что собственные числа подобных матриц (здесь - A и C ) совпадают. Действительно, −1
ϕ A (λ ) = λE − A = λTT −1 −TCT −1 = T λE − C T −1 = ϕ C (λ ) . Говорят, что матрица A приводится к диагональному виду преобразованием
Λ = V −1 AV = DT AV . (2.4-23) Более высокие степени A приводятся к диагональному виду таким же
способом:
Λ2 = V −1AVV −1 AV = V −1 A 2V .....................................................
Λl = V −1A lV или A l = VΛlV −1 . Таким образом, если рассмотреть матричный многочлен
N ( A) = A l + C1 A l −1 + K + C l −1 A + C l E, то
N ( A) = V {Λl + C1Λl −1 + K + Cl −1Λ + C l E }V −1,
или .
0 ⎡N (λ1 ) ⎢ 0 N ( λ2 ) N ( A) = V ⎢ ⋅⋅⋅ ⎢ ⋅⋅⋅ ⎢ 0 0 ⎣
0 ⎤ ⋅⋅⋅ 0 ⎥ −1 ⋅⋅⋅ ⎥V . ⋅⋅⋅ ⋅⋅⋅ ⎥ ⋅ ⋅ ⋅ N (λl )⎥⎦
(2.4-24)
45
Если применить этот результат к характеристическому полиному, то получим
ϕ ( A) = 0,
(2.4-25)
то есть каждая квадратная матрица удовлетворяет своему характеристическому полиному. Это утверждение известно в теории матриц как теорема Кэли-Гамильтона. Для любой функции от матрицы f (A) , которую можно представить в виде конечного или бесконечного степенного полинома, справедливо аналогичное выражение
0 0 ⎤ K ⎡f (λ1 ) ⎢ 0 0 ⎥ T f ( λ2 ) K ⎥ ⋅D , f ( A) = V ⋅ ⎢ ⎢ M M M ⎥ ⎢ ⎥ 0 K f (λn )⎦ ⎣ 0
(2.4-26)
или эквивалентное ему
r rT f ( A) = ∑ f (λi )v i d i . n
(2.4-27)
i =1
Отсюда вытекает, например, один из способов определения матричной экспоненты или соответствующей переходной матрицы:
r rT Φ( t ) = e = ∑ e v i d i . At
n
λ t i
(2.4-28)
i =1
ПРИМЕР 2.4-2. Для объекта, представленного на рис.2.8. в примере 2.41, найдём левые собственные векторы. Если обозначить присоединённую матрицу к матрице A как I {A} , то очевидно равенство
I { A T } = I T { A} . Поэтому 2 0 0 ⎡λ + 3λ + 2 ⎤ ⎥. 2 + 4λ + 3 0 λ I d ( λ ) = I { AT } = ⎢ λ + 1 ⎢ ⎥ 2 ⎢⎣ 1 λ +3 λ + 5λ + 6⎥⎦
Учитывая, что
λ1 = −1; λ2 = −2; λ3 = −3 , имеем:
46
⎡0 0 0⎤ ⎡ 0 0 0⎤ I d (λ1 ) = ⎢0 0 0⎥ ; I d (λ2 ) = ⎢− 1 − 1 0⎥; ⎢ ⎥ ⎢ ⎥ ⎢⎣1 2 2⎥⎦ ⎢⎣ 1 1 0⎥⎦ ⎡ 2 0 0⎤ I d (λ3 ) = ⎢− 2 0 0⎥; ⎢ ⎥ ⎢⎣ 1 0 0⎥⎦ Рассчитаем левые собственные векторы. Учтем при этом (2.4-14). Таким
r
образом, для первого собственного вектора d1 должны выполняться условия
rT rT r d 1 =ν 1 [0 0 1], d 1 v 1 = 2ν 1 = 1,
откуда
ν1 =
1 2
и
r d 1T = [0 0 0.5].
Аналогично получим
⎡0⎤ ⎡ 1 ⎤ r ⎢ ⎥ r d 2 = 1 ; d 3 = ⎢ − 1⎥ . ⎢ ⎥ ⎢ ⎥ ⎢⎣− 1⎥⎦ ⎢⎣0.5⎥⎦ Теперь можно записать выражение для переходной матрицы. Из (2.4-28) имеем
e At
⎡0 0 0.5⎤ ⎡0 1 − 1⎤ ⎡1 − 1 0.5⎤ = ⎢0 0 1 ⎥e −t + ⎢0 1 − 1⎥e − 2t + ⎢0 0 0 ⎥e −3 t ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣0 0 1 ⎥⎦ ⎢⎣0 0 0 ⎥⎦ ⎢⎣0 0 0 ⎥⎦
и окончательно
⎡e −3 t ⎢ e At = ⎢ 0 ⎢⎣ 0
e −2t − e −3 t e −2 t 0
0.5e − t − e −2t + 0.5e −3 t ⎤ ⎥ e −t − e − 2 t ⎥. ⎥⎦ e −t
Рассмотрим ещё несколько примеров. Для
47
0⎤ ⎡− 3 1 A = ⎢ 0 − 2 1 ⎥; ⎢ ⎥ ⎢⎣ 0 0 − 1⎥⎦
λ1 = −1; λ2 = −2 ; λ3 = −3;
имеем
1⎤ ⎡ 0 0 ⎡0 1 − 1⎤ ⎡1 − 1 0.5⎤ ⎢ 2⎥ A = j ⎢0 0 1 ⎥ + j 2 ⎢0 1 − 1⎥ + j 3 ⎢0 0 0 ⎥= ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎦ 0 0 1 0 0 0 0 0 0 ⎢ ⎥ ⎣ ⎦ ⎣ ⎢⎣ ⎥⎦ ⎡ 1 3⎤ 3 2 3 2 − − + ⎢ ⎥ 2 2 ⎢ ⎥ 2 1 − 2 ⎥. = j⎢ 0 ⎢0 ⎥ 0 1 ⎢ ⎥ ⎣ ⎦ Проведём проверку:
⎡ 3⎤ ⎡ 1 2 3 2 3 − − + ⎥ ⎢ 3 ⎢ 2 2 ⎥ ⎢ ⎢ 2 1− 2 ⎥ ⋅ ⎢ 0 j2⎢ 0 ⎥ ⎢0 ⎢0 0 1 ⎥ ⎢ ⎢ ⎦ ⎣ ⎣ 0⎤ ⎡− 3 1 = ⎢ 0 − 2 1 ⎥. ⎢ ⎥ ⎢⎣ 0 0 − 1⎥⎦
2− 3 2 0
3⎤ 1 − 2+ ⎥ 2 ⎥ 2 1− 2 ⎥ = ⎥ 1 ⎥ ⎦
Для той же матрицы найдём A : 5
λ15 = −1, λ52 = −32 , λ53 = −243
и
48
⎡ ⎢0 A 5 = − ⎢0 ⎢ ⎢0 ⎢⎣ ⎡− 243 =⎢ 0 ⎢ ⎢⎣ 0
1⎤ ⎡ 0 1 − 1⎤ ⎡ ⎥ ⎢1 − 1 2 0 1 ⎥ − 32⎢0 1 − 1⎥ − 243 ⎢0 0 ⎢ ⎥ ⎥ ⎢ ⎢ ⎥ 0 1⎥ ⎢0 0 ⎣0 0 0 ⎦ ⎥⎦ ⎢⎣ 211 − 90 ⎤ − 32 31 ⎥. ⎥ − 1 ⎥⎦ 0 0
1⎤ 2⎥ 0⎥ = ⎥ 0⎥ ⎥⎦
2.5. Свойства движений линейных систем 2.5.1. Матричная весовая и переходная функции Пусть заданы уравнения некоторого динамического объекта
r r r x& (t ) = A(t )x + B(t )u(t ) ; r r y (t ) = C (t ) x (t ) .
(2.5-1) (2.5-2)
В соответствии с формулой Коши выражение для вектора выхода t r r r y (t ) = C(t )Φ(t, t 0 )x (t ) + ∫ C(t )Φ(t ,ξ )B(ξ )u(ξ )dξ .
(2.5-3)
t0
Анализируя качество работы объекта, удобно рассматривать движение r y (t ) как сумму свободной составляющей, обусловленной, в основном, свойствами самого объекта, и вынужденной составляющей, несущей отпечаток входного сигнала - вектора управления. Строго говоря, это разделение условно, но очевидно, что свободную составляющую целесообразно отождествить с первым слагаемым правой части равенства (2.5-3). Отсюда следует вывод, что основные свойства объекта определяются его переходной матрицей Φ(t ,t 0 ) , в то время как степень их проявления зависит от вектора начальных условий. Отметим, однако, что первопричиной всякого движения объекта является вектор управления. Это означает, что даже при анализе собственных движений объекта следует учитывать и матрицу управления B(t ) . Обозначим
w y (t ,τ ) = C (t )Φ (t,τ )B (τ ) .
(2.5-4)
Очевидно, что для i -й координаты вектора выхода при нулевых начальных условиях справедливо выражение
49
t nu
y i (t ) = ∫ ∑ w ij (t ,ξ )u j (ξ )dξ . t 0 j =1
Если положить
uk (ξ ) = δ (ξ − τ ) и u j (ξ ) = 0 при j ≠ k , то в соответствии со свойствами лучим
δ -функции по-
y i (t ) = w ik (t ,τ ) . Таким образом, элемент, стоящий в i -ой строке и в k -м столбце матрицы w y (t ,τ ) , можно интерпретировать как реакцию i -ой коорди-
r
наты вектора y (t ) на дельта-функцию δ (t − τ ) в k -ой координате r вектора управления u (t ) . Матрица w y (t ,τ ) называется матричной весовой или матричной импульсной переходной функцией объекта по вектору выхода. Аналогичным образом определяется матричная весовая функция объекта по вектору состояния
w x (t ,τ ) = Φ (t ,τ )B (τ ) .
(2.5-5)
u2 u1
k x1 p
10 2p + 1
x2
Рис. 2.11. К примеру на определение матричной весовой функции Интеграл от матричной весовой функции t
H (t, t 0 ) = ∫ w (t ,τ )dτ
(2.5-6)
t0
называют матричной переходной функцией объекта. Элементы этой матрицы могут рассматриваться как реакции координат вектора выхода (вектора состояния) на единичные функции по соответствующим координатам вектора управления. Если на вход объекта поступает постоянr ный во времени вектор управления u0 × 1(t − t 0 ) , то при нулевых начальных условиях
r r y (t ) = H (t , t 0 )u 0 .
(2.5-7) 50
В качестве примера на рис. 2.12 изображены элементы матричной переходной функции по вектору состояния для системы, представленной на рис. 2.11.
Рис.2.12. Элементы матричной переходной функции для системы, представленной на рис. 2.11 В стационарном случае рассмотренные матрицы являются функцией одного аргумента:
w y (t, t 0 ) = w y (t − t 0 ) = w y (τ ) = Ce Aτ B = CΦ (τ )B
(2.5-8)
и t
H y (t ) = ∫ CΦ (t − τ )Bdτ .
(2.5-9)
0
Это выражение для переходной функции можно упростить. Производя замену аргумента
σ = t −τ , получим 0
H y (t ) = ∫ CΦ(σ )Bdσ σ =t
и окончательно t
H y (t ) = − ∫ CΦ (τ )Bdτ .
(2.5-10)
0
Используя представление переходной матрицы через матричную экспоненту, можно получить 51
3 4 t2 ⎧ ⎫ 2 t 3 t H y (t ) = C ⎨Et + A + A +A + K⎬B . 2 3! 4! ⎩ ⎭
(2.5-11)
Один из наиболее употребимых способов вычисления Φ(t ) и H (t ) состоит в определении (расчете) соответствующих окаймленных матричных рядов. ПРИМЕР 2.5-1. Объект управления задан системой дифференциальных уравнений, которым соответствует схема в переменных состояния, приведенная на рис. 2.13.
x2(0)
x1(0)
x2
x1
u
2
y
2 Рис.2.13. Структурная схема к примеру 2.5-1 Этой схеме соответствуют уравнения
⎧ x& 1 = x 2 , ⎪& ⎨ x 2 = −2 x 2 + u, ⎪y = 2 x + x 1 2. ⎩ Требуется найти переходную матрицу, матричные весовую и переходную функции, реакцию объекта на постоянный входной сигнал. Прежде всего, найдем переходную матрицу. Элемент первой строки и первого столбца этой матрицы можно определить как реакцию координаты x1 на начальные условия x1 (0 ) = 1, x 2 (0 ) = 0 при u = 0 . Решение первого дифференциального уравнения дает
ϕ11 (t ) = x1 (t ) = 1. Аналогично
ϕ 22 (t ) = x 2 (t ) при x 2 (0 ) = 1,
x1 (0 ) = u = 0 .
Решая при этих условиях второе дифференциальное уравнение, получим
ϕ 22 (t ) = e −2t . 52
Очевидно ϕ 21 (t ) = 0 , так как координата x 2 не зависит от x1 . Для того, чтобы определить ϕ12 (t ) , следует взять интеграл t
ϕ12 (t ) = ∫ e −2τ dτ = 0.5(1 − e −2t ). 0
Таким образом,
⎡1 0.5(1 − e −2t )⎤ Φ( t ) = ⎢ ⎥. −2t 0 e ⎣ ⎦
В соответствии с уравнениями объекта
⎡0⎤ ⎡0 1 ⎤ ; ; C = [2 1], A=⎢ B = ⎢ ⎥ ⎥ ⎣1⎦ ⎣0 − 2⎦ поэтому
w y (t ) = CΦ(t )B = 1 и t
H y (t ) = ∫ CΦ (τ )Bdτ = t . 0
При нулевых начальных условиях и u = u 0 = const
y (t ) = u 0 ⋅ t . Если начальные условия ненулевые, то
r y (t ) = CΦ(t )x (0 ) + u 0 (t ) = 2 x 1 (0) + x 2 (0) + u 0 ⋅ t .
При этом t r r r x(t ) = Φ(t )x (0) + H x (t )u0 = Φ(t )x (0) + ∫ Φ(τ )Bdτ ⋅ u0 = 0
1 ⎤ ⎡1 1 ⎡ ⎤ ⎢ t + (e −2t − 1)⎥ −2 t x (0) + (1 − e )x2 (0)⎥ 2 4 +⎢ =⎢ 1 2 ⎥u0 . 1 −2 t −2 t ⎢ ⎥ e x2 (0) (1 − e ) ⎥ ⎣ ⎦ ⎢ ⎦ ⎣ 2 Видно, что в выходной координате участвуют не все составляющие движения, присутствующие в векторе состояния. Еще более характерная ситуация возникнет, если изменить исходные данные. Если положить
53
⎧ x&1 = x 2 ⎪& ⎨x2 = 2x2 + u , ⎪y = −2 x + x 1 2 ⎩ то поведение выходной координаты принципиально не изменится
y (t ) = −2 x 1 (0) + x 2 (0) + u 0 ⋅ t , но процесс по координатам состояния будет неограниченно расти:
1 1 2t 1 ⎤ ⎡ −2t ( ) ( ) x e x e tu 0 ⎥ ( ) ( ) 0 1 0 1 − − + − − 1 2 r ⎢ 2 4 2 x (t ) = ⎢ ⎥. 1 − 2t 2t e x 2 (0) + (e − 1)u 0 ⎥ ⎢ ⎦ ⎣ 2 Такие случаи, когда вектор выхода не отражает характерные свойства объекта, могущие привести к катастрофическим результатам, будут подробно обсуждаться в последующих разделах. 2.5.2. Модальная (спектральная) интерпретация решения векторноматричных дифференциальных линейных стационарных уравнений Рассмотрим сначала движение автономной системы
r r x& (t ) = Ax (t ),
r r x (t ) = x 0 .
(2.5-12)
Пусть все собственные числа матрицы A различны. Тогда ее собственr n ные векторы v i , i = 1,2,..., n образуют базис в пространстве R , то есть являются линейно независимыми. В соответствии с (2.3-5) и (2.4-28) решение уравнения (2.5-12) можно записать в виде n r rr r x (t ) = ∑ e λi t v i d iT x (0) . i =1
Обозначим скаляр
rT r μ i = d i x (0 ) ,
(2.5-13)
тогда
r x (t ) =
n
r
∑ μ i e λi t v i .
(2.5-14)
i =1
Очевидно, что свободное движение вектора состояния объекта является комбинацией движений по собственным векторам матрицы A . Такие движения называют модами системы, а матрицу собственных векторов V - модальной матрицей. Коэффициент μ i соответствует величине возбуждения i - ой моды системы, обусловленной начальными условия54
ми. Иначе говоря, каждая мода возбуждается соответствующим выбором начального состояния. Согласно (2.5-13),
⎡ x1(0) ⎤ ⎢ x (0 )⎥ μ i = [d i 1 d i 2 ... d in ] ⎢ 2 ⎥ = d i 1x1(0) + d i 2 x 2 (0) + ... + d in x n (0) . ⎢ ... ⎥ ⎥ ⎢ ⎣ x n (0)⎦ r Если вектор начальных условий x(0) совпадает по направлению с i - м собственным вектором, то есть
r r x (0 ) = α ⋅ v i ,
то, учитывая, что согласно (2.4-13) и (2.4-14),
rT r d i v i = 1, получаем rT r μ i = d i x (0 ) = α i
и
rT r μ j = d j x (0 ) = 0
r r d iT v j = 0 при i ≠ j и
при
j ≠ i.
Таким образом, при указанном выборе начальных условий, возбуждается только i-ая мода, или «частота». Рассмотрим с этих же позиций движение неавтономного объекта
r r r x& (t ) = Ax(t ) + Bu(t ). Изложенный подход можно использовать и в этом случае, если вектор r Bu(t ) разложить по собственным векторам матрицы A : n r r Bu(t ) = ∑ β i (t ) × v i
..
(2.5-15)
i =1
Для того, чтобы определить скалярные функции
rT части этого равенства слева на d j : n rT r rT r d j Bu(t ) = ∑ β i (t )d j v i ,
β i (t ) , умножим обе
i =1
откуда, учитывая (2.4-13) и (2.4-14), получаем
rT r β i (t ) = d i Bu(t ).
(2.5-16)
Таким образом, в соответствии с формулой Коши (2.3-18) и выражением для переходной матрицы (2.4-28) имеем
55
t n r r At r x (t ) = e x (0 ) + ∫ e A (t −τ ) ⋅ ∑ β i (τ )v i dτ = i =1
0
t n n r r r r λ ( t −τ ) = e x (0 ) + ∫ ∑ e j ∑ β i (τ )v j d Tj v i dτ = At
0 j =1
(2.5-17)
i =1
⎫ r ⎧ λ j t t λ j (t −τ ) r T r d j Bu (τ )dτ ⎬ ⋅ v j . = ∑ ⎨μ i e + ∫ e j =1 ⎩ ⎭ 0 n
r
Если вынуждающая функция u (t ) выбирается таким образом, чтобы r вектор Bu (t ) совпадал с направлением одного из собственных векторов матрицы A , то она будет возбуждать только одну соответствующую моду «частоту».
2.6. Модели стационарных линейных систем в комплексной плоскости на основе преобразования Лапласа 2.6.1. Матрица передаточных функций Известно, что преобразование Лапласа определяется парой преобразований ∞ r r r X ( p ) = L{x (t )} = ∫ x (t )e − pt dt ,
0
r r x (t ) = L−1 X ( p ) =
{
}
C + j∞
1 ∫ 2π ⋅ j C − j∞
r X ( p )e pt dp .
(2.6-1)
Первое из них называется прямым, а второе - обратным. Векторная
r r функция x(t ) называется оригиналом, а X ( p ) - изображением этого
оригинала по Лапласу; p - комплексная переменная преобразования Лапласа. Преобразование Лапласа можно осуществить, если p = σ + jω и σ > σ c , где σ c - абсцисса абсолютной сходимости. Ве-
r
σ C выбирается исходя из требования, чтобы функция x (t )e −σt при σ > σ C была абсолютно интегрируемой.
личина
При вычислении обратного преобразования Лапласа интегрирование ведется на плоскости комплексной переменной p по прямой, параллельной мнимой оси, лежащей на прямой с, причем с выбирается так,
r чтобы все полюсы X ( p ) оказались слева от прямой интегрирования (рис. 2.14). На этом рисунке показано расположение полюсов некоторой
r функции X ( p ) .
56
+j
Плоскость p
σc с
+
Рис.2.14. К вычислению обратного преобразования Лапласа Пусть, как обычно, уравнения объекта имеют вид
r r r x& (t ) = A(t )x(t ) + B(t )u(t ); r r y (t ) = C(t )x (t ). Перейдем к изображениям по Лапласу
r r r r pX ( p) − x(0) = AX ( p ) + BU ( p ); r Y ( p ) = CX ( p ). r
Перенесем AX(p) в левую часть равенства, а x(0) - в правую:
r r r ( pE − A) X ( p ) = x(0) + BU ( p). Отсюда получаем выражение для изображения вектора состояния
r r r −1 −1 X ( p ) = ( pE − A) x (0) + ( pE − A) BU ( p ) .
Сравнивая это равенство с формулой Коши t r r r At x(t ) = e ⋅ x(0) + ∫ e A( t −τ ) ⋅ Bu(τ )dτ , 0
отмечаем, что резольвента матрицы A может рассматриваться как изображение по Лапласу от переходной матрицы (матричной экспоненты):
( pE − A ) −1 = L {e At }. Справедливо равенство
( pE − A) −1 =
I ( p) , ϕ A ( p)
(2.6-2)
57
где I ( p ) - присоединенная матрица для матрицы А, и ϕ A (p ) - характеристический полином матрицы A . I ( p ) и ϕ A (p ) могут быть определены по методу Фаддеева - Леверье. При нулевых начальных условиях
r r X ( p ) = ( pE − A)−1 BU ( p ),
(2.6-3)
Wux ( p ) = ( pE − A) −1 ⋅ B
(2.6-4)
где функция
называется матричной передаточной функцией от вектора управления до вектора выхода или передаточной функцией по каналу «u-x». Аналогично, при нулевых начальных условиях
r r −1 Y ( p ) = C( pE − A) BU ( p ),
(2.6-5)
где функция
Wuy ( p ) = C( pE − A) −1 ⋅ B
(2.6-6)
называется матричной передаточной функцией от вектора управления до вектора выхода или передаточной функцией по каналу «u-y». Функ−1 цию ( pE − A) называют резольвентой матрицы A . С использованием передаточной функции можно записать:
r r X ( p ) = Wux ( p ) ⋅ U ( p ) . r r Y ( p ) = Wuy ( p ) ⋅ U ( p )
(2.6-7)
Принимая во внимание, что изображение по Лапласу δ - функции равно единице, можно представить передаточную функцию как изображение от весовой функции
W ( p ) = L{w (t )}.
(2.6-8)
Передаточная функция является функцией от матрицы A , поэтому в соответствии с (2.4-27) можно записать
r rT C ⋅v i ⋅ d i B Wuy ( p ) = ∑ i =1 ( p − λi )
(2.6-9)
r rT C ⋅ v i ⋅ di B r ⋅ U ( p) . Y ( p) = ∑ i =1 ( p − λi )
(2.6-10)
n
и
n
Графическое изображение последней формулы представлено в виде структурной схемы, изображённой на рис. 2.15. 58
rT d1 B r U ( p)
1 p − λ1
r C v1
rT d2 B
1 p − λ2
r Cv2
rT dn B
1 p − λn
r Cvn
∑
r Y ( p)
Рис. 2.15. Структурная схема системы на базе представления передаточной функции через собственные числа и собственные векторы матрицы динамики ПРИМЕР 2.6-1. Для объекта, схема в переменных состояния которого приведена на рис.2.16, уравнения состояния имеют вид
x&1 = x 2 − u1 ; x& 2 = x 3 + u1 ;
x& 3 = x 2 + u2 ;
y 1 = x1 ; y 2 = x3 .
Им соответствует матрицы
⎡− 1 0⎤ ⎡0 1 0⎤ ⎡ 1 0 0⎤ A = ⎢0 0 1⎥; B = ⎢ 1 0⎥; C = ⎢ ⎥. ⎥ ⎢ ⎥ ⎢ 0 0 1 ⎣ ⎦ ⎢⎣ 0 1⎥⎦ ⎢⎣0 1 0⎥⎦ Характеристический полином имеет вид
ϕ A (λ ) = λ3 − λ . Собственные числа
λ 1 = 0 ; λ 2 = 1; λ 3 = − 1 .
59
u1 x2
x1 x3
u2
y1 y2
Рис.2.16. Структурная схема к примеру 2.6-1 Присоединенная матрица
⎡λ 2 − 1 λ ⎢ I (λ ) = ⎢ 0 λ2 ⎢⎣ 0 λ
1⎤ λ ⎥⎥. λ2 ⎥⎦
Резольвента
⎡1 ⎢λ I (λ ) ⎢⎢ −1 (λE − A ) = = 0 ϕ A (λ ) ⎢ ⎢ ⎢0 ⎣
1 1 ⎤ λ − 1 λ (λ2 −1) ⎥ λ 1 ⎥⎥ . λ2 − 1 λ2 − 1 ⎥ λ ⎥ 1 λ2 − 1 λ2 − 1 ⎥⎦ 2
В соответствии с (2.6-4) передаточная функция по вектору состояния 2 1 ⎤ ⎡− p + p +1 ⎢ p( p 2 − 1) p( p 2 − 1) ⎥ ⎥ ⎢ p 1 −1 ⎥ Wux ( p ) = ( pE − A ) B = ⎢ 2 2 ⎢ p −1 p −1 ⎥ ⎥ ⎢ 1 p ⎥ ⎢ 2 p2 −1 ⎦ ⎣ p −1
и по вектору выхода 2 1 ⎤ ⎡ − p + p +1 ⎢ p( p 2 − 1) p 2 − 1⎥ −1 Wuy ( p ) = C ( pE − A ) B = ⎢ ⎥. 1 p ⎢ ⎥ 2 2 ⎢⎣ p −1 p − 1⎥⎦
Используя присоединенную матрицу, можно найти матрицу правых собственных векторов 60
⎡1 1 1 ⎤ V = ⎢0 1 − 1⎥ . ⎢ ⎥ ⎢⎣0 1 1 ⎥⎦ Присоединенная матрица для A
T
2 ⎡λ − 1 0 2 I d (λ ) = ⎢ λ λ ⎢ ⎢⎣ 1 λ
0⎤ λ ⎥⎥ . λ2 ⎥⎦
Левые собственные векторы
1 0 0 ⎤ r ⎡ ⎤ r ⎡ ⎤ r ⎡ d 1 = ⎢ 0 ⎥; d 2 = ⎢0.5⎥; d 3 = ⎢− 0.5⎥ . ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣⎢− 1⎦⎥ ⎣⎢0.5⎦⎥ ⎣⎢ 0.5 ⎦⎥ Базовые матрицы
⎡1 0 − 1⎤ ⎡0 0.5 0.5⎤ r r r r v 1d 1T = ⎢0 0 0 ⎥ ; v 2 d 2T = ⎢0 0.5 0.5⎥ ; ⎢ ⎥ ⎢ ⎥ ⎢⎣0 0 0 ⎥⎦ ⎢⎣0 0.5 0.5⎥⎦ ⎡0 − 0.5 0.5 ⎤ r r v 3 d 3T = ⎢0 0.5 − 0.5⎥ . ⎢ ⎥ ⎢⎣0 − 0.5 0.5 ⎥⎦ Вычислим коэффициенты суммы (2.6-9):
r r ⎡− 1 − 1⎤ Cv 1d 1T B = ⎢ ⎥; 0 0 ⎣ ⎦
r r ⎡0.5 0.5⎤ Cv 2 d 2T B = ⎢ ⎥; 0 . 5 0 . 5 ⎦ ⎣
r rT ⎡− 0.5 0.5⎤ Cv 3 d 3 B = ⎢ ⎥ ⎣− 0.5 0.5⎦ и получим результат, естественно, совпадающий с уже полученным
Wuy ( p ) =
1 ⎡−1 − 1⎤ 1 1 ⎡1 1⎤ 1 1 ⎡− 1 1⎤ + ⋅ . + ⋅ p ⎢⎣ 0 0 ⎥⎦ p − 1 2 ⎢⎣1 1⎥⎦ p + 1 2 ⎢⎣− 1 1⎥⎦
Практически без дополнительных выкладок получаем
61
⎡− 1 − 1⎤ 1 ⎡1 1⎤ t 1 ⎡− 1 1⎤ −t w y (t ) = ⎢ ⎥ + 2 ⎢1 1⎥ ⋅ e + 2 ⎢− 1 1⎥ ⋅ e . 0 0 ⎣ ⎣ ⎦ ⎣ ⎦ ⎦ Интегрируя весовую функцию, получаем матричную переходную функцию
1 t 1 t ⎡ −t −t ⎤ ( ) ( )⎥ t e 2 e t e e − + − + − + − ⎢ 2 2 H y (t ) = ⎢ ⎥. 1 t 1 t −t −t (e − 2 + e ) (e − e ) ⎥ ⎢ ⎣ 2 ⎦ 2
2.6.2. Основные свойства передаточных функций Понятие передаточной функции лежит в основе классической теории автоматического регулирования. В связи с этим ниже перечисляются основные её свойства, используемые при анализе систем автоматического управления. 1. Элемент i -й строки и j -го столбца матричной передаточной функции равен отношению изображения i -й координаты вектора выхода к j -ой координате вектора управления при нулевых начальных условиях:
Wij (p ) =
Yi ( p ) . U j ( p)
(2.6-11)
Таким образом, nu
Yi ( p ) = ∑W ij ( p )U j ( p ) .
(2.6-12)
j =1
2. Для стационарных объектов с сосредоточенными параметрами элементы матричной передаточной функции - это дробно-рациональные функции комплексной переменной p :
b0 p m + b1p m −1 + ... + bm Wij ( p ) = = Qij ( p ) a0 p n + a1p n −1 + ... + an Rij ( p )
.
(2.6.13)
3. По известной передаточной функции легко восстанавливаются соответствующие дифференциальные уравнения. По данным предыдущего примера
62
1 − p2 + p + 1 Y1 ( p ) = U ( p ) + U 2 ( p) . 1 p( p 2 − 1) p( p 2 − 1) После приведения к общему знаменателю получаем
p 3Y1 (p ) − pY1 (p ) = − p 2U1( p ) + pU1( p ) + U1( p ) + U 2 ( p ) , и в результате имеем
&y&&1(t ) − y& 1(t ) = −u&&1 (t ) + u&1(t ) + u1(t ) + u2 (t ) . 4. Знаменатель передаточной функции - это соответствующий характеристический полином. Полюсы передаточной функции - это корни соответствующего характеристического полинома. 5. Поскольку весовая функция является оригиналом для передаточной, то при всех различных полюсах n
w ij (t ) = ∑ Cl e pl t ,
(2.6.14)
l =1
где pl - полюсы функции; m
Rij ( pl )
b Cl = ' = 0⋅ Q ij ( pl ) a0
∏ (p v =1 n
∏ (p
v =1,v ≠ l
− rv )
l
l
− rv )
;
b0 ,a0 - коэффициенты при старших степенях p
(2.6.15)
числителя и знамена-
теля передаточной функции Wij (p ) ;
rv - нули W ij (p ) . 6. В физически реализуемых системах порядок числителя m элементарной передаточной функции не может превышать порядка ее знаменателя n . 7. В простейших случаях элементарная передаточная функция может быть непосредственно получена из соответствующего дифференциального уравнения. Например, для динамического звена с уравнением
T
dy (t ) du(t ) + y (t ) = T dt dt
путем перехода к изображениям по Лапласу при нулевых начальных условиях получаем
T pY ( p) + Y ( p) = T p U ( p) , откуда
63
W ( p) =
Y ( p) Tp = . U ( p ) Tp + 1
При описании пассивных электрических цепей передаточные функции могут вычисляться в соответствии с правилами электротехники с использованием полных символических сопротивлений. Так, например, для схемы, приведенной на рис.2.17, С
R1
U
R2
Uвых=Y
Рис.2.17. Пассивное дифференцирующее звено
W ( p) =
Y ( p) = U ( p)
R2 1 pC R2 + 1 R1 + pC R1 ⋅
=
R2 ⋅ R1 + R2
R1Cp + 1 . R2 R1Cp + 1 R1 + R2
64
2.7. Комплексный передаточный коэффициент 2.7.1. Способы определения понятия «Комплексный передаточный коэффициент» Известно несколько подходов к введению понятия «Комплексный передаточный коэффициент». Рассмотрим основные из них. ♦ Формальная замена комплексной переменной в передаточной функции. Изображения по Лапласу вектора выхода и вектора управления связаны между собой с помощью передаточной функции
v v Y ( p ) = W ( p )U ( p ) .
(2.7-1)
Если в этом равенстве комплексную переменную p принять чисто мнимой величиной p = jω , то формально получаем следующее равенство
v v Y ( jω ) = W ( jω )U ( jω ) .
(2.7-2)
Здесь комплексный передаточный коэффициент W ( jω ) определяется формально:
W ( jω ) = W ( p ) | p = jω . Строго говоря, эта замена не всегда правомерна. ♦ Использование преобразования Фурье Прямое и обратное преобразования Лапласа выглядят щим образом: ∞
Y ( p ) = ∫ y (t )e dt ; − pt
0
1 C + jω y (t ) = Y ( p )e pt dp ∫ 2πj C − jω
следую-
(2.7-3)
Преобразование Лапласа существует тогда, когда вещественная часть комплексной переменной p удовлетворяет неравенству σ > σ C . Если функция y (t ) , t ∈ [0, ∞ ) является односторонней и абсолютно ин∞
тегрируемой, т.е.
∫0 y (t )dt < ∞ , то её абсцисса абсолютной сходимости
σ C <0, и можно принять p = jω (σ = 0 ). В этом случае прямое преобразование Лапласа совпадает с прямым преобразованием Фурье: ∞
Y ( jω ) = ∫ y (t )e − jωt dt .
(2.7-4)
0
Практически столь же просто обратное преобразование Лапласа превращается в обратное преобразование Фурье: 65
1 + j∞ y (t ) = Y ( jω )e j∞t d ( jω ) ⇒ ∫ 2πj − j∞
(2.7-5)
1 Y ( jω )e jωt dω . ∫ 2π −∞ r r r r r Таким образом, если x& (t ) = Ax (t ) + Bu (t ); y (t ) = Cx (t ) и если r r r функции x (t ) , y (t ) и u (t ) абсолютно интегрируемы, то можно к указанy (t ) =
+∞
ным уравнениям применить не только преобразование Лапласа, но и преобразование Фурье:
r r r jωX ( jω ) = AX ( jω ) + BU ( jω ); r r X ( jω ) = ( jωE − A) −1 ⋅ B ⋅U ( jω ); r r X ( jω ) = W x ( jω ) ⋅U ( jω ); W y ( jω ) = C ⋅ ( jωE − A ) −1 B .
(2.7-6)
Функция W y ( jω ) = C ( jωE − A) B называется комплексным передаточным коэффициентом, или частотной функцией соответствующего динамического звена или системы. Аналогично передаточной функции, она может быть выражена через левые и правые собственные, векторы матрицы А векторно-матричного дифференциального уравнения этого звена или системы: −1
r v Cv i d iT B W ( jω ) = ∑ . i =1 jω − λ i n
(2.7-7)
2.7.2. Реакция динамических звеньев на гармонические воздействия Рассмотрим реакцию системы
r r r x (t ) = A ⋅ x ( t ) + b ⋅ u ( t )
со скалярным управлением на гармоническое воздействие
u(t ) = U m ⋅ Cosωt =
U m jωt U m − jωt ⋅e + e . 2 2
(2.7-8)
Каждое из слагаемых последнего выражения вызывает свою реакцию, то есть,
r r r x (t ) = x 1 (t ) + x 2 ( t ) .
(2.7-9)
66
В силу линейности рассматриваемых систем применим принцип суперпозиции, и достаточно определить реакцию на первое слагаемое
U m jωt ⋅e . 2
(2.7-10)
ro r X x1 (t ) = 1 ⋅ e jωt , 2
(2.7-11)
u 1 (t ) =
r
Ищем x 1 (t ) в виде:
где
⎡ Xo ⎤ ⎢ o11 ⎥ or ⎢ ⎥ X = ⎢ X 12 ⎥ , ⎢ Mo ⎥ ⎢X ⎥ ⎣ 1n ⎦ o
а X i - комплексные амплитуды по координатам вектора состояния: o
X i = X i max e jϕ i . (2.7-12) r r Подставим x1 (t ) и u1 (t ) в исходное дифференциальное уравнение и проведём элементарные преобразования:
ro ⎞ ⎛ ro X 1 jωt r U m jωt d ⎜ X 1 jωt ⎟ ⋅e + b ⋅ ⋅e ; ⋅e ⎟ = A⋅ 2 2 dt ⎜⎜ 2 ⎟ ⎠ ⎝ ro ro r jωt X 1 ⋅ jω ⋅ e = A ⋅ X 1 ⋅ e jωt + b ⋅ U m ⋅ e jωt ; ro ro r X 1 ⋅ jω − A ⋅ X 1 = b ⋅ U m ; ro r −1 X 1 = ( jωE − A) ⋅ b ⋅ U m , то есть:
ro X 1 = W ( jω ) ⋅ U m ,
(2.7-13)
где матричный комплексный передаточный коэффициент
r W ( jω ) = ( jωE − A) b , −1
что совпадает с (2.7-6). 67
Аналогичным образом можно получить реакцию на вторую составляющую входного сигнала u 2 (t ) =
U m − jωt ⋅e : 2
ro X 2 = W ( − jω ) ⋅ U m .
(2.7-14)
Полная реакция системы на гармоническое воздействие (2.7-8) в соответствии с (2.7-13)) , ((2.7-14)) и ((2.7-9)
r W ( jω )U m jωt W ( − jω )U m − jωt x (t ) = e + e = 2 2
⎡ W1 ( jω ) cos(ωt + ϕ 1 ) ⎤ ⎢ ⎥ + ( ) cos( ) W j t ω ω ϕ 2 2 ⎥U . =⎢ ⎢ ⎥ m .......... .... ⎢ ⎥ + W j t ( ω ) cos( ω ϕ ) n ⎦ ⎣ n Таким образом, элемент матричной функции W ( jω ) , которая, по понятным теперь причинам, называется частотной функцией, определяется как отношение вынужденной гармонической составляющей (частное решение неоднородного дифференциального уравнения) к гармоническому входному воздействию при условии записи их в символической форме. Комплексный передаточный коэффициент определяет изменение в зависимости от частоты амплитуды и фазы гармонического сигнала при прохождении его от вектора управления до каждой из координат вектора состояния или вектора выхода:
W i ( jω ) =
X i max jϕ i ⋅e . Um
(2.7-15)
Модуль W ( jω ) определяет отношение амплитуд:
W i ( jω ) =
X i max , Um
(2.7-16)
а фаза – сдвиг по фазе между входным и выходным гармоническими сигналами:
arg(W i ( jω )) = ϕ i .
(2.7-17)
2.7.3. Частотные характеристики Элементы матричной частотной функции связывают между собой соответствующие координаты векторов входа и управления: 68
W ik ( jω ) =
Yi ( jω ) . U k ( jω )
(2.7-18)
Такие скалярные функции принято иллюстрировать графическими частотными характеристиками: – амплитудно-фазовой характеристикой (АФХ), построенной в полярной системе координат {модуль, фаза}; можно рассматривать и соответствующую декартову систему координат, по осям которой откладываются вещественная и мнимая части годографа вектора W ( jω ) ; – логарифмическими частотными характеристиками (ЛЧХ) - амплитудно-частотной (ЛАЧХ), построенной в осях | W ( jω ) | в децибелах, - ω в логарифмическом масштабе, и фазочастотной (ЛФЧХ), построенной в осях фаза - ω в логарифмическом масштабе Модуль частотной функции в децибелах определяется в соответствии с выражением
| W ik ( jω ) | ∂σ = 20 lg | W ik ( jω ) | .
(2.7-19) 2
⎛ 4p +1 ⎞ k В качестве примера для звена W ( p ) = ⎜ ⎟ ⋅ 3 приведены ⎝ 0.08 p + 1⎠ p АФХ (рис.2.18) и ЛЧХ (рис.2.19).
+j ω1 ω2
-1
ω4
1
ω=8
+
ω3 Рис 2.18. Амплитудно-фазовая характеристика
69
Рис 2.19. Логарифмические амплитудно-частотная и фазочастотная характеристики В учебной литературе по теории автоматического управления достаточно подробно рассматривается методика построения частотных характеристик типовых или более общего вида динамических звеньев и систем. Поэтому в настоящем пособии эти вопросы не затрагиваются.
70
2.8. Графическое представление объектов и систем управления Графическое изображение с использованием функциональных блоков, передаточных функций, сигналов и их изображений называют структурными схемами. Для представления систем в виде совокупности отдельных функционально определенных блоков (подсистем) используются функциональные схемы. 2.8.1. Соглашение об обозначениях Элементарно-+\.е динамическое звено (система) с передаточной функцией W ( p ) представлено на рис 2.20, где
Yвх ( p )
W (p)
Yвых ( p )
Рис. 2.20. Динамическое звено
Yвх ( p ) – изображение по Лапласу входного сигнала; Yвых ( p ) – изображение по Лапласу выходного сигнала; W ( p ) – передаточная функция звена; Связь между элементами выражается уравнением:
Yвых ( p ) = Yвх ( p )W ( p ) . Варианты изображения элементов сравнения, или сумматоров на структурных схемах представлены на рис.2.21
U1
U3
U1
U2
U3
U2
U1
+
U2
U3
–
Рис. 2.21. Элементы сравнения, сумматоры Все три варианта равносильны и описываются уравнением:
U 3 = U1 − U 2 . Если на вход сумматора подается несколько входных сигналов, то он изображается в виде, представленном на рис.2.22 (три входных сигнала).
71
U1 U2 U3
Σ
U4
Рис. 2.22. Сумматор с тремя входными сигналами Варианты элементов умножения на структурных схемах представлены на рис 2.23. Оба вида равносильны в применении и описываются уравнением: U 2 = K × U1 .
U2
U1
U1
K
U2
K Рис. 2.23. Элементы умножения В качестве примера функциональной схемы на рис 2.24 представлена функциональная схема системы стабилизации крена ракеты. На рисунке использованы обозначения: БЦВМ – бортовая цифровая вычислительная машина; УМ – усилитель мощности; РМ – рулевая машина; ЦАП – цифро-аналоговый преобразователь; АЦП – аналого-цифровой преобразователь; δ - положение управляющего органа (сопло, руль); ϕ - угол крена; ϕ& - угловая скорость крена; Возмущающие факторы: W – ветер; T – окружающая температура; PAT – атмосферное давление; r r – вектор командных сигналов.
72
W
δ
PAT
T
Объект (ракета)
ϕ
Датчик угла
ϕ&
Датчик угловой скорости
АЦП РМ
УМ
ЦАП
r r БЦВМ
Рис. 2.24. Функциональная схема угловой стабилизации ракеты 2.8.2. Структурные схемы и графы стационарных систем 2.8.2.1. Типовые соединения многомерных линейных систем Одной из характерных задач анализа САУ является задача преобразования и упрощения исходных структурных схем. При этом используются правила преобразования простейших, типовых соединений, к которым относят параллельное (согласно-параллельное) - рис 2.25, последовательное – рис 2.26, и встречно-параллельное, когда одно динамическое звено включено в обратную связь другому – рис 2.27. Для каждой из этих ситуаций нетрудно найти передаточную функцию эквивалентного звена. Пусть исходные динамические звенья имеют следующее описание:
r r r x& 1 (t ) = A1 x1 (t ) + B1u1 (t );
r r y 1 (t ) = C1 x1(t ) ;
r r r r r x& 2 (t ) = A 2 x 2 (t ) + B2u 2 (t ); y 2 (t ) = C2 x 2 (t ) .
(2.8-1)
Параллельное соединение (рис. 2.25). В случае параллельного соединения звеньев введем в рассмотрение следующие очевидные равенства из блочных векторов и матриц
73
r ⎡ x& 1 ⎤ ⎡ A1 ⎢ r& ⎥ = ⎢ ⎣x2 ⎦ ⎣ 0
r r 0 ⎤ ⎡ x1 ⎤ ⎡ B1 ⎤ r r ⎡ x1 ⎤ ⋅ r + ⋅ u; y = [C1 C2 ] ⋅ ⎢ r ⎥ . (2.8-2) A2 ⎥⎦ ⎢⎣ x 2 ⎥⎦ ⎢⎣B2 ⎥⎦ ⎣x2 ⎦
В соответствии с этим можно записать выражение для эквивалентной передаточной функции соединения
r u1 r u
r u2
r y1
I r x1
r y
II r x2
r y2
Рис. 2.25. Параллельное соединение
WЭ ( p ) = C( pE − A) −1 B ,
(2.8-3)
где:
0⎤ ⎡ B1 ⎤ = ; B ⎢B ⎥; C = [C1 C2 ]. A2 ⎥⎦ ⎣ 2⎦
⎡A A=⎢ 1 ⎣0 Учитывая, что а
(2.8-4)
r r r y = y1 + y 2 ,
r r r r Y1 ( p ) = W1 ( p )U ( p ); Y2 ( p ) = W2 ( p )U ( p ) ,
получаем
WЭ ( p ) = W1 ( p ) + W2 ( p ) .
(2.8-5)
С другой стороны, передаточную функцию эквивалентного звена можно расписать следующим образом: −1
⎛ ⎡A 0 ⎤ ⎞ ⎡B1 ⎤ WЭ (p) =C⋅(pE− A) ⋅B =[C1 C2 ] ⎜ pE−⎢ 1 ⎥ ⎟ ⎢B ⎥ = 0 A ⎝ ⎣ 2⎦ ⎠ ⎣ 2⎦ −1
0 ⎤ ⎡pE − A =[C1 C2 ]⎢ n1 1 pEn2 − A2 ⎥⎦ ⎣ 0
−1
⎡B1 ⎤ ⎢B ⎥, ⎣ 2⎦ 74
где: n1, n 2 – размерности соответствующих единичных матриц. Продолжим преобразования: −1 0 ⎡( pE n1 − A1 ) ⎤ ⎡ B1 ⎤ WЭ ( p ) = C ⎢ −1 ⎥ ⎢ ⎥= B − 0 ( ) pE A ⎣ ⎦⎣ 2 ⎦ n2 2
= [C1
−1 ⎡ ( pE n1 − A1 ) ⎤ = C2 ]⎢ −1 ⎥ − ( pE A ) ⎣ ⎦ n2 2
C1 ( pE n1 − A1 ) −1 B1 + C 2 ( pE n 2 − A2 ) −1 B2 . Таким образом, в результате получаем:
WЭ ( p ) = W1 ( p ) + W 2 ( p ); WЭ ( p) =
C1I1 ( p ) ⋅ B1 C 2 I 2 ( p ) ⋅ B2 , + Q1 ( p ) Q2 ( p )
(2.8-6)
где
I1,I 2 – соответствующие присоединенные матрицы для матриц А1 и А2 ; Q1 ( p ), Q2 ( p ) - характеристические полиномы первого и второго звеньев, то есть:
Q1 ( p ) = ϕ A1 ( p ) = det( pE n1 − A1 ) Q2 ( p ) = ϕ A 2 ( p ) = det( pE n 2 − A2 ) Характеристический полином эквивалентной системы имеет вид:
Q( p ) = Q1 ( p ) ⋅ Q2 ( p ) .
(матрицы А ) (2.8-7)
Отсюда следует, что нули характеристического полинома (полюсы) эквивалентной передаточной функции соединения состоят из нулей характеристических полиномов (полюсов передаточных функций) первого и второго звеньев. Таким образом, если каждое из параллельных звеньев устойчивы, то и всё соединение в целом устойчиво; если в соединении присутствует хотя бы одно неустойчивое звено, то соединение в целом неустойчиво (связь между характером полюсов передаточной функции и устойчивостью соответствующей системы будет обсуждаться в п. 2.9).
75
Последовательное соединение (рис. 2.26). При последовательном соединении блочные уравнения имеют вид
r r u = u1
I r x1
r r y 1 = u2
II r x2
r r y2 = y
Рис. 2.26. Последовательное соединение
0 ⎤ ⎡ x1 ⎤ ⎡B1 ⎤ u; + ⋅ A2 ⎥⎦ ⎢⎣ x 2 ⎥⎦ ⎢⎣ 0 ⎥⎦
⎡ x&1 ⎤ ⎡ A1 ⎢ x& ⎥ = ⎢B C ⎣ 2⎦ ⎣ 2
⎡x ⎤ y = [0 C2 ] ⎢ 1 ⎥ , ⎣ x2 ⎦
(2.8-8)
и в выражении (2.8-3) для эквивалентной функции
⎡ A A=⎢ 1 ⎣B2C1
0⎤ ⎡B1 ⎤ ; B = ⎢ 0 ⎥; C = [0 C2 ]. A2 ⎥⎦ ⎣ ⎦
(2.8-9)
Кроме того, нетрудно получить связь между передаточными функциями отдельных звеньев, входящих в соединение, и эквивалентной передаточной функцией
WЭ ( p ) = W1 ( p )W2 ( p ) .
(2.8-10)
Вывод о связи между устойчивостью отдельных звеньев и устойчивостью их последовательного соединения аналогичен выводу для случая параллельного включения. Встречно-параллельное включение звеньев рис. 2.27.
r u1
r u
r x1
r r y1 = y
m r y2
r x2
r r u2 = y1
Рис. 2.27. Встречно-паралельное соединение
r rДляr встречно-параллельного u1 = u m y 2 , получаем:
⎡ A A=⎢ 1 ⎣B2C1
соединения,
m B1C2 ⎤ ⎡B1 ⎤ ; B = ⎢ 0 ⎥; C = [C1 0] A2 ⎥⎦ ⎣ ⎦
учитывая,
что
(2.8-11)
и 76
WЭ ( p) = [E ± W1 ( p )W2 ( p )] W1 ( p ) . −1
(2.8-12) Поскольку полюсы передаточной функции эквивалентного соединения в данном случае не удается выразить непосредственно через полюсы передаточных функций отдельных звеньев, то однозначного ответа об устойчивости соединения без дополнительного анализа получить не удается. 2.8.2.2. Графы динамических систем Графом называется множество вершин и ребер, в котором каждому ребру соответствует две вершины - начало и конец ребра. Основные характеристики графов: 1) каждой вершине на графе, изображаемой кружком или точкой, ставится в соответствие величина одной из переменных (координат системы); 2) каждое ребро, изображаемое на графе линией со стрелкой, имеет вершину –“начало” и вершину – “конец”. Стрелка обозначает направление передачи сигнала от начала к концу, таким образом, граф прохождения сигналов является направленным (антисимметричным) графом; 3) величина, соответствующая началу (вершине) ребра, называется входной величиной ребра. Если из вершины выходит несколько ребер, то входные величины этих ребер одинаковы и равны величине соответствующей вершины; 4) ребро изображает одно из звеньев в системе и ему ставится в соответствие передаточная функция; 5) если к вершине подходит несколько ребер, то сопоставляемая ей величина равна сумме выходных величин ребер. Между графом прохождения сигналов и структурной схемой имеется взаимно - однозначное соответствие. Стрелка структурной схемы соответствует вершине графа, а прямоугольник (звено) – ребру. При необходимости в граф системы могут вводиться дополнительные единичные ребра для выявления промежуточных координат, являющихся, в основном, выходами отдельных ребер. Для примера, приведены графические представления некоторой системы в виде структурной схемы (рис 2.28) и графа (рис 2.29). Простейшие правила преобразования структурных схем и графов линейных систем представлены в таблице 2.1.
77
W1
y1
ε
v
W2
u3
y3
W3
y2
u4
W4
y5
W5
y
Рис. 2.28. Структурная схема системы
v
1
y1
W1
ε
y3
W3
u3
W4
1 u4
y 1
y
W5
W2 -1 Рис. 2.29. Граф системы
Таблица 2.1 № Структурная схема 1
Граф
Параллельное соединение звеньев. W1
U
W1
y U
y
W2
2
WЭ = W1 ( p ) +
+ W2 ( p)
W2
Последовательное соединение звеньев.
U
3
Эквивалентная передаточная функция
W1
W2
y
U
W1
W2
y WЭ = W1 ( p) ⋅ ⋅ W2 ( p )
Встречно-параллельное соединение звеньев. 78
y
U
U 1
W1
W1
1
m
Wэ ( p) =W1( p) / /1±W1( p)W2 ( p)
m W2
W2
Встречаются и более сложные случаи соединения звеньев, так, например, соединения с перекрестными связями (рис. 2.30).
W1
u
S1 p1
W2
p2
y
W4
W3
S2
Рис. 2.30. Соединение с перекрестными связями В этих случаях можно пользоваться правилом переноса динамического звена через сумматор или точку разветвления. Любое динамическое звено можно перенести через сумматор или точку разветвления; при этом звено должно войти во все входящие и ответвляющиеся ветви. В те ветви, в которые звено входит без изменения направления распространения сигнала, звено проходит со своей передаточной функцией. В тех ветвях, при продвижении в которые меняется направление распространения сигнала, передаточная функция звена изменяется на обратную. Это правило иллюстрируется элементарными примерами, приведёнными на рис. 2.31÷2.34.
79
p
u
u
y
W
y
y
W W
y Рис. 2.31. Перенос звена W через точку разветвления p S
u1
y
W
S
u1
W
u2
y
W
u2 Рис. 2.32. Перенос звена W через сумматор S
u
W1
p
W2
y1
W3 y2
u
W1
W2
y1
p 1/ W 2 W3 y2
Рис. 2.33. Перенос звена W2 через точку разветвления p
80
U1
S
W1
W3
y
W2
u1
u2
S
W1
W3
y
1/W 2 W2
u2 Рис. 2.34. Перенос звена W1 через сумматор S. В качестве примера проведём упрощение структурной схемы, приведённой на рис. 2.30. Перенесём динамическое звено с передаточной функцией W 2 через точку разветвления p2 . После этого получим схему, состоящую только из элементарных соединений (рис. 2.35.).
1/ W2
u
W2 S1
p1 p2
W1
r y
W4 S2
W3 Рис. 2.35. Схема соединения после переноса
81
Теперь исходная система может быть представлена в упрощенном виде (рис 2.36.) и будет описываться выражением: W э =
W2 1 + W 2W 3
u
W1 + W4 W2
W2 ⎛W ⎞ ⋅⎜ 1 +W4 ⎟ 1+ W2W3 ⎝ W2 ⎠
y
Рис. 2.36. Исходная схема в упрощенном виде 2.8.2.3. Формула Мейсона В случае громоздких систем с большим числом звеньев и перекрестных связей наиболее эффективным является использование для получения эквивалентных передаточных функций правила Мейсона. В связи с этим введем необходимые дополнительные определения. Прямой путь между двумя заданными вершинами графа – это непрерывная последовательность ветвей одного направления, в которой каждая из вершин встречается не более одного раза. Контур – замкнутая цепь, при однократном обходе которой в направлении, указанном стрелками, каждая из вершин встречается не более одного раза. Согласно правилу Мейсона, передаточная функция W между входом в точке А и выходом в точке B равна:
WK ( p ) ⋅ Δ K ( p ) , K =1 Δ( p ) χ
W AB ( p ) = ∑
(2.8-13)
где: χ – число прямых путей между вершинами A и B ; W k ( p ) – передаточная функция k-го прямого пути от вершины A к вершине B (она равна произведению передаточных функций всех ребер, входящих в последовательность прямого пути); Δ( p ) – определитель графа; Δ k ( p) – k-й минор определителя графа, равный определителю более простого графа, который получается из данного графа путем удаления из него всех ребер и вершин, лежащих на k-м прямом пути, а также всех ребер входящих и исходящих из этих вершин. Определитель графа определяется из соотношения:
Δ( p ) = 1− ∑Woi ( p ) + ∑Woi ( p )Woj ( p ) − i
i,j
82
− ∑Woi ( p )Woj ( p )Wok ( p ) + K ,
(2.8-14)
i , j ,k
где
Woi ( p ) – передаточные функции различных контуров графа; Woi ( p )Woj ( p ) – произведения передаточных функций непересекающихся пар контуров;
W oi ( p )W oj ( p )W oz ( p ) – произведения передаточных функций непересекающихся троек контуров. ПРИМЕР 2.8-1. Найти передаточную функцию Wuy для системы, структурная схема которой приведена на рис. 2.37.
u
u1
W1
y1
u2
y
W2
y4
y3
W3
W4
Рис. 2.37. Структурная схема системы с перекрёстными связями Этой схеме соответствует граф, представленный на рис. 2.38.
y3
u
1
W3
-1
u1 W1 y 1
1
u2
W2
1
y4
1
y
W4
Рис. 2.38. Граф системы с перекрёстными связями Для этого графа: • передаточная функция единственного прямого пути
Wпр = W1 W2 ; • передаточные функции контуров
W01 = −W1 W3 ;
W02 = W2 W4 ; 83
• главный определитель
Δ = 1+ W1 W3 −W2 W4 ; • определитель прямого пути
Δ1 = 1; • искомая передаточная функция
Wuy =
W1W2 . 1 + W1 W3 − W2 W4
ПРИМЕР 2.8-2. Найти передаточную функцию между точками A и B для графа, приведённого на рис. 2.39.
Wg Wf 1
Wd
A
1
Ws
Wh
We
Wa
1
Wc
B
Wb Wi
Wm Wp
Wr
Wn
Wq Рис. 2.39. Граф системы
• Передаточные функции прямых путей: W1=Wa·Wb·Wc; W2=Wa·Wd·We·Wc; W3=Wa·Wd·Wg·Wh. 84
• Передаточные функции контуров: W01= Wd·Wg·Wh·Wn·Wr·Wp·Wl; W02= Wd·We·Wc·Wn·Wr·Wp·Wl; W03= Wb·Wc·Wn·Wr·Wp·Wl; W04= Wc·Wn·Wr·Wm; W05= Wr·Wp·Wq; W06= Wg·Wf. • Произведения передаточных функций непересекающихся пар контуров: W02·W07; W03·W06; W03·W07; W04·W06; W04·W07; W05·W06; W05·W07. • Непересекающихся троек контуров нет. • Определитель графа: Δ=1- W01 - W02 - W03 - W04 - W05 - W06 - W07+ + W02·W07+W03·W06+W03·W07+W04·W06+W04·W07+W05·W06+W05·W07 . • Миноры определителя графа: Δ1=1-W05-W07-W06+W05·W06+W05·W07; Δ2=1-W05-W07+W05·W07; Δ3=1-W05. • Результирующая передаточная функция
WAB =
W1Δ1 + W2 Δ 2 + W3 Δ 3 + W4 Δ 4 + W5 Δ 5 . Δ
85
2.9. Устойчивость систем 2.9.1. Асимптотические свойства собственного движения и весовой матрицы линейной системы Пусть нелинейное дифференциальное уравнение состояния имеет вид
r
r. r r x (t ) = F { x (t ), u(t ), t } .
(2.9-1)
Пусть также u 0 (t ) – некоторая заданная (номинальная) функция време-
r
ни и x 0 (t 0 ) – некоторый номинальный вектор начальных условий.
r
Решение x 0 (t ) является устойчивым в смысле Ляпунова, если для любого t 0 и для любого
ε > 0 существует δ (ε , t 0 ) > 0 такое, что при
r r x (t 0 ) − x 0 ( t 0 ) ≤ δ
(2.9-2)
удовлетворяется неравенство
r r (2.9-3) x (t ) − x 0 (t ) ≤ ε . r Норма вектора x в простейшем случае совпадает с его евклидовой
длиной n r 2 x = ( ∑ x i )1/ 2 .
(2.9-4)
i =1
Возможно так же использование и других форм нормы, например n r r x = max x i ; x = ∑ x i . i
(2.9-5)
i =1
Введение нормы в пространстве состояний дает возможность ввести понятие близости точек пространства. Устойчивость в смысле Ляпунова r гарантирует, что состояние x(t ) не отклоняется далеко от «номинальноr r го» режима x 0 (t ) при начальном состоянии x (t 0 ) , достаточно близком к
r
номинальному начальному состоянию x 0 (t 0 ) .
r
Решение x 0 (t ) называется асимптотически устойчивым, если оно устойчиво в смысле Ляпунова, и для любого t 0 существует такое что при
r r x ( t 0 ) − x 0 (t 0 ) ≤ ρ
ρ (t 0 ) ,
(2.9-6)
выполняется условие
r r lim x (t ) − x 0 (t ) = 0 . t →∞
(2.9-7)
86
r
Решение x 0 (t ) является асимптотически устойчивым в целом, если оно
r
устойчиво по Ляпунову, и для любых t 0 и x (t 0 )
r r lim x (t ) − x 0 (t ) = 0 .
(2.9-8)
t →∞
Применительно к нелинейным системам, вследствие сложности характерных для них явлений, обсуждается обычно устойчивость решений. В линейных системах ситуация проще, и в этом случае целесообразнее говорить об устойчивости уже не решения, а самой системы. Пусть дано уравнение системы
r. r r x C (t ) = A(t ) x C (t ) + B(t )u(t ) , (2.9-9) r r r и для t 0 , x C 0 (t 0 ) и u 0 (t ) , при t ≥ t 0 известно xC 0 (t ) , то есть справедливо уравнение
r. r r x C 0 (t ) = A(t ) x C 0 (t ) + B(t )u 0 (t ) .
(2.9-10)
r
r
Естественно, что при других начальных условиях xC 1 (t 0 ) решение xC 1 (t ) будет другим
r. r r x C1 (t ) = A(t ) x C1 (t ) + B(t )u 0 (t ) .
(2.9-11)
Вычтем из (2.9-11) уравнение (2.9-10):
r r r d r {x C1 (t ) − xC 0 (t )} = A(t ){xC1 (t ) − xC 0 (t )} dt Обозначив,
(2.9-12)
r r r x (t ) = x C 1 ( t ) − x C 0 ( t ) ,
при начальных условиях
r r r x (t 0 ) = x C 1 ( t 0 ) − x C 0 ( t 0 ) . получим уравнение
r. r x (t ) = A(t )x(t ) , при
r r t = t 0 x = x (t 0 ) .
(2.9-13)
Таким образом, понятие устойчивости решения можно свести к понятию устойчивости линейной системы. Линейная система устойчива в определенном смысле (по Ляпунову, асимптотически, или асимптотически в целом), если тривиальr ное решение x 0 (t ) ≡ 0 устойчиво в этом смысле. Линейная система асимптотически устойчива тогда и только тогда, когда она асимптотически устойчива в целом. 87
Таким образом, исследование вопроса устойчивости решений линейной неавтономной системы сводится к исследованию решения соответствующего однородного дифференциального уравнения, которое определяется матрицей A(t ) и имеет вид:
r r x (t ) = Φ(t , t 0 )x (t 0 ) ; r r y = C(t )Φ(t, t 0 )x (t 0 ) .
(2.9-14) (2.9-15)
Рассмотрим три возможных случая. 1. Φ(t , t 0 ) – ограниченная матрица в интервале [t 0 , ∞ ) , то есть существует такое положительное число М что
Φ ij (t, t 0 ) ≤ M,
t ≥ t 0 ; i , j = 1,2.., n.
Тогда получаем, что
r x (t ) ≤ n 2 M max x i (t 0 ) , i
и условие устойчивости выполняется, если взять, например,
δ≤
ε n 2M
.
2. Переходная матрица удовлетворяет условию
lim Φ(t, t 0 ) = 0 . t →∞
При этом движение, а значит, и сама система являются асимптотически устойчивыми. 3. Φ(t , t 0 ) – неограниченная матрица в интервале [t 0 , ∞ ) . При этом дви-
r
жение неустойчиво, так как для любого x (t 0 ) ≠ 0 :
r lim x (t ) = ∞ . t →∞
Это означает и неустойчивость самой системы. Если система является наблюдаемой и управляемой, (эти понятия будут рассмотрены в п.п. 3.2, 3.3), то устойчивость системы можно исследовать с помощью весовой функции. Система асимптотически устойчива, если
lim w y (t ,τ ) = 0 . t →∞
Итак, линейная система является асимптотически устойчивой, если ее переходная матрица с течением времени стремится к нулевой матрице. Для стационарных систем, то есть для систем с постоянными параметрами, это условие эквивалентно требованию, чтобы все собственные числа матрицы А имели отрицательные действительные части, то есть лежали в левой полуплоскости плоскости комплексной перемен88
ной λ . Это следует из формы представления переходной матрицы через собственные числа и правые и левые собственные векторы матрицы А в соответствии с (2.4-28). Таким образом, анализ устойчивости системы может быть сведен к анализу расположения собственных чисел матрицы А , или, что, то же самое, расположения полюсов передаточной функции полностью управляемой и наблюдаемой системы. В теории автоматического управления разработан ряд методов, называемых критериями устойчивости, позволяющих проанализировать расположение собственных чисел относительно мнимой оси плоскости λ , и не требующих при этом точного решения соответствующего характеристического уравнения. К первой группе этих методов относятся, так называемые, алгебраические критерии, которые путем элементарных вычислений по коэффициентам характеристического полинома позволяют проанализировать устойчивость исследуемой системы с известными значениями ее параметров.
2.9.2. Необходимое условие устойчивости Для устойчивости системы с характеристическим полиномом
ϕ (λ ) = a0 λn + a1λn −1 + ...an −1λ + an
(2.9-16)
необходимо, чтобы при a0 > 0 все коэффициенты характеристического полинома были положительны, то есть a i > 0 при i = 1, 2 , ..., n . Докажем это утверждение. Если λ1 , λ2 ,,,,, λn - нули характеристического полинома (корни характеристического уравнения ϕ ( λ ) = 0 ), то (2.9-16) может быть записано в виде
ϕ (λ ) = (λ − λ1 )(λ − λ2 )...(λ − λn ) . λi
(2.9-17)
Если λi - вещественный корень в левой полуплоскости, то есть = −α i (α i > 0 - положительное вещественное число), то
(λ − λi ) = (λ + α i ) и произведение таких сомножителей даст полином только с положительными коэффициентами. Пусть λi - комплексный корень в левой полуплоскости, то есть λi = −α i + jω i (α i > 0 ). Тогда при всех вещественных коэффициентах характеристического полинома среди его нулей должен быть комплексно сопряжённый: λi +1 = −α i − jω i . Произведение двух соответствующих сомножителей даст полином второй степени с положительными коэффициентами:
(λ − λi )(λ − λi +1 ) = λ2 + 2α i λ + α i2 + ω i2 ) . Следует обратить внимание на то, что рассмотренное условие устойчивости не является достаточным. Если среди коэффициентов ха89
рактеристического полинома имеются отрицательные, то это означает, что соответствующая система неустойчива. Если все коэффициенты положительны, то система может быть как устойчивой, так и неустойчивой. В этом случае необходим дополнительный анализ.
2.9.3. Критерий устойчивости Гурвица. Пусть характеристический полином некоторой системы имеет вид (2.9-16). Сопоставим этому полиному матрицу Гурвица:
⎡ a1 a3 a5 ⎢a a a 2 4 ⎢ 0 ⎢ 0 a1 a3 Gϕ = ⎢ ⎢ ... ... ... ⎢0 0 0 ⎢ ⎣0 0 0
... 0 ... 0 ... 0 ... ... ... an −1 ... an −2
0⎤ 0⎥ ⎥ 0⎥ . ... ⎥⎥ 0⎥ ⎥ an ⎦
(2.9-18)
По главной диагонали стоят коэффициенты полинома, остальные элементы строятся по следующему принципу: вверх от диагонального элемента ставятся коэффициенты полинома в порядке возрастания индексов, вниз - коэффициенты полинома в порядке убывания индексов. Элементы, требующие индексов, больших степени полинома, или отрицательных, устанавливаются нулевыми.
Критерий Гурвица. Для устойчивости системы необходимо и достаточно чтобы при а0>0 были положительны все (n) главные миноры матрицы Гурвица. Рассмотрим примеры конкретизации критерия Гурвица для простейших случаев. • n = 1. Запишем дифференциальное уравнение
a0 ⋅
dy + a1 y = 0 dt
и характеристическое уравнение
a0 λ + a1 = 0 . В данном случае применение критерия Гурвица даёт тривиальный результат
а0 > 0, a1 > 0 . • n = 2. Запишем дифференциальное уравнение 90
d 2y dy a0 ⋅ 2 + a1 ⋅ + a2 y = 0 , dt dt характеристическое уравнение
a0 λ2 + a0 λ + a1 = 0 и матрицу Гурвица
⎡a G=⎢ 1 ⎣a0
0⎤ . a2 ⎥⎦
Как и в предыдущем случае, при a0 > 0 применение критерия Гурвица даёт тривиальный результат:
a1 > 0, a2 > 0 . Отметим, что для систем первого и второго порядка необходимое условие устойчивости является и достаточным. • n = 3. Запишем характеристическое уравнение
a0 λ3 + a1λ2 + a2 λ + a3 = 0 и матрицу Гурвица
⎡ a1 G = ⎢a0 ⎢ ⎢⎣ 0
a3 a2 a1
0⎤ 0 ⎥. ⎥ a3 ⎥⎦
Для устойчивости системы по критерию Гурвица необходимо и достаточно, чтобы при a0 > 0 были положительны первый
Δ 1 = a1 > 0 , второй
Δ2 =
a1 a0
a3 = a1a2 − a0 a3 > 0 a2
и третий
a1 Δ 3 = a0 0
a3 a2 a1
0 0 = a3 Δ 2 > 0 a3 91
главные миноры матрицы Гурвица. С учётом необходимого условия устойчивости (требования положительности всех коэффициентов характеристического уравнения) критерий Гурвица для устойчивости системы третьего порядка требует выполнения неравенства
a1a2 − a0 a3 > 0 .
(2.9-19)
• n = 4. Запишем характеристическое уравнение
a0 λ4 + a1λ3 + a2 λ2 + a3 λ + a 4 = 0 и матрицу Гурвица
⎡ a1 ⎢a G=⎢ 0 ⎢0 ⎢ ⎣0
a3 a2 a1 a0
0 a4 a3 a2
0⎤ 0⎥ ⎥. 0⎥ ⎥ a4 ⎦
Для устойчивости системы по критерию Гурвица необходимо и достаточно, чтобы при a0 > 0 были положительны первый
Δ 1 = a1 > 0 , второй
Δ2 =
a1 a0
a3 = a1a2 − a0 a3 > 0 , a2
a3 a2 a1
0 a 4 = a3 (a1a2 − a0 a3 ) − a 4 a12 > 0 a3
третий
a1 Δ 3 = a0 0 и четвёртый
Δ 4 = a4 Δ 3 > 0 главные миноры матрицы Гурвица. С учётом необходимого условия устойчивости (требования положительности всех коэффициентов характеристического уравнения) критерий Гурвица для устойчивости системы четвёртого порядка требует выполнения неравенства
a3 (a1a2 − a0 a3 ) − a 4 a12 > 0 .
(2.9-20)
Для системы пятого порядка критерий Гурвица выливается в требование выполнения уже двух неравенств: 92
a1a2 − a0 a3 > 0 (a1a2 − a0 a3 )(a3 a4 − a2 a5 ) − (a1a4 − a0 a5 ) > 0 . 2
(2.9-21)
С дальнейшим увеличением порядка систем использование критерия Гурвица становится всё более громоздким и теряет смысл. Если возникает необходимость привлечения вычислительной техники, то в наше время стало проще непосредственное вычисление корней характеристического уравнения. Тем не менее, для систем третьего - четвёртого порядков привлекает простота использования критерия Гурвица. ПРИМЕР 2.9-1. Рассмотрим систему, представленную на рис. 2.40, с входным сигналом v , сигналом ошибки ε , и выходным сигналом y .
v
ε
k (Tp + 1)3
y
Рис 2.40 Структурная схема системы Этой системе соответствует передаточная функция
k k (Tp + 1) 3 Wvy ( p ) = . = 3 3 k T p + 3T 2 p 2 + 3Tp + 1 + k 1+ (Tp + 1) 3 В соответствии со свойствами передаточных функций характеристический полином замкнутой системы имеет вид
ϕ ( p ) = T 3 p 3 + 3T 2 p 2 + 3Tp + 1+ k . По критерию Гурвица система устойчива, если выполняется неравенство
a1a2 − a0 a3 = 9T 3 − T 3 (1 + k ) > 0 . Отсюда, с учётом требования положительности всех коэффициентов характеристического полинома, следует, что система устойчива, если при T > 0 выполняются неравенства
−1< k < 8. Значения параметров, при которых система находится на границе устойчивости, принято называть критическими. В данном примере у кон эффициента k имеется два критических значения - нижнее k кр = −1 и верхнее k кр = 8 . в
93
2.9.4. Частотный критерий устойчивости (критерий Найквиста) Часто рассмотрению подлежат замкнутые системы, структурные схемы которых могут быть приведены к типовому виду, представленному на рис. 2.41. Как правило, передаточная функция разомкнутой системы W (p ) имеет относительно простой вид и несложно определить расположение её полюсов относительно мнимой оси. Таким образом, предполагается, что анализ устойчивости разомкнутой системы проведён. В то же время, анализ устойчивости замкнутой системы представляет собой нетривиальную задачу. Критерий устойчивости Найквиста оперирует с частотными характеристиками, достаточно нагляден и позволяет использовать физические представления о свойствах исследуемой системы. Критерий Найквиста позволяет судить об устойчивости системы в замкнутом состоянии по частотным характеристикам разомкнутой системы. 2.9.4.1. Понятие логарифмического вычета Пусть задана некоторая функция Ψ(p ) , аналитичная всюду в области G , за исключением конечного числа изолированных особых точек. Будем полагать, что все особые точки являются полюсами. Будем полагать также, что граница C области G не содержит ни нулей, ни полюсов функции Ψ(p ) . Рассмотрим логарифмическую производную функции Ψ(p ) :
L ( p) =
′ d [ln Ψ( p)] = Ψ ( p) Ψ( p ) dp
(2.9-22)
и назовем логарифмическим вычетом функции Ψ(p ) в точке p = a вычет в этой точке ее логарифмической производной:
LnRes{Ψ(p), a} = Res {L ( p ), a} .
(2.9-23)
Пусть функция Ψ(p ) имеет в точке p = a ноль порядка k , то есть
Ψ( p ) = ( p − a ) k F ( p ) , где
F (a ) ≠ 0 . Тогда
Ψ ′( p ) = k ( p − a ) k −1 F ( p ) + ( p − a ) k F ′( p ) и
L ( p) =
k F ′( p ) + . p − a F ( p)
(2.9-24)
94
Отметим, что полюсы функций F (p ) и F ′(p ) совпадают. Так как нули аналитической функции изолированы, то в достаточно малом круге p − a < ρ функция F ′( p ) F ( p ) является аналитической и может быть разложена в окрестности точки p = a в ряд Тейлора:
F ′( p ) ∞ = ∑α n ( p − a)n . F ( p ) n =0 С учётом этого (2.9-24) превращается в
L ( p) =
∞ k + ∑α n ( p − a)n . p − a n =0
Эта формула представляет собой разложение в ряд Лорана функции L (p) в окрестности точки p = a . Из этой формулы следует, что точка p = a является полюсом первого порядка функции L (p) и
Res{L ( p ), a} = k .
(2.9-25)
Пусть теперь функция Ψ(p ) имеет в точке p = b полюс кратности s , то есть
Ψ( p ) = ( p − b ) − s J ( p ) , где b не является ни нулём, ни полюсом функции J (p ) . Тогда
Ψ ′( p ) = −s( p − b ) −( s +1) J ( p ) + ( p − b ) − s J ′( p ) и
L ( p) =
J ′( p ) −s + . p − b J ( p)
По аналогии с предыдущим случаем получим, что в окрестности точки
p=b
∞ −s L ( p) = + ∑ β n ( p − b)n , p − b n =0
следовательно,
Res{L ( p ), b} = −s .
(2.9-26)
Таким образом, в нулях и полюсах функции Ψ(p ) ее логарифмическая производная (2.9-22)
L ( p) =
Ψ ′( p ) Ψ( p ) 95
имеет полюсы первого порядка, причем в нуле функции Ψ(p ) логарифмический вычет равен порядку нуля, а в полюсе – взятом со знаком минус порядку полюса. По теореме вычетов имеем
1 Ψ ′( p ) ⎧ Ψ′( p ) , p ⎫ = k − s , dp = Res ∑v ∑ v ∑v v ⎨ v⎬ ∫ 2πj C Ψ( p ) ⎩ Ψ( p ) ⎭ v или окончательно
1 Ψ′( p ) dp = N − Π , ∫ 2πj C Ψ( p )
(2.9-27)
где N – число нулей, а Π –число полюсов функции Ψ(p ) в области G. 2.9.4.2. Принцип приращения аргумента Обозначим
Ψ( p ) = Ψ( p) e jϕ Ψ ( p ) ,
(2.9-28)
ln Ψ( p ) = ln Ψ( p ) + jϕ Ψ ( p ) .
(2.9-29)
тогда
С учётом (2.9-27), получаем:
1 Ψ ′( p ) 1 = dp ∫ ∫ d ( ln Ψ( p)) = 2πj C Ψ( p ) 2πj C 1 1 = d ln Ψ( p ) + djϕ Ψ ( p ) = N − Π. ∫ ∫ 2πj C 2πj C
(2.9-30)
Поскольку в правой части равенства стоит вещественное число, то мнимая часть левой части равенства также равна нулю. Таким образом, если функция Ψ(p ) аналитична в замкнутой области G , ограниченной контуром C , за исключением конечного числа полюсов в области G , и если функция Ψ(p ) не имеет ни полюсов, ни нулей на контуре C , то приращение аргумента функции Ψ(p ) при движении вектора p по замкнутому контуру C определяется выражением
Δϕ ΨC = 2π (N − Π ) .
(2.9-31)
2.9.4.3. Анализ устойчивости замкнутой системы Рассмотрим замкнутую систему с единичной обратной связью (рис. 2.41)
96
ε
v
y
W ( p)
Рис 2.41. Замкнутая система с единичной обратной связью Пусть известно, что среди n полюсов p1, p2 ,..., pn передаточной функции разомкнутой системы
W ( p) =
R( p ) Q( p )
(2.9-32)
имеется v 1 нулевых и v2 чисто мнимых полюсов на верхней полуплоскости плоскости комплексной переменной p (рис 2.42) , то есть + j
G +
C
C
Рис 2.42. Расположение нулей ( ) и полюсов ( ) передаточной функции разомкнутой системы
Q( p ) = p v1 ( p − jω q )v 2 Q1 ( p ) .
(2.9-33)
Образуем функцию
Ψ( p ) = 1 + W ( p ) =
Q( p ) + R ( p ) S ( p ) = , Q( p) Q( p )
(2.9-34)
характерную тем, что ее знаменатель является характеристическим полиномом разомкнутой системы, а числитель – характеристическим полиномом замкнутой. 97
Выберем в качестве области G всю правую полуплоскость плоскости комплексной переменной p . Контур C сформируем из мнимой оси, за исключением точек, совпадающих с полюсами передаточной функции разомкнутой системы, дуг окружностей бесконечно малого радиуса, охватывающих эти полюсы, как показано на рис. 2.42, и окружности бесконечно большого радиуса, охватывающей всю правую полуплоскость. Допустим, в общем случае, что разомкнутая система неустойчива, и её передаточная функция имеет m "неустойчивых" полюсов, то есть m полюсов в правой полуплоскости плоскости комплексной переменной p . Предположим, что замкнутая система также неустойчива, и z – число неустойчивых полюсов передаточной функции замкнутой системы. Тогда, в соответствии с принципом приращения аргумента
Δϕ Ψc = 2π ( z − m ).
(2.9-35)
Если обходить контур C в отрицательном направлении, совпадающим с положительным направлением мнимой оси, то
Δϕ Ψ−C = 2π (m − z ) .
(2.9-36)
Будем сопоставлять изменение комплексной переменной р при перемещении ее вдоль контура C на плоскости p и соответствующее ему изменение функции Ψ(p ) на комплексной плоскости Ψ . Для этого разобьем контур C на несколько характерных участков. На участке I годограф комплексной переменной p изменяется по окружности бесконечно большого радиуса, охватывая всю правую полуплоскость, то есть
pI = ρe jΘ ,
ρ → ∞.
(2.9-37)
Ранее отмечалось, что в физически реализуемых системах порядок числителя передаточной функции не может превышать порядок ее знаменателя. Отсюда следует, что степени полиномов S(p) и Q(p) равны, а значит
S( ρe jΘ ) Ψ| ( p) = lim = const . ρ →∞ Q( ρ e j Θ )
(2.9-38)
Таким образом, приращение фазы функции Ψ(p ) при изменении p вдоль первого участка равно нулю:
Δϕ ΨI = 0 .
(2.9-39)
В качестве участка II выберем мнимую ось плоскости p , то есть
pII = jω
(2.9-40) 98
за исключением тех ее точек, в которых располагаются полюсы разомкнутой системы. Соответствующая этому изменению p функция
Ψ|| ( p ) = Ψ( jω ),
−∞ <ω <∞
(2.9-41)
легко может быть вычислена. Участок III – это участок движения комплексной переменной p вдоль окружности бесконечно малого радиуса с центром в начале координат, где по условию находится v 1 полюсов передаточной функции разомкнутой системы. При этом, в соответствии с (2.9-33), функция Ψ(p ) будет иметь вид
S( ρe jΘ ) Ψ||| ( p) = lim = ρ →0 ρ v1 e jv1Θ ( ρe jΘ − jω q )v 2 Q1 ( ρe jΘ ) − jv1Θ
(2.9-42)
S (0 ) e ⋅ , v ρ →0 ( − jω q ) 2 Q1 (0) ρ v1
= lim
то есть на плоскости Ψ(p ) будет иметь место перемещение («доворот») по окружности бесконечно большого радиуса. Направление этого перемещения противоположно по знаку направлению перемещения на плоскости p , а абсолютная величина приращения угла - в v 1 раз больше. Таким образом, третьему участку соответствует изменение фазы функции Ψ(p ) на величину
Δϕ Ψ||| = −v 1π .
(2.9-43)
Наконец, рассмотрим движение комплексной переменной p вдоль окружности бесконечно малого радиуса с центром в точке p = jω q , где расположено v 2 полюсов передаточной функции разомкнутой системы. На этом, четвертом участке контура С
pIII = jω q + ρe jΘ ,
ρ → 0.
(2.9-44)
В соответствии с (2.9-33), функция
S( jω q ) e − jv 2Θ ΨIV ( p ) = lim ⋅ ν2 v1 ρ →0 ( jω q ) Q1( jω q ) ρ
(2.9-45)
будет образовывать годограф, перемещающийся на плоскости Ψ по окружности бесконечно большого радиуса, и соответствующее приращение фазы будет равно
Δϕ ΨIV = −2v 2
π 2
.
(2.9-46)
99
Пользуясь тем, что Ψ(p ) является дробно–рациональной функцией от p, и
Ψ( p ∗ ) = Ψ ∗ ( p ) ,
(2.9-47)
можно произвести обход лишь верхней половины контура C . Тогда суммарное приращение фазы
Δϕ ΨSum = Δϕ ΨI + Δϕ ΨII + Δϕ ΨIII + Δϕ ΨIV = π (m − z ).
(2.9-48)
Удобнее строить не функцию Ψ(p ) , а функцию W (p ) . Как видно из равенства (2.9-34), годограф функции Ψ(p ) поворачивается вокруг начала координат на тот же угол, что и годограф функции W (p ) поворачивается относительно точки ( −1, j 0) . Выше приведенные рассуждения позволяют сформулировать критерий устойчивости замкнутой системы, который называют частотным критерием, или критерием Найквиста. Критерий Найквиста. Если передаточная функция разомкнутой системы имеет m полюсов с положительной вещественной частью, то для устойчивости системы в замкнутом состоянии необходимо и достаточно, чтобы при изменении ω от 0 до + ∞ расширенная амплитудно-фазовая характеристика разомкнутой системы повернулась вокруг точки ( −1, j 0) на угол + mπ . Расширение частотной характеристики W ( jω ) необходимо при наличии у передаточной функции разомкнутой системы полюсов на мнимой оси. Каждому нулевому полюсу соответствует на амплитудно-фазовой характеристике доворот по окружности бесконечно большого радиуса на угол − π 2 . Каждому чисто мнимому положительному полюсу соответствует на амплитуднофазовой характеристике доворот по окружности бесконечно большого радиуса на угол − π . Естественно, что, давая формулировку критерия устойчивости, исходят из условия z = 0 . Можно получить и более общий результат. Основываясь на формуле (2.9-48), в каждом конкретном случае можно вычислить количество «неустойчивых» полюсов замкнутой системы
z=m−
Δϕ SUM
π
.
(2.9-49)
Здесь Δϕ SUM – результирующий угол поворота расширенной амплитудно-фазовой характеристики разомкнутой системы вокруг точки ( −1, j 0) при изменении ω от 0 до + ∞ . На практике удобнее пользоваться другой формулировкой критерия, которая предложена Я. З. Цыпкиным и использует понятие перехо100
дов расширенной амплитудно-фазовой характеристикой участка вещественной оси ( −1, − ∞ ) . Переходом называется пересечение амплитудно-фазовой характеристикой вещественной оси на интервале ( −∞ , − 1] . Переход считается положительным, если при увеличении частоты в точке перехода фаза растет, и отрицательным, – если уменьшается. Если амплитудно-фазовая характеристика начинается, или заканчивается на указанном участке вещественной оси, то имеет место половина перехода с соответствующим знаком. На рис. 2.43 приведены примеры, иллюстрирующие понятие переходов и критерий Найквиста. Все три примера соответствуют системам, устойчивым в замкнутом состоянии.
+j
m=1
m=1 +0.5п 1,0j
W1( jω )
ϕз
W2 ( jω ) A -1,0j
o
A
+j
+
-0.5п
+1п
ϕз
o
+
+j m=0 B A
-1п
+1п
o
-1, j0
+
0п
ϕз
W3 ( jω )
Рис 2.43. Иллюстрация к анализу устойчивости
В системе координат логарифмических частотных характеристик переход имеет место, если фазочастотная характеристика пересекает линию − π ± kπ (к=1,2...), и при этом логарифмическая амплитудночастотная характеристика идет выше оси абсцисс (модуль комплексного передаточного коэффициента больше единицы). 101
Приведем теперь формулировку критерия Найквиста, использующую понятие переходов. Если передаточная функция разомкнутой системы имеет m полюсов с положительной вещественной частью, то для устойчивости системы в замкнутом состоянии необходимо и достаточно, чтобы суммарное число переходов расширенной логарифмической частотной характеристики было равно + m / 2 . Если замкнутая система неустойчива, то число ее «неустойчивых» полюсов
z = m − 2∑ Π ,
(2.9-50)
где ∑ Π – суммарное число переходов расширенной частотной характеристики разомкнутой системы. 2.9.4.4. Понятие запасов устойчивости Естественно, что каждая система автоматического управления должна быть устойчивой. В инженерной практике часто используется понятие запасов. Например в строительстве и машиностроении общепринятым является термин "запас прочности". Аналогично этому при проектировании систем управления пользуются понятиями запасов устойчивости. Запасом устойчивости по модулю будем называть число, большее единицы, которое показывает, во сколько раз (на сколько децибел) нужно изменить исходный передаточный коэффициент разомкнутой системы, чтобы вывести замкнутую систему на границу устойчивости. Соответственно различают запасы по модулю на увеличение и уменьшение коэффициента. На рис. 2.43 для каждого из вариантов длина отрезка oA численно равна запасу устойчивости по модулю на уменьшение; величина, обратная длине отрезка oB для третьего варианта - запасу устойчивости по модулю на увеличение. Запасом устойчивости по фазе ϕ з называют минимальный по модулю угол, на который следует довернуть вектор W ( jω ) с модулем, равным единице, чтобы его конец оказался в точке ( −1, j 0) . На рис. 2.43 для каждого из вариантов АФХ указан запас устойчивости по фазе. 2.9.4.5. Устойчивость систем с запаздыванием Звено транспортного запаздывания смещает по времени выходной сигнал относительно входного на величину запаздывания τ :
y (t ) = u (t − τ ) .
(2.9-51)
Передаточная функция и комплексный передаточный коэффициент соответственно представлены выражениями (2.9-52) и (2.9-53):
W з ( p ) = e −τp ;
(2.9-52)
W з ( jω ) = e − jωτ .
(2.9-53) 102
При исследовании устойчивости системы, в которую входит звено запаздывания, приводят её структурную схему к виду (рис. 2.44), в котором это звено оказывается включённым последовательно с остальной частью системы
v
Wз ( p )
W0 ( p )
y
Рис. 2.44. Типовая структура системы с запаздыванием При этом, если обозначить
W0 ( p ) =
R0 ( p ) , Q0 ( p )
то характеристическое уравнение замкнутой системы примет вид
Q0 ( p ) + R 0 ( p ) e − p τ = 0 .
(2.9-54)
В связи с тем, что разложение в ряд Тейлора экспоненциальной функции имеет вид
e − pτ =
1 1 1 1 − pτ + ( pτ ) 2 − ( pτ ) 3 + ... 2! 3!
,
то характеристическое уравнение (2.9-54) имеет бесконечно большое число корней. При этом, естественно, алгебраические критерии устойчивости неприменимы. В то же время, для данной системы может быть использован критерий Найквиста. ПРИМЕР 2.9-2. Пусть структурная схема системы с запаздыванием приведена к виду, представленному на рис. 2.44 и
W0 ( p ) =
2 . (Tp + 1)2
На рис. 2.45 представлены амплитудно-фазовые характеристики звена запаздывания и последовательно с ним включённого звена W0 ( jω ) .
103
+j
e − jωτ
−1
1
2
+
Δϕ W 0 ( jω )
Рис. 2.45. Исследование устойчивости системы с запаздыванием Так как модуль комплексного передаточного коэффициента звена запаздывания на всех частотах равен единице, то АФХ разомкнутой системы
W ( jω ) = W0 ( jω )e − jωτ
(2.9-55)
отличается от W0 ( jω ) только фазой:
ϕ (ω ) = ϕ 0 (ω ) − ωτ .
(2.9-56)
Если провести дугу окружности единичного радиуса с центром в начале координат от отрицательной вещественной полуоси до пересечения с АФХ W0 ( jω ) в точке ω = ω '1' , то полученное значение Δϕ из соотношения
Δϕ = ω '1' ⋅ τ кр
(2.9-57)
позволит найти так называемое критическое время запаздывания τ кр , то есть время запаздывания, при котором система выводится на границу устойчивости. Здесь ω '1' - значение частоты, при которой
W 0 ( jω '1' ) = 1.
(2.9-58)
В рассматриваемом примере
104
W0 ( jω ) =
2 1 + (ωT ) 2
,
(2.9-59)
откуда
ω '1' =
1 π π , ϕ 0 (ω "1" ) = − , Δϕ = T 2 2
(2.9-60)
и
τ кр =
πT 2
.
(2.9-61)
2.10. Качество процессов управления 2.10.1. Основные показатели качества Устойчивость - это необходимое, но недостаточное условие эффективной работы системы. Комплекс требований, определяющих поведение системы в установившихся и переходных процессах отработки заданного воздействия, определяется понятием «качество процесса управления» или качество системы. На этапе разработки системы управления рассматривают процессы управления в устойчивых системах при воздействии особо "тяжелых" для них сигналов, заданных в виде определенных или случайных функций времени Качество работы системы проверяется по ее реакции на: 1) дельта функцию δ (t ) ; 2) единичную функцию 1(t ) ; 3) гармонический сигнал A ⋅ sin ω H t ; 4) случайные воздействия с заданными вероятностными характеристиками. Качество отработки типовых сигналов оценивают либо непосредственно по выходному сигналу y (t ) , либо путем сравнения этого сигнала y (t ) с реакцией некоторой эталонной системы (рассогласование ε e (t ) на рис.2.46), либо по ошибке воспроизведения командного сигнала
ε v ( t ) = v (t ) − y ( t ) .
105
Управляемая система
v (t )
Эталонная система
y (t )
ε e (t ) y e (t )
Рис. 2.46. Сравнение управляемой системы с эталонной На рис. 2.47 представлена реакция некоторой следящей системы на линейно возрастающий командный сигнал
v (t ) = (0.5 + 0.025 t )1(t ) , на рис. 2.48 – реакция на единичную функцию.
Tk / 2
ε vуст
ε vm
tн
tм
ε v (t )
2Δ
ε vуст
tр
Рис. 2.47. Иллюстрация к характеристикам качества системы (реакция на линейно изменяющийся сигнал)
106
T
k
E
vуст
2Δ
t
t н
м
tр
Рис. 2.48. Иллюстрация к определению показателей качества (реакция на единичную функцию) С помощью этих рисунков удобно проиллюстрировать основные показатели качества, используемуе при анализе систем управления. 1. Установившаяся ошибка:
ε уст = ε ( ∞ ) = lim(v (t ) − y (t )) . t →∞
(2.10-1)
2. Время регулирования t р - минимальное время, в течение которого переходный процесс перестает выходить за пределы заданной «трубки». Определяется из условия
ε (t ) − ε уст ≤ Δ
при t ≥ t p ,
(2.10-2)
где Δ - заранее заданное значение, определяемое требованиями к точности системы (обычно 2-5% от значения командного или выходного сигнала в установившемся режиме). 3. Максимальное перерегулирование σ - наибольший выброс управляемого процесса относительно установившегося значения по отношению к разности ε уст и ε (0) .
ε мах − ε уст σ = 100% ⋅ ε уст − ε (0)
(2.10-3) 107
Обычно требуют σ ≤ 30 ÷ 40% . 4. Время нарастания: t н - время первого входа процесса в трубку. 5. Время максимального перерегулирования: t m . 6. Число перерегулирований N в интервале: 0 ≤ t ≤ t p число выбросов, для которых
ε уст − ε m > Δ . 7. Частота или период Tk колебательной составляющей переходного процесса.
2.10.2. Ошибки системы регулирования в установившихся режимах. Статические и астатические системы Рассмотрим одну из самых распространённых структурных схем схему типа следящей системы (рис.2.49), назначение которой с минимальной ошибкой воспроизвести на выходе y (t ) командный сигнал v (t ) .
ε
v
W ( p)
y
Рис.2.49. Простейшая типовая структура следящей системы В общем случае разомкнутая система может быть представлена последовательным соединением объекта (неизменяемой части системы) с передаточной функцией Wоб (p ) и регулятора (корректирующего звена) с передаточной функцией W рег (p ) . Кроме того, учтем дополнительно возмущающее воздействие f (t ) . С учетом этого передаточная функция разомкнутой системы W ( p ) = W рег ( p )Wоб ( p ) , а исходная структурная схема примет вид, представленный на рис.2.50.
v
ε
Wpег ( p)
f Wоб ( p )
y
Рис.2.50. Структурная схема системы для анализа точности в установившихся режимах
108
В соответствии с этой структурной схемой изображение по Лапласу от ошибки E (p ) зависит как от командного сигнала, так и от возмущения:
E ( p ) = Wvε ( p ) ⋅ V ( p ) + Wfε ( p ) ⋅ F ( p ) = Ev ( p ) + Ef ( p ) ,
(2.10-4)
где
1 , 1+W ( p )
(2.10-5)
− Wоб ( p ) . 1 + W ( p)
(2.10-6)
W vε ( p ) = Wfε ( p ) =
Широкий класс командных сигналов и возмущающих воздействий может быть представлен степенными функциями времени
(α 0 + α 1t + α 2 t 2 + ...) ⋅1(t ) .
(2.10-7)
Сначала рассмотрим реакцию системы на возмущающее воздействие, вида:
f (t ) =
fν ν ⋅ t ⋅ 1(t ) , ν!
(2.10-8)
где fν = const и имеет размерность возмущения f , деленную на
сек . Такая функция имеет ненулевые производные от нулевого до ν порядка и нулевые производные порядка выше, чем ν . Причем, ν
f (ν ) (t ) = fν .
(2.10-9)
Изображение по Лапласу возмущения (2.10-8) имеет вид
F ( p) =
fν . pν +1
(2.10-10)
Пусть
Wоб ( p) =
K об Rоб ( p) , Qоб ( p)
(2.10-11)
Wрег ( p ) =
K рег R рег ( p ) p l Q1рег ( p )
(2.10-12)
и
Rоб (0) = R рег (0) = Qоб (0) = Q1рег (0) = 1.
(2.10-13)
Тогда изображение ошибки можно представить в виде: 109
− K об ⋅ Rоб ( p ) ⋅ p l ⋅ Qрег ( p ) fν ⋅ . Ef ( р) = l ν +1 Qоб ( p ) ⋅ p ⋅ Q1рег ( p ) + K об ⋅ K рег ⋅ Rоб ( p ) ⋅ R рег ( p ) p (2.10-14) В соответствии с предельной теоремой преобразования Лапласа, если существует lim ε (t) , то t →∞
− K об ⋅ fν ⋅ p l −ν . p →0 K об ⋅ K рег
lim ε f (t ) = lim p ⋅ Ef ( p ) = lim t →∞
p →0
(2.10-15)
Если ν = l , то
lim ε f (t ) = t →∞
− fν . K рег
(2.10-16)
Очевидно, в этом случае размерность коэффициента K рег равна −l
отношению размерностей возмущения и ошибки, умноженному на сек . Такая система называется астатической по возмущающему воздействию с порядком астатизма l . Если на вход такой системы подать возмущающий сигнал типа степенной функции времени с ν < l , то установившаяся ошибка будет равна нулю. Если l = 0 , то нетрудно убедится в том, что если возмущение является единичной функцией:
f (t ) = f0 ⋅ 1(t ) ,
(2.10-17)
то
ε f (∞ ) =
− K об ⋅ f0 . 1 + K об ⋅ K рег
(2.10-18)
Такая система называется статической, поскольку при постоянном возмущении ошибка в статике не равна нулю, пропорциональна величине возмущения f0 и тем меньше, чем больше коэффициент усиления разомкнутого контура K = K об K рег . Аналогичные рассуждения можно провести для случая, когда f = 0 , а командный сигнал является степенной функцией времени:
vν ν ⋅t . ν!
(2.10-19)
Q( p ) = Qоб ( p ) ⋅ Qрег ( p ) = p l ⋅ Q1( p) и Q1 (0) = 1.
(2.10-20)
v (t ) = В этом случае положим
110
Тогда
vν p l ⋅ Q1( p ) = lim E ( p ) lim p ⋅ . v l t →∞ p →0 p ⋅ Q1( p ) + K ⋅ R( p ) pν
(2.10-21)
Такая система при l ≠ 0 называется астатической по командному сигналу с порядком астатизма, равным l .В этом случае коэффициент K называется добротностью системы. Его размерность сек − l . Если ν = l , то
vν = const . (2.10-22) k Если ν < l , то ε v (∞ ) = 0 . При l = 0 система называется статической. Для нее, при
ε v (∞ ) =
v (t ) = v 0 ⋅ 1(t )
(2.10-23)
имеем
ε v (∞ ) =
v0 . 1+ K
(2.10-24)
В рассмотренном случае регулятор содержал l интеграторов, то есть, был астатическким, а объект интеграторов не содержал – был статическим. Если рассмотреть другой вариант, где, в отличие от (2.10-11), (2.10-12),
Wоб ( p ) =
K рег R рег ( p ) K об Rоб ( p ) = ; W ( p ) рег p l Q1об ( p ) Qрег ( p )
и
Rоб (0) = R рег (0) = Q1об (0) = Qрег (0) = 1, то выводы по отработке командного сигнала не изменятся, а при возмущении (2.10-8)
− fν 1 ⋅ . t →∞ K рег pν
lim ε f (t ) = lim t →∞
При ν = 0 получаем
ε f (∞ ) =
− f0 , K рег
а при ν > 0 ошибка с течением времени неограниченно растёт. Таким образом, 111
порядок астатизма системы по отношению к какому-либо внешнему воздействию равен числу интегрирующих звеньев, включенных в обратную связь между координатой ошибки и этим воздействием. Системой с астатизмом l -го порядка по отношению к командному сигналу v называется система автоматического управления, вынужденная ошибка которой при отработке сигнала, выражаемого в виде полинома степени l по t
A0 + A1t + ... +
Al l t , l!
постоянна и пропорциональна величине Al , то есть старшей производной воздействия. При отработке сигнала, выражаемого полиномом меньшей степени, установившаяся ошибка в такой системе равна нулю. Изложенные выше рассуждения приводят к выводу, что с точки зрения стремления к уменьшению ошибки желательно иметь более высокий порядок астатизма и более высокое значение K рег . И то и другое, как правило, вступает в противоречие с требованиями устойчивости. Уже синтез устойчивой системы с астатизмом выше третьего порядка ставит перед разработчиком серьёзные проблемы. ПРИМЕР 2.10-1. Пусть дана система со структурной схемой представленной на рис.2.51. Система обладает астатизмом 1-го порядка, как по командному, так и по возмущающему воздействиям, так как система со−1 держит один интегратор с передаточной функцией p в регуляторе (корректирующем звене). Для данной системы: 1) если f = const и v = const , то ε уст = 0 ; f
v
_Kf__ Tf p+1
ε
K p(1+Tk p) (1+αTk p)p
_____K0_______ T02 p2+2ζ0 T0 p+1
y
Рис.2.51. Иллюстрация к примеру 2.10-1 2) если v = v 1 ⋅ t , v 1 = const , а f – константа или нулевая величина, то кинетическая ошибка
ε уст = ε (∞) =
v1 , K
где добротность 112
K = K p ⋅ Kоб ; 3) если f = f1 ⋅ t , f1 = const , а v - константа или нулевая величина, то
ε уст =
f1 ⋅ Kf ; Kp
4) если v = v 2 ⋅ t , v 2 = const , или f = f2 ⋅ t , f2 = const , то ошибка будет непрерывно нарастать. 2
2
2.10.3. Точность систем при отработке гармонических сигналов Каждый командный сигнал может быть разложен либо в дискретный (ряд Фурье для периодической функции времени), либо в непрерывный спектр гармоник (интегральное преобразование Фурье). Для того, чтобы воспроизвести командный сигнал с малыми искажениями, необходимо точно воспроизвести хотя бы существенные гармоники этого спектра. В интервале этих существенных частот амплитудно-частотная характеристика замкнутой системы (АЧХ) должна быть близка к единице, а фазочастотная (ФЧХ) - к нулю (рис. 2.52). При этом, естественно, полоса пропускания системы должна быть заведомо шире спектра командного сигнала. Для оценки величины ω в рассмотрим спектральную плотность сигнала (спектр мощности): 2
SV (ω) =V( jω)⋅V(−jω) = V(iω) .
(2.10-25)
Ф {v (t )} = V ( jω )
Wvy ( jω )
1
ωB
ω
Рис. 2.52. Спектральная характеристика командного сигнала Ф {v (t } и АЧХ системы Wvy (ω ) Полная энергия сигнала определяется выражением ∞
Е V = ∫ S (ω )d ω .
(2.10-26)
0
113
Величину ω В целесообразно выбрать так, чтобы площадь под кривой S(ω ) на интервале частот [0,ω В ] составляла не менее 90% от площади под этой кривой во всём диапазоне частот от нуля до бесконечности (рис. 2.53).
Sν (ω )
ωв ω Рис. 2.53. К обоснованию выбора величины ω В Применительно к структурной схеме, приведённой на рис. 2.41, для которой частотная функция от командного сигнала к ошибке имеет вид
Wvε ( jω ) =
1 , 1 + W ( jω )
(2.10-27)
этим требованиям соответствует неравенство
1 <Δ 1 + W ( jω )
0 ≤ ω < ωВ ,
,
(2.10-28)
где Δ - некоторая заданная величина. В рассматриваемом диапазоне частот обычно W ( jω ) >> 1. Поэтому неравенство (2.10-28) будет всегда выполняться, если 1 < Δ. − 1 + W ( jω )
(2.10-29)
Отсюда следует
W >
1+ Δ 1 ≈ . Δ Δ
(2.10-30)
Таким образом, для точного воспроизведения командного сигнала требуется, чтобы в спектре частот от 0 до ω В выполнялось условие
W >
1 . Δ
(2.10-31) 114
Обычно принимают: Δ = 0.05 ÷ 0.1 . Применительно к ЛАЧХ неравенство (2.10-31) превращается в требование того, чтобы в диапазоне 0 ≤ ω < ω В выполнялось условие
W ( jω ) дБ > (26 ÷ 20 )дБ .
(2.10-32)
2.10.4. Связь между логарифмическими амплитудно-частотными характеристиками и качеством переходных процессов в САУ Между частотными и временными характеристиками систем существует однозначная взаимозависимость. Особенно много внимания уделялось этому вопросу в те времена, когда вычислительная техника была недоступна рядовому инженеру, и он должен был судить о свойствах разрабатываемых систем, пользуясь только косвенными оценками. Часть таких методик косвенных оценок качества по частотным характеристикам представляет интерес и в настоящее время. На эту тему имеется обширная учебная литература. В настоящем пособии затрагивается один фрагмент из этих методик, который позволяет достаточно просто связать качество временных процессов в замкнутых системах с видом амплитудно-частотных логарифмических характеристик соответствующих разомкнутых систем. Здесь следует отметить, что дальнейшее содержание параграфа относится лишь к так называемым неминимальнофазовым системам, то есть к таким, передаточные функции которых не содержат ни нулей, ни полюсов с положительной вещественной частью. Весь диапазон частот при рассмотрении ЛАЧХ (рис. 2.54) разбивают на три поддиапазона: 1) Область низких частот [0 ≤ ω < ω н ]. Этот диапазон определяет в значительной мере точность воспроизведения "медленно" меняющихся воздействий. В этом диапазоне в соответствии с результатами, полученными в предыдущем разделе, должно быть выполнено условие:
⎛ 1 ⎞ ⎧⎪26дБ , если Δ = 0.05 ; L(ω ) ≥ 20 lg⎜ ⎟ = ⎨ ⎝ Δ ⎠ ⎪⎩34дБ , если Δ = 0.02 .
(2.10-33)
Кроме того, вид ЛАЧХ в этой области указывает на порядок астатизма и статическую или кинетическую точность системы. Наклон низкочастотной асимптоты равен − 20 ⋅ ν дБ/дек., где ν - порядок астатизма. Ширина интервала [0, ω н ] позволяет найти ширину спектра частот управляющих воздействий, воспроизводимых системой без каких-либо значительных искажений и позволяет судить о том, какие воздействия для рассматриваемой системы можно считать медленно изменяющимися.
115
2) Диапазон средних частот [ω н , ω к ] – определяет запасы устойчивости и качество системы при воздействии типа ступенчатой функции. В этом интервале находится частота среза ω с , позволяющая оценить время регулирования:
t р ≈ (3 ÷ 4 )
π . ωс
(2.10-34)
Частота среза ω с примерно равна собственной частоте замкнутой системы (частоте, где у замкнутой системы может быть некоторый резонанс).
W ( jω ) дБ 2
1
3
-20дБ/дек
ωн
ωк
ωс
ω
Рис. 2.54. Типовая ЛАЧХ Для удовлетворительного качества переходных процессов необходимо, чтобы ЛАЧХ на этом интервале имела наклон -20дБ/дек, а длина этого интервала примерно равнялась 1дек. На этом интервале определяются запасы устойчивости системы. Рекомендуемые значения этих запасов составляют примерно 10дБ по модулю и 350 - 400 по фазе. 3) Интервал высоких частот
ω > ω c . Этот интервал примерно соответст-
вует W ( jω ) дБ ≤ −16 дБ. На этот интервал приходятся сопрягающие частоты, пренебрежение которыми не оказывает существенного влияния на качество переходных процессов. ПРИМЕР 2.10-2. Дана система с передаточной функцией 2
k 1 + T1p ⎞ W ( p ) = 3 ⎛⎜ ⎟ . p ⎝ 1 + T2 p ⎠ 116
Это система с астатизмом третьего порядка. На рис.2.55 представлена её логарифмическая амплитудно-частотная характеристика. Цифрами 1, 2, 3 обозначены соответственно области низких, средних и высоких частот.
L
1
2
3
-60 дБ/дек
mзум ωн
ϕ
-20 дБ/дек
1/Т1
mзув
ω ср
ω 1/Т2 -60 дБ/дек
0
0
0
-90 0
ϕз
-180
ω
0
-270
Рис. 2.55. Иллюстрация к примеру 2.10-2
2.10.5. Соотношение масштабов во временной и частотной областях 1. Если функция f (t ) преобразуема по Фурье, F ( jω ) = Ф{f (t )} ее преобразование по Фурье и a - положительное вещественное число, то справедливо равенство
⎧ ⎛ t ⎞⎫ Ф ⎨ f ⎜ ⎟ ⎬ = aF ( j ω ) . ⎩ ⎝ a ⎠⎭
(2.10-35)
. Докажем, это. Прямое преобразование Фурье выражается формулой
F ( jω ) =
∞
∫0 f ( t ) ⋅ e
− jω t
dt
Введем новые переменные t = t ⋅ a,
1 F ( jω a ) = a
(2.10-36)
ω=
ω a
. Тогда
⎛ t ⎞ − ja ω ⎛⎜⎝ at ⎞⎟⎠ dt , ∫0 f ⎜ a ⎟ e ⎝ ⎠
∞
117
откуда
aF ( j ω a ) =
⎛ t ⎞ − ja ω ⎛⎜⎝ at ⎞⎟⎠ f dt ∫0 ⎜ a ⎟ e ⎝ ⎠
∞
и равенство (2.10-35) доказано. Таким образом, при растяжении (сжатии) в "а" раз графика функции f (t ) вдоль оси времени, график модуля спектральной характеристики F ( jω ) , во-первых, сжимается (растягивается) вдоль оси частот в "а" раз и, во-вторых, увеличиваются (уменьшаются) в "а" раз его значения. Известно, что чем короче импульс, тем шире его спектр. 2. Изображение по Фурье от переходной функции h(t ) системы с передаточной функцией W (p ) имеет вид
H ( jω ) =
W ( jω ) , jω
(2.10-37)
поэтому сама функция h(t ) может быть определена с помощью обратного преобразования Фурье:
1 +∞W ( jω ) jωt h(t ) = ⋅∫ e dω . 2π −∞ jω
(2.10-38)
По аналогии с пунктом 1 введем новые переменные
t =t ⋅a , ω =
ω a
,
и, подставив их в (2.10-38), получим:
1 +∞ W ( ja ω ) jωt ⎛ t ⎞ 1 +∞ W ( ja ω ) jaω at h⎜ ⎟ = ⋅∫ e da ω = 2π ⋅ ∫ jω e dω . ⎝ a ⎠ 2π − ∞ ja ω −∞ (2.10-39) Таким образом, если частотная характеристика системы, получается путем сжатия (или растяжения) вдоль оси частот частотной характеристики некоторой исходной системы (рис. 2.56), то ее переходная функция соответственно растягивается (или сжимается) вдоль оси времени.
118
t W1
W2
W3
ω Рис. 2.56. Связь между изменением полосы пропускания системы и длительностью её переходной функции
119
2.11. Интегральные критерии качества с позиций общности задач оптимального и модального синтеза При рассмотрении качества систем управления большое место занимает группа интегральных критериев качества. Они достаточно полно изложены в обширной литературе по теории автоматического регулирования и управления. Это – интегралы от координат вектора состояния, вектора управления, ошибки регулирования. Интегральные показатели, или критерии качества непосредственно выходят на синтез оптимального управления. При этом под оптимальностью понимается минимум какого-либо интегрального критерия. Наиболее простой из них – это интеграл от квадрата ошибки отработки командного сигнала на бесконечном интервале времени ∞
J 0 = ∫ ε 2 (t )dt .
(2.11-1)
t =0
Однако, как показала практика, стремление к минимизации такого критерия приводит к чрезмерной колебательности переходных процессов. В связи с этим стали усложнять функционал. Так например, кроме квадрата ошибки с целью уменьшения выбросов в переходных процессах в функционал стали вводить квадрат от её производной ∞
J1 = ∫ (c 0ε 2 (t ) + c1ε& 2 (t ))dt .
(2.11-2)
t =0
Кроме этого, оказалось полезным учитывать величину управляющего воздействия: ∞
J 2 = ∫ (c0ε 2 (t ) + c1ε& 2 (t ) + cU u 2 (t ))dt .
(2.11-3)
t =0
Различные исполнения системы в некоторых случаях стало удобным сравнивать по величине соответствующих интегральных показателей. Такой анализ неизбежно стал перерастать в синтез оптимального управления с различными интегральными критериями. В одной из наиболее общих форм интегральные критерии, используемые оптимальном синтезе, записывают в виде:
r r r r r r J = ∫ ( x T (t )QX x (t ) + 2 x T (t )QXU u (t ) + u T (t )QU u(t ))dt . ∞
(2.11-4)
0
Возникло целое направление в теории оптимальных систем – аналитическое конструирование регуляторов (АКР). Был разработан специальный математический аппарат, обеспечивающий расчёт управления, которое минимизирует функционал вида (2.11-4). Однако, возникла очередная проблема, - проблема выбора значений элементов матриц Q X , Q XU , QU в соответствующих квадратичных 120
формах. Эту задачу в общем виде формализовать не удалось до сих пор. В то же время, при проектировании систем выявилась важная закономерность: эталонные процессы, к которым притягивается движение в системе, должны соответствовать структуре управляемого объекта. Это означает, что уравнения эталонной системы, отображённой на рис. 2.46, должны иметь такой же вид, как и уравнения объекта. Поэтому в качестве эталонной системы можно выбрать систему того же порядка, что и объект, но с собственными числами, а значит, и с характеристическим полиномом, отвечающими требованиям, предъявляемым к замкнутой системе. Рассмотрим способ формирования ошибки ε E , характеризующей отклонение некоторой конкретной системы от эталонной. Пусть эталонная система n однородных дифференциальных уравнений первого порядка приведена к одному дифференциальному уравнению n -го порядка:
xЭ( n ) + γ 1x Э( n −1) + ... + γ n −1xЭ(1) + γ n x Э = 0 .
(2.11-5)
В левую часть равенства (2.11-5) вместо координаты xЭ подставим одну из координат вектора состояния объекта. Скорее всего, при этом равенство нулю нарушится. Получаем уравнение невязки: (n ) ( n −1) (1) xОб + γ 1xОб + ... + γ n −1xОб + γ n xОб = ε E .
(2.11-6)
Переменная ε E характеризует отклонение процессов объекта от эталонных. Она равна нулю на интервале времени t = [0, ∞ ) только лишь в том случае, когда процессы в объекте или в проектируемой системе полностью тождественны процессам в эталонной системе. Учтём уравнение объекта
r r r x& (t ) = Ax(t ) + Bu(t )
(2.11-7)
и приведём уравнение (2.11-6) к такому r виду, чтобы rв него входили только координаты векторов состояния x и управления u :
q x 1x1(t ) + q x 2 x 2 (t ) + ... + q xn x n (t ) + qu 1u1(t ) + qu 2u2 (t ) + ... + qunu unu (t ) = ε E (t ).
(2.11-8)
Это уравнение, используя очевидные обозначения, можно записать иначе:
r r r r q Tx x (t ) + quT u (t ) = ε E (t ) .
(2.11-9)
В соответствии с введённой текущей ошибкой ε E (t ) может быть использован интегральный критерий качества (функционал) ∞
J = ∫ ε E2 (t )dt .
(2.11-10)
0
121
Квадрат ошибки можно записать с помощью квадратичных форм:
r r T r r rT r r T T q q x t x t x t q ( ) ( ) ( ) ⎤ ⎡ q ⎡ ⎤ ⎡ ⎤⎡ ⎤ ⎡ ⎤ ⎡ ε E2 = ⎢ r ⎥ ⎢ r x ⎥ ⎢ r x ⎥ ⎢ r ⎥ = ⎢ r ⎥ ⎢ r x r Tx ⎣u (t )⎦ ⎣q u ⎦ ⎣q u ⎦ ⎣u(t )⎦ ⎣u(t )⎦ ⎣q u q x
r r r q x q uT ⎤ ⎡ x(t )⎤ , r r r q u q uT ⎥⎦ ⎢⎣u(t )⎥⎦
(2.11-11) где
⎡ q x1 ⎤ ⎢q ⎥ r qx = ⎢ x2 ⎥ ; ⎢L⎥ ⎢q ⎥ ⎣ xn ⎦
⎡ q u1 ⎤ ⎢q ⎥ r u2 ⎥. qu = ⎢ ⎢L⎥ ⎢q ⎥ ⎣ u nu ⎦
(2.11-12)
Обозначив
r r r r r r Q X = q Tx q x ; QU = q uT q u ; Q XU = quT qu ,
(2.11-13)
в итоге получаем критерий (2.11-4). В связи с тем, что порядки уравнений объекта и эталонной системы совпадают, в результате оптимального синтеза удастся найти оптимальное управление, при котором минимум функционала окажется равным нулю. Так как при этом для процессов в системе с оптимальным управлением окажется выполнимым равенство (2.11-6) при ε E = 0 , то полученная система будет иметь характеристический полином
ϕ C (λ ) = ϕ Э (λ ) = λn + γ 1λn −1 + ... + γ n −1λ + γ n
(2.11-14)
и, следовательно, собственные числа синтезированной системы совпадут с собственными числами эталона. Таким образом, результаты АКР при таком подходе обеспечивают не только минимум критерия (2.11-4), равный нулю, но и позволяет получить систему с желаемыми собственными числами. Поскольку связь переходных процессов с собственными числами (модами) системы более очевидна и непосредственна, модальный синтез часто оказывается предпочтительнее метода АКР, тем более, что алгоритм модального синтеза существенно проще алгоритмов АКР. ПРИМЕР 1. Для иллюстрации изложенного рассмотрим объект, представленный на рис. 2.9. Уравнения объекта имеют вид:
x& 1 (t ) = x 2 (t ); x& 2 (t ) = −2 x 2 (t ) + x 3 (t );
(2.11-15)
x& 3 (t ) = − x 3 (t ) + u(t ) .
122
Пусть эталонная система (эталонный процесс) определяется уравнением
x Э( 3 ) (t ) + γ 1 x Э( 2 ) (t ) + γ 2 x Э(1) + γ 3 x Э (t ) = γ 3v (t ) ,
(2.11-16)
соответствующим желаемым собственным числам. Из этого уравнения видно, что при постоянном командном сигнале v = v 0 = const в статике
lim( x Э (t )) = x Э уст = v 0 . t →∞
(2.11-17)
Подставив в левую часть равенства (2.11-16) координату объекта x1 (t ) и получим уравнение невязки:
ε E (t ) = x1( 3 ) (t ) + γ 1 x1( 2 ) (t ) + γ 2 x1(1) (t ) + γ 3 x1 (t ) .
(2.11-18)
Заменим производные от координаты x1 на координаты вектора состояния объекта с учётом уравнений (2.11-15):
x1(1) = x 2 ; x1( 2 ) = x 2(1) = −2 x1 + x 3 ;
(2.11-19)
x1( 3 ) = −2 x 2(1) + x 3(1) = 4 x 2 − 3 x 3 + u . В результате уравнение невязки принимает вид
ε E (t ) = γ 3 x1 (t ) + ( 4 − 2γ 1 + γ 2 )x 2 (t ) + (γ 1 − 3)x 3 (t ) + u(t ) ,
(2.11-20)
откуда получаем:
γ3 ⎡ ⎤ r q x = ⎢4 − 2γ 1 + γ 2 ⎥ ; ⎢ ⎥ ⎢⎣ γ 1 − 3 ⎥⎦
q u = 1.
(2.11-21)
Теперь в соответствии с (2.11-13) могут быть вычислены матрицы Q X , QU , Q XU и получен функционал (2.11-4) для использования при решении задачи АКР. В то же время, приравняв нулю ε E (t ) в (2.11-20), можно непосредственно получить выражение для формирования управления u(t ) через координаты вектора состояния объекта. Более того, если потребовать выполнения равенства
x1( 3 ) (t ) + γ 1x1( 2 ) (t ) + γ 2 x1(1) (t ) + γ 3 x1(t ) = γ 3v (t ) ,
(2.11-22)
то с учётом (2.11-20) получим систему с обратной связью по вектору состояния и управлением
r u(t ) = Lx (t ) + k v v (t ) ,
(2.11-23) 123
где фигурируют матрица обратной связи
L = [− γ 3
− 4 + 2γ 1 − γ 2
3 − γ 1]
(2.11-24)
и передаточный коэффициент по командному сигналу
kv = γ 3.
(2.11-25)
Таким образом, без решения задачи АКР получено оптимальное управление, обеспечивающее процессы в замкнутой системе, имеющей собственные числа, соответствующие характеристическому полиному эталонной системы (2.11-14). Кроме того, в полученной системе обеспечена единичная статика по командному сигналу v (2.11-17). В этом примере проиллюстрирована идентичность задачи АКР с надлежащим образом выбранным критерием оптимальности задаче модального синтеза. В следующих разделах будет подробно изложена методика модального синтеза.
124
3. Синтез линейных непрерывных систем 3.1. Выбор корректирующих звеньев. Метод желаемых ЛЧХ Как уже отмечалось, существует связь между частотными характеристиками системы, как в замкнутом, так и в разомкнутом состоянии, и протекающими в ней переходными процессами. На протяжении многих лет инженерами накоплен большой опыт по синтезу систем автоматического управления на базе формирования эталонных, желаемых частотных характеристик соответствующих разомкнутых систем. В литературе имеются обширные таблицы таких эталонных логарифмических амплитудно-частотных характеристик для большого числа типовых передаточных функций объектов управления. В настоящем пособии излагается лишь основная идея такого подхода. Рассматривается одноконтурная система (рис. 3.1). Разомкнутый контур состоит из последовательно включённых неизменяемой части системы (в неё входят объект, привод, датчики, преобразующие и согласующие устройства) с передаточной функцией W 0 ( p ) и корректирующее звено с передаточной функцией W k (p ) .
v
y Wk ( p )
W0 ( p )
Рис. 3.1. Исходная структурная схема Предполагается, что заданы требования к основным показателям качества, обсуждавшимся в п.2.10.1. В соответствии с этим по упомянутым таблицам, или на основе подхода, изложенного в п.2.10.4, строится асимптотическая логарифмическая амплитудно-частотная характеристика (ЛАЧХ) L жел (ω ) разомкнутой системы, удовлетворяющая указанным требованиям. На этом же рисунке строится асимптотическая ЛАЧХ неизменяемой части системы
L0 (ω ) = W0 ( jω ) дБ .
(3.1-1)
Потребуем, чтобы комплексный передаточный коэффициент разомкнутой системы был равен функции, определяемой желаемой ЛАЧХ, то есть
W жел ( jω ) = W k ( jω ) W 0 ( jω )
(3.1-2) 125
или
L жел (ω ) = Lk (ω ) + L0 (ω ) .
(3.1-3)
В соответствии с этим простой операцией графического вычитания легко получить асимптотическую ЛАЧХ корректирующего звена
Lk (ω ) = L жел (ω ) − L0 (ω ) .
(3.1-4)
По ней уже нетрудно восстановить передаточную функцию W k (p ) . ПРИМЕР 3.1-1. Передаточная функция неизменяемой части системы
W
0
( p) =
1 . p ( p + 1)( 0 .1p + 1)
Требования к системе. 1) При отработке командных сигналов, меняющихся со скоростью до 10ед/с, ошибка не должна превосходить 0.1 ед.. 2) Время регулирования t р ≈ 1с. 3) Ошибка воспроизведения гармонических сигналов с амплитудой Av на частотах до 1рад/c должна быть не более 0.05 Av . Последовательность расчёта. 1. Построить асимптотическую ЛАЧХ неизменяемой части системы L0 (ω ) (рис. 3.2).
2. Построить желаемую ЛАЧХ L жел (ω ) . В связи с тем, что согласно п.1 требований к системе при линейно изменяющемся во времени командном сигнале допустима постоянная ошибка, система должна иметь астатизм первого порядка. Поэтому низкочастотная асимптота должна идти с наклоном -20 дБ/дек. В соответствии с (2.10-22) добротность системы
K=
10 [ ед / c ] v1 = = 100 −1c . ε (∞ ) 0.1[ ед ]
Следовательно, низкочастотная асимптота должна пересекать ось частот при ω = 100 рад/с. Частота среза определяется с учётом требуемого времени регулирования из (2.10-34):
ωc =
(3 ÷ 4)π ≈ 10 рад / c . tр
Таким образом, среднечастотный участок желаемой ЛАЧХ на этой частоте пересекает ось абсцисс, имеет наклон -20 дБ/дек имеет протяжённость, равную одной декаде, то есть занимает интервал 126
3.16 ≤ ω ≤ 31.6 . Диапазон частот ω > 31.6 считаем высокочастотным. Наклон высокочастотной асимптоты выбираем равным -60 дБ/дек, - таким же, как наклон высокочастотной асимптоты неизменяемой части системы. Для того, чтобы упростить реализацию корректирующего звена, низкочастотную и среднечастотные асимптоты соединяем отрезком прямой с наклоном -40 дБ/дек. При этом следует учесть требование по точности воспроизведения гармонического сигнала: в соответствии с (2.10-33) на частоте 1 рад/c желаемая ЛАЧХ должна пройти выше уровня 26 дБ.
L[ дБ ] 60
Lk -20 дБ/дек +40 дБ/дек
40
Lk
20 -20 дБ/дек 26 дБ
0.1
0.33
1
L жел
ω 10
3.16
31.6
100
-20 -40 дБ/дек
L0
-40 -60 дБ/дек -60
Рис. 3.2. Иллюстрация к методу желаемых ЛЧХ
3. Построить ЛАЧХ корректирующего звена, производя графическое вычитание отрезков прямых в соответствии с (3.1-4). 127
4. Замерить значения сопрягающих частот асимптотической ЛАЧХ корректирующего звена и записать соответствующее выражение для передаточной функции
Wk ( p) =
1 1 p + 1)( p + 1) 3.16 10 . 1 1 2 p + 1)( p + 1) ( 31.6 0.33
100( p + 1)(
3.2. Управляемость линейных стационарных систем Непрерывная линейная система
r r r x& ( t ) = A x ( t ) + B u ( t )
(3.2-1)
является полностью управляемой тогда и только тогда, когда она может r быть переведена из любого начального состояния x (t 0 ) в произвольный
r
момент времени t 0 в любое конечное состояние x (t1 ) за конечное время
t1 − t 0 .
r
Примем начальные условия нулевыми: x (t 0 ) = 0 . Тогда, в соответствии с формулой Коши t1 r r A ( t −τ ) x ( t 1 ) = ∫ e 1 B u (τ )d τ .
(3.2-2)
t0
Принимая во внимание выражение для матричной экспоненты в виде бесконечного ряда
e
A ( t1 −τ )
A(t 1 − τ ) A 2 (t 1 − τ ) 2 =E+ + + ... , 1! 2!
(3.2-3)
равенство (3.2-2) можно записать в виде t 1( t − τ )2 r t1 r t1 r r 2 x(t1 ) = B ∫ u(τ )dτ + AB ∫ ( t1 − τ )u(t )dτ + A B ∫ 1 u(τ )dτ + ... 2 ! t0 t0 t0
Обозначим:
⎡ α i1 ⎤ 2 ⎢α ⎥ t1 r ( t1 − τ ) r i2 ⎥. αi = ∫ u (τ )d τ = ⎢ i! t0 ⎢ ... ⎥ ⎢α ⎥ ⎣ i , ni ⎦
(3.2-4)
128
r
Представим произведения A B в виде блочных матриц векторов i
β: r r r ⎤ ⎡ A B = ⎢ β i1 β i 2 ...β i n ⎥ . ⎣ ⎦ i
(3.2-5)
Тогда t1
A B∫ i
t0
(t
1
i r −τ ) r u (τ )dτ = β i1 i!
[
r
β i2
r
]
... β i nu =
r
nu
∑ α iν β iν
(3.2-6)
ν =1
и
r x (t 1 ) =
∞
r
nu
∑ ν∑ α ν ⋅ β ν . i =0
=1
i
(3.2-7)
i
r
В результате вектор x (t1 ) может рассматриваться как линейная комбинация векторов
r
β iν , являющихся вектор-столбцами матриц
r B, AB, A2B, A3B, ... . Иначе говоря, конечное состояние x (t1 ) принад-
лежит линейному подпространству, порождаемому вектор-столбцами 2 3 бесконечной последовательностью матриц B, AB, A B, A B, ... . В этой последовательности должна появиться матрица A B , все вектор-столбцы которой линейно зависят от вектор-столбцов предыду2 l −1 щих матриц B, AB, A B, ..., A B. Такая матрица обязательно должна иметь место, так как в линейном n-мерном пространстве не может быть более чем n линейно–независимых векторов. Отсюда же следует, что l ≤ n. Таким образом, можно записать l
A l B = BΛ 0 + AB Λ 1 + ... + A l −1BΛ l −1 ,
(3.2-8)
где Λ i - соответствующие диагональные матричные коэффициенты
⎡λ i 1 0 ⋅ ⋅ ⋅ 0 ⎤ ⎢0 λ ⋅⋅⋅ 0 ⎥ i2 ⎥. Λi = ⎢ ⎢⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⎥ ⎢ ⎥ 0 0 λ ⋅ ⋅ ⋅ ⎣ in ⎦
(3.2-9)
l +1
Очевидно, тем же свойством обладает и матрица A B , так как
A l +1B = AA l = ABΛ 0 + A 2 BΛ 1 + ... + A l −1BΛ l − 2 + A l BΛ l −1 .
(3.2-10)
По индукции можно утверждать то же самое и для всех A B при k ≥ l . k
129
r
Итак, конечное состояние x (t 1 ) принадлежит линейному подпространству, порождаемому вектор-столбцами матриц
B, AB, A 2 B, ... , A n −1B (здесь учтено, что l ≤ n ). Если эти вектор-столбцы не порождают n мерное пространство, то в такой системе можно достичь лишь тех состояний, которые принадлежат подпространству меньшей размерности. Таким образом, критерий управляемости формулируется следующим образом:
r
r
r
Система x& (t ) = Ax (t ) + Bu (t ) полностью управляема тогда и только тогда, когда ранг матрицы управляемости
U = [B AB A2B L An−1B]
(3.2-11)
равен n , то есть полной размерности линейного пространства. При этом говорят, что пара матриц {A, B} полностью управляема. ПРИМЕР 3.2-1. Определить управляемость системы
x&1 = −4x1 + 5x2 − 5U ; x& 2 = 3x1 − 2x2 + 3U ; y = x1 . Для этой системы
⎡− 5⎤ ⎡− 4 5⎤ , A= ⎢ B = ⎢ 3⎥ ⎥ ⎣ ⎦ ⎣ 3 − 2⎦ и матрица управляемости
35⎤ ⎡ −5 U = [A AB ] = ⎢ ⎥. 3 21 − ⎣ ⎦ Определитель этой матрицы равен нулю, она имеет ранг меньше двух, то есть порядка системы, и система является неуправляемой. Отметим, что собственные числа матрицы динамики системы
λ1 = +1;
λ2 = −7 ,
то есть система неустойчива. В тоже время передаточная функция по выходной координате
Wuy ( p ) = −
5 , p+7
130
у неё только один, устойчивый полюс и по ней не видно, что в действительности система неустойчива. Матричная передаточная функция по вектору состояния
5 ⎤ ⎡ − ⎢ p + 7⎥ Wux ( p ) = ⎢ ⎥. 3 ⎥ ⎢ ⎢⎣ p + 7 ⎥⎦ Ей соответствует решение дифференциального уравнения системы
r r ⎡− 5⎤ t −7 ( t −τ ) At x (t ) = e x ( 0 ) + ⎢ ⎥ ⋅ ∫ e u(τ )dτ . 3 0 ⎣ ⎦ Как видно, в вынужденной составляющей решения отсутствует одна неустойчивая - мода. Кроме того, независимо от управляющего сигнала для координат вынужденной составляющей вектора состояния существует линейная связь
x 2В (t ) = −0.6 x1В (t ) . ПРИМЕР 3.2-2. Определить управляемость системы
x&1 = −4x1 + 5x2 − 10U ; x& 2 = 3x1 − 2x2 + 3U ; y = x1 . Для этой системы
⎡− 10⎤ ⎡− 4 5⎤ , A=⎢ B = ⎢ ⎥ ⎥ ⎣ 3⎦ ⎣ 3 − 2⎦ и матрица управляемости
25⎤ ⎡ − 10 U = [A AB ] = ⎢ ⎥. ⎣ 3 − 36⎦ Определитель этой матрицы не равен нулю, она имеет ранг, равный двум, то есть порядку системы, и система является полностью управляемой. Отметим, что в данном случае полюсы передаточной функции
Wuy ( p ) = −
10( p + 1) ( p − 1)( p + 7)
полностью повторяют все собственные числа матрицы A . 131
3.3. Наблюдаемость линейных стационарных систем. В теории автоматического управления большую роль играет задача восстановления вектора состояния по результатам наблюдения за входом и выходом объекта. Непрерывная система
v v v x& (t ) = Ax (t ) + Bu(t ) v v y (t ) = Cx(t )
(3.3-1)
v
называется наблюдаемой, если вектор состояния x (t 0 ) можно опреде-
r
лить, зная y (t ) на некотором интервале времени t = [t 0 , t1 ] . Если это справедливо для любого t 0 , то система называется полностью наблюдаемой. Задачей настоящего параграфа является вывод критерия наблюдаемости. r Достаточно рассмотреть задачу при u(t ) = 0 . Тогда
r r y (t ) = Ce At x (0 ) .
(3.3-2)
В развёрнутом виде - это система алгебраических уравнений
C11 x 1 + C12 x 2 + ... + C1n x n = y 1 (t 1 ) C 21 x1 + C 22 x 2 + ... + C 2 n x n = y 1 (t 1 ) ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
,
(3.3-3)
C ny x 1 + ... + C ny ,n x n = y ny (t n ) в качестве неизвестных в которой выступают координаты вектора состояния. В связи с тем, что, как правило, n y < n , число уравнений оказывается меньше числа неизвестных, и решение невозможно. В соответствии с теоремой Кэли-Гамильтона каждая квадратная матрица удовлетворяет собственному характеристическому уравнению:
An + α1An−1 + ... + α n−1A + α n E = 0 .
(3.3-5)
Поэтому матричная экспонента, являющаяся степенным рядом относительно матрицы A , может быть представлена в виде полинома степени n − 1. С учетом этого равенство (3.3-2) можно записать в виде: 132
n −1 r r y (t ) = ∑ γ l (t ) ⋅ C ⋅ A l x ( 0 ) ,
(3.3-5)
l =0
где γ l (t ) – соответствующие коэффициенты этого полинома. Для i-й составляющей вектора выхода соответственно будем иметь n −1 v v y i (t ) = ∑ γ l (t )(CA l ) i x (0) .
(3.3-6)
l =0
Здесь (CA ) i – i -я строка матрицы (CA ) . l
l
Если набор (CA ) i для i = 1,2,..., n y ; l = 0,1,2,..., n − 1 не содержит полного базиса, то есть n линейно независимых строк, иначе говоря, если матрица l
⎡ C ⎤ ⎢ CA ⎥ ⎢ ⎥ N = ⎢ CA 2 ⎥ ⎢ ... ⎥ ⎢ n −1 ⎥ ⎣CA ⎦
(3.3-7)
имеет ранг, меньший, чем n , то в качестве ненулевого вектора начальr ных условий x (0 ) ≠ 0 может быть выбран вектор, ортогональный всем строкам матрицы N. Тогда в соответствии с (3.3-5) получим, что r y ( t ) = 0 для всех t , т.е. система не наблюдаема.
r
Теперь докажем, что если ранг матрицы N равен n , то x(t 0 ) может быть определен с помощью конечного числа измерений вектора выхода v y (t ) . Обозначим
Γ(t k ) = [γ 0 (t k )E γ 1(t k )E ... γ n−1(t k )E ] ,
(3.3-8)
где Е – квадратная единичная матрица размером [n y × n y ] . Моменты измерения t k выберем таким образом, чтобы для различных значений k элементы γ i (t k ) отличались друг от друга. С учетом введенного обозначения равенство (3.3-5) примет вид
r r y ( t k ) = Γ ( t k )N x ( 0 ) .
(3.3-9)
Известно, что ранг произведения любых двух матриц не превосходит ранга каждого из сомножителей. Ранг матрицы Γ ( t k ) не превосходит числа ее строк n y < n . Проводя многократные измерения на интервале времени переходного процесса системы, построим расширенный вектор выхода 133
r y ⎡ ( t1 ) ⎤ ⎢ yr ( t ) ⎥ r YR = ⎢ 2 ⎥ ⎢ ... ⎥ ⎥ ⎢r ⎣ y ( t n )⎦
(3.3-10)
⎡ Γ( t 1 ) ⎤ ΓR = ⎢ ... ⎥ . ⎢ ⎥ ⎣Γ( t n ) ⎦
(3.3-11)
и обозначим
Матрица Γ имеет n y × n строк. Моменты измерений должны быть выбраны таким образом, чтобы выполнялось условие rank ΓR = n . Как было обусловлено, ранг матрицы N также равен n . Поэтому уравнение
r r ΓR ⋅ N ⋅ x ( 0 ) = Y R
(3.3-13)
содержит n линейно независимых скалярныхv уравнений, то есть оно может быть разрешено относительно вектора x(0) . Таким образом, доказан следующий критерий полной наблюдаемости стационарных линейных систем: Линейная стационарная система вполне наблюдаема тогда и только тогда, когда ранг матрицы наблюдаемости N равен n . ПРИМЕР 3.3-1. . Объект управления задан уравнениями
x&1 = −8 x1 + 3 x 2 + 3u ; x& 2 = − x1 − 4 x 2 + 2u ; y = x1 − 2 x 2 . Этим уравнениям соответствуют матрицы
3⎤ ⎡− 8 ⎡3⎤ A=⎢ B = ; ⎥ ⎢2⎥; C = [1 − 2]. − − 1 4 ⎣ ⎦ ⎣ ⎦ Определитель матрицы управляемости
⎡ U=⎢ ⎣
3 − 15⎤ 2 3⎥⎦
не равен нулю, поэтому система управляема. Матрица наблюдаемости
134
⎡ C ⎤ ⎡ 1 − 2⎤ N=⎢ ⎥=⎢ ⎥ ⎣CA⎦ ⎣− 6 − 5⎦ Её определитель также отличен от нуля, следовательно, система полностью наблюдаема. Для данного объекта нетрудно рассчитать собственные числа
λ1 = −5;
λ 2 = −7 ,
правые
r ⎡1⎤ r ⎡3⎤ v1 = ⎢ ⎥; v 2 = ⎢ ⎥ ⎣1⎦ ⎣1⎦ и левые
rT d1 = [− 0.5 1.5] ;
rT d 2 = [0.5 − 0.5]
собственные векторы. В соответствии с (2.4-27), (2.6-4) и (2.6-6) нетрудно получить передаточные функции по векторам состояния и выхода:
⎡ 1.5 ⎢p + 5 + W x ( p) = ⎢ ⎢ 1.5 + ⎢⎣ p + 5 W y ( p) = −
1.5 ⎤ p + 7⎥ ⎥; 0.5 ⎥ p + 7 ⎥⎦
1.5 0.5 + . p+5 p+7
В данном случае полюсы передаточной функции по выходу полностью отображают собственные числа матрицы динамики. ПРИМЕР 3.3-2. . Объект управления задан уравнениями
x&1 = −8 x1 + 3 x 2 + 3u x& 2 = − x1 − 4 x 2 + 2u
;
y = x1 − 3x 2 .
Матрицы A и B здесь такие же, как и в предыдущем примере, следовательно, объект управляем. Матрица выхода
C = [1 − 3].
Ранг матрицы наблюдаемости
⎡ C ⎤ ⎡ 1 − 3⎤ N=⎢ ⎥=⎢ ⎥ ⎣CA⎦ ⎣− 5 15 ⎦ 135
в данном случае меньше порядка объекта и равен единице, так как второй столбец пропорционален первому. Следовательно, данный объект неуправляем. Правые и левые собственные векторы матрицы динамики и передаточная функция по вектору состояния такие же, как и в предыдущем примере. Передаточная функция по выходу
W y ( p) = −
3 . p+5
У неё отсутствует полюс, равный второму собственному числу матрицы A. Определим свободное движение объекта по вектору состояния и по выходу:
rT r 2 r r λi t r At x (t ) = e x ( 0 ) = ∑ e v i d i x ( 0 ) ; i =1
r y (t ) = Cx (t ).
.
Получаем:
r ⎡− 0.5 1.5⎤ r ⎡1.5 − 1.5 ⎤ r −5t x (t ) = ⎢ x ( 0 ) e + x (0)e −7 t ; ⎢ ⎥ ⎥ ⎣− 0.5 1.5⎦ ⎣0.5 − 0.5⎦ r y (t ) = [1 − 3]x (0)e −5t . Если выбрать
r r ⎡3⎤ x (0 ) = v 2 = ⎢ ⎥ , ⎣1⎦ r r то так как векторы v 2 и d1 взаимно ортогональны, и их скалярное произведение равно нулю, получим
r ⎡3⎤ x (t ) = ⎢ ⎥ e − 7 t , ⎣ 1⎦ в то время как
r y (t ) = 0 .
136
3.4. Замена базиса в линейном конечномерном пространстве Линейное пространство R называется конечномерным, а число n – числом измерений этого пространства или его размерностью ( dimR = n ), если в R существует n линейно независимых векторов, в то время как любые n + 1 векторов в R линейно зависимы. Система из nr линейно r r независимых, заданных в определенном порядке векторов e1 ,e 2 ,..., e n в n -мерном пространстве называется базисом этого пространства. Если каждый из векторов базиса ортогонален любому другому вектору этого базиса, т.е. их скалярные произведения равны нулю, то такой базис называется ортогональным. Если, кроме того, модуль каждого вектора базиса равен единице, то базис называется ортонормированным. r r r r r Векторы x, e1 ,e 2 ,..., e n , где x - любой вектор из R , линейно зависимы, так как их n + 1. Отсюда справедливо равенство:
r
откуда
r
r
r
α 0 x + α1e1 + α 2 e2 + ... + α n en = 0 ,
(3.4-1)
r r r r x = x e1e1 + x e 2 e 2 + ... + x en en .
(3.4-2)
Здесь:
r x e1, x e 2 ,..., x en - координаты вектора x в базисе {e} .
Столбец
⎡ x e1 ⎤ ⎢x ⎥ r xe = ⎢ e2 ⎥ ⎢ ... ⎥ ⎢ ⎥ ⎣ x en ⎦
(3.4-3)
r
называют r координатным столбцом вектора x в этом базисе. x - вектор в пространстве, и только если в этом пространстве выr берем базис, то возникает понятие координатного вектор-столбца x e . Если установим другой базис, то ему будет соответствовать другой координатный вектор-столбец. Пусть в n -мерном пространстве задано два базиса:
r r r {e} : e1, e2 ,..., en
и 137
r r r {f } : f1, f 2 ,..., fn . Так как это векторы одного и того же пространства, то каждый из векторов базиса {f } можно разложить через векторы базиса {e} :
r r r r f1 = fe11e1 + fe 21e2 + ... + fen1en ; r r r r f 2 = fe12 e1 + fe 22 e2 + ... + fen 2 en ;
(3.4-4)
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ r r r r f n = fe1n e1 + fe 2n e2 + ... + fenn en .
Коэффициенты f eik (здесь i –номер координаты, а k –номер раскладываемого вектора) можно представить в виде квадратной матрицы
⎡ fe11 ⎢f Fe = ⎢ e21 ⎢..... ⎢f ⎣ e n1 или
fe12 ... fe1n ⎤ fe22 ... fe2n ⎥ ⎥, ..... ..... .....⎥ fe n2 ... fe nn ⎥⎦
[
r Fe = fe1
r fe2
(3.4-5)
]
r ⋅ ⋅ ⋅ fen .
(3.4-6)
Каждый из столбцов матрицы F e – это координатные столбцы векторов
r r r f1, f 2 ,..., fn базиса {f } в базисе {e} .
С учетом введенных обозначений систему равенств (3.4-4) можно записать в виде
r r r r r r ⎧f1 = [e1 e 2 ... e n ] ⋅ fe1 = [e ] ⋅ fe1 ⎪ r ⎪r f e f [ ] = ⋅ e2 ⎪2 . ⎨ ⎪.......... .......... .......... .......... .......... ⎪r r ⎪f = [e ] ⋅ f en ⎩n
(3.4-7)
Можно ещё более упростить (укрупнить) эти равенства, используя понятия блочных матриц:
[f
r
1
r f2
или, в итоге
] [
r r r ⋅ ⋅ ⋅ f n = [e] ⋅ fe1 [e] ⋅ fe 2
[f ] = [e ] F
e
.
r ⋅ ⋅ ⋅ [e] ⋅ fen
]
(3.4-8) (3.4-9) 138
Матрица F e называется матрицей перехода от базиса {e} к базису {f } . Так как F e невырожденная, то
[e] = [f ] ⋅ E ,
(3.4-10)
Ef = Fe -1
(3.4-11)
f
где матрица называется матрицей перехода от базиса {f } к базису {e} .
r r
ПРИМЕР 3.4-1. Пусть в R2 задан базис {e} векторами e1,e 2 (рис. 3.3).
r f1
r e2
r f2
r e1
Р ис . 3 .3 . Св я зь ме ж д у в ек тора ми р а зли ч ны х ба зис ов Введем базис {f } следующим образом:
r r r f1 = 1 ⋅ e 1 + 1 ⋅ e 2 ; r r r f2 = − 1 ⋅ e 1 + 0 ⋅ e 2 .
Запишем матрицу перехода от базиса {e} к базису {f } :
⎡1 − 1⎤ Fe = ⎢ ⎥. ⎣1 0 ⎦ Найдем обратную матрицу
⎡ 0 1⎤ Fe −1 = ⎢ ⎥ ⎣− 1 1⎦ и, в соответствии с (3.4-10), получаем
r [e1
[
r r e2 ] = f1
]
[
r ⎡ 0 1⎤ r f2 ⋅ ⎢ ⎥ = − f2 ⎣− 1 1⎦
]
r r f1 + f2 .
Этот результат подтверждается анализом рис. 3.3. 139
Рассмотрим, как связаны между r собой компоненты, (координатные столбцы) одного и того вектора x в разных базисах. В соответствии с (3.4-2) и
r r r r x = x e1e1 + x e 2 e2 + ... + x en en
(3.4-12)
r r r r x = x f 1f1 + x f 2 f2 + ... + x fn f n .
(3.4-13)
Приравнивая правые части последних двух равенств, получим
r
а с учётом (3.4-9)
r
[e] ⋅ x e = [f ] ⋅ x f ,
(3.4-14)
r r [e ] x e = [e ]F e x f
(3.4-15)
Окончательно получаем
r r r r xe = Fe xf ; x f = F e − 1 ⋅ x e .
(3.4-16)
3.5. Линейные операторы и матрицы линейных операторов. Отображение A линейного пространства X в линейное пространство Y A : X →Y называют линейным преобразованием или линейным оператором, если оно удовлетворяет двум условиям: а)
r r r r r r A ( x + v ) = A ( x ) + A (v ) для всех x,v ∈ X ;
(3.5-1)
б)
r r r r x v ∈ X и любого α . A (αx ) = αA ( x ) для всех (3.5-2) r rЕсли отображение A переводит вектор x в некоторый другой вектор y : r r A (x) = y , (3.5-3) r r r r то вектор y - называют образом вектора x , а x - прообразом вектора y . n Линейный оператор, отображающий линейное пространство R n само в себя, называется линейным оператором в R .
140
r
r
r
r
Пусть x ∈ R ; y ∈ R и y = A ( x ) . Рассмотрим, как связаны в r r этом случае координаты векторов x и y . Будем ориентироваться снаr r r чала на базис [e] = [e1 e 2 ⋅ ⋅ ⋅ en ]. Очевидно при этом, что n
n
r r n x = ∑ x ek ek ;
(3.5-4)
r r n y = ∑ y ei ei .
(3.5-5)
k =1
i =1
Рассмотрим, прежде всего, как действует оператор A ты базиса. Пусть
на элемен-
r r r r e A (e1 ) = a11e e1 + a21 e2 + ... + ane1en
................................................ r r r r A (ek ) = a1ek e1 + a2ek e2 + ... + anke en
(3.5-6)
................................................. r r r r e A (en ) = a1en e1 + a2en e2 + ... + ann en Из соотношений (3.5-3) и (3.5-4) следует
r y =
r
n
∑ x A (e ) .
(3.5-7)
n r r n y = ∑ x ek ∑ a ike e i .
(3.5-8)
k =1
ek
k
Учтём (3.5-6): k =1
i =1
Сопоставляя это равенство с (3.5-5), получим n r y ei = ∑ aike x ek
, i = 1,2,..., n
(3.5-9)
k =1
Запишем этот результат в матричной форме:
r r y e = Ae ⋅ xe , (3.5-10) r r где, как и раньше y e и x e - координатные вектор-столбцы, соответствующих векторов в базисе [e] , а матрица
141
a12e ... a1en ⎤ e a22 ... a 2en ⎥ ⎥ (3.5-11) ..... ..... .....⎥ e ⎥ a ne2 ... a nn ⎦ называется матрицей оператора A в базисе [e] . Элементы её столбr r цов по построению - это координаты векторов A (e 1 ), A (e 2 )..... базисе [e] . Аналогично вводится понятие матрицы Af того же оператора A в некотором другом базисе [f ] . Рассмотрим теперь, как изменяется матрица оператора A при r r n замене базиса в пространстве R . Пусть, как и прежде y = A ( x ) и матрица Ae , в соответствии с (3.5-10) связывает между собой коордиr r натные столбцы векторов x и y в базисе [e] . ⎡ a11 ⎢a e Ae = ⎢ 21 ⎢..... ⎢ e ⎣a n1 e
Согласно ранее полученным результатам - соотношениям (3.4-16), и
r r x e = Fe ⋅ x f
(3.5-12)
r r y e = Fe ⋅ y f .
(3.5-13)
Из этих двух соотношений и (3.5-10) легко выводится равенство
r r y f = Af ⋅ x f ,
(3.5-14)
Af = Fe −1 ⋅ Ae ⋅ Fe .
(3.5-15)
где
Эта формула позволяет связать между собой матрицы одного и того же оператора в различных базисах. В математике такие матрицы называются подобными. Ранее (п.2.4.3) уже отмечалось, что подобные матрицы имеют одинаковые собственные числа. ПРИМЕР 3.4-2. Пусть имеется базис [e] (рис. 3.4) 1. Зададим оператора A его действием на векторы базиса [e] :
r r r A (e1 ) = e1 + 2e 2 ; r r A (e 2 ) = −e1 .
Тем самым мы определили матрицу оператора A в базисе [e] :
⎡1 − 1⎤ Ae = ⎢ ⎥. 2 0 ⎣ ⎦ 142
r
2. Зададим вектор x в базисе [e] :
r r r x = e1 − e 2 .
r A (e1 )
r y
r e2 r A (e2 )
r f2
r e1
r f1
r x
Рис. 3.4. Действие оператора на вектор Отсюда
r ⎡ 1⎤ xe = ⎢ ⎥ . ⎣ − 1⎦ 3. Рассчитаем координатный вектор, используя (3.5-14):
r r ⎡1 − 1⎤ ⎡ 1 ⎤ ⎡2⎤ y e = Ae xe = ⎢ ⎥ ⋅ ⎢− 1⎥ = ⎢2⎥ . 2 0 ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ 4. Введем новый базис [f ] : r r f1 = −e2 ; r r r f2 = −e1 − e2 . Тогда матрица перехода от базиса [e] к базису [f ] будет иметь вид
⎡ 0 − 1⎤ Fe = ⎢ ⎥. − − 1 1 ⎣ ⎦ 5. Определим матрицу Af оператора A в базисе [f ] :
⎡ 1 − 1⎤ ⎡1 − 1⎤ ⎡ 0 − 1⎤ ⎡ 1 2⎤ Af = Fe −1 AeFe = ⎢ ⋅⎢ ⋅⎢ . =⎢ ⎥ ⎥ ⎥ ⎥ ⎣− 1 0 ⎦ ⎣2 0 ⎦ ⎣− 1 − 1⎦ ⎣− 1 0⎦ 143
r
6. Найдём координатный столбец вектора x в базисе [f ] . В соответствии с рис. 3.4
r r r x = 2f1 − f 2 .
С другой стороны, согласно (3.5-12)
r r xf = Fe −1 ⋅ xe .
(3.5-16)
Оба подхода дают один и тот же результат:
r ⎡2⎤ xf = ⎢ ⎥ . ⎣ − 1⎦
r
В итоге получим координатный столбец вектора y в базисе [f ] :
r r ⎡0⎤ y f = Af x f = ⎢ ⎥ . ⎣ − 2⎦ ПРИМЕР 3.5-1. Дана матрица Ae оператора A в базисе [e] :
⎡0 1⎤ Ae = ⎢ ⎥ ⎣0 0⎦ r r и два вектора - f1 и f 2 , координатные столбцы которых в том же базисе имеют вид:
r ⎡ 1⎤ r ⎡0⎤ f e1 = ⎢ ⎥ ; f e 2 = ⎢ ⎥ , ⎣3⎦ ⎣2⎦ то есть
r r r f1 = e 1 + 2e 2 ; r r f 2 = 3e 2 .
Примем эти векторы в качестве нового базиса и вычислим в нём матрицу Af оператора A . Для этого выполним следующие действия. 1. Составим матрицу перехода от базиса [e] к базису [f ] :
⎡1 0 ⎤ Fe = ⎢ ⎥. 2 3 ⎣ ⎦ 2. Вычислим обратную матрицу:
144
Fe
−1
⎡ 1 =⎢ 2 ⎢⎣− 3
0⎤ 1⎥ . 3 ⎥⎦
3. Вычислим матрицу Af :
⎡ 2 ⎢ Af = Fe −1 ⋅ Ae ⋅ Fe = ⎢ 4 ⎢− ⎣ 3 3.6. Замена базиса в ской системы
3⎤⎥ ⎥. − 2⎥ ⎦
пространстве состояний динамиче-
Пусть заданы уравнения системы
r r r x = A x (t ) + B u (t ) ; r r y (t ) = C x (t ) .
(3.6-1)
Для этой системы могут быть найдены матрицы управляемости
U = [B AB A 2 B ... A n −1B ] ,
(3.6-2)
наблюдаемости
⎡ C ⎤ ⎢ CA ⎥ ⎥, N =⎢ ⎢ ... ⎥ ⎢ n −1 ⎥ ⎣ CA ⎦
(3.6-3)
передаточной функции
W y ( p ) = C( pE − A) −1 B .
(3.6-4)
Могут быть также записаны выражения для векторов состояния и выхода t r r r x (t ) = Φ(t − t 0 )x (t 0 ) + ∫ Φ(t − τ )Bu (τ )dτ ; t0
t r r r y (t ) = CΦ(t − t 0 )x (t 0 ) + ∫ CΦ(t − τ )Bu (τ )dτ .
(3.6-5)
t0
Полученные в предыдущих разделах результаты не были ограничены выбором какого-либо конкретного базиса в пространстве состоя145
ний. Все они были справедливы для любого базиса, в котором записаны матрицы A , B , C , Ф , W , U , N . Для определённости назовём этот базис базисом [e] . В этом случае можно подразумевать, что символы всех векторов и матриц в выражениях (3.6-1) - (3.6-5) снабжены индексом " e ". В дальнейшем нам будет удобно выбирать вполне определенный базис в пространстве состояний X таким образом, чтобы матрицы имели «хорошую», каноническую форму. Такой выбор базиса может оказаться целесообразным, так как, во-первых, канонические представления матриц системы имеют минимальное число ненулевых элементов и поэтому удобны для моделирования и других вычислений, а во-вторых, канонические представления позволяют получить чрезвычайно простые алгоритмы синтеза управления. Рассмотрим перевод уравнений (3.6-1) в некоторый новый базис F . Отметим при этом, что, переходя к новому базису в пространстве состояний, преобразовывая базис для пространства вектора состояний, не будем изменять базис пространства входов и пространства выходов r r системы. Заменим в (3.6-1) x e на x f согласно (3.5-12):
r r r Fe ⋅ x& f = Ae ⋅ Fe x f + Be u ; r r y = C eF e x f . Умножая слева обе части дифференциального уравнения на F чим:
r r r x& f = Fe −1 AeFe x f + Fe −1Be u .
(3.6-6) −1
, полу-
(3.6-7)
Учитывая (3.5-15), и вводя дополнительные обозначения
Af = Fe −1 ⋅ Ae ⋅ Fe ; Bf = Fe −1 ⋅ Be ;
(3.6-8)
C f = C e ⋅ Fe , окончательно получаем уравнения системы в базисе [f ] :
r r x& f = Af + B f ⋅ u (t ); r r y& (t ) = C f ⋅ x (t ).
(3.6-9)
ПРИМЕР 3.6-1. Пусть система задана схемой моделирования, привеr денной на рис. 3.5. Выберем в качестве координат вектора состояний x в исходном базисе [e] выходы интеграторов 1 и 2. В результате получим уравнения системы в исходном базисе: 146
r r r x& e (t ) = Ae x e (t ) + Be ⋅ u (t ); r r y ( t ) = Ce ⋅ x e ( t ) ,
u
1
x e1
2
xe2
y
Рис. 3.5. Схема моделирования в исходном базисе [ e ] где
1 − 1⎤ ; Ae = ⎡ ⎢⎣1 − 1⎥⎦
⎡1⎤ Be = ⎢ ⎥ ; ⎣0⎦
Ce = [0 1].
Зададим матрицу перехода к новому базису:
1 1⎤ Fe = ⎡ , ⎢⎣1 0⎥⎦ которой соответствуют уравнения
r r r f1 = e1 + e2 ; r f2 = e1 .
Вычислим обратную матрицу
0 1⎤ Fe −1 = ⎡ . ⎢⎣1 − 1⎥⎦ В соответствии с (3.6-8) находим
⎡0 1⎤ Af = ⎢ ⎥; ⎣0 0 ⎦
⎡0 ⎤ B f = ⎢ ⎥; ⎣ 1⎦
Cf = [1 0] .
Этим матрицам соответствуют уравнения
x& f1 = x f2 ; x& f2 = u ; y = x f1 , 147
которым, в свою очередь, отвечает схема, приведённая на рис. 3.6.
xf 2
u
xf1
y
Рис. 3.6. Схема моделирования в базисе [f ] Собственные числа системы, естественно, сохранились, так как матрицы А l и Af подобны. Связь между входом и выходом осталась неизменной, а схема моделирования стала заметно проще.
3.7. Вычисление матрицы преобразования базиса в пространстве состояний динамической системы с помощью матриц управляемости и наблюдаемости Пусть матрицы управляемой системы представлены rв двух различных базисах [e] и [f ] в пространстве состояний вектора x :
{Ae , B e }, {Af , B f } . Рассмотрим матрицу управляемости:
U f = [B f
Af B f
Af2 B f
... Afn −1 B f ] .
(3.7-1)
В соответствии с (3.6.-8)
Af Bf = Fe −1 Ae Be : Af2Bf = Fe −1AeFeFe −1AeFeFe −1Be = Fe −1Ae2Be ; ………….
Afk = Fe −1Aek Be .
(3.7-2)
Учитывая эти равенства в (3.7-1), получим выражение для перевода матрицы управляемости из одного базиса в другой:
U f = Fe −1Ue .
(3.7-3)
Умножая это равенство справа на Ue , получаем: T
Uf UeT = Fe −1UeU eT .
(3.7-4)
Если система управляема, то rank U e = rank U f = n . Это значит, что матрица U e имеет n линейно независимых строк и может быть представлена в виде 148
r ⎡z1T ⎤ ⎢ rT ⎥ z Ue = ⎢ 2 ⎥ , (3.7-5) ⎢ ... ⎥ ⎢ rT ⎥ ⎣zn ⎦ r r r где векторы z1, z2 ...zn – линейно независимы. Следовательно, матрица r ⎡z1T ⎤ ⎢ rT ⎥ z r r r UeU eT = ⎢ 2 ⎥ ⋅ [z1 z2 ... zn ], (3.7-6) ⎢ ... ⎥ ⎢ rT ⎥ ⎣ zn ⎦ которая является матрицей Грама, имеет положительный определитель, а значит – невырождена. Следовательно,
Fe −1 = Uf UeT (UeUeT )−1 .
(3.7-7)
Если система имеет скалярный вход (u-скаляр), то матрица B ста-
r
новится вектором (B = b ) , а матрица Ue – квадратной, в управляемой системе – невырожденной. Тогда:
Fe −1 = Uf Ue−1 .
(3.7-8)
Отметим, что в данном рассуждении Fe – матрица перехода от базиса [e] к базису [f ] , поэтому обратная ей - это матрица перехода от базиса [f ] к базису [e] :
Fe −1 = Ef .
(3.7-9)
Рассмотрим другой случай, когда переход от базиса [e] к базису [f ] задан парой матриц
{Ae ,C e }, {Af ,C f } некоторой наблюдаемой системы. Запишем матрицу наблюдаемости (3.3-7) и с учётом (3.6-8) проведём аналогичные предыдущим преобразования:
⎡ C f ⎤ ⎡ C eF e ⎤ ⎢C A ⎥ ⎢C AF ⎥ N f = ⎢ f f ⎥ = ⎢ e e e ⎥ = N eFe . ⎢ ⋅⋅⋅ ⎥ ⎢ ⎥ ⎢C A n −1 ⎥ ⎢C A n −1F ⎥ ⎣ f f ⎦ ⎣ e e e⎦
(3.7-10)
Так как система наблюдаема, то 149
rank (N e ) = rank (N f ) = n и матрица наблюдаемости имеет n линейно независимых столбцов
r N = [z1
r z2
r ⋅ ⋅ ⋅ zn ] ,
а квадратная матрица
rT ⎡ z1 ⎤ ⎢zr T ⎥ r N T N = ⎢ 2 ⎥[z1 ⎢⋅ ⋅ ⋅⎥ ⎢ rT ⎥ ⎣z n ⎦
r z2
r ⋅ ⋅ ⋅ zn ]
не вырождена. Умножим обе части равенства (3.7-10) слева на N e : T
N eT N f = N eT N eFe ,
(3.7-11)
Fe = (N eT N e ) −1 N eT N f .
(3.7-12)
откуда получим
Если система имеет скалярный выход, то
Fe = N e−1N f .
(3.7-13)
3.8. Канонические представления систем 3.8.1. Управляемое каноническое представление системы со скалярным входом Пусть в некотором исходном базисе [h] пространства состояний X записаны уравнения движения объекта со скалярным управлением:
r r& r x h (t ) = Ah x h (t ) + bhu(t ) ; r r y (t ) = Ch x h ( t ) .
(3.8-1) (3.8-2)
Болееr общая запись связывает не координатные столбцы, а сами векторы в x ∈ X с помощью соответствующего оператора A :
r r& r x (t ) = A ⋅ x ( t ) + b ⋅ u ( t ) . (3.8-3) r A ,b управляема, то n векторов Если система r r r b , A b, ... , A n −1b образуют базис в пространстве X в силу того, что rank U = n . Следовательно, в пространстве X в качестве базиса может
{
}
быть выбрана следующая система векторов: 150
r r ⎧e1 = b; ⎪ r ⎪er = A b; ⎪ 2 r ⎪r 2 ⎨e3 = A b ⎪ ⎪............ ⎪r r ⎪en = A n −1b. ⎩
(3.8-4)
Пусть характеристический полином оператора цы в преобразованном базисе имеет вид:
A
, а значит и его матри-
ϕ A (λ ) = λn + αλn −1 + ... + α n −1 λ + λn .
(3.8-5)
Построим ещё один базис - базис [u ] следующим образом:
r r r r r n −2 n −1 u1 = α n −1 b + b + ... + b + b α A α A A 1 123 n −2 { { 123 ; e1
e2
e n −1
r r r r r n −3 n −2 u 2 = α n −2 b + b + ... + b + b α A α A A 1 123 n −3 { { 123 ; e1
e2
en − 2
en −1
r r r r r n −4 n −3 u 3 = α n −3 b + b + ... + b + b α A α A A n−4 { 1 123 { 123 ; e1
e2
en − 3
en − 2
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ r r r r 2 u n −2 = α 2 b + b + b α A A { 1 { {; e1
e2
e3
r r r u n −1 = α 1 b + b A { {; e1
r r un = b {.
e2
(3.8-6)
e1
Проверим, действительно ли это базис? Матрица перехода от базиса [e] к базису [u ] в соответствии с (3.4-4) и (3.4-5) имеет вид:
151
⎡α n −1 ⎢α ⎢ n −2 ⎢α n −3 U e = ⎢⎢ ... ⎢ α2 ⎢ ⎢ α1 ⎢⎣ 1
α n −2 α n −3 α n −3 α n − 4 α n − 4 α n −5
... α 2
α1
... α 1 ... 1
1 0
...
...
...
...
...
α1
1
...
0
0
1
0
...
0
0
0
0
...
0
0
1⎤ 0⎥ ⎥ 0⎥ ...⎥⎥ . 0⎥ ⎥ 0⎥ 0 ⎥⎦
(3.8-7)
Эта матрица является треугольной, её определитель равен проn изведению диагональных элементов, умноженному на (−1) , т.е. не равен нулю. Следовательно, U e не вырождена и система векторов
r r
r
{u1 u 2 ...u n } действительно образует базис в пространстве X. Вычислим теперь представление матрицы оператора [u ] . При этом воспользуемся равенством
r n r r r r u u u A fk = a1k u1 + a2 k u 2 + ... + ank u n = ∑ aiku A (u i ) .
( )
в базисе
(3.8-8)
i =1
С учётом (3.8-6)
r
A
r
r r r r b + ... + α n −1 A b + α n b − α n b = r r + ... + α n −1 A + α n E )b − α n b =
A (u1 ) = A n b + α 1 A
n −1
= ( A n + α 1 A n −1 r r = ϕ A ( A )b − α n b.
(3.8-9)
r r По теореме Кэлли-Гамильтона ϕ A ( A ) = 0 , а значит A (u1 ) = −α n b , отu u куда следует, что an1 = −α n и a i 1 = 0 при i < n , то есть r auT1 = [0 0 ... 0 − α n ] . (3.8-10) Далее действуем аналогичным образом:
r r r r r r n −1 n−2 A (u 2 ) = A b + α 1 A b + ... + α n −2 A b + α n −1b − α n −1 b {r , (3.8-11) 144444442 4444444 3 r un u1
откуда следует, что a12 = 1, a i 2 = 0 при 1 < i < n; an 2 = −α n −1 , то есть u
u
u
r auT2 = [0 1... 0 − α n −1 ] .
Далее:
r r r r r r A (u 3 ) = A n −2 b + α 1 A n −3 b + ... + α n −3 A b + α n −2 b − α n − 2 b , (3.8-12) { r 144444442 4 4 4 4 4 4 4 3 r un u2
152
откуда следует, что u a13u = 0; a 23 = 1; a iu3 = 0 при 2 < i < n; anu3 = −α n −2 ,
то есть
r auT3 = [0 0 1 0 ... 0 − α n − 2 ] .
Вычислим предпоследний столбец матрицы:
r r r r r 2 A (u n −1 ) = A b + α 1 A b + α 2 b − α 2 b , { 1444r2444 3 r un
(3.8-13)
un − 2
откуда следует, что ai,n-1 = 0 для 1 ≤ i < n − 2 , an −2 ,n −1 = 1, a n- 1,n-1 = 0 и u
u
u
u an,n= −α 2 , то есть 1 r auT n −1 = [0 0 ⋅ ⋅ ⋅ 0 1 0 − α n − 2 ] .
Наконец,
r
r
r
r
r
r
A (u n ) = A b + α 1b − α 1b = u n −1 − α 1u n ,
(3.8-14)
откуда следует, что a i,n = 0 для 1 ≤ i < n − 1, и an −1,n = 1, a n,n = −α 2 , то есть u
u
u
rT aun = [0 0 ⋅ ⋅ ⋅ 0 1 − α 1 ].
Таким образом, матрица AU оператора
A
в базисе [u ] имеет вид:
... 0 ⎤ 1 0 ⎡ 0 ⎢ 0 ... 0 ⎥ 0 1 ⎢ ⎥ ... 0 ⎥ 0 0 ⎢ 0 ⎥. AU = ⎢ ... (3.8-15) ... ... ... ... ⎢ ⎥ ⎢ 0 ... 0 ⎥ 0 0 ⎢ ⎥ ... 1 ⎥ 0 0 ⎢ 0 ⎢⎣− α n − α n −1 − α n − 2 ... − α 1 ⎥⎦ r r Так как b = u n , то есть является последним вектором базиса [u ] , то коr ординатный столбец вектора b в этом базисе r buT = [0 0 0 ... 0 0 1] . (3.8-16) r Пара AU , bU называется управляемым каноническим представлением (УКП) системы с одним (скалярным) входом. Матрица AU называется сопровождающей по отношению к полиному ϕ A ( λ) .
{
}
153
Таким образом, мы доказали, что если исходная система управляема, то r в пространстве состояний Х существует базис, в котором пара Α, b имеет управляемое каноническое представление.
{ }
r Если в некотором исходном базисе [h] заданы матрицы AH , bH и,
если система управляема, то для того, чтобы вычислить их (матриц) УКП, достаточно вычислить коэффициенты характеристического полинома ϕ A (λ ) . После этого может быть вычислена матрица преобразования от исходного базиса [h] к УКП в соответствии с (3.7-8):
U H−1 = U U U H−1 .
(3.8-17)
Далее индекс “h” для системы в исходном базисе будем опускать. ПРИМЕР 3.8-1. Для системы
r& r r x = Ax + b u ; r y = Cx
известны матрицы
⎡2 3⎤ r ⎡1 ⎤ A=⎢ ⎥, b = ⎢ ⎥, C = [1 1] . ⎣4 5⎦ ⎣⎢2⎦⎥ Нетрудно вычислить матрицу
⎡1 8 ⎤ U ≡ UH = ⎢ ⎥. 2 14 ⎣ ⎦ Её определитель U = −2 ≠ 0 , откуда следует, что система управляема и, значит, для неё существует УКП. Вычислим характеристический полином:
λ −2 −3 ⎤ ϕ A ( λ ) = λE − A = ⎡⎢ = λ2 − 7λ − { {2 . ⎣ − 4 λ − 5⎥⎦ α1 α2 Это позволяет сразу же записать матрицы A и B в базисе УКП:
0 1⎤ , AU = ⎡ ⎢⎣2 7⎥⎦
r 0 bU = ⎡ ⎤ . ⎢⎣1⎥⎦
Векторно-матричные уравнения системы в УКП имеют вид:
r r r x& u = Au x u + bu u; r y = Cu x u .
154
Для того, чтобы найти матрицу CU , требуется рассчитать матрицу перехода от исходного базиса к базису УКП. Для этого предварительно вычислим
4 ⎤ ⎡− 7 ⎡0 1⎤ = U H−1 = ⎢ и U U ⎥ ⎢ 1 7⎥ . − 1 0 . 5 ⎣ ⎦ ⎣ ⎦ Тогда искомая матрица
4 ⎤ ⎡ 1 − 1/ 2⎤ ⎡1 1⎤ ⎡0 1⎤ ⎡− 1 = = , U H ⎢0 2⎥ . ⎥ ⎢ 1 − 1/ 2⎥ ⎢0 1/ 2 ⎥ 1 7 ⎣ ⎦ ⎦ ⎦ ⎣ ⎣ ⎦⎣
U H−1 = ⎢
После этого в соответствии с (3.6-8) находим
CU = C HU H = [1 3] . 3.8.2. Передаточная функция и структурная схема для системы в УКП Уравнения системы
r r& r xU (t ) = AU xU (t ) + bU u(t )
y = CU xU
(3.8-18)
со скалярным входом u (t ) и скалярным выходом y (t ) , где матрицы AU и
r bU определяются выражениями (3.8-15) и (3.8-16), а матрица CU имеет
вид
CU = [c u1 c u 2 L c un ] ,
(3.8-19)
можно записать в развёрнутом виде :
x& u 1 = x u 2 ; x& u 2 = x u 3 ; x& u 3 = x u 4 ;
(3.8-20)
... ... ... x& u n −1 = x u n ; x& u n = −α n x u 1 − α n −1 x u 2 − ... − α 2 x u n −1 − α 1 x u n + u ; y = c u 1 x u 1 + c u 2 x u 2 + ... + c u n x u n .
(3.8-21)
155
Этим уравнениям соответствует схема, представленная на рис.3.7.
y
u
cu n
c u n −1
xu n
x u n −1
-α 1
-α 2
cu 3
cu 2 xu 2
xu 3 -α n-2
-α n-1
cu 1 xu1 -α n
Рис. 3.7. Схема моделирования системы в УКП
В соответствии с этим рисунком передаточная функция системы имеет вид
W ( p) = =
cu 1p − n + cu 2 p − ( n −1) + ... + cu n −1p −2 + cu n p −1 1 + α1p −1 + α 2 p −2 + ... + α n p −n cu 1 + cu 2 p + ... + cu n −1p n −2 + cu n p n −1 p n + α 1p n −1 + α 2 p n −2 + ... + α n −1p + α n
= (3.8-22)
.
Отметим, что статический передаточный коэффициент
W (0 ) =
cu 1
αn
.
(3.8-23)
3.8.3. Идентификационное каноническое представление системы с одним (скалярным) выходом С помощью рассуждений, аналогичных проведённым в п.3.8.1, можно получить следующие результаты. Если пара матриц {A,C} полностью наблюдаема, то в пространстве состояний Х всегда существует базис, в котором пара {A,C} имеет идентификационное каноническое представление (ИКП):
156
⎡0 ⎢1 ⎢ ⎢0 AI = ⎢⎢... ⎢0 ⎢ ⎢0 ⎢⎣ 0
−αn ⎤ 0 ... 0 0 − α n −1 ⎥ ⎥ 1 ... 0 0 − α n −2 ⎥ ... ... ... ... ... ⎥⎥ ; 0 ... 0 0 − α 3 ⎥ ⎥ 0 ... 1 0 − α 2 ⎥ 0 ... 0 1 − α 1 ⎥⎦ 0 ... 0
0
CI = [0 0 ... 0 0 1] . Отметим, что:
r CIT = bU .
AIT = AU ;
(3.8-24)
(3.8-25)
(3.8-26)
Если в некотором исходном базисе [h] заданы матрицы AH , C H и, если система полностью наблюдаема, то для того, чтобы вычислить их (матриц) ИКП, достаточно вычислить коэффициенты характеристического полинома ϕ A ( λ ) . После этого может быть вычислена матрица преобразования от исходного базиса [h] к ИКП в соответствии с (3.7-13):
I
−1 H
= N H−1N I .
(3.8-27)
Если известна матрица BH при векторе управления в исходном базисе, то с учётом (3.6-8) в базисе ИКП она может быть определена с помощью соотношения
BI = I
−1 H
BH .
(3.8-28)
3.8.4. Передаточная функция и структура для системы в ИКП В соответствии с видом матриц AI и CI уравнения системы со скалярным входом u и скалярным выходом y имеют вид:
⎧ x& i 1 = −α n x i n + bi 1u ; ⎪ x& = x − α x + b u ; i1 n −1 i n i2 ⎪ i2 ⎪ x& i 3 = x i 2 − α n −2 x i n + bi 3 u ; ⎨ ⎪... ... ... ... ... ... ⎪ x& i n −1 = x i n − 2 − α 2 x i n + bi n −1u ; ⎪ ⎩ x& i n = x i n −1 − α 1 x i n + bi n u ;
(3.8-29)
157
y = xi n .
(3.8-30)
Этим уравнениям соответствует структурная схема, представленная на рис. 3.8.
u bi 1
bi 2
bi n −2 xi 2
xi 1
bi n −1
bi n x i n −1
x i n −2
y
xi n -α n
-α n-1
-α 3
-α 2
-α 1
Рис. 3.8. Схема моделирования системы в ИКП В соответствии с этим рисунком передаточная функция системы имеет вид:
W ( p) = =
bi 1 p − n + bi 2 p − ( n −1) + ... + bi n −1 p −2 + bi n p −1 1 + α 1 p −1 + α 2 p −2 + ... + α n p −n bi 1 + bi 2 p + ... + bi n −1 p n −2 + bi n p n −1
p n + α 1 p n −1 + α 2 p n −2 + ... + α n −1 p + α n
= (3.8-31)
.
Отметим, что статический передаточный коэффициент
W (0 ) =
bi 1
αn
.
(3.8-32)
158
3.9. Обратная связь по состоянию, обеспечивающая заданное (желаемое) расположение собственных чисел в замкнутой системе с одним (скалярным) входом Даны уравнения полностью управляемого объекта управления в некотором исходном базисе
r r& r x H (t ) = AH x(t ) + bH u(t ); r y (t ) = C H x H ,
(3.9-1)
каждая координата вектора состояния которого доступна для измерения. Требуется синтезировать такое управление, которое бы обеспечило требуемое качество отработки внешнего командного сигнала v (t ) . Динамические свойства системы управления, в основном, определяются её собственными числами, то есть нулями характеристического полинома n
ϕ A (λ ) = ∏ (λ − λi ) =λn + α 1λn −1 + ... + α n .
(3.9-2)
i =1
Время переходного процесса каждой моды определяется расстоянием до мнимой оси вещественной части; колебательность - соотношением мнимой и вещественной частей соответствующих собственных чисел. Эти зависимости могут быть проанализированы при изучении характеристик типовых звеньев, кроме того, они рассматриваются в обширной учебной литературе по теории автоматического регулирования и управления. В соответствии со структурной схемой, приведённой на рис. 3.9, сформируем сигнал управления объектом в виде:
r u(t ) = LH x H (t ) + k v v (t ) ,
(3.9-3)
где: LH – некоторая матрица-строка обратной связи:
LH = [l h 1
lh2
... l h n ];
(3.9-4)
k v – коэффициент по командному сигналу. Тогда уравнение системы примет вид:
r r r r r x& H (t ) = AH x H (t ) + bH LH x H (t ) + bH k v v (t ) ,
(3.9-5)
r v r& r C x H (t ) = AH x H (t ) + bH k v (t ) ,
(3.9-6)
или
где AH - матрица замкнутой системы в исходном базисе: C
r AHC = AH + bH LH .
(3.9-7) 159
v
u
kv Регулятор
y Объект
r x
L
Рис. 3.9. Структурная схема замкнутой системы Поскольку объект полностью управляем, то существует базис [u ] ,
{ }
r в котором пара A, b имеет управляемое каноническое представление r AU , bU . Поэтому перейдём к записи уравнений системы в базисе УКП.
{
}
В соответствии с (3.4-16) произведём замену
r r x H = U H xU .
Тогда из (3.9-1) получим
r
r
(3.9-8)
r
U H x& U (t ) = AHU H x U (t ) + bH u(t ) ;
(3.9-9)
r y (t ) = C HU H x U .
(3.9-10) −1
Умножив уравнение (3.9-9) слева на U H , будем иметь
r r& r x U (t ) = AU x U (t ) + bU u(t ); , r y (t ) = C U x U ( t ) ,
(3.9-11)
r где AU bU и CU - соответствующие матрицы в УКП. Используя подстановку (3.9-8), из (3.9-3) получим
r u(t ) = LU x U + k v v (t ) ,
(3.9-12)
где матрица обратной связи в базисе УКП
LU = LHU H .
(3.9-13)
В результате, уравнение замкнутой системы в базисе управляемого канонического представления будет иметь вид:
r r r x& U (t ) = AUC x U (t ) + bU ⋅ k v v (t ) .
(3.9-14)
Здесь AU является сопровождающей матрицей по отношению к характеристическому полиному замкнутой системы C
160
n
ϕ AC (λ ) = ∏ (λ − λ3i ) =λn + γ 1λn −1 + ... + γ n ,
(3.9-15)
i =1
поэтому она имеет стандартный вид
⎡ ⎢ ⎢ AUC = ⎢ ⎢ ⎢ ⎢⎣
0
1
0
⋅⋅⋅
0
0
1
⋅⋅⋅
⋅⋅⋅
⋅⋅⋅
⋅⋅⋅
⋅⋅⋅
0
0
0
⋅⋅⋅
−γ n
− γ n −1
− γ n −2
⋅⋅⋅
0 ⎤ 0 ⎥ ⎥ ⋅⋅⋅ ⎥ . 1 ⎥⎥ − γ 1 ⎥⎦
(3.9-16)
С другой стороны, очевидно, что
r A = AU + bU LU . C U
(3.9-17)
Отсюда сразу же следует связь между коэффициентами характеристического полинома (3.9-2) объекта и коэффициентами характеристического полинома (3.9-14) желаемой системы:
− γ i = −α i + l U n −i +1 , i = 1, 2, K, n .
(3.9-18)
Далее обусловлены следующие действия. 1. Задание желаемых собственных чисел замкнутой системы λ13 , λ32 ,..., λ3n . 2. Вычисление коэффициентов характеристического полинома замкнутой системы γ 1 , γ 2 , ...,γ n в соответствии с выражением (3.9-14). 3. Вычисление согласно (3.9-17) коэффициентов матрицы обратной связи в базисе УКП:
lU ,n −i +1 =α i −γ i , i = 1,2,..., n .
(3.9-19)
4. Вычисление в соответствии с (3.9-12) и (3.8-17) матрицы обратной связи в исходном базисе:
LH = LU U U U H−1 .
(3.9-20)
5. Определение величины коэффициента k в соответствии с требованиями по статике. Так например, если требуется обеспечить единичную статику по командному сигналу v , то это значит, что установившееся значение переходной функции h(t ) замкнутой системы должно быть равно единице. Одним из свойств передаточной функции устойчивой системы является равенство: v
lim h(t ) = limWvy ( p ) . t →∞
p →0
(3.9-21)
161
Согласно структурной схеме, приведённой на рис. 3.9, передаточная функция между командным v и выходным y сигналами имеет вид:
Wvy ( p ) = k v ⋅ W ( p ) ,
(3.9-22)
где передаточная функция W (p ) , может быть определена аналогично выражению (3.8-22). Таким образом, получаем:
h( ∞ ) = k v
cU1
γn
= 1,
(3.9-23)
откуда окончательно,
kv =
γn cU1
.
(3.9-24)
162
3.10. Синтез управления в многомерной системе. Задача разделения каналов В предыдущих разделах, посвящённых синтезу, рассматривались объекты со скалярным управлением (входом) и скалярным выходом. На практике встречаются и более сложные объекты. Один из них был упомянут в разделе 2.2. Это смесительный бак, у него две входные величины – два входных потока с различными концентрациями растворённого вещества, и две выходных – концентрация и расход выходного потока. В качестве другого примера может быть взят объект, связанный с перемоткой некоторой полосы с одного рулона на другой. Для этого объекта выходные переменные – это натяжение и линейная скорость перемотки; входные – напряжения или токи приводных двигателей моталки и разматывателя. Наконец, самолёт. В качестве выходных переменных могут выступать углы тангажа, курса и крена; в качестве входных, управляющих, - угловые положения руля высоты, руля направления и элеронов. Как правило, в таких объектах каждая выходная величина зависит от всех входных. В то же время, при синтезе управления такими объектами часто требуется обеспечить не только заданные динамические и статические свойства системы, но и независимое управление по каждой из выходных переменных. Пусть уравнения объекта имеют вид
r r r x& (t ) = Ax (t ) + Bu(t ) ; r r y (t ) = Cx(t ) ,
(3.10-1) (3.10-2)
где размерность вектора состояния [n × 1] , вектор управления и вектор выхода имеют одинаковую размерность [ p × 1] . Такую же размерность r имеет вектор командного сигнала v , поступающий на вход системы. r Требуется синтезировать управление u такое, чтобы: 1) i –я составляющая вектора выхода y i зависела только от i –й составляющей командного сигнала v i ; 2) по каждому из каналов была обеспечена заданная динамика, иными словами, передаточная функция Wvi ,yi (p) =
Yi (p) , имеющая заVi (p)
данные полюсы; 3) для каждого из каналов был обеспечен заданный статический коэффициент передачи.
3.10.1. Разделение исходного объекта на подсистемы интеграторов Представим (3.10-2) в виде 163
⎡C1 ⎤ r r ⎢⎢C2 ⎥⎥ r y = Cx = x, ⎢M⎥ ⎢C ⎥ ⎣ p⎦ где Ci - строки матрицы C . Тогда i -я координата вектора выхода
r y i = Ci x .
Рассмотрим процедуру многократного дифференцирования координат вектора выхода:
r r r y i′ = C i x& = C i A x + C i B u ; r r r y i′′ = C i A 2 x + C i AB u + C i B u ′; r r r r y i( 3 ) = C i A 3 x + C i A 2 B u + C i AB u ( 1) + C i B u ( 2 ) ;
(3.10-3)
L LL LL LL LL LL LL L LL LL LL r r r r y i( m ) = C i A m x + C i A m −1B u + C i A m −2 B u ( 1) + ... + C i B u ( m −1) Сократим запись:
r r m−1 r y i( m) = Ci Am x + Ci Am−1Bu + ∑Ci Am−1−ν Bu (ν )
(3.10-4)
ν =1
Для каждой координаты найдем максимальное число дифференr u цирований, при котором еще не появляется производная вектора , то есть, найдем такие числа m i , что
C i A m i −1B ≠ 0 и C i A m i − 2 B = 0 . Таким образом, получим систему уравнений:
r r y 1( m1 ) = C1 A m1 x + C1 A m1−1B u ; r r y 2( m2 ) = C 2 A m2 x + C 2 A m2 −1B u ; LLLLLLLLLLL r (m ) m r m −1 y p p = C p A p x + C p A p Bu .
(3.10-5)
Запишем эту систему равенств в векторно-матричном виде: m m −1 (m ) ⎡ y 1 1 ⎤ ⎡ C1A 1 ⎤ ⎡ C1A 1 ⎤ ⎢ y ( m2 ) ⎥ ⎢C A m2 ⎥ r ⎢C A m2 −1 ⎥ r ⎢ 2 ⎥=⎢ 2 ⎥x + ⎢ 2 ⎥Bu = −F* xr + B*ur . ⎢ M ⎥ ⎢ M ⎥ ⎢ M ⎥ ⎢ ( mp ) ⎥ ⎢ ⎢ mp ⎥ m p −1 ⎥ ⎣ y 1 ⎦ ⎣C1A ⎦ ⎣C1A ⎦
(3.10-6)
164
Обозначим
⎡ y1 1 ⎤ r ⎢ y 2( m2 ) ⎥ ⎥ q=⎢ ⎢ M ⎥ ⎢ ( mp ) ⎥ ⎣y1 ⎦ (m )
(3.10-7)
и m −1
⎡ C1A 1 ⎤ ⎢C A m2 ⎥ ⎥; F* = − ⎢ 2 ⎢ M ⎥ ⎢ mp ⎥ ⎣C1A ⎦
⎡ C1A 1 ⎤ ⎢C A m2 −1 ⎥ ⎥. B* = ⎢ 2 ⎢ M ⎥ ⎢ m p −1 ⎥ ⎣C1A ⎦
m
(3.10-8)
Тогда (3.10-6) можно переписать в виде
r r r q = −F* x + B* u .
(3.10-9)
B * не
Если задача разделения каналов имеет решение, то матрица вырождена и:
r r r u = B *−1q + B *−1F* x .
(3.10-10)
На рис. 3.10 представлена промежуточная структурная схема, соответствующая уравнениям (3.10-1), (3.10-2) и (3.10-8). →
q
→
u
В*-1
→
→
В
∫
x
C
y
A B*-1 F*
Рис. 3.10. Промежуточная структурная схема Для этой схемы справедливы уравнения
r r r x& = ( A + BB*−1F* )x + BB*−1q ; r r y = Cx .
(3.10-11)
Обозначим
A = A + BB*−1F* ; ∨
B = BB . ∨
−1 *
(3.10-12)
165
Теперь (3.10-11) превратится в
r r r ⎧⎪ x& = A x + B q ; V V ⎨r r ⎪⎩ y = C x ,
(3.10-13)
r
а структурная схема промежуточной системы с входным вектором q примет вид, представленный на рис. 3.11. →
→
q
x
∫
B V
→
y
C
A
V
Рис. 3.11. Структурная схема системы r относительно входного вектора q
r
r
С другой стороны, вектор выхода y связан с вектором q равенством (3.10-7) и поэтому схеме, представленной на рис. 3.11 полностью эквивалентна схема, составленная из p подсистем последовательно включённых интеграторов. Эта схема представлена на рис. 3.12.
q1
∫
∫
∫
∫
y1
m1 интеграторов
qi
∫
∫
yi
mi интеграторов
qp
∫
∫
yp mp интеграторов
Рис. 3.12. Структурная схема объекта, представленного в виде изолированных подсистем интеграторов Общее количество интеграторов не может быть больше n , то есть: 166
p
∑1 m ≤ n . i
i=
Таким образом, система { A , B } (3.10-13), у которой в качестве входного
r V вектора выбран вектор q ,
V
а) развязана по каналам, то есть y i зависит только от q i для всех значений i ; p
б) имеет
∑1 m
i
i=
собственных значений, равных нулю.
Теперь систему { A , B } нужно попытаться привести к удобному баV
V
зису, в котором синтезировать обратную связь, реализующую желаемые собственные числа по каждому каналу. Прежде всего, установим некоторые свойства матриц A и B . АнаV
V
логично (3.10-4) запишем:
y
( mi ) i
r m −1 r mi −1 m −1−ν = C i A x + C i A B q + ∑ C i A i B q (ν ) . mi
V
V
( mi )
С другой стороны, y i
Ci A V
1)
2) Ci A
mi −1
V
mi
[
V
откуда:
C i AV
V
m i −ν
V
V
= 0 для всех i = 1,2,…,p ;
V
Ci A V
ν =1
= q i . Отсюда следует:
r r r mi −1 B q = Ci A b1 b2 V
3) C i A
V
m i −1
m i −1
r bj = 0
V
⎡ q1 ⎤ r ⎢ q2 ⎥ ... bp ⋅ ⎢ ⎥ = qi , V ⎢ M ⎥ ⎢q ⎥ ⎣ ny ⎦
]
r bi = 1;
(3.10-14)
(3.10-15)
(3.10-16)
V
, при
j ≠i ;
(3.10-17)
V
r b j = 0 для ν > 1 и для всех j , i .
(3.10-18)
V
3.10.2. Преобразование базиса в пространстве Rn Перейдём от исходного базиса [e] к новому базису [f ] с помощью некоторой матрицы преобразования F е . При выборе базиса [f ] учтем, следующие обстоятельства: • Объект управляем, поэтому ранг матрицы управляемости 167
r r r r r r r n −1 n −1 U = [b1 b2 ... bp M A b1 ... A bp M ... M A b1 ... A bp ] V V V V V
V
V
V
V
V
(3.10-19)
V
равен порядку системы; • так как каждый канал этой системы с размерностью mi управляем, то столбцы
r r r r r r m1 −1 m p −1 b1, A b , ... , A b , ... , b , A b , ... , A b p p p 1 1 V V V V V
V
V
V
V
V
линейно независимы. Теперь выберем базис [f ] , соответствующий следующим координатным столбцам:
r r r r r r m1−1 m1− 2 fe1 = A b1 ; fe 2 = A b1 ; ...; fe m1 = b1 ; ∨ ∨ ∨
∨
∨
r r r r r r m2 −1 m2 − 2 fe m1+1 = A b2 ; fe m1+2 = A b2 ; ... ; fe m1+m2 = b2 ; ∨ ∨ ∨
∨
(3.10-20)
∨
..................................
r r r r r r m p −1 mp − 2 fe m1+...+mp−1+1 = A bp ; fe e m1+...+mp−2 = A bp ; f e m1+...+mp = bp ; ∨ ∨ ∨
∨
p
Если
< n , то оставшуюся часть векторов базиса [fост ] можно выби-
∑m i =1
∨
i
рать, перебирая оставшиеся столбцы матрицы U :
r m1+1 r r m1 ν 1 −1 A b , A b ,... A b 1 1 1 V V V V
V
V
r до тех пор, пока следующий вектор A b1 не будет выражаться в виде V ν
V
линейной комбинации всех предыдущих векторов базиса. Далее добаr m2 +1 r m2 вим A b2 , A b2 и так далее, пока число векторов базиса не достигV
V
V
V
нет числа n . Тогда матрица преобразования базиса [e] в базис [f ] будет иметь вид
Fe = [A V
m1−1
r r r r r r m −2 m2 −1 L b1 L A 1 b1 L b1 L A b L b b [fост ]]. 2 2 p V ∨
V
V
V
V
V
∨
Рассмотрим вид матрицы B в базисе [f ] . Первый столбец этой
V r матрицы, то есть вектор b1 совпадает с m1 -м столбцом базиса [f ] ; втоr рой столбец матрицы B , то есть вектор b2 совпадает с ( m1 + m2 ) -м столбцом базиса [f ] и так далее. Следовательно,
168
r
⎡ β1 0 r ⎢ ⎢ 0 β2 Bf = ⎢L L ⎢ ⎢0 0 ⎢⎣ 0 0
L L L L L
0⎤ ⎥ 0⎥ L⎥ , r ⎥ βp ⎥ 0 ⎥⎦
(3.10-21)
где
⎫ ⎪ ⎪⎪ ⎬mi строк. ⎪ ⎪ ⎪⎭
⎡0⎤ ⎢0⎥ r ⎢ ⎥ β i = ⎢L⎥ ⎢ ⎥ ⎢0⎥ ⎢⎣ 1 ⎥⎦
(3.10-22)
Теперь обратим внимание на матрицу С . В соответствии с (3.6-8)
Сf = C F
е
r ⎡ C ⎡ 1⎤ C1fe1 r ⎢ ⎢C ⎥ r r r C f 2 = ⎢ ⎥ ⋅ fe1 fe2 L fen = ⎢ 2 e1 ⎢ L ⎢M⎥ ⎢ r ⎢ ⎥ C ⎢⎣Cpfe1 ⎣ p⎦
[
]
L L L L
r C1fen ⎤ r ⎥ C2fen ⎥ . L ⎥ r ⎥ Cpfen ⎥⎦
(3.10-23)
Из этого равенства с учётом (3.10-14), (3.10-16), (3.10-17) получим:
где
⎡s1 0 L 0 0⎤ ⎢ 0 s L 0 0⎥ 2 ⎥, Cf = ⎢ ⎢ M M M M M⎥ ⎢ ⎥ 0 0 0 L s p ⎣ ⎦
(3.10-24)
si = [1 0 L 0] . 14 4244 3
(3.10-25)
mi
Наконец, займемся матрицей Af . Прежде всего, рассмотрим важV
ную интерпретацию элементов матрицы Af . В соответствии с (3.6-8)
Аf = Fе −1 Ае Fе , поэтому
Fе Аf = Ае Fе .
(3.10-26) 169
Левую часть этого равенства можно расписать следующим образом:
⎡a11f a12f L a1fn ⎤ r r r ⎢ ⎥ Fе Аf = fe1 fe2 ... fen ⋅ ⎢ M M M M ⎥= f ⎢⎣anf 1 anf 2 L ann ⎥⎦ r r r r r r f = [a11f fe1 + ... + anf 1fen a12f fe1 + ... + anf 2fen L a1fn fe1 + ... + ann fen ] .
[
]
С другой стороны:
r r Ае Fе = [Ае fe1 L Аеfen ].
Таким образом, получаем:
r r r r Aefei = a1fi fe1 + a2f i fe 2 + ... + anif fen .
(3.10-27)
Это означает, что элементы i -го столбца матрицы Af V
⎡ a1i ⎤ r f ⎢a2f i ⎥ ai = ⎢ ⎥ ⎢L ⎥ ⎢⎣a f ⎥⎦ ni f
r r являются коэффициентами разложения произведения A fei ≡ Ae fei по ∨ ∨ r r r координатным векторам fe1 , fe 2 , ..., fen . r Используя , (3.10-20), сопоставим произведения A fei с координат∨
ными столбцами векторов базиса [f ] :
r r m A fe1 = A 1 b1 ; ∨ ∨ ∨ r r r m1−1 A fe 2 = A b1 = fe1 ; ∨ ∨ ∨ r r r m1− 2 A fe 3 = A b1 = fe 2 ; ∨
∨
(3.10-28)
∨
LLLLLLLL . Так как A fe1 , A fe m1+1 т. д. не совпадают ни с одним из собственных V
V
p
векторов с номерами от 1 до n − ∑ mi − 1, то в соответствующих столбi =1
цах матрицы Af на позициях строк с номерами, большими p , могут наV
ходиться ненулевые элементы. Такие ячейки матрицы помечены симво170
лом " × ". Кроме того, на данном этапе нет смысла рассматривать столбцы этой матрицы с номерами, большими p . В результате получаем выражение для матрицы A в базисе [f ] : ∨
171
Af = V
010…0 001…0 …………. 000…1 000…0
000…0 000…0 …………. 000…0 000…0
: : : : :
000…0 000…0 …………. 000…0 000…0
000…0 0 0 0… 0 ………… 000…0 000…0 …………. 000…0 000…0 …………. 000…0 000…0 *00…0 …………. *00…0
010…0 001…0 …………. 000…1 000…0 …………. 000…0 000…0 …………. 000…0 000…0 *00…0 …………. *00…0
: : : : :
000…0 000…0 …………. 000…0 000…0 …………. 010…0 001…0 …………. 000…1 000…0 *00…0 …………. *00…0
m1
m2
: : : : : : : :
mp
m1
m2
mp
n − ∑ mi n − ∑ mi
Эту же матрицу удобнее записать в блочном виде:
⎡ A11 ⎢ 0 ⎢ A = ⎢ M V f ⎢ 0 ⎢ ⎢⎣ A 01
0 A10 ⎤ 0 A 20 ⎥ ⎥ M M ⎥. (3.10-29) A p p A p 0 ⎥⎥ A 0 p A 00 ⎥⎦ r Разобьём вектор состояния x на систему ( p + 1) частных векторов и обозначим
0 A 22 M 0 A 02
L L M L L
r z ⎡ 1⎤ ⎢ zr ⎥ ⎢ 2⎥ r xf = ⎢ M ⎥ , ⎢ zr ⎥ ⎢ rp ⎥ ⎢⎣ z 0 ⎥⎦
(3.10-30)
172
r
где zi имеет размерность [mi × 1] . Тогда уравнения (3.10-13) в базисе [f ] примут вид:
r ⎡ z&1 ⎤ ⎡ A11 ⎢ r& ⎥ ⎢ ⎢z2 ⎥ ⎢ 0 ⎢ M ⎥ =⎢ M ⎢ r& ⎥ ⎢ ⎢zp ⎥ ⎢ 0 ⎢⎣zr& ⎥⎦ ⎢⎣ A01 0
0 A22 M 0 A02
0 L 0 M M L Ap p L A0 p L
r r A10 ⎤ ⎡ z1 ⎤ ⎡ β 1 r A20 ⎥ ⎢ z 2 ⎥ ⎢ 0 ⎥ ⎢ ⎥ ⎢ M ⎥∗⎢ M ⎥+⎢ M r ⎢ A p 0 ⎥⎥ ⎢z p ⎥ ⎢ 0 ⎢r ⎥ A00 ⎥⎦ ⎢⎣ z 0 ⎥⎦ ⎢⎣ 0
⎡ y 1 ⎤ ⎡s1 0 L 0 ⎢y ⎥ ⎢ 0 s L 0 2 ⎢ 2⎥ = ⎢ ⎢ M ⎥ ⎢M M M M ⎢y ⎥ ⎢ 0 0 L s p ⎣ p⎦ ⎣
0 r
β2 M 0 0
r z ⎡ ⎤ 0⎤ ⎢ r1 ⎥ z 0⎥ ⎢ 2 ⎥ ⎥ ∗⎢ M ⎥. M⎥ ⎢r ⎥ z 0⎥⎦ ⎢ rp ⎥ ⎢⎣z0 ⎥⎦
L 0 ⎤ ⎡ q1 ⎤ ⎥ ⎢ ⎥ L 0 ⎥ ⎢q 2 ⎥ M M ⎥∗⎢ M ⎥; r ⎥ ⎢ ⎥ L βp ⎥ ⎢ M ⎥ L 0 ⎥⎦ ⎢⎣q p ⎥⎦
(3.10-31)
Отсюда следуют уравнения для частных подсистем:
r r r r z& i = A ii z i + A i 0 z 0 + β i q i r (i = 1,2,..., p ) y i = s i zi , p r r r z& 0 = ∑ A0ν zν + A00 z 0 .
(3.10-32)
(3.10-33)
ν =1
Раскроем систему дифференциальных уравнений для i -й подсистемы:
r ⎧z& i 1 = zi 2 + a1i 10 z0 = zi 2 + g i 1 ⎪ ⎪z& i 2 = zi 3 + g i 2 ⎪ ⎪ , ⎨................. ⎪ ⎪z& i ,mi −1 = zi ,mi + g i ,mi −1 ⎪ ⎪⎩z& i ,mi = g i ,mi + q i
{y
i
(3.10-34)
= zi 1
где a - первая строка матрицы Ai 0 . Такой подсистеме соответствует структурная схема, представленная на рис. 3.13. i 10 1
173
gi 2
g i mi qi
∫
zi mi
zi 3
gi1
∫
zi 2
∫
zi 1
yi
Рис. 3.13. Структурная схема частной подсистемы Из сопоставления этой схемы со схемой, приведённой на рис. 3.12, следует: (ν ) а) zi 1 = y i ; ziν = y i при ν > 1;
б) q iν = 0 и Aν 0 = 0 для ν = 1,2,..., p . Таким образом, выходы интеграторов частных подсистем, покаr занных на рис. 3.12, совпали с координатами вектора x в базисе [f ] . Кроме того, все блочные матрицы A00 , A10 ,..., A p 0 в (3.10-29)- нулевые.
3.10.3. Формирование управления Работая в базисе [f ] , мы имеем p изолированных подсистем, сумма выходов которых подаётся на вход общей подсистемы с матриp
цей динамики A00 размерности n − ∑ mi :
r
i =1
r r ⎧z&1 = A11z1 + β 1q1; y 1 = z11 ; ⎪ ⎪................... ⎪ ⎨zr& = A zr + βr q ; y = z ; pp p p p p p1 ⎪ p ⎪ p ⎪zr& = A zr + ∑ A zr . 00 0 0ν ν ⎩ 0 ν =1
(3.10-35)
Соответствующая структурная схем представлена на рис. 3.14.
r
Пары матриц { Aii , β i } для i = 1, 2 , ... , p имеют форму УКП, причем, каждая из матриц A ii имеет только нулевые собственные значения. Это вполне согласуется с тем, что в п. 3.10.1 было произведено преобразование объекта на подсистемы последовательно включённых интеграторов. Сформируем управление q i для i = 1, 2 , ... , p в следующем виде:
r qi = ki v i (t ) + l fi zi (t ) ,
(3.10-36)
174
А11 q1
→
∫
β1
А01 →
z1 ... ..... .... ..... .... ..... .... →
qp
∫
→
βp
zp
∑
A0p
∫
→ z0
A00
Ap,p
Рис. 3.14. Структурная схема объекта в базисе [f ] где
l fi = [l if1
l if2
K
l if,m i ] -
матрица обратной связи для i -й подсистемы в базисе [f ] . Тогда получим следующее дифференциальное уравнение для i -й подсистемы:
r r r r& r z i = Aii z i + β i l fi z i + β i k i v i ,
или
r r r z& i = χ fi z i + β i k i v i .
(3.10-37)
Нетрудно убедиться, что матрица динамики i -й подсистемы в базисе [f ] имеет вид
⎡0 1 ⎢0 0 ⎢ χ fi = ⎢ M M ⎢ ⎢0 0 ⎢⎣l if1 l if2
0 1 M 0 l if3
L 0 ⎤ L 0 ⎥ ⎥ M M ⎥. ⎥ L 1⎥ L l if,mi ⎥⎦
(3.10-38)
Следовательно, определены характеристические полиномы подсистем:
ϕ i ( λ ) = λmi − l if,mi λmi −1 − l if,mi −1λmi −2 − ... − l if1 .
(3.10-39)
Согласно (3.8-22) а также с учетом (3.10-13), (3.10-24) и (3.10-37) запишем выражение для передаточной функции замкнутой i -й подсистемы: 175
Wv i y i ( p ) =
p mi
ki . − l if,mi p mi −1 − ... − l if1
(3.10-40)
Очевидно:
W v i y i (0 ) =
ki . − l if1
(3.10-41)
Задавая расположение полюсов и статику для каждой подсистемы, в итоге получим матрицы:
⎡l f 1 0 L 0 ⎢0 l L 0 f2 Lf = ⎢ M M M ⎢M ⎢0 0 L l f ,p ⎣
0⎤ ⎡k 1 0 L 0 ⎤ ⎢0 k L 0 ⎥ 0⎥ 2 ⎥ ; k=⎢ ⎥. M⎥ ∨ ⎢ M M M M⎥ ⎢0 0 L k ⎥ 0⎥⎦ p⎦ ⎣
(3.10-42)
Возвращаясь в исходный базис для уравнений (3.10-13), получим:
r
LV = Lf Fе −1 .
(3.10-43)
При этом вектор q формируется в соответствии с выражением
r r r q(t ) = LV x(t ) + k∨ v (t ) .
(3.10-44)
Учитывая (3.10-10), окончательно получим:
r r r r r −1 −1 −1 u = B* F* x + B* LV x + B* kV V (t ) = Lx + kV ,
(3.10-45)
где
L = B*−1 (F* + LV );
k = B*−1 kV .
(3.10-46)
На этом можно закончить синтез, если часть системы, оказавшаяся вне обратной связи, имеет допустимые динамические свойства. Если же нет, например, A00 - неустойчива, то приходится идти на то, чтобы ввести
r
обратную связь L0 , по z0 , по крайней мере, через один из каналов (q r ) , оставив полностью развязанными остальные ( p − 1) каналов. В этом случае k r , l fr , l f 0 нужно рассчитывать совместно. Связь L0 должна обесV
печить «надзор» за бывшими ранее без контроля ( n − ∑ mi ) полюсами (собственными числами) системы. Эта часть расчета может быть произведена по обычной методике синтеза системы с одним входом. Результирующая структура в базисе [f ] приведена на рис. 3.15.
176
l f1 А11 v1
k1
q1
V
→
∫
β1
А01 → z1
............................................ →
vi
ki
qi
∫
→
βi
V
zi
A0i
∑
A ii l fi
............................................ →
vp
kp V
qp
∫
→
βp
zp
A0p
App l fp vr
kjr V
qr
→ →
βr
∫
zj
∫
A0r
Arr
A00
l fr l f0
Рис. 3.15. Структурная схема системы в базисе [f ] 3.10.4. Итоговый алгоритм 1) Расчет чисел mi , i = 1,2,..., p :
⎧Ci A m−1B ≠ 0; mi = mmax ⎨ m −2 ⎩Ci A B = 0.
(3.10-47)
177
Эти числа можно также находить непосредственно из схемы в переменных состояния. 2) Вычисление матриц F* ,B* : m m −1 ⎡ C1 A 1 ⎤ ⎡ C1 A 1 ⎤ F* = − ⎢ M ⎥; B* = ⎢ M ⎥B. ⎢ ⎥ ⎢ ⎥ mp m p −1 ⎢⎣C p A ⎥⎦ ⎢⎣C p A ⎥⎦
(3.10-48)
−1
3) Вычисление B* . Если B* - вырождена, то задача разделения каналов не имеет решения. 4) Вычисление матриц A, B : V
V
A = A + BB*−1 F* ; B = BB*−1 . { V V
(3.10-49)
B v
5. Построение матрицы Fe :
r r r r r m −1 m −1 Fe = ⎡⎢ A 1 b1 M...M b1 MM A 2 b2 M...M b2 M...M bp M[fост ]⎤⎥ . V V V V V ⎣V ⎦ V
(3.10-50)
6. Расчет коэффициентов характеристических уравнений каналов, то есть строк l fi . Для этого предварительно должны быть заданы наборы желаемых собственных чисел ( λi 1 , λi 2 , ... , λi mi ) по каждому из каналов, после чего в соответствии с равенством mi
( λ − λ iν ) =λm − l if,m λm −1 − l if,m −1λm − 2 − ... − l if1 ∏ ν =1 i
i
i
i
i
(3.10-51)
следует рассчитать
l fi = [l if1 ... l if,mi ].
(3.10-52)
и сформировать матрицу
⎡l f 1 0 L 0 ⎤ ⎢0 l L 0⎥ f2 ⎥ .. Lf = ⎢ ⎢M M M M⎥ ⎢ ⎥ 0 0 L l fp ⎦ ⎣ 7. Расчет (построение в соответствии с выбранным базисом) матрицы A00 и вычисление ее собственных чисел. 8. Принятие решения о необходимости завязки каналов для коррекции собственных чисел полинома ϕ 0 ( λ ) . В случае необходимости - выбрать канал для коррекции и далее провести для него расчет по ме178
тодике синтеза системы с одним входом. В конечном итоге должна быть получена Lf - полная матрица обратной связи промежуточной системы в базисе [f ] . 9. Расчет матрицы k по заданным коэффициентам Wi (0) : V
k i = −Wi (0)l if1
(3.10-53)
⎡k 1 0 L 0 ⎤ ⎢V ⎥ 0 k 0 L 2 ⎢ ⎥ V kV = ⎢ . M M M M⎥ ⎢ ⎥ ⎢ 0 0 L kp ⎥ ⎣ V ⎦
(3.10-54)
V
и
10. Расчет матрицы обратной связи промежуточной системы в исходном базисе
LV = Lf Fe −1.
(3.10-55)
11. Расчет результирующей матрицы обратной связи
L = B*−1(F* + LV ) .
(3.10-56)
12. Расчет матрицы передаточных коэффициентов по вектору командных сигналов
k = B*−1 kV .
(3.10-57)
Вектор управления формируется традиционным образом:
r r r u ( t ) = L x ( t ) + kv ( t ) .
(3.10-58)
При необходимости может быть синтезирован идентификатор (наблюдатель) неизмеряемых координат вектора состояния.
179
3.11. Основы построения идентификаторов состояния (наблюдателей) 3.11.1. Наблюдатель Люенбергера полного порядка 3.11.1.1. Синтез архитектуры наблюдателя Рассмотрим линейную стационарную систему, которая описывается векторно-матричными дифференциальными уравнениями:
r r r ⎧ x& (t ) = Ax (t ) + Bu(t ); ⎨r r ⎩y (t ) = Cx(t ).
(3.11-1)
Для такой системы существуют алгоритмы модального синтеза, которые позволяют найти управление:
r r r u (t ) = Lx (t ) + kv (t ) ,
(3.11-2)
обеспечивающее заданные динамику и статику системы. Проблема заключается в необходимости использования вектора обратной связи для формирования такого управления. Фактически в распоряжении разраr ботчика системы управления лишь вектор выхода y (t ) . Возникает воr r прос: как, наблюдая за вектором y (t ) , восстановить вектор x (t ) , или
)r
r
найти его оценку x (t ) ? При этом ошибка оценки вектора x (t )
)r r r e ( t ) = x ( t ) − x (t )
(3.11-3)
должна быть относительно малой, и тем более, с течением времени не должна расти. Будем полагать, что разработчику достаточно хорошо известны
) ) )
параметры объекта, то есть оценки A, B, C , матриц A, B, C . Более того, положим
) ) ) A = A, B = B, C = C .
(3.11-4)
В этом случае, если построить аналоговую или цифровую модель объекта в соответствии с уравнениями
)r& )r r x = Ax (t ) + Bu(t ); )r )r y (t ) = Cx (t ) ,
(3.11-5)
как показано на рис. 3.16, то можно было бы ожидать выполнения равенств
)r r )r r x = x и y = y.
(3.11-6)
180
r u
r x
Объект Рис.4
)r x
В Модель объекта
r y
А
Рис. 3.16. Неудачный вариант построителя оценки вектора состояния Однако, априорное знание объекта (в том числе, матриц A , B и C ) является приближённым, параметры его могут дрейфовать во времени, начальные условия для вектора состояния, которые следовало бы подставить в модель, неизвестны. Поэтому в действительности в такой схеме ошибка оценки вектора состояния может иметь склонность к неограниченному росту с течением времени. Американским учёным Д.Г.Люенбергером впервые были изучены структуры работоспособных асимптотических идентификаторов (наблюдателей, восстановителей) вектора состояния, названных позднее его именем. Основополагающая идея состоит в том, чтобы в рассмотренную структурную схему ввести дополнительную обратную связь по ошибке r оценки вектора y , заведомо обеспечивающую асимптотическое затухание ошибки оценки вектора состояния. Внешне структурная схема наблюдателя Люенбергера полного порядка, которая приведена на рис. 3.17, совпадает с одной из форм известного фильтра Калмана. Различие в том, что матрица K , которая в фильтре Калмана называется его именем (матрицей Калмана), в наблюдателе Люенбергера рассчитывается из других соображений.
181
r u
r x& В
r x
∫
r y C
A
объект
r ey
K
)r& x
B
)r x
∫ A
C
)r y
Модель объекта
Наблюдатель
Рис. 3.17. Наблюдатель Люенбергера полного порядка В соответствии с рис.3.17 уравнение наблюдателя будет иметь вид:
(
)
)r& )r )r r r x ( t ) = Ax ( t ) + Bu ( t ) + K y ( t ) − y ( t ) .
(3.11-7)
Получим уравнение для ошибки оценки вектора состояния. Для этого в равенство (3.11-3) подставим выражения для вектора состояния и его оценки из (3.11-1) и (3.11-7):
(
)
)r )r r r r r r e& (t ) = Ax(t ) + Bu (t ) − Ax (t ) − Bu(t ) − K Cx(t ) − Cx(t ) ,
откуда
r r e& (t ) = L ⋅ e(t ) ,
(3.11-8)
L = (A − KC)
(3.11-9)
где называют матрицей динамики наблюдателя. Выражение (3.11-8) является однородным дифференциальным уравнением. Решение его имеет вид:
r r e(t ) = exp(L ⋅ t ) ⋅ e (0) .
(3.11-10)
Поведение ошибки во времени зависит от собственных чисел матрицы наблюдателя L . Выбрав их соответствующим образом, можно достаточно быстро свести ошибку к нулю, и получать от наблюдателя точную оценку вектора состояния. Далее будет показано, что если пара {A, C} наблюдаема, то соответствующим выбором матрицы K можно обеспечить любое желаемое расположение собственных чисел наблюдателя, 182
т.е. матрицы
L
. Практически, собственные значения наблюдателя вы-
)r бираются так, чтобы состояние наблюдателя x сходилось к состоянию
наблюдаемой системы несколько быстрее затухания переходных процессов в желаемой замкнутой системе. Чрезмерное ускорение наблюдателя приводит к затруднениям при его реализации. 3.11.1.2. Алгоритм определения матрицы К для систем со скалярным входом. Если пара {A,C} наблюдаема, то в пространстве вектора состояния существует базис [i ] , в котором эта пара имеет идентификационное каноническое представление (ИКП) {AI , CI }. Обозначим некоторый исходный базис как [h] . В этом базисе дифференциальное уравнение для ошибки оценки вектора состояния имеет вид
r r e&h (t ) = L h eh (t ) .
(3.11-11)
Перейдём к базису ИКП. Используем уже известное соотношение, связывающее координатные столбцы одного и того же вектора в разных базисах
r r eh = I h eI .
(3.11-12)
Используя эту подстановку, запишем
r r I h ⋅ e&I (t ) = L h ⋅ I h ⋅ eI (t ) . Умножив обе части последнего равенства на I
−1 h
, получим
r r e&I (t ) = L I eI , где
L I = I h−1L hI
.
(3.11-13)
L I = AI − K ICI ,
(3.11-14)
h
Кроме того, где
AI = I
−1 h
Ah I h ;
CI = Ch I h ; K I = I
−1
h
Kh.
(3.11-15)
Матрица динамики наблюдателя в базисе ИКП в соответствии с уравнением (3.11-4) имеет вид: . 183
⎡ 0 0 0 K 0 0 −α n ⎤ ⎡ 0 0 K 0 K I1 ⎤ ⎢ 1 0 0 K 0 0 −α ⎥ ⎢ 0 0 K 0 K ⎥ I2 n −1 ⎢ ⎥ ⎢ ⎥ ⎢ 0 1 0 K 0 0 − α n −2 ⎥ ⎢ 0 0 K 0 K I 3 ⎥ LI = ⎢ ⎥ − ⎢K K K K K ⎥ = K K K K K K K ⎢ ⎥ ⎢ ⎥ ⎢ 0 0 0 K 1 0 − α 2 ⎥ ⎢ 0 0 K 0 K In −1 ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ 0 0 0 K 0 1 − α 1 ⎦ ⎣ 0 0 K 0 K In ⎦ ⎡ 0 0 0 K 0 0 − βn ⎤ ⎢1 0 0 K 0 0 − β ⎥ n −1 ⎢ ⎥ = ⎢K K K K K K K ⎥, ⎢ ⎥ ⎢ 0 0 0 K 1 0 − β2 ⎥ ⎢⎣ 0 0 0 K 0 1 − β1 ⎥⎦ где β j – коэффициенты характеристического полинома наблюдателя, которые вычисляются на основании желаемых собственных чисел наN блюдателя λi согласно выражению
ϕ L (λ ) = ∏ (λ − λNi ) =λn + β 1λn −1 + ... + β n . n
(3.11-16)
i =1
Очевидно выражение для элементов матрицы K в базисе ИКП:
k I j = β n +1− j − α n +1− j , j = 1, 2 , ..., n .
(3.11-17)
Перевод матрицы K в исходный или какой-либо другой базис может быть произведён в соответствии с выражением (3.11-15). ПРИМЕР 3.11-1. Построить наблюдатель полного порядка для объекта со структурной схемой, приведённой на рис. 3.18.
u
x2
x1
y
2 Рис. 3.18. Объект для примера 3.11-1 Запишем матрицы объекта в исходном базисе:
⎡0⎤ ⎡− 2 1 ⎤ r r = = A = AH = ⎢ , b b H ⎥ ⎢1⎥ , C = CH = [1 0]. 0 − 1 ⎣ ⎦ ⎣ ⎦ 184
Характеристический полином объекта (матрицы динамики A )
ϕ A (λ ) = (λ − λ1 )(λ − λ2 ) = λ2 + 3λ + 2 , его коэффициенты
α1 = 3 ;
α2 = 2,
нули (собственные числа)
λ1 = −1; λ2 = −2 . Время переходного процесса в объекте определяется наиболее близким к мнимой оси собственным числом λ1 :
t рег ≈
3 = 3c . − λ1 1
Зададим собственные числа наблюдателя
λ1N = λN2 = −3 . Им соответствует характеристический полином наблюдателя:
ϕ L (λ ) = (λ + 3)2 = λ2 + 6λ + 9 , его коэффициенты
β1 = 6 ;
β2 = 9 .
В соответствии с (3.11-17) определяем элементы матрицы K и саму эту матрицу в базисе ИКП:
ki 1 = β 2 − α 2 = 7; k i 2 = β1 − α1 = 3 ;
⎡7⎤ KI = ⎢ ⎥ . ⎣3⎦
Для того, чтобы перевести матрицу K в исходный базис, рассчитаем матрицу наблюдаемости и обратную ей в исходном базисе
⎡ 1 0⎤ NH = ⎢ ⎥; − 2 1 ⎣ ⎦
⎡ 1 0⎤ NH−1 = ⎢ ⎥; 2 1 ⎦ ⎣
учитывая представление в базисе ИКП
⎡0 − 2⎤ CI = [0 1]; AI = ⎢ ⎥, − 1 3 ⎦ ⎣ рассчитаем в этом базисе матрицу наблюдаемости
⎡0 1 ⎤ NI = ⎢ ⎥. 1 − 3 ⎣ ⎦ 185
В соответствии с (3.11-13) вычислим матрицу перехода от исходного базиса [h] к базису ИКП [i ] :
I
H
1⎤ ⎡ 0 . = NH−1NI = ⎢ ⎥ ⎣ 1 − 1⎦
Используя (3.11-15), получим матрицу K в исходном базисе
⎡3 ⎤ KH = I HKI = ⎢ ⎥ . ⎣4⎦ Теперь можно заняться уравнением наблюдателя в исходном базисе. В соответствии с (3.11-9) имеем
⎡− 5 1 ⎤ L H = AH − K HCH = ⎢ ⎥. − − 4 1 ⎦ ⎣ Учитывая (3.11-17), запишем, опуская далее индекс исходного базиса
)r& )r x = L ⋅ x + Bu + Ky .
(3.11-18)
Тогда уравнение наблюдателя будет иметь вид:
⎫⎪ x&ˆ1 = −5xˆ1 + xˆ 2 + 3y &xˆ = −4xˆ − xˆ + 4y + u⎬⎪ . 2 1 2 ⎭ 3.11.2. Наблюдатель пониженного порядка Из предыдущего примера четко видно, что искать xˆ1 было излишне r так, как y = x1 . В тех случаях, когда некоторые координаты вектора y r совпадают с какими-либо из координат вектора x , то очевидно, что рассматриваемый выше наблюдатель – наблюдатель полного порядка выдает излишнюю информацию. Рассмотрим, каким образом можно получить наблюдатель с более простыми алгоритмами, полностью испольr зующими информацию о векторе состояния x , имеющуюся в векторе r r выхода y . В более общем случае, когда вектор y имеет размерность ny , оказывается достаточным построить наблюдатель, порядок которого равен n − ny .
r
r
Пусть вектор y имеет размерность ny и связан с вектором x равенством:
r r y = Cx ,
(3.11-19) 186
или
y 1 = c11x1 + c12 x 2 + ... + c1n x n
⎫ ⎪ y 2 = c 21x1 + c 22 x 2 + ... + c 2 n x n ⎪ ⎬. ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⎪ y ny = c ny ,1x1 + c ny ,2 x 2 + ... + c ny ,n x n ⎪⎭
(3.11-20)
Если x1, x 2 ,..., x n рассматривать как неизвестные, то здесь мы имеем n неизвестных и ny < n уравнений. Таким образом, недостаёт
(n − n ) уравнений. Полагаем, что
rankC = ny , т. е. все строки матрицы r C линейно независимы. Введем (n − ny )- мерный вектор q , дополнив матрицу C до квадратной невырожденной матрицы C p с помощью матрицы Cq : y
Запишем:
откуда следует
Обозначим
⎡C ⎤ Cр = ⎢ ⎥ . ⎣C q ⎦
(3.11-21)
r ⎡y ⎤ ⎡ C ⎤ r ⎢qr ⎥ = ⎢C ⎥ x , ⎣ ⎦ ⎣ q⎦
(3.11-22)
r y r ⎡ ⎤ x = C p−1 ⎢ r ⎥ . ⎣q ⎦
(3.11-23)
C p−1 = [Fy [ n×ny ]
тогда
Fq [n×( n −ny )] ] ,
r r r x = Fy y + Fq q .
(3.11-24)
(3.11-25)
r r Если удастся найти оценку qˆ вектора q , то можно будет вычислить оценку вектора состояния r
r
r r r xˆ = Fy y + Fq qˆ .
(3.11-26)
Так как q = C q x , то
r r r q& = Cq Ax + Cq Bu .
(3.11-27) 187
r
Подставим сюда x из (3.11-26):
r r r r q& = C q AFy y + C q AFq q + C q Bu .
(3.11-28)
r
Построим наблюдатель для вектора q . В последнем уравнении r r векторы u и y выступают в качестве входов. Если попытаться коррек-
)
( r r)
цию наблюдателя ввести традиционным образом: K y − y , то получим:
r r r r yˆ = Cxˆ = CFy y + CFq qˆ .
(3.11-29)
Но из (3.11-21) и (3.11-24) имеем
⎡C ⎤ С pC p−1 = ⎢ ⎥[Fy ⎣Cq ⎦
⎡ CFy Fq ] = ⎢ ⎣Cq Fy
CFq ⎤ = En , Cq Fq ⎥⎦
r r откуда должно следовать: CFy = E ny ; CFq = 0 , то есть, yˆ = y и инфорr
мации о q здесь нет. Поэтому примем:
(
)
)r& )r )r r r )r& q = Cq AFq q + Cq Bu + Cq AFy y + K y& − y .
(3.11-30)
Проведем необходимые преобразования. Так как
r r r y& = Cx& = СAxˆ + СBu , то с учетом (3.11-26) получим:
r r& r r yˆ = CAFy y + CAFq qˆ + CBu .
(3.11-31)
Проследим за поведением ошибки оценки
r r r Δq(t ) = q(t ) − qˆ (t ) .
r Используя полученные выше выражения для q& и 30), получим:
(
r& qˆ - (3.11-28) и (3.11-
)
r r r )r& Δq& = Cq AFq Δq − K y& − y . r r& Вычислим разность y& − yˆ : r r r r r r r y& = Cx& = CAx + CBu = CAFy y + CAFq q + CBu ___
)r )r& )r& )r )r r r y = Cx = CAx + CBu = CAFy y + CAFq q + CBu r r r& r r y& − yˆ = CAFy ( y − yˆ ) + CAFq Δq . 188
r r Так как выше было показано, что yˆ = y , то окончательно получим: r r Δq& (t ) = L q Δq ,
(3.11-32)
где матрица наблюдателя
L q = Cq AFq − KCAFq .
(3.11-33)
Очевидно, что можно «заказать динамику обнуления ошибки», выбирая К ( Cq AFq и CAFq - заданные матрицы). Матрицу К следует выбирать таким образом, чтобы обеспечить заданное расположение собственных чисел наблюдателя. Если, например, ny = 1, то Cq AFq имеет
размер [(n − ny ) × (n − n y )], а CAFq - [1× (n − n y )] и К - [(n − ny ) × 1]. В этом случае задача решается аналогично расчету наблюдателя полного порядка со скалярным выходом. Таким образом, рассчитав собственные значения матрицы Cq AFq , задавшись желаемыми собственными значениями наблюдателя пониженного порядка и получив соответствующие значения коэффициентов его характеристического полинома, легко записать выражение для матрицы K в базисе идентификационного канонического представления. После этого потребуется перевести матрицу К в исходный базис. Если известна пара матриц Cq AFq ,CAFq , то через матрицы наблюдаемости в исходном базисе и в базисе идентификационного канонического представления N h и NI , причем N h должна быть построена с использованием пары матриц Cq AFq ,CAFq , можно найти матрицу перехода от бази-
{
{
}
}
са [i ] к исходному базису [h] . Теперь следует позаботиться о реализуемости алгоритма наблюдателя. Из уравнения (3.11-30) с учетом (3.11-25) получим:
)r& )r r r r q = L q q + (Cq B − KCB )u + (Cq AFy − KCAF y )y + K y& .
(3.11-34)
Это уравнение для реализации не годится, так как в случае его использования пришлось бы осуществлять операции дифференцироваr ния вектора y (t ) . В реальных условиях на вектор выхода объекта, как правило, наложены шумы измерений и другой физической природы. Эти шумы характеризуются широким спектром, и дифференцирование существенно увеличивает шумовую составляющую в выходном сигнале.
r Для того, чтобы не решать задачу измерения y& , введем новую пе-
ременную
r
r
r
ξ = q − ky , тогда
r r r q = ξ + ky .
(3.11-35)
Проведем соответствующую замену в (3.11-34) и в результате получим первое уравнение наблюдателя: 189
r&
r
r
r
ξ = L qξ + (C q B − KCB )u + (L q K + C q AFy − KCAF y )y .
(3.11-36)
Теперь из уравнений (3.11-30) и (3.11-35) имеем:
r r r r r r xˆ = Fy y + Fq qˆ = Fy y + Fqξ + Fq Ky ,
или
r r r xˆ + (Fy + Fq K )y + Fqξ .
(3.11-37)
Это - второе уравнение наблюдателя. Таким образом, получено уравнеr r ние оценки xˆ вектора x с помощью наблюдателя пониженного порядка.
3.11.3. Наблюдатель Люенбергера минимального порядка Рассмотрим ещё один подход к формированию наблюдателя. Так же, как в п.3.11.2 сформируем матрицы Cq , C p и введём вектор
r r q(t ) = Cq x(t ) . (3.11-38) r Оценку вектора q (t ) будем искать как решение уравнения )r& )r r r q q ( t ) = L q (t ) + G y y (t ) + G u u ( t ) ,
(3.11-39)
где L , G и G - некоторые, пока неизвестные r матрицы. Как и прежде, ошибкой оценки вектора q будем считать разность q
y
u
)r r r Δ q (t ) = q (t ) − q (t ) .
(3.11-40)
В соответствии с уравнением объекта и выражением (3.11-38) запишем:
r r r q& (t ) = Cq Ax (t ) + Cq Bu (t ) .
(3.11-41)
r
Найдём дифференциальное уравнение для ошибки Δq(t ) :
r& r r r r r Δ q ( t ) = C q Ax ( t ) + C q B u ( t ) − L q q ( t ) − G y y ( t ) − G u u ( t ) .
(3.11-42)
r
Добавим и вычтем в правой части последнего равенства L q и с учётом (3.11-38) получим: q
r& r r r q Δ q (t ) = L Δ q (t ) + (Cq B − G u )u(t ) + (Cq A − G y C − L q Cq )x (t ) .
(3.11-43)
Положим
G u = Cq B
(3.11-44)
и потребуем выполнения равенства 190
Cq A − G y C − L qCq = 0 .
(3.11-45)
Тогда получим уравнение для ошибки наблюдателя
r& r Δ q ( t ) = L q Δ q (t ) .
(3.11-46)
Если назначить матрицу L так, чтобы её собственные числа лежали в левой полуплоскости достаточно далеко от мнимой оси, то ошибка наблюдателя, имеющая изначально место при ненулевых начальных условиях, будет с соответствующей скоростью стремиться к нулю. Так же быстро вектор q
r )r y ⎡ ⎤ x (t ) = C p−1 ⎢ r ⎥ (3.11-47) q ⎣ ⎦ r будет стремиться к вектору x (t ) . Вытекающее из (3.11-45) уравнение
C q A −L q C q = G y C
(3.11-48)
называется матричным уравнением Люенбергера. Теперь учтём, что задача построения наблюдателя, то есть нахож-
)r
r
дения оценки x вектора состояния x возникла из-за необходимости реализовать управление
r r r u ( t ) = Lx ( t ) + k v v ( t ) .
(3.11-49)
Сама по себе оценка вектора состояния часто не нужна. Поэтому попы-
r
∧
таемся найти r оценку Lx линейной комбинации координат вектора состояния Lx . Будем искать эту оценку в виде
)r r r Lx (t ) = χq(t ) + ηy (t ) . (3.11-50) )r r Так как с течением времени q стремится к q , то с учётом (3.11-38) и ∧
уравнения выхода объекта получим ∧r r r Lx (t ) = χCq x (t ) + ηCx (t ) ,
(3.11-51)
откуда следует
L = χC q + ηC .
(3.11-52)
Таким образом, необходимо решить следующую систему матричных уравнений:
Cq A − L qCq = G y C ;
χC q + ηC = L .
(3.11-53)
191
Эта система всегда имеет решение, если, во-первых, собственные чисq ла матриц L и A не совпадают друг с другом и, во-вторых, размерr q ность вектора q (размерность матрицы наблюдателя L )
s ≥ nu (ν − 1) ,
(3.11-54)
где nu - размер вектора управления; ν - индекс наблюдаемости. Это такое число, для которого матрица
⎡ C ⎤ ⎢ ⎥ ~ ⎢ CA ⎥ N= ⎢ L ⎥ ⎢ ν −1 ⎥ ⎣CA ⎦ имеет ранг, равный n .
(3.11-55)
Таким образом, может быть сформулирован следующий итоговый алгоритм. 1. Найти индекс наблюдаемости ν и размерность наблюдателя s . 2. Задать желаемую динамику наблюдателя и записать матрицу его q динамики L в виде матрицы, сопровождающей свой характеристический полином. y 3. Вычислить матрицы C q , G , χ , η согласно (3.11-53), а также матрицу G согласно (3.11-44). 4. Реализовать алгоритмы регулятора, включая наблюдатель Люенбергера минимального порядка: u
)r& )r r r q q (t ) = L q (t ) + G y y (t ) + G u u (t ) ; )r r r r u (t ) = χq(t ) + ηy (t ) + k v v (t ).
(3.11-56)
192
3.12. Синтез реализуемого управления, обеспечивающий заданные динамические и статические свойства системы управления 3.12.1. Динамические свойства системы с обратной связью и наблюдателем полного порядка Предполагается, что известны уравнения управляемого и наблюдаемого объекта:
rr r r ⎧⎪ x& (t ) = Ax (t ) + b u (t ); ⎨r r ⎪⎩y (t ) = Cx (t ).
(3.12-1)
Кроме того, проведён синтез управления и получены матрица L и коv эффициент k для равенства
r r r u ( t ) = Lx (t ) + k v v (t ) ,
(3.12-2)
обеспечивающего желаемые собственные числа замкнутой системы λз1, λз2 , ... λзn , или нули характеристического полинома замкнутой системы
ϕ AC (λ ) = λn + γ 1λn −1 + ... + γ n −1λ + γ n .
(3.12-3)
Предполагается также, что имеется наблюдатель
)r& )r r r x (t ) = ( A − KC )x (t ) + Bu(t ) + Ky (t ) ,
(3.12-4)
спроектированный таким образом, что его характеристический полином ϕ L (λ ) имеет коэффициенты β 1, β 2 , ... β n , соответствующие некоторой
выбранной совокупности собственных чисел λ1 , λ2 , ..., λn . Учтём, что при формировании управления фактически можно восполь)r r зоваться не самим вектором состояния x , а лишь его оценкой x , то есть N
)r r r u ( t ) = Lx (t ) + k v v (t ) .
N
N
(3.12-5)
Таким образом, рассматривается функциональная схема полной системы (объект, формирователь управления и наблюдатель), представленная на рис. 3.18
193
r v (t )
)r x
r
формирователь u (t ) управления
r y (t )
объект
наблюдатель регулятор
Рис. 3.18. Функциональная схема полной системы Запишем уравнения этой системы, то есть, совместно уравнения объекта с управлением и наблюдателя
r r) r r r ⎧⎪ x& (t ) = Ax (t ) + b Lx(t ) + Bk v v (t ); ⎨ )r& )r )r r r ⎪⎩ x (t ) = ( A − KC )x(t ) + BLx (t ) + Bk v v (t ) + KCx (t ).
(3.12-6)
С использованием блочных матриц получим
r ⎡ x& (t )⎤ ⎡ A ⎢ )r& ⎥ = ⎢ ⎣ x (t )⎦ ⎣KC
r BL ⎤ ⎡ x (t )⎤ ⎡Bk v ⎤ r )r ⎥ + ⎢ v ⎥v (t ) . ⎥ ⎢ A − KC + BL ⎦ ⎣ x (t )⎦ ⎣Bk ⎦
(3.12-7)
Поведение этой системы зависит от собственных чисел матрицы динамики полной системы
⎡ A X =⎢ ⎣KC
⎤ . A − KC + BL ⎥⎦ BL
(3.12-8)
Надо попытаться для X найти некоторую подобную матрицу, такую, чтобы можно было легко определить её собственные числа. Перейдём к подобной матрице с помощью преобразования
Xf = Fh −1X hFh .
(3.12-9)
Матрицу Fh выберем следующей:
⎡E Fe = ⎢ n ⎣E n
0n ⎤ , − E n ⎥⎦
(3.12-10)
где индекс n указывает на размеры соответствующих нулевой и единичных матриц. Легко убедиться, что Fh
⎡E
0 ⎤⎡ A
BL
−1
⎤ ⎡E
= Fh . В результате получим: 0 ⎤
− BL ⎤ ⎡ A + BL . ⎥ 0 A − KC ⎦
n Xf = ⎢ n ⎥ ⎢KC A − KC + BL ⎥ ⎢E − E ⎥ = ⎢ − E E ⎦⎣ n ⎣ ⎣ n n ⎦⎣ n⎦
194
Характеристический полином матрицы деляется следующим образом:
X
не зависит от базиса и опре-
ϕ X (λ ) = det[λE 2 n − X ] = λE n − ( A + BL ) ⋅ λE n − ( A − KC ) . Отсюда следует
ϕX (λ ) = ϕ AC (λ )ϕ L (λ ) .
(3.12-11)
Таким образом, полная система, в которой управление вычисляется в функции оценки вектора состояния, имеет 2n собственных чисел: λз1, λз2 , ... λзn , λN1, λN2 , ... λNn . Собственные числа замкнутой системы сохранили те собственные числа, были заданы при синтезе управления. Отметим, что в полной системе передаточная функция от коr r мандного сигнала v до выходного сигнала y тождественно равна передаточной функции в идеализированной системе без наблюдателя. Это действительно так, потому что по определению передаточная функция связывает изображения соответствующих переменных при нулевых наr чальных условиях. При нулевых начальных условиях выход объекта y и
)r выход наблюдателя y тождественно равны.
3.12.2. Динамические свойства системы с обратной связью управлением и наблюдателем минимального порядка В случае использования наблюдателя минимального порядка в соответствии с (3.11-56) и (3.11-44) уравнения регулятора имеют вид
)r& )r r r q q(t ) = L q(t ) + G y y (t ) + Cq Bu (t ); )r r r r u (t ) = χq(t ) + ηy (t ) + k v v (t ). С учётом управления запишем совместно уравнения объекта и наблюдателя:
)r r& r r r x (t ) = Ax (t ) + BηCx (t ) + Bχq(t ) + Bk v v (t );
)r& )r )r r r r y q q(t ) = G Cx (t ) + Cq BηCx (t ) + L q(t ) + Cq Bχq(t ) + Cq Bk v v (t ).
(3.12-12)
Отсюда матрица динамики полной системы имеет вид:
Bχ ⎡ A + B ηC ⎤ X =⎢ y q ⎥. G C C B η C L C B χ + + q q ⎣ ⎦
(3.12-13)
Перейдём к подобной матрице с помощью преобразования (3.12-9), где
195
⎡E n Fe = Fe −1 = ⎢ ⎣Cq
0 ⎤ . − E s ⎥⎦
(3.12-14)
В результате, учитывая (3.11-52) и (3.11-48), получим:
⎡ A + BL − Bχ ⎤ Xf = ⎢ ⎥. 0 L q ⎦ ⎣
(3.12-14)
Отсюда следуют те же выводы, что и полученные выше для системы с наблюдателем полного порядка.
3.12.3. Результирующий алгоритм синтеза для системы с одним входом и одним выходом 1. Для матрицы объекта A вычислить характеристический полином ϕ A (λ ) и зафиксировать его коэффициенты α1, α 2 , ..., α n . 2. В соответствии с требованиями к динамике замкнутой системы задать з з з желаемые значения собственных чисел λ 1, λ 2 , ... λ n , вычислить n
ϕ AC (λ ) = ∏ (λ + λ3 ) , i =1
то есть найти коэффициенты желаемого характеристического полинома γ 1, γ 2 , ..., γ n . 3. Рассчитать матрицу обратной связи в базисе УКП:
LU = [l u 1 l u 2
⋅ ⋅ ⋅ l u n ], где
l u j = α n +1− j − γ n +1− j .
4. Задать желаемые собственные числа наблюдателя λ1 , λ2 , ..., λn и вычислить коэффициенты характеристического полинома наблюдателя: β 1, β 2 , ... β n . 5. Рассчитать матрицу обратной связи наблюдателя в базисе ИКП: N
N
N
⎡ kI1 ⎤ ⎢k ⎥ ⎢ I2 ⎥ K I = ⎢k I 3 ⎥ , где kI j = β n +1− j − α n +1− j . ⎢ ⎥ ⎢ M ⎥ ⎢⎣ k In ⎥⎦ 6. Рассчитать матрицу перехода от исходного базиса к базису УКП U h = UUU−1 , матрицу выхода в этом базисе CU = CU h и, при наличии
196
требования обеспечить единичную статику, вычислить коэффициент по командному сигналу k = v
γn
CU 1
.
7. Рассчитать матрицу перехода от базиса [u ] (УКП) к базису [i ] (ИКП)
= NI−1 ⋅ NU и обратную ей матрицу. r 8. Рассчитать вектор b в базисе ИКП, используя переход от базиса УКП r r −1 bI = I U bU . 9. Рассчитать матрицу обратной связи L в базисе ИКП, используя переход от базиса [u ] к базису [i ] : LI = LU IU . I
U
10. Записать уравнение наблюдателя в базисе ИКП:
(
)
r r) r r v )r& xI (t ) = AI − K ICI + bI LI xI (t ) + K I y (t ) + bI k v (t ) . 11. Записать уравнение для формирования управления:
)r u(t ) = LI xI (t ) + k v v (t ) .
Уравнения, полученные в пунктах 10 и 11 – это уравнения регулятора. Следует подчеркнуть, что в них используется вектор оценки состояния объекта, записанный не в исходном базисе, а в базисе идентификационного канонического представления.
3.12.4. Итоговые примеры полного синтеза систем управления 3.12.4.1. Система со скалярными входом и выходом и наблюдателем полного порядка Задан объект, представленный структурной схемой на рис. 3.19. x1
x2
u
y 2
Рис. 3.19. Структурная схема объекта Требуется синтезировать реализуемое управление, обеспечивающее единичную статику по командному сигналу, а также динамику основного контура системы и наблюдателя в соответствии с желаемыми собственными числами
λ1з,2 = −5 ± j 5;
λ1N = λN2 = −10.
Ниже приведены промежуточные результаты расчёта. Матрица управляемости объекта и ей обратная в исходном базисе: 197
⎡0 1 ⎤ U=⎢ ⎥; 1 − 1 ⎣ ⎦
⎡1 1⎤ U −1 = ⎢ ⎥. 1 0 ⎦ ⎣
Матрица управляемости объекта и ей обратная в базисе УКП:
⎡0 1 ⎤ UU = ⎢ ; ⎥ ⎣ 1 − 3⎦
⎡3 1⎤ UU−1 = ⎢ . ⎥ ⎣ 1 0⎦
Коэффициенты характеристического полинома объекта, желаемой системы и наблюдателя:
r
⎡3⎤
α = ⎢ ⎥; ⎣2⎦
⎡10 ⎤ ⎥; 50 ⎣ ⎦
r
r
.γ = ⎢
⎡ 20 ⎤
β =⎢ . 100⎥ ⎣
⎦
Матрица обратной связи в базисе УКП:
LU = [− 48 − 7].
Матрица наблюдателя:
⎡98⎤ KI = ⎢ ⎥ . ⎣17 ⎦ Матрица перехода от исходного базиса к базису УКП:
⎡ 1 0⎤ UH = ⎢ ⎥. ⎣2 1⎦ Матрица выхода в базисе УКП:
CU = [1 0] .
Коэффициент по командному сигналу k = 50 . v
Матрица наблюдаемости базисе УКП, обратная ей и та же матрица в базисе ИКП:
⎡ 1 0⎤ NU = NU−1 = ⎢ ⎥, 0 1 ⎦ ⎣
⎡0 1 ⎤ NI = ⎢ ⎥. 1 − 3 ⎦ ⎣
Матрица перехода от базиса ИКП к базису УКП:
⎡0 1 ⎤ UI = ⎢ ⎥ . 1 3 − ⎣ ⎦ Вектор передачи управления в базисе ИКП:
r ⎡1⎤ bI = ⎢ ⎥ . ⎣ − 3⎦ 198
Матрица обратной связи в базисе ИКП:
LI = [− 7 − 27] . Матрица динамики наблюдателя в базисе ИКП:
⎡0 − 100 ⎤ . ⎥ ⎣1 − 20 ⎦
L I = AI − K ICI = ⎢
Результирующие уравнения регулятора:
) ) x&1 = −100 x 2 + u + 98 y ; ) ) ) x& 2 = x1 − 20 x 2 − 3u + 17 y ; ) ) u = −7 x1 − 27 x 2 + 50 v . В этих уравнениях индекс i при координатах вектора оценки состояния опущен. 3.12.4.2. Система со скалярными входом и выходом и наблюдателем пониженного порядка Для объекта, заданного на рис.3.19, построить наблюдатель пониженного порядка. Учесть, что управление объектом строится на основе з собственных чисел замкнутой системы λ1,2 = −5 ± 5 j . Для этого объекта
⎡− 2 1 ⎤ ⎡0⎤ A=⎢ ; B = ⎥ ⎢1⎥ ; C = [1 0], 0 1 − ⎣ ⎦ ⎣ ⎦ собственные числа объекта -
λ1 = −1,
λ2 = −2 .
Порядок объекта n = 2 , размерность выхода ny = 1, следовательно, размерность наблюдателя пониженного порядка nq = 1. Зададимся собственным числом наблюдателя λ1 = −10 (оно должно располагаться на комплексной плоскости левее собственных чисел замкнутой системы). Так как y = x1 , то примем q = x 2 . Тогда Н
⎡ y ⎤ ⎡ 1 0⎤ ⎡ x1 ⎤ ⎢q ⎥ = ⎢0 1⎥ ⎢ x ⎥ . ⎣ ⎦ ⎣ ⎦⎣ 2 ⎦ Таким образом, выбрана матрица
Cq = [0 1] .
199
Ей соответствует невырожденная квадратная матрица
⎡ 1 0⎤ C p = C p−1 = ⎢ ⎥. 0 1 ⎣ ⎦ Соответственно получаем
⎡1⎤ ⎡0⎤ Fy = ⎢ ⎥ ; Fq = ⎢ ⎥ . ⎣0⎦ ⎣1⎦ Теперь в соответствии с (3.11-33) определим
⎡− 2
L q = [0 1] ⋅ ⎢ ⎣0
1 ⎤ ⎡0⎤ ⎡− 2 1 ⎤ ⎡0⎤ − K [ ] = −1 − K . 1 0 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ − 1⎦ ⎣1⎦ ⎣ 0 − 1⎦ ⎣1⎦
Поскольку назначено
λН = −10 , то
− 1 − К = −10 Таким образом, вид:
L q:
и
К = 9.
L q = −10 , и первое уравнение наблюдателя принимает
ξ& = −10ξ − 72y + u . r
Запишем оценку для x :
r ⎡ xˆ ⎤ ⎡ 1⎤ ⎡0⎤ xˆ (t ) = ⎢ ⎥ y (t ) + ⎢ ⎥ξ = ⎢ 1 ⎥ . ⎣− 9⎦ ⎣1⎦ ⎣ xˆ 2 ⎦ Отсюда
xˆ 2 = 9 y + ξ . Замкнем систему (сформируем управление). В п.3.12.4.1 была рассчитана матрица обратной связи
LU = [− 48 − 7].
Переведем её в исходный базис:
L = LUU e−1 = LUUUU e−1 = [− 34 − 7] . Таким образом, управление принимает вид
u = −34 y − 7 x 2 + 50v . Структурная схема полной схемы с регулятором и с наблюдателем пониженного порядка представлена на рис. 3.20.
200
v
u
50
x1 = y
объект 72
9
) x2
10 7
xˆ 2
34
Рис. 3.20. Структурная схема полной системы для примера 3.12-2 3.12.4.3. Система со скалярными входом и выходом и наблюдателем пониженного порядка Структурная схема объекта представлена на рис. 3.21.
u
x3
x2
x4
x1
y1
y2
2 Рис. 3.21. Структурная схема объекта Ему соответствуют матрицы
⎡0 ⎢0 A=⎢ ⎢0 ⎢ ⎣0
0⎤ ⎡0⎤ ⎢0⎥ 1 0 0 0⎤ 1 1 0⎥ ⎥; B = ⎢ ⎥; C = ⎡ ⎢0 0 0 1⎥ . ⎢1⎥ 0 −1 0 ⎥ ⎦ ⎣ ⎥ ⎢ ⎥ 0 1 − 2⎦ ⎣0⎦ 1
0
Требуется рассчитать управление и построить наблюдатель минимального порядка. Объект имеет собственные числа 201
λ1 = 0; λ2 = +1; λ3 = −1; λ4 = −2 и характеристический полином
ϕ A (λ ) = λ4 + 2λ3 − λ2 − 2λ . Найдём матрицу управляемости:
1 0⎤ ⎡0 0 ⎢0 1 0 1⎥ 2 3 ⎥. U = [B AB A B A B ] = ⎢ ⎢1 − 1 1 − 1⎥ ⎢ ⎥ ⎣0 1 − 3 7 ⎦ Её определитель det U = −6 , то есть отличен от нуля. Это означает, что
объект управляем. Рассчитаем закон управления (матрицу обратной связи), обеспечивающий следующие желаемые собственные числа замкнутой системы:
λ1з = λз2 = λз3 = λз4 = −1, которым соответствует характеристический полином
ϕ Ac (λ ) = λ4 + 4λ3 + 6λ2 + 4λ + 1. Таким образом, имея коэффициенты характеристических полиномов объекта и желаемой замкнутой системы
⎡2⎤ r ⎢ − 1⎥ α = ⎢ ⎥; ⎢ − 2⎥ ⎢0⎥ ⎣ ⎦
⎡4 ⎤ r ⎢6 ⎥ γ =⎢ ⎥, ⎢4 ⎥ ⎢ ⎥ ⎣ 1⎦
можно в соответствии с (3.9-18) рассчитать матрицу обратной связи в базисе УКП:
LU = [− 1 − 6 − 7 − 2] .
Чтобы найти эту матрицу в исходном базисе, нужно знать матрицу U H перехода от исходного базиса к базису УКП. Так как столбцы этой матрицы являются координатными столбцами векторов базиса [u ] (УКП) r r r u1 , u2 , ... , un в исходном базисе [h] , то, используя (3.8-6), можно записать:
202
⎡0⎤ ⎡0⎤ r ⎢0⎥ r r ⎢1⎥ r r u h 4 = bh = ⎢ ⎥ ; u h 3 = AH u h 4 + α 1bh = ⎢ ⎥ ; ⎢1⎥ ⎢1⎥ ⎢ ⎥ ⎢ ⎥ ⎣1⎦ ⎣0⎦ ⎡1⎤ ⎡2⎤ r ⎢2⎥ r r ⎢0⎥ r r r uh 2 = AH uh 3 + α 2 bh = ⎢ ⎥ ; uh1 = AH uh 2 + α 3 bh = ⎢ ⎥ . ⎢ − 2⎥ ⎢0⎥ ⎢ ⎥ ⎢ ⎥ ⎣0⎦ ⎣ − 1⎦ Таким образом, получаем:
⎡2 1 ⎢0 2 UH =⎢ ⎢0 − 2 ⎢ ⎣0 − 1
⎡1 − 1 0 1 ⎤ 0 0⎤ 6 6⎥ ⎢ 2 1 1 −1 ⎥ ⎢0 1 0⎥ − 1 3 3 . ⎥ и UH = ⎢ 1 2 ⎥ 1 1⎥ 0 1 ⎢ 3 3⎥ ⎥ ⎢0 1 0⎦ 1 4 ⎥ − 1 ⎣ 3 3⎦
В соответствии с (3.9-12)
L ≡ LH = LUU H−1 = [− 1 − 29 − 2 − 1 ]. 2 6 6 В соответствии с (3.6-8)
⎡2 1 0 0 ⎤ CU = CU H = ⎢ ⎥. 0 − 1 1 0 ⎣ ⎦ Используя (3.8-22) запишем передаточные функции:
Wu y 1 ( p ) =
1 1 ; Wu y 2 ( p ) = ; p( p + 1)( p − 1) ( p + 1)( p + 2)
Wv y 1 ( p ) = k v
p+2 v p( p − 1) ( ) ; W p = k . v y2 ( p + 1) 4 ( p + 1) 4
В замкнутой системе будет обеспечена единичная статика по координате y 1 , если задать
1 kv = . 2 ~
Теперь перейдём к синтезу наблюдателя. Построим матрицу N : 203
⎡1 ⎢ ~ ⎡ C ⎤ ⎢0 N=⎢ ⎥= ⎣CA⎦ ⎢0 ⎢ ⎣0
0⎤ 0 0 1⎥ ⎥. 1 0 0⎥ ⎥ 0 1 − 2⎦ 0 0
Ранг этой матрицы равен четырём, то есть, порядку объекта. Так как старшая степень блока CA , входящего в неё, равна единице, то индекс наблюдаемости ν = 2 и порядок наблюдателя в соответствии с (3.11-54) s = 1. Это означает, что в данном случае может быть построен наблюдатель первого порядка. Зададим единственное собственное число наN блюдателя λ1 = −4 . Отсюда сразу определяется матрица наблюдателя
L q = −4 .
Раскроем матричное уравнение Люенбергера (3.11-48), имея ввиду, что в данном случае матрица Cq имеет размер [ 4 × 1] . Для этого запишем подробно каждое слагаемое:
Cq A = [c q1 c q 2
cq 3
⎡0 ⎢0 c q 4 ]⎢ ⎢0 ⎢0 ⎣
= [0 c q1 + c q 2
cq2 − cq3 + cq 4
L qCq = [− 4c q1
− 4c q 2
− 4c q 3
1
0
0⎤ 1 1 0⎥ ⎥= 0 −1 0 ⎥ 0 1 − 2⎥⎦ − 2c q 4 ]; − 4c q 4 ];
⎡ 1 0 0 0⎤ G y C = [g y 1 g y 2 ]⎢ ⎥ = [g y 1 0 0 g y 2 ]. 0 0 0 1 ⎣ ⎦ С учётом этих выражений матричное уравнение Люенбергера можно представить в виде системы скалярных уравнений:
4c q1 = g y 1; c q1 + 5c q 2 = 0; c q 2 + 3c q 3 + c q 4 = 0; 2c q 4 = g y 2 . Аналогично поступим со вторым матричным уравнением системы (3.1153), учитывая вытекающие из этого уравнения размерности матриц χ и η: 204
χCq = [χc q1 χc q 2
χc q 4 ];
χc q 3
⎡ 1 0 0 0⎤
ηC = [η1 η2 ]⎢ ⎥ = [η1 0 0 η 2 ] 0 0 0 1 ⎣ ⎦ и
χcq1 + η1 = l1 ; χcq 2 = l 2 ; χcq 3 = l 3 ; χcq 4 + η2 = l 4 . Таким образом, получено восемь уравнений при наличии девяти неизвестных c q1 , c q 2 , c q 3 , c q 4 , g y 1 , g y 2 , η1 , η 2 , χ . Примем χ = 1. После этого легко находятся остальные неизвестные:
145 Cq = ⎡⎢ ⎣ 6 74 ⎣ 3
η = ⎡⎢−
−
29 6
−2
65 ⎤ ; ⎥ 6⎦
290 − 11⎤⎥ ; G y = ⎡⎢ ⎦ ⎣ 3
65 ⎤ . 3 ⎥⎦
В соответствии с (3.11-44) вычисляем
G u = Cq B = −2 . В результате можем записать уравнения регулятора совместно наблюдателем Люенбергера минимального (первого) порядка:
)r& )r 290 65 q(t ) = −4q(t ) − 2u(t ) + y 1 (t ) + y 2 (t ); 3 3 r) 1 74 u (t ) = v (t ) + q (t ) − y 1 (t ) − 11y 2 (t ). 2 3 Этим уравнениям соответствует структурная схема системы управления, приведённая на рис. 3.22.
205
y1
u
v
ОБЪЕКТ
y2
2
65 3
290 3
4
11 74 3 Рис. 3.22. Структурная схема системы управления.
3.12.4.4. Многомерная система с разделением каналов и наблюдателем минимального порядка Задан объект, представленный структурной схемой на рис. 3.23.
u1
y1
x3
x1
2
u2
x2
x4 y2
Рис. 3.23. Структурная схема объекта Объекту соответствуют матрицы
⎡0 ⎢0 A=⎢ ⎢1 ⎢0 ⎣
0 0 0⎤ ⎡1 ⎢0 0 0 0⎥ ⎥; B = ⎢ 1 0 0⎥ ⎢0 ⎢0 1 1 0⎥⎦ ⎣
0⎤ 0 0 1 0⎤ 1⎥ ⎥; C = ⎡ ⎢0 0 0 1⎥ . 0⎥ ⎣ ⎦ ⎥ 0⎦ 206
Расчёт матриц управляемости и наблюдаемости определяет объект как полностью управляемый и наблюдаемый. I. Синтез управления в соответствии с п.3.10. 1. Расчёт чисел m i :
C1 A 0 B = [0 0]; C1 A1B = [1 1]; C 2 A 0 B = [0 0]; C 2 A 1B = [0 1]. Отсюда следует m1 = m 2 = 2 . 2. Вычисление матриц F∗ , B∗ . При m1 = m 2 = 2
⎡ 0 0 0 0⎤ ⎡ 1 1⎤ F∗ = −CA 2 = ⎢ B CAB = = ; ⎥ ∗ ⎢0 1⎥ . − − 1 1 0 0 ⎣ ⎦ ⎦ ⎣ −1
3. Расчёт B∗ .
⎡1 − 1⎤ B∗−1 = ⎢ ⎥. ⎣0 1 ⎦ Поскольку эта матрица существует, задача разделения каналов имеет решение. 4. Вычисление матриц A, B . ∨
∨
⎡1 1 ⎡1 − 1⎤ ⎢− 1 − 1 ⎢0 1 ⎥ −1 ⎢ ⎥ B = BB∗ = ; A = A + B F∗ = ⎢ ∨ ∨ ⎢1 1 ⎢0 0 ⎥ ∨ ⎢0 1 ⎢0 0 ⎥ ⎣ ⎣ ⎦
0 0⎤ 0 0⎥ ⎥. 0 0⎥ 1 0⎥⎦
В соответствии с (3.10-13) этим матрицам отвечают уравнения
x& 1 = x 1 + x 2 + q1 − q 2 ; x& 2 = − x 1 − x 2 + q 2 ; x& 3 = x1 + x 2 ; x& 4 = x 2 + x 3 . Соответственно этим уравнениям
x 3( 2 ) = q1 ; x 4( 2 ) = q 2 , 207
то есть действительно, исходная система разбита на две независимые подсистемы, состоящие из последовательно включённых интеграторов. 5. Построение матрицы F e . В данном случае
[
r Fe = A b1 ∨
r b1
∨
r A b2 ∨
∨
∨
⎡1 ⎢− 1 r b2 = ⎢ ∨ ⎢1 ⎢0 ⎣
]
1 0 − 1⎤ 0 0 1⎥ ⎥. 0 0 0⎥ 0 1 0 ⎥⎦
Новому базису соответствуют матрицы
⎡0 ⎢0 Af = ⎢ ⎢0 ⎢0 ⎣
1 0 0⎤ ⎡0 ⎢1 0 0 0⎥ ⎥ ; Bf = ⎢ 0 0 1⎥ ⎢0 ⎢0 0 0 0⎥⎦ ⎣
0⎤ 0⎥ 1 0 0 0⎤ ⎥ ; Cf = ⎡ ⎢0 0 1 0⎥ . 0⎥ ⎣ ⎦ 1⎥⎦
6. Расчёт матрицы обратной связи промежуточной системы в базисе [f ] . Зададим желаемые собственные числа для первого канала
λ11,2 = −1± j1 и для второго канала
λ21,2 = −5 ± j 5 . Им соответствуют характеристические полиномы
ϕ1(λ ) = λ2 + 2λ + 2; ϕ 2 (λ ) = λ2 + 10λ + 50. Получаем строки матрицы Lf :
l f 1 = [− 2 − 2]; l f 2 = [− 50 − 10] и саму матрицу
0 0 ⎤ ⎡− 2 − 2 Lf = ⎢ ⎥. − − 0 0 50 10 ⎣ ⎦ Пункты 7 и 8 итогового алгоритма расчёта управления для данного случая не нужны, так как в рассматриваемом примере сумма порядков подсистем m1 + m2 равна порядку объекта, и матрица A00 отсутствует. 9. Расчёт матрицы при командном сигнале. Потребуем выполнения равенства 208
Wv 1y 1 (0) = Wv 2 y 2 (0) = 1. Тогда
k1v = 2; k 2v = 50 ∨
∨
и
⎡2 0 ⎤ kv = ⎢ ⎥. ∨ 0 50 ⎣ ⎦ 10. Расчёт матрицы обратной связи промежуточной системы в исходном базисе.
⎡0 0 0 ⎤ ⎢1 ⎡− 2 − 2 −1 ⎢ L∨ = Lf Fe = ⎢ ⎥ 0 − 50 − 10⎦ ⎢0 ⎣0 ⎢0 ⎣
0 1 0⎤ 1 0 0⎥ ⎥= 0 0 1⎥ 1 1 0⎥⎦
0 ⎤ ⎡− 2 − 2 − 2 =⎢ ⎥. 0 10 10 50 − − − ⎦ ⎣ 11. Расчёт результирующей матрицы обратной связи.
8 50 ⎤ ⎡− 1 9 L = B∗−1 (F∗ + L ) = ⎢ ⎥. ∨ − − − − 1 11 10 50 ⎣ ⎦ 12. Расчёт матрицы передаточных коэффициентов по вектору командных сигналов
⎡2 − 50⎤ k v = B∗−1 k v = ⎢ ⎥. ∨ 0 50 ⎣ ⎦ Таким образом, получено управление, использующее координаты вектора состояния объекта:
u1 = − x1 + 9 x 2 + 8 x 3 + 50 x 4 + 2v 1 − 50v 2 ; u 2 = − x1 − 11x 2 − 10 x 3 − 50 x 4 + 50v 2 . II. Синтез наблюдателя в соответствии с п.3.11.3. 1. Расчёт индекса наблюдаемости.
~
Строим матрицу N :
209
⎡0 ⎢ ~ ⎡ C ⎤ ⎢0 N = ⎢ 2−1 ⎥ = ⎣CA ⎦ ⎢1 ⎢0 ⎣
0 1 0⎤ 0 0 1⎥ ⎥. 1 0 0⎥ 1 1 0⎥⎦
Эта матрица имеет 4 линейно независимые строки, её детерминант от-
~
личен от нуля, значит rank (N ) = 4 = n . Следовательно, индекс наблюдаемости объекта ν = 2 и размерность наблюдателя s = 2 . 2. Задание динамики наблюдателя. N Зададим собственные числа λ1,2 = −10 . Соответственно матрица динамики наблюдателя
0 ⎤ ⎡− 10 Lq =⎢ ⎥. 0 − 10 ⎣ ⎦ 3. Решение системы матричных уравнений (3,11-53). y Матрица Cq имеет размерность [2 × 4] , матрицы G , γ , η - [2 × 2] . Следовательно, система скалярных уравнений, соответствующая системе матричных уравнений (3,11-53), содержит 16 уравнений и 20 неизвестных. Таким образом, мы имеем право произвольно задать 4 «лишних» неизвестных. Зададим матрицу χ единичной, то есть
⎡ 1 0⎤ ⎥. 0 1 ⎦ ⎣
χ =⎢
С учётом этого из первого матричного уравнения (3.11-53) получим следующую систему уравнений:
1) cq13 + 10c q11 = 0;
5) c q 23 + 10cq 21 = 0;
2)c q13 + cq14 + 10cq12 = 0;
6) c q 23 + c q 24 + 10cq 22 = 0;
3)c q14 + 10cq13 = g11 ;
7) c q 24 + 10cq 23 = g 21 ;
4)10cq14 = g12 ;
8) 10c q 24 = g 22 .
Второе матричное уравнение (3.11-53) преобразуется в систему скалярных уравнений
9) cq11 = −1;
13) cq 21 = −1;
10) cq12 = 9;
14) cq 22 = −11;
11) cq13 + η11 = 8;
15) cq 23 + η21 = −10; 210
12) cq14 + η12 = 50;
16) cq 24 + η22 = −50.
Совместное решение последних шестнадцати скалярных уравнений позволяет найти все элементы искомых матриц:
− 1000 ⎤ ⎡− 1 9 10 − 100 ⎤ ⎡ − 2 150 ⎤ ⎡ 0 y Cq = ⎢ ; G = ; η = . ⎥ ⎢ ⎥ ⎢ ⎥ ⎣− 1 − 11 10 100 ⎦ ⎣− 20 − 150 ⎦ ⎣200 + 1000 ⎦ Используя (3.11-44), вычислим матрицу
⎡− 1 9 ⎤ . G u = Cq B = ⎢ ⎥ ⎣− 1 − 11⎦ 4. В соответствии с полученными результатами записать уравнения регулятора, включая наблюдатель:
) ) q&1(t ) = −10q1(t ) − 1000 y 2 (t ) − u1(t ) + 9u2 (t ); ) ) q& 2 (t ) = −10q2 (t ) + 200 y 1(t ) + 1000 y 2 (t ) − u1(t ) − 11u2 (t ); ) u1(t ) = q1(t ) − 2y 1(t ) + 150 y 2 (t ) + 2v 1(t ) − 50v 2 (t ); ) u2 (t ) = q2 (t ) − 20 y 1(t ) − 150 y 2 (t ) + 50v 2 (t ).
Результирующая структурная схема замкнутой системы представлена на рис. 3.24.
211
150 -2
10
∑
-1000
∑
-9
-50
v1
u1
2
ОБЪЕКТ
50
v2 -150
y1
∑
y2
u2
-11
-20
10
∑
200 1000
Рис. 3.24. Структурная схема замкнутой системы На рис. 3.25 показана итоговая структурная схема системы управления с использованием передаточных функций. Как и отмечалось выше, передаточные функции, связывающие соответствующие координаты вектора входа и вектора выхода системы не зависят от наличия наблюдателя. Из рисунка хорошо видно, что результирующая система имеет полностью развязанные каналы, по каждому из каналов обеспечены единичная статика и заданные при синтезе собственные числа ( полюсы передаточных функций).
212
v1
v2
2 p 2 + 2p + 2 50 p 2 + 10 p + 50
y1
y2
Рис. 3.25. Итоговая структурная схема системы управления
213
СПИСОК ЛИТЕРАТУРЫ 1.Андреев Ю.Н. Управление конечномерными линейными объектами. –М.: Наука, 1976. –424 с. 2.Бесекерский В.А., Попов Е.П. Теория систем автоматического регулирования. –М.: Наука, 1982. –304 с., ил. 3. Воронов А.А. Устойчивость, управляемость, наблюдаемость М.:Наука, 1979.-335с.,ил. 4.Деруссо П., Рой Р., Клоуз С. Пространство состояний в теории управления. –М.: Наука, 1970. –620 с., ил. 5.Ерофеев А.А. Теория автоматического управления: учебник для вузов. -СПб.: Политехника, 1998. -295 с.: ил. 6.Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. –М.: Мир, 1977. –650 с., ил. 7.Красовский А.А., Поспелов Г.С. Основы автоматики и технической кибернетики, М.-Л.. Госэнергоиздат, 1962, 600 с. с черт. 8.Острём К., Виттенмарк Б. Системы управления с ЭВМ: Пер с англ. –М.: Мир, 1987. –480 с., ил. 9.Попов Е.П. Теория линейных систем автоматического регулирования и управления. –М.: Наука, 1978. –256 с., ил. 10.Попов Е.П. Теория нелинейных систем автоматического регулирования и управления. –М.: Наука, 1979. –256 с., ил. 11.Сборник задач по теории автоматического регулирования и управления: Под ред. В.А.Бесекерского. 5-е изд., перераб. И доп.-М.: Наука, 1978 с.-510с.,ил. 12.Синтез дискретных регуляторов при помощи ЭВМ/В.В.Григорьев, В.Н.Дроздов, В.В.Лаврентьев, А.В.Ушаков–Л.: Машиностроение, Ленингр. отд-ние, 1983. –245 с.. 13.Современная теория управления. / Под ред. Леондеса К.Т. –М.: Наука, 1970. –512 с., ил. 14.Теория автоматического управления. Часть I/ Под ред. Нетушила А.В. –М.: Высшая школа, 1968. –424 с., ил. 15.Теория автоматического управления. Часть II/ Под ред. Нетушила А.В. –М.: Высшая школа, 1972. –432 с., ил. 16.Теория автоматического управления. Часть I/ Под ред. Воронова А.А. –М.: Высшая школа, 1977. –303 с., ил. 17.Теория автоматического управления. Часть II/ Под ред. Воронова А.А. –М.: Высшая школа, 1977. –288 с., ил. 18.Ту, Юлиус Т. Цифровые и импульсные системы автоматического управления. Пер. С англ. М., Машиностроение, 1964. 18. Топчеев Б.И., 19.Ту Ю.Т. Современная теория управления. . –М.: Машиностроение, 1965. –704 с. 20.Циплаков А.П. Задачник по теории автоматического регулирования. М.: Машиностроение,1977 С.-592 с., ил. 214
21.Цыпкин Я.З. Основы теории автоматических систем. –М.: Наука, 1977. –560 с., ил.
215
ОГЛАВЛЕНИЕ 1.
ВВЕДЕНИЕ В ТЕОРИЮ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ .......................5
2.
МЕТОДЫ АНАЛИЗА НЕПРЕРЫВНЫХ СИСТЕМ.............................................20
2.1. 2.2. 2.3.
ПОНЯТИЕ ПРОСТРАНСТВА СОСТОЯНИЙ ....................................................................20 ЛИНЕАРИЗАЦИЯ ИСХОДНЫХ УРАВНЕНИЙ ..................................................................22 ЛИНЕЙНЫЕ СИСТЕМЫ, ЗАДАННЫЕ ОБЫКНОВЕННЫМИ ДИФФЕРЕНЦИАЛЬНЫМИ УРАВНЕНИЯМИ В НОРМАЛЬНОЙ ФОРМЕ КОШИ.......................................................................32 2.3.1. ОДНОРОДНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ .................................................32 2.3.2. РЕШЕНИЕ НЕОДНОРОДНЫХ ВЕКТОРНО-МАТРИЧНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ .........................................................................................................................36 2.4. НЕКОТОРЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ.............................................................37 2.4.1. СОБСТВЕННЫЕ ЧИСЛА, ХАРАКТЕРИСТИЧЕСКИЙ ПОЛИНОМ, ПРИСОЕДИНЕННАЯ МАТРИЦА ..................................................................................................................37 2.4.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ ТРАНСПОНИРОВАННОЙ МАТРИЦЫ .................................................................................................................41 2.4.3. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ ЧЕРЕЗ ЕЁ ЛЕВЫЕ И ПРАВЫЕ СОБСТВЕННЫЕ ВЕКТОРЫ ..................................................................................................................44 2.5. СВОЙСТВА ДВИЖЕНИЙ ЛИНЕЙНЫХ СИСТЕМ ..............................................................49 2.5.1. МАТРИЧНАЯ ВЕСОВАЯ И ПЕРЕХОДНАЯ ФУНКЦИИ ...................................................49 2.5.2. МОДАЛЬНАЯ (СПЕКТРАЛЬНАЯ) ИНТЕРПРЕТАЦИЯ РЕШЕНИЯ ВЕКТОРНО-МАТРИЧНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ УРАВНЕНИЙ ...................................54 2.6. МОДЕЛИ СТАЦИОНАРНЫХ ЛИНЕЙНЫХ СИСТЕМ В КОМПЛЕКСНОЙ ПЛОСКОСТИ НА ОСНОВЕ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА ..................................................................56 2.6.1. МАТРИЦА ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ....................................................................56 2.6.2. ОСНОВНЫЕ СВОЙСТВА ПЕРЕДАТОЧНЫХ ФУНКЦИЙ .................................................62 2.7. КОМПЛЕКСНЫЙ ПЕРЕДАТОЧНЫЙ КОЭФФИЦИЕНТ ......................................................65 2.7.1. СПОСОБЫ ОПРЕДЕЛЕНИЯ ПОНЯТИЯ «КОМПЛЕКСНЫЙ ПЕРЕДАТОЧНЫЙ КОЭФФИЦИЕНТ» ........................................................................................................65 2.7.2. РЕАКЦИЯ ДИНАМИЧЕСКИХ ЗВЕНЬЕВ НА ГАРМОНИЧЕСКИЕ ВОЗДЕЙСТВИЯ .................66 2.7.3. ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ .............................................................................68 2.8. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ОБЪЕКТОВ И СИСТЕМ УПРАВЛЕНИЯ ........................71 2.8.1. СОГЛАШЕНИЕ ОБ ОБОЗНАЧЕНИЯХ ........................................................................71 2.8.2. СТРУКТУРНЫЕ СХЕМЫ И ГРАФЫ СТАЦИОНАРНЫХ СИСТЕМ ......................................73 2.9. УСТОЙЧИВОСТЬ СИСТЕМ .........................................................................................86 2.9.1. АСИМПТОТИЧЕСКИЕ СВОЙСТВА СОБСТВЕННОГО ДВИЖЕНИЯ И ВЕСОВОЙ МАТРИЦЫ ЛИНЕЙНОЙ СИСТЕМЫ ................................................................................................86 2.9.2. НЕОБХОДИМОЕ УСЛОВИЕ УСТОЙЧИВОСТИ ............................................................89 2.9.3. КРИТЕРИЙ УСТОЙЧИВОСТИ ГУРВИЦА....................................................................90 2.9.4. ЧАСТОТНЫЙ КРИТЕРИЙ УСТОЙЧИВОСТИ (КРИТЕРИЙ НАЙКВИСТА) ..........................94 2.10. КАЧЕСТВО ПРОЦЕССОВ УПРАВЛЕНИЯ ....................................................................105 2.10.1. ОСНОВНЫЕ ПОКАЗАТЕЛИ КАЧЕСТВА ...................................................................105 2.10.2. ОШИБКИ СИСТЕМЫ РЕГУЛИРОВАНИЯ В УСТАНОВИВШИХСЯ РЕЖИМАХ. СТАТИЧЕСКИЕ И АСТАТИЧЕСКИЕ СИСТЕМЫ .....................................................................................108 2.10.3. ТОЧНОСТЬ СИСТЕМ ПРИ ОТРАБОТКЕ ГАРМОНИЧЕСКИХ СИГНАЛОВ ........................113
216
2.10.4. СВЯЗЬ МЕЖДУ ЛОГАРИФМИЧЕСКИМИ АМПЛИТУДНО-ЧАСТОТНЫМИ ХАРАКТЕРИСТИКАМИ И КАЧЕСТВОМ ПЕРЕХОДНЫХ ПРОЦЕССОВ В САУ..................................115 2.10.5. СООТНОШЕНИЕ МАСШТАБОВ ВО ВРЕМЕННОЙ И ЧАСТОТНОЙ ОБЛАСТЯХ ................117 2.11. ИНТЕГРАЛЬНЫЕ КРИТЕРИИ КАЧЕСТВА С ПОЗИЦИЙ ОБЩНОСТИ ЗАДАЧ ОПТИМАЛЬНОГО И МОДАЛЬНОГО СИНТЕЗА ...............................................................120 3.
СИНТЕЗ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ .........................................125
3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7.
ВЫБОР КОРРЕКТИРУЮЩИХ ЗВЕНЬЕВ. МЕТОД ЖЕЛАЕМЫХ ЛЧХ ..............................125 УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ ..........................................128 НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ. .......................................132 ЗАМЕНА БАЗИСА В ЛИНЕЙНОМ КОНЕЧНОМЕРНОМ ПРОСТРАНСТВЕ ...........................137 ЛИНЕЙНЫЕ ОПЕРАТОРЫ И МАТРИЦЫ ЛИНЕЙНЫХ ОПЕРАТОРОВ...............................140 ЗАМЕНА БАЗИСА В ПРОСТРАНСТВЕ СОСТОЯНИЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ ...........145 ВЫЧИСЛЕНИЕ МАТРИЦЫ ПРЕОБРАЗОВАНИЯ БАЗИСА В ПРОСТРАНСТВЕ СОСТОЯНИЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ С ПОМОЩЬЮ МАТРИЦ УПРАВЛЯЕМОСТИ И НАБЛЮДАЕМОСТИ ......148 3.8. КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ СИСТЕМ .............................................................150 3.8.1. УПРАВЛЯЕМОЕ КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИСТЕМЫ СО СКАЛЯРНЫМ ВХОДОМ..................................................................................................................150 3.8.2. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ И СТРУКТУРНАЯ СХЕМА ДЛЯ СИСТЕМЫ В УКП ..............155 3.8.3. ИДЕНТИФИКАЦИОННОЕ КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИСТЕМЫ С ОДНИМ (СКАЛЯРНЫМ) ВЫХОДОМ..........................................................................................156 3.8.4. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ И СТРУКТУРА ДЛЯ СИСТЕМЫ В ИКП .............................157 3.9. ОБРАТНАЯ СВЯЗЬ ПО СОСТОЯНИЮ, ОБЕСПЕЧИВАЮЩАЯ ЗАДАННОЕ (ЖЕЛАЕМОЕ) РАСПОЛОЖЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ В ЗАМКНУТОЙ СИСТЕМЕ С ОДНИМ (СКАЛЯРНЫМ) ВХОДОМ ...........................................................................................159 3.10. СИНТЕЗ УПРАВЛЕНИЯ В МНОГОМЕРНОЙ СИСТЕМЕ. ЗАДАЧА РАЗДЕЛЕНИЯ КАНАЛОВ .163 3.10.1. РАЗДЕЛЕНИЕ ИСХОДНОГО ОБЪЕКТА НА ПОДСИСТЕМЫ ИНТЕГРАТОРОВ..................163
3.10.2. ПРЕОБРАЗОВАНИЕ БАЗИСА В ПРОСТРАНСТВЕ R ...............................................167 3.10.3. ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ...........................................................................174 3.10.4. ИТОГОВЫЙ АЛГОРИТМ .......................................................................................177 3.11. ОСНОВЫ ПОСТРОЕНИЯ ИДЕНТИФИКАТОРОВ СОСТОЯНИЯ (НАБЛЮДАТЕЛЕЙ)............180 3.11.1. НАБЛЮДАТЕЛЬ ЛЮЕНБЕРГЕРА ПОЛНОГО ПОРЯДКА ..............................................180 3.11.2. НАБЛЮДАТЕЛЬ ПОНИЖЕННОГО ПОРЯДКА ............................................................186 3.11.3. НАБЛЮДАТЕЛЬ ЛЮЕНБЕРГЕРА МИНИМАЛЬНОГО ПОРЯДКА....................................190 3.12. СИНТЕЗ РЕАЛИЗУЕМОГО УПРАВЛЕНИЯ, ОБЕСПЕЧИВАЮЩИЙ ЗАДАННЫЕ ДИНАМИЧЕСКИЕ И СТАТИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ УПРАВЛЕНИЯ .................................................193 3.12.1. ДИНАМИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ И НАБЛЮДАТЕЛЕМ ПОЛНОГО ПОРЯДКА .................................................................................................193 3.12.2. ДИНАМИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ УПРАВЛЕНИЕМ И НАБЛЮДАТЕЛЕМ МИНИМАЛЬНОГО ПОРЯДКА ..............................................................195 3.12.3. РЕЗУЛЬТИРУЮЩИЙ АЛГОРИТМ СИНТЕЗА ДЛЯ СИСТЕМЫ С ОДНИМ ВХОДОМ И ОДНИМ ВЫХОДОМ .................................................................................................196 3.12.4. ИТОГОВЫЕ ПРИМЕРЫ ПОЛНОГО СИНТЕЗА СИСТЕМ УПРАВЛЕНИЯ ..........................197 n
СПИСОК ЛИТЕРАТУРЫ................................................................................................214
ОГЛАВЛЕНИЕ................................................................................................................216
217