А.А.Усков, В.В.Круглов
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ НА ОСНОВЕ МЕТОДОВ НЕЧЕТКОЙ ЛОГИКИ
Смоленск «Смоленская городская типография» 2003
2
УДК 519.711 ББК 32.965 У 75 Рецензенты: доктор технических наук, профессор М.И.Дли доктор технических наук, профессор В.П.Дьяконов
Усков А.А., Круглов В.В. Интеллектуальные системы управления на основе методов нечеткой логики. – Смоленск: Смоленская городская типография, 2003. – 177 с.
ISBN 5-94223-038-2 Книга посвящена применению современных информационных технологий в системах управления. Рассмотрены методы анализа и синтеза систем управления с нечеткой логикой. Книга рассчитана на специалистов в области теории управления, аспирантов и студентов старших курсов технических университетов. Отпечатано с готового оригинал-макета авторов.
ISBN 5-94223-038-2
Усков А.А., Круглов В.В., 2003
3
ОГЛАВЛЕНИЕ Введение
5
ЧАСТЬ 1
8
Глава 1. Традиционные методы построения систем управления
8
1.1. Общие принципы построения систем управления
8
1.2. Показатели качества систем регулирования
12
1.3. Типовые математические модели объектов управления
15
1.4. Оптимальные системы регулирования
17
1.5. Релейное регулирование
17
1.6. Системы с линейными регуляторами
20
1.7. Системы регулирования с добавочными информационными каналами 22 1.8. Нелинейные регуляторы
25
1.9. Адаптивные системы управления
30
Литература к главе 1
34
Глава 2. Интеллектуальные системы управления. Применение искусственных нейронных сетей и генетических алгоритмов в системах управления
37
2.1. Интеллектуальные системы управления
37
2.2. Применение искусственных нейронных сетей в системах управления 38 2.3. Применение эволюционных методов в системах управления
58
Литература к главе 2
64
Глава 3. Применение нечеткой логики и экспертных систем в задачах управления
70
3.1. Системы управления на основе методов нечеткой логики
70
3.2. Регуляторы на основе нечетких нейронных сетей
88
3.3. Применение экспертных систем в системах управления
92
3.4. Выводы по обзору литературных источников
94
Литература к главе 3
96
4
ЧАСТЬ 2
101
Глава 4. Аналитическое исследование систем управления с нечеткой логикой
101
4.1. Вводные замечания
101
4.2. Характеристика блоков нечеткого логического вывода
106
4.3. Анализ устойчивости систем управления с блоками нечеткого вывода
116
4.4. Анализ устойчивости и показателей качества систем управления с одномерными блоками нечеткого вывода
120
Литература к главе 4
127
Глава 5. Адаптивные нечеткие нейронные сети
128
5.1. Общие сведения
128
5.2. Описание базового алгоритма
133
5.3. Свойства моделей, полученных с помощью нечеткого дополняющего алгоритма
137
5.4. Модификации алгоритма
145
5.5. Экспериментальное исследование алгоритма
148
5.6. Модели динамических объектов
157
5.7. Некоторые обобщения и выводы
163
Литература к главе 5
165
Глава 6. Алгоритмическое и программное обеспечение для исследования интеллектуальных систем управления 6.1.
Алгоритмы для численного исследования систем управления
167 167
6.2. Программное обеспечение для численного исследования систем управления
174
Литература к главе 6
176
5
ВВЕДЕНИЕ Научно-технический прогресс в XX веке в значительной степени определялся достижениями физики, в частности такими ее областями, как ядерная физика и физика полупроводников. По всей видимости, в XXI веке данная тенденция будет сохраняться. (Алферов Ж.И. Физика на пороге XXI века // Наука и жизнь. 2000. № 3. С. 2-9.) В то же время все большее значение начинают приобретать разработки в области информатики – аппаратно и программно реализованные алгоритмы обработки информации. Так, широкое применение за последнее десятилетие получили совсем недавно известные только узкому кругу специалистов нейронные сети, нечеткая логика, генетические алгоритмы и ряд других информационных технологий. Экстраполируя данный процесс на будущее, можно предположить, что роль алгоритмов обработки информации в научнотехническом прогрессе будет возрастать и в дальнейшем. Задачи, решаемые информационными системами, в большинстве случаев можно свести к ряду типовых, среди которых можно выделить следующие: 1) классификация образов – определение принадлежности образа одному или нескольким предварительно определенным классам; 2) аппроксимация функций – оценка неизвестной зависимости по экспериментальным данным; 3) прогноз (предсказание) – определение будущего процесса по его прошлому и настоящему;
6
4) оптимизация – нахождение решений, которые максимизируют или минимизируют определенный критерий качества при заданных ограничениях; 5) память, адресуемая по содержанию (ассоциативная память) – память доступная по указанному содержанию; 6) управление – перевод и поддержание системы в требуемом состоянии. Из приведенных выше задача управления является самой сложной, в большинстве случаев для ее решения как вспомогательные требуется решить также другие приведенные здесь задачи. В
настоящей
книге
рассмотрено
применение
современных
информационных технологий в задачах управления сложными объектами. Книга состоит из двух частей. В первой части (содержащей главы 1-3) приведен обзор принципов построения систем управления. Первая глава посвящена традиционным системам управления. Во второй главе рассматривается применение нейронных сетей и генетических алгоритмов в системах управления. В третьей главе сделан обзор применения методов нечеткой логики и экспертных систем в системах управления. Во
второй
части
книги
(содержащей
главы
4-8)
приведены
разработанные авторами методы анализа и синтеза систем управления сложными объектами. В
четвертой
главе
рассматриваются
аналитические
методы
исследования систем управления с нечеткой логикой. В пятой главе приводится дополняющий алгоритм адаптации нечетких нейронных сетей, анализ его свойств и результаты численных исследований.
7
В шестой главе рассмотрено разработанное алгоритмическое и программное обеспечение для численного исследования интеллектуальных систем управления. Авторы осознают, что книга не лишена недостатков, возможно, содержит опечатки, неточности или даже ошибки. Отзывы и замечания о содержании книги можно отправить по следующему адресу:
[email protected]
8
ЧАСТЬ 1
В настоящем разделе приведен обзор методов построения систем автоматического управления и регулирования. Данный обзор не претендует на полноту и глубину изложения материала, а служит лишь для пояснения основных принципов и подходов. 1. ТРАДИЦИОННЫЕ МЕТОДЫ ПОСТРОЕНИЯ СИСТЕМ УПРАВЛЕНИЯ 1.1. Общие принципы построения систем управления Объектом управления (ОУ) называют часть окружающего мира (среды), на состояние которой можно воздействовать целенаправленно (т.е. управлять ею) [1.1]. Под управлением понимается процесс организации целенаправленного воздействия на ОУ, переводящего объект управления в требуемое (целевое) состояние. Реализацию управления осуществляет система управления (СУ). Под системой управления понимается все необходимые алгоритмы обработки информации и средства их реализации, объединенные для достижения целей управления в объекте. Обобщенная схема системы управления приведена на рис. 1.1 [1.1]. На данном рисунке приняты следующие обозначения: Дх и Ду – датчики, с помощью которых измеряется состояние среды X и объекта Y соответственно;
УУ
–
управляющее
устройство,
вырабатывающее
9
управляющее
воздействие
ИМ
U;
–
исполнительный
механизм,
формирующий по сигналу от управляющего устройства U воздействие на объект U0; Е – ненаблюдаемые возмущения, под которыми понимаются все ненаблюдаемые внутренние и внешние факторы объекта, влияющие на его состояние.
С р е д а
E X
Объект
С р е д а
Y
U0
ИМ
Дx
U
Xd
УУ j
Дy Yd z*
алгоритм
цель
Рис. 1.1. Обобщенная схема системы управления Для целенаправленного функционирования управляющего устройства, ему кроме информации с Дх и Ду необходимо также задать цель управления Z* (т.е. к чему следует стремиться в процессе управления) и алгоритм управления j (способ достижения заданной цели). Под алгоритмом управления понимается четкое недвусмысленное правило, инструкция, указание, что и как следует делать, чтобы достигнуть заданной цели Z* в сложившейся ситуации I: I=<Xd, Yd>. Основными факторами, которые присущи любой системе управления, являются: 1) цель управления Z*; 2) информация о состоянии объекта и среды I; 3) воздействие на объект (собственно управление) U;
10
4) алгоритм управления j. Все
трудности
построения
сложностью объекта.
систем
управления
определяются
Приведем основные черты сложного объекта
управления [1.1]. 1. Отсутствие
математического
описания.
Под
математическим
описанием понимается наличие алгоритма вычисления состояния Y объекта по наблюдениям его входов: управляемого U и неуправляемого, но наблюдаемого X. 2. Недетерменированность (стохастичность) сложного объекта. Эта черта обусловлена не столько наличием, каких-либо источников случайных помех в объекте, сколько сложностью объекта и связанным с этим неизбежным обилием всякого рода второстепенных (с точки зрения управления)
процессов,
которыми
пренебрегают
при
построении
математической модели. 3. Нестационарность. Эта черта проявляется в дрейфе характеристик объекта, т.е. в эволюции объекта во времени. Отметим, что это лишь черты, присущие сложному объекту, но не в коей мере не его формальные признаки. Отсутствие одной или даже нескольких из указанных черт не обязательно делает объект простым. Эти черты имеют неформальный характер, но, тем не менее, позволяют характеризовать сложный объект управления. Выделяют следующие этапы управления сложным объектом. 1. Формулировка цели управления Z*. 2. Определение
ОУ.
Процесс
определения
объекта
должен
заканчиваться определением границ объекта управления, отделяющих его от среды. В ряде случаев, когда границы объекта очевидны, такой проблемы не возникнет. Отметим, что данный этап тесно связан с предыдущим. 3. Создание
математической
определение ее параметров.
модели
объекта
управления
и
11
4. Синтез управления. Под синтезом управления понимается принятие решения о том, каково должно быть управление U, чтобы достигнуть заданной цели Z* управления объектом. Это решение опирается на имеющуюся модель объекта, заданную цель Z*, полученную информацию о состоянии среды X и объекта Y, выделенный ресурс R, который чаще всего представляет собой ограничения, накладываемые на управление U, в связи со спецификой
объекта
управления
и
возможностями
СУ
(временами,
энергетическими, материальными и т.п.). 5. Реализация управления. Данный этап состоит в реализации алгоритма управления. Этот процесс не вызывает затруднения, если сведения о состоянии среды X, объекта Y и его модели достоверны. Однако к моменту реализации управления эта информация может измениться. Для учета такого рода изменений требуется коррекция управления U в процессе его реализации. 6. Этап коррекции. Этап коррекции обусловлен спецификой сложного объекта и заключается в возврате к одному из предыдущих этапов управления. Дело в том, что все решения, принимаемые на предыдущих этапах, приближенные, опираются на старую информацию и отражают состояние объекта, лишь в прошедшие моменты времени. Коррекция может затрагивать различные этапы. Часто перечисленные этапы могут идти одновременно, параллельно, некоторые из них могут отсутствовать. Реализация указанных выше мер приводит к адаптивной системе управления, приспосабливающейся к изменяющимся свойствам среды и объекта управления. По степени автоматизации системы управления подразделяют на автоматические и автоматизированные. Функционирование автоматических систем
управления
осуществляется
без
участия
человека.
автоматизированных системах управления – с участием людей операторов.
В
12
В общем случае сложный объект управления может включать ряд функционально
подчиненных
подсистем.
Иерархия
их
подчинения
обуславливает декомпозицию исходных целей и задач управления на рекурсивную последовательность вложенных составляющих. В конечном итоге такое разделение предполагает многоуровневую организацию системы управления. При этом структура системы управления сложным объектом, обычно,
включает
стратегический,
тактический
и
исполнительный
(приводной) уровни [1.2, 1.3, 1.4]. На исполнительном нижнем уровне системы управления, обычно, решается задача регулирования – задача изменения нужным образом (или поддержания неизменными) каких либо координат объекта управления. Управляющее устройство в данном случае называется регулятором и в совокупности с объектом управления образует систему автоматического регулирования. Показатели качества систем регулирования Качество управления, обеспечиваемое системами регулирования, определяется поведением системы как в установившемся режиме, так и во время переходного процесса [1.5 – 1.7]. Допустим, что целью системы регулирования является поддержание выходной координаты объекта y равной задающему воздействию x (т.е. y(t)=x(t)). При подаче на вход системы постоянного задающего воздействия (x(t)=x0 – const) в установившемся режиме на выходе системы присутствует сигнал y уст
и
x ст ошибка
x0
качество
управления
характеризуется
статической
ошибкой
y уст . В ряде случаев также рассматривается установившаяся системы
при
подаче
на
вход
линейно
возрастающего,
синусоидального и ряда других типовых задающих воздействий.
13
Динамические характеристики системы можно оценить по виду переходного процесса при отработке типовых воздействий. В качестве типового входного воздействия чаще всего рассматривается ступенчатое задающее воздействие. В этом случае кривая переходного процесса для регулируемой величины y(t) называется переходной характеристикой системы (см. рис. 1.2). y ymax 2 x yуст
0
t
Тпп
Рис. 1.2. Переходная характеристика системы Основными показателями качества переходного процесса являются: 1) перерегулирование
[%]
y max
y уст
y уст
100% ,
2) длительность переходного процесса Tпп
(1.1)
– время с момента
возникновения скачка задающего воздействия, по истечении, которого отклонение регулируемой величины не превосходит заданное допустимое значение x .
14
Интегральные оценки качества позволяют характеризовать переходный процесс в системе одним числом. На практике наибольшее распространение получили следующие интегральные оценки: 1) квадратичная интегральная оценка
e( t ) 2 dt ,
I
(1.2)
0
где e(t ) x(t) y(t)
– ошибка регулирования;
2) улучшенная квадратичная интегральная оценка
I
e( t )
2
T
2
0
d e( t ) dt
2
dt .
(1.3)
Первая из указанных квадратичных оценок тем меньше, чем переходный процесс в рассматриваемой системе ближе к задающему воздействию, а вторая – чем ближе переходный процесс в рассматриваемой системе к переходному процессу на выходе инерционного звена с постоянной времени T . Отметим, что предложено большое количество показателей качества управления автоматических систем [1.5 – 1.7]. В
теории
аналитические
автоматического методы
управления
определения
разработаны
показателей
различные
качества
систем
регулирования, однако данные методы применимы либо лишь для определенных частных классов систем, либо являются приближенными, поэтому единственным универсальным методом исследования является имитационное моделирование СУ.
15
Типовые математические модели объектов управления На практике точная модель объекта управления обычно неизвестна. В то же время для оценочных расчетов полезно иметь модель, хотя бы приближенно описывающую свойства объекта. Опыт показывает, что в первом приближении математическое описание многих промышленных объектов (электрических, электромеханических, теплотехнических и др.) можно представить в виде структуры приведенной на рис. 1.3 (модель Гаммерштейна) [1.2, 1.8, 1.9].
u(t)
НЭ
f(t)
y(t)
ЛДЗ
Рис. 1.3. Типовая структура объекта управления На рис. 1.3 приняты следующие обозначения: НЭ – безынерционный нелинейный элемент, ЛДЗ – линейное динамическое звено. Как правило, под НЭ понимают нелинейность типа "зона нечувствительности с ограничением" (см. рис 1.4).
f f0 -u0 u0 -f0
u
16
Рис. 1.4. Характеристика нелинейного элемента При этом передаточная функция ЛДЗ обычно имеет вид [1.8, 1.9]:
W(p)
Y(p) F(p)
k exp( p ) , (1 pT1)(1 pT2)
(1.4)
где F(p) и Y(p) – изображение по Лапласу входного и выходного сигналов ЛДЗ соответственно, для объектов, с так называемым, самовыравниванием, и
W(p)
Y(p) F(p)
k exp( p ) , (1 pT)p
(1.5)
для объектов без самовыравнивания.
Оптимальные системы регулирования Под оптимальной системой автоматического управления понимается система, обладающая по какому-либо критерию наилучшими качествами. В настоящее время разработан целый ряд методов для синтеза оптимальных в том или ином смысле систем регулирования: методы, основанные на классическом вариационном исчислении, динамическое программирование,
принцип
максимума,
теория
конструирования оптимальных регуляторов и др. [1.10 - 1.12].
аналитического
17
Попытки
практического
использованием
указанных
создания
методов
оптимальных
встречают
ряд
регуляторов
с
принципиальных
трудностей, главными из которых являются необходимость знания точной математической модели объекта управления и возможность контролировать все переменные состояния системы. В то же время переходные процессы в оптимальных системах могут служить сравнительной оценкой для переходных процессов в системах с практически реализуемыми регуляторами, как данные о теоретически достижимых показателях качества. Рассмотрим
различные
варианты
построения
регуляторов
автоматических систем, не требующие знания точной модели объекта управления. Релейное регулирование Рассмотрим замкнутую одноконтурную систему автоматического регулирования, приведенную на рис. 1.5. На рисунке приняты следующие обозначения: Р – регулятор, ОУ – объект управления.
x(t)
e(t)
-
P
u(t)
ОУ
y(t)
Рис. 1.5. Структура системы автоматического регулирования Регулятор релейных систем представляет собой статическое звено с релейной характеристикой. Некоторые варианты возможных характеристик релейных регуляторов приведены на рис. 1.6. Данный тип регуляторов является одним из простейших.
18
Релейные системы можно разделить на два класса [1.13]. Режимом нормального
функционирования
систем
первого
класса
является
колебательный режим; в таких системах обычно объект управления не содержит интегрирующих звеньев, а релейный элемент – гистерезисный двухпозиционный. Режимом нормального функционирования систем второго класса является отсутствие автоколебаний. В таких системах обычно объект управления содержат интегратор, а релейный элемент – трехпозиционный с зоной нечувствительности. Примеры температуры,
релейных используемые
систем в
первого
класса:
электронагревательных
стабилизаторы приборах
и
холодильных установках; стабилизаторы напряжения электромеханических генераторов электрической энергии, применяющиеся на транспортных средствах. Пример
релейной
системы
регулирования угла поворота.
второго
класса:
следящая
система
19
u
u
B
B -
e
e
-B
-B
а)
б) u
u
B
B
-A
-AA -B
в)
-A A
e
A+
-B
e
г)
Рис. 1.6. Возможные характеристики релейных регуляторов Свойства релейных систем хорошо изучены [1.13]. Для аналитического исследования процессов в релейных системах разработано несколько эффективных методов: метод фазовой плоскости, частотные методы анализа и ряд других. Можно показать, что релейные системы могут стабилизировать объект управления только в случае выполнения следующих условий [1.8, 1.13, 1.14]: 1) задание и возмущения равномерно ограничены;
20
2) система не содержит звеньев запаздывания (или постоянные запаздывания
значительно
меньше
постоянных
времени
инерционных звеньев объекта); 3) линейная часть системы является минимально-фазовой и имеет относительный порядок (разность между порядком числителя и знаменателя передаточной функции) не превышающий 2. В релейных системах на объект управления всегда подается предельное значение управляющих воздействий. Поэтому такие системы имеют большую скорость изменения упрощающих величин и иногда могут быть оптимальными по быстродействию [1.15]. Отличительными особенностями релейных регуляторов являются: простота, надежность, в ряде случаев не очень хорошие показатели регулирования, а иногда вообще неспособность к стабилизации ОУ, что ограничивает их широкое распространение. Отметим,
что
релейные
системы
могут
использоваться
для
идентификации динамических объектов. Для этого объект включается в замкнутый контур релейной системы, и по параметрам возникающих автоколебаний определяют параметры идентифицируемого объекта. 1.6. Системы с линейными регуляторами Линейные регуляторы представляют собой динамические звенья, описываемые линейными дифференциальными уравнениями. Наиболее распространенными линейными регуляторами являются ПИД-регуляторы, имеющие описание:
t
u(t)
K P e( t ) K I
e( t ) dt 0
KD
d e( t ) , dt
(1.6)
21
где e(t) входной сигнал регулятора (см. рис. 1);
u(t) его выходной
сигнал; K p , K I , K D – коэффициенты пропорциональной, интегральной и дифференциальной составляющих соответственно. Частным случаем ПИД-регуляторов являются: И-регуляторы (для которых,
в отличие от ПИД-регуляторов, K p и K D равны нулю), П-
регуляторы ( K I и K D равны нулю), ПИ-регуляторы ( K I равно нулю), ПДрегуляторы ( K I равно нулю) [1.8, 1.9, 1.16]. Идея ПИД-регулятора является эмпирической: пропорциональная составляющая отражает ошибку системы в настоящий момент времени, интегральная – историю изменения ошибки системы, а дифференциальная составляющая – предсказание будущей ошибки управления. К ПИД-регулятору можно придти, например, следующим образом. Пусть объект управления описывается линейным звеном с передаточной функцией (1.4), параметры объекта постоянны, при этом параметр достаточно мал. Потребуем, чтобы передаточная функция замкнутой системы соответствовала передаточной функции звена запаздывания с постоянной
, при этом регулятор будет описываться уравнением (1.6) с
параметрами [1.9]:
KD
T1 T2 , k oy
KI
1 , k oy
KP
T1 T2 . k oy
(1.7)
Отметим, что системы управления с ПИД-регуляторами превосходит по своим характеристикам системы с ПИ-регуляторами, однако
ПИ-
регулятор менее чувствителен к изменению параметров объекта и проще в настройке, в связи с чем его применение иногда предпочтительнее [1.8]. Если объект управления является объектом без самовыравнивания (содержит интегрирующее звено), то в этом случае применение ПИД, ПИ и И-
22
регуляторов
приводит
к
структурной
неустойчивости
системы
и
используются ПД и П-регуляторы. ПИД-регуляторы
доказали
свою
эффективность
в
управлении
разнообразными процессами. Более 80 % применяемых в настоящее время в промышленности регуляторов – это ПИД-регуляторы. Данные регуляторы могут быть проанализированы на основе хорошо разработанной линейной теории управления и просты для понимания [1.5]. Следует
заметить,
что
в
реальных
системах
всегда
присутствует
нелинейности, в частности нелинейность насыщения, которая проявляется при больших отклонениях координат объекта, таким образом, линейные модели являются только приближенными. Разработано большое количество достаточно эффективных методов настройки параметров ПИД-регуляторов [1.8, 1.9, 1.16, 1.17]. Следует, однако, отметить, что для объектов с переменными параметрами, значительным временным запаздыванием, существенными нелинейностями и большими помехами ПИД-регуляторы в ряде случаев не могут обеспечить необходимого качества управления. 1.7. Системы регулирования с добавочными информационными каналами При
оптимальном
построении
регулятора
заданной
структуры
динамическая ошибка регулирования принимает свое минимальное значение. Дальнейшее увеличение динамической точности регулирования не может быть
достигнуто путем улучшения
алгоритма
функционирования
регулятора. Однако при этом бывает, что требования к качеству управления могут остаться неудовлетворенными. Для достижения цели приходится принимать меры, чтобы регулятор получал более полную и своевременную информацию о состоянии объекта управления [1.5, 1.9, 1.18].
23
Пусть имеется возможность контроля некоторых вспомогательных координат объекта управления, которые реагирует на возмущение с меньшим запаздыванием, чем основная регулируемая величина. В частности, этими координатами могут быть сами возмущения, если они поддаются контролю. В этом случае в системе можно организовать дополнительный канал управления, как это показано на рис. 1.7.
f x
-
-
y
ОУ
P
z
Рис. 1.7. Система с дополнительным информационным каналом На рис. 1.7 приняты следующие обозначения: Z – дополнительная координата объекта, f – возмущение. Другой
подход
к
построению
системы
с
добавочными
информационными каналами – это идея так называемого комбинированного управления [1.9, 1.18]. Под комбинированным управлением понимается такой метод построения замкнутой автоматической системы, когда наряду с регулированием
по
отклонению
или
ошибке
осуществляется
также
регулирование по задающему или возмущающему воздействию, таким образом, в комбинированных системах используется регулирование по замкнутому и разомкнутому контурам одновременно. Система называется инвариантной по отношению к какому либо воздействию, если после завершения переходного процесса регулируемая величина и ошибка регулирования не зависят от этого воздействия.
24
На рис. 1.8 показана линейная система, инвариантная к входному воздействию. Несложно показать, что при выполнении соотношения:
p
ошибка регулирования e
1 , Wp
(1.8)
0 и не зависит входного воздействия x .
(p) y
е
x
W(p)
-
Рис. 1.8. Система, инвариантная по отношению к входному воздействию Аналогично, в системе на рис. 1.9 при выполнении соотношения:
p
e
0
1 , Wp
(1.9)
при любых f, таким образом, система инвариантна по отношению
к возмущающему воздействию f.
25
f (p) е
x
y W(p)
-
Рис. 1.9. Система, инвариантная по отношению к возмущающему воздействию В приведенных примерах инвариантность реализуется только тогда, когда выполняются соотношения (1.8) и (1.9), в то же время передаточная функция (р) в данных соотношениях физически нереализуема, поэтому на практике может быть осуществлена не полная, а лишь частичная инвариантность, при которой
(р) заменяется своим приближением. Это в
ряде случаев сводит на нет преимущества инвариантных систем.
1.8. Нелинейные регуляторы В реальных условиях рассмотренные выше релейные и линейные регуляторы не всегда позволяют обеспечить требуемое качество управления, что привело к разработке регуляторов, реализующих сложные нелинейные динамические операторы. Ограничивает
широкое
применение
нелинейных
регуляторов
отсутствие универсальных методов их синтеза. Поэтому использование нелинейных регуляторов на практике ограничено частными случаями, для которых доказана их эффективность. Только в последнее время появился универсальный подход к синтезу нелинейных систем управления – интеллектуальное управление, основные идеи которого будут рассмотрены в
26
следующей главе [1.2]. В данном параграфе рассматриваются традиционные подходы к построению нелинейных регуляторов. Простейшие нелинейные регуляторы – релейные, были рассмотрены выше. Их логическим продолжением являются СУ с переменной структурой [1.19]. В системах с переменной структурой происходит скачкообразное изменение связей между функциональными элементами регулятора в зависимости от переменных состояния замкнутой системы управления. На рис. 1.10 приведен пример системы с переменной структурой. Система состоит из объекта управления ОУ, двух каналов регулирования Р 1, Р2 и управляющего устройства УУ, скачком изменяющего структуру системы при изменении сигнала рассогласования e.
x
P1
e -
y
ОУ
P2 УУ
Рис. 1.10. Система с переменной структурой Применение принципа переменной структуры позволяет получить системы, сочетающие в себе как достоинства переключаемых подсистем, так и имеющие новые уникальные свойства [1.19]. Например, применяя в системе на рис. 1.10 регулятор Р1, обеспечивающий переходный процесс с малой
длительностью,
обеспечивающий
но
большим
монотонный
перерегулированием,
переходный
процесс
с
а
Р2
–
большой
длительностью, с помощью принципа переменной структуры можно
27
получить
систему
с
монотонным
переходным
процессом
малой
длительности. В качестве примера, так же, приведем регулятор типа М (предложен О.М.Мининой) [1.8]. Рассматриваемый регулятор описывается системой дифференциальных уравнений:
du dt du dt
de KМ ( dt
d 2e
TД
dt
de 0 при e dt
) при e 2
de dt
0, (1.10)
0.
Структурная схема М-регулятора приведена на рис. 1.11.
Рис. 1.11. Структура М-регулятора Применение
М-регуляторов
в
СУ
с
запаздыванием
и
самовыравниванием позволяет значительно сократить время переходного процесса по сравнению с ПИД-регулированием. При этом, однако, системы с М-регуляторами значительно чувствительнее к изменению параметров объекта, что существенно ограничивает их применение [1.8]. Принцип
переменности
высококачественное
управление
структуры
позволяет
свободным
движением
обеспечить объектов
с
28
постоянными параметрами, а в случае изменения параметров объекта в широком диапазоне или при наличии возмущений, приложенных к объекту, позволяет построить систему, малочувствительную к этим изменениям. Применение
принципа
переменной
структуры
оказывается
весьма
эффективным при управлении существенно нелинейными объектами, а также объектами с запаздыванием [1.19]. В то же время следует отметить, что большинство замечательных свойств систем с переменной структурой достигается за счет использования скользящего режима – режима при котором структура системы изменяется с бесконечной частотой. В реальных условиях идеальный скользящий режим невозможен, параметры реального скользящего режима зависят от скрытых параметров системы, возникают биения, т.е. высокочастотные колебания в окрестности точки равновесия. Данное обстоятельство существенно сужает, а в ряде случаев делает невозможным практическое применение классических систем с переменной структурой [1.14]. Обобщением систем с переменной структурой являются системы с операторными обратными связями. В рассмотренных выше системах управления обратная связь (ОС) вводится в прямой тракт с помощью операции “суммирование” – это так называемая аддитивная обратная связь. Однако это лишь частный случай введения обратной связи. Более общей является обратная связь, которая изменяет динамический оператор, реализуемый прямым трактом системы – операторная обратная связь. В работе [1.14] заложены основы теории операторных обратных связей, которая в случае ее успешной разработки позволит создавать системы, сочетающие замечательные свойства систем с переменной структурой, достигаемые в идеальном скользящем режиме, и одновременно отсутствие проблем с его практической реализацией. Однако в настоящее время теория систем управления с операторными обратными связями развита недостаточно.
29
Частный случай операторной обратной связи – параметрическая ОС [1.20, 1.21]. Здесь сигнал ОС изменяет параметры прямого тракта системы. Простейшими примерами параметрической обратной связи являются билинейная обратная связь, при которой сигнал обратной связи вводится посредством операции “умножение” (см. рис. 1.12) и логометрическая обратная связь (см. рис. 1.13), при которой обратная связь вводится путем операции “деление”. Отметим, что в системах с параметрической обратной связью вид переходного процесса зависит от входного и возмущающего сигнала системы, что в ряде случаев позволяет создавать системы, обладающие адаптивными свойствами. В частности, в системах с логометрической обратной связью при выполнении определенных условий отсутствует противоречие между точностью и устойчивостью, хорошо известное из теории линейных систем [1.22].
x
y
ОУ
X
ko -
K ОС
Рис. 1.12. Система с билинейной обратной связью
x
ОУ
ko -
y
K ОС
Рис. 1.13. Система с логометрической обратной связью
30
1.9. Адаптивные системы управления Обычно при проектировании систем управления предполагается, что известны математическая модель объекта управления (по крайне мере, с точностью до параметров), а также внешние воздействия и режимы работы. В
результате
определяется
структура
и
все
параметры
системы
регулирования, удовлетворяющей заданным требованиям. Однако не всегда существует
такая
определѐнность всех факторов. Часто значения
параметров объекта управления, а иногда и структура его математического описания не являются достоверными.
При этом требования к качеству
процесса управления достаточно высоки. В этих случаях невозможно создать качественную систему управления с определенными фиксированными параметрами, и возникает необходимость в создании адаптивной системы регулирования,
в
которой
параметры
(структура)
настраивается
автоматически, чтобы получить процесс управления, удовлетворяющий заданным требованиям. Адаптивные системы по сравнению с обычными системами, обладают контуром самонастройки. При этом, возможны два варианта: 1) после того как проведена настройка регулятора, контур самонастройки больше не участвует в работе системы и отключается; 2) параметры объекта и возмущающих воздействий постоянно меняются, и если эти изменения значительны,
то
для
получения
необходимого
качества
управления
необходимо синхронно изменять и параметры регулятора. Существует большое количество, подчас даже противоречивых методов классификации адаптивных систем управления [1.7, 1.10, 1.11, 1.16, 1.18, 1.23 – 1.28]. Приведем один из возможных подходов к классификации. По критерию адаптации можно различать системы с эталонной моделью и системы с экстремальной самонастройкой. В первых из них регулятор адаптируется таким образом, чтобы замкнутая система управления
31
имела свойства, как можно более близкие к заданным – свойствам эталонной модели. Во вторых регулятор адаптируется с целью получить наилучшие в том или ином смысле показатели качества управления. Контур самонастройки (КСН) будет разомкнутым, если он не совмещен с регулируемой величиной или параметрами объекта управления, а реагирует на косвенную величину f, от которой зависит выходной сигнал системы y (см. рис. 1.14).
КСН x
Регулятор
f y
u
ОУ
Рис. 1.14. Система с разомкнутым контуром самонастройки На рис. 1.15 и рис. 1.16 приведены системы с замкнутым контуром самонастройки. В системе на рис. 1.15 в контур самонастройки подается величина y', связанная каким-либо образом с регулируемой величиной у. В системе на рис. 1.16 регулятор адаптируется в зависимости от параметров объекта
управления,
идентификации (БИ).
которые
определяются
посредством
блока
32
КСН y' x
Регулятор
u
y
ОУ
Рис. 1.15. Система с замкнутым контуром самонастройки
БИ x
Регулятор
u
y
ОУ
Рис. 1.16. Адаптивная система с блоком идентификации Существенным
является
способ
определения
факторов
для
самонастройки. Возможны два варианта: - с помощью подачи специального воздействия на СУ (на объект); - путем анализа естественного хода процесса управления. В связи с этим различают системы с поисковой самонастройкой и беспоисковые, или аналитически самонастраивающиеся. Отметим, что существует ряд СУ, не имеющих специального добавочного
контура
самонастройки,
но
обладающих
некоторыми
свойствами самонастраивающихся систем. Это системы с нелинейными регуляторами, с параметрическими ОС и т.п. Такие системы называют системами с пассивной самонастройкой или системами, эквивалентными самонастраивающимся. Системы с контуром самонастройки, в связи с этим,
33
называются системами с активной самонастройкой. В литературе нет однозначных критериев, какие системы управления относить к адаптивным, а какие нет. Приведем примеры наиболее распространенных адаптивных систем управления [1.17]. Один из традиционных подходов к построению самонастраивающихся систем управления – обобщенное прогнозирующее управление. Суть данного метода состоит в следующем: делается прогноз процесса в системе на длительный интервал времени, далее выбирается стратегия управления, затем данная стратегия, применяется на какое-то определенное время, в следующий момент времени снова делается прогноз, затем выбор стратегии и ее реализация на определенное время; данный цикл постоянно повторяется. Рассмотренный подход эффективен при управлении неминимальнофазовыми, неустойчивыми в разомкнутом состоянии объектами и объектами с неизвестным запаздыванием. Самонастраивающееся ПИД-управление. В таких адаптивных системах параметры ПИД-регулятора настраиваются в зависимости от сигналов внешних возмущений, показателей качества управления или параметров объекта управления. Отметим недостатки адаптивных систем разработанных согласно традиционным принципам. Большинство алгоритмов адаптации получены при условии отсутствия неконтролируемых возмущающих воздействий и возможности определить все параметры объекта в процессе идентификации. Кроме того, практически все алгоритмы адаптации работоспособны, лишь если выполняется гипотеза квазистационарности объекта управления в течении
времени
настройки
регулятора
и
отсутствуют
исчезающие
возмущения. Следует также заметить, что существующие алгоритмы адаптации достаточно сложны в реализации.
34
Рассмотренные выше системы управления с релейными и линейными регуляторами, системы с переменной структурой, системы с операторными обратными связями, системы с ПИД-регуляторами с самонастройкой и системы с обобщенным прогнозирующим управлением принято относить к традиционным системам управления. В них не применяются современные информационные технологии, такие, как нейронные сети, нечеткая логика, генетические алгоритмы, экспертные системы и ряда других (это можно считать их отличительной особенностью от традиционных СУ). В следующих главах будет показано, что применение указанных технологий в системах управления может существенно улучшить качество управления сложными объектами.
Литература к главе 1 Растригин Л.А. Современные принципы управления сложными объектами. М.: Советское радио, 1980. Интеллектуальные системы автоматического управления / Под. ред. И.М.Макарова, В.М.Лохина. М.: Физматлит, 2001. Вукотбратович М, Стокич Д. Управление манипуляционными роботами. М.: Наука, 1985. Медведев В.С., Лесков А.Г., Ющенко А.С. Системы управления манипуляционных роботов. М.: Наука, 1978. Попов
Е.П.
Теория
линейных
систем
автоматического
регулирования и управления. М.: Наука, 1989. Попов
Е.П.
Теория
нелинейных
систем
автоматического
регулирования и управления. М.: Наука, 1988. Филипс Ч., Харбор Р. Системы управления с обратной связью. М.: Лаборатория базовых знаний, 2001.
35
Круг Е.К., Александриди Т.М., Дилигенский С.Н. Цифровые регуляторы. М.-Л.: Энергия, 1966. Ротач В.Я. Расчет динамики промышленных автоматических систем регулирования. М.: Энергия, 1973. Александров А.Г. Оптимальные и адаптивные системы. М.: Высшая школа, 1989. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000. Иванов
В.А.,
Фалдин
Н.В.
Теория
оптимальных
систем
автоматического управления. М.: Наука, 1981. Цыпкин Я.З. Релейные автоматические системы. М.: Наука, 1974. Емельянов С.В., Коровин С.К. Новые типы обратных связей. Управление при неопределенности. М.: Наука. Физматлит, 1997. Павлов
А.А.
Синтез
релейных
систем,
оптимальных
по
быстродействию. М.: Наука, 1966. Изерман Р. Цифровые системы управления. М.: Мир, 1984. Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения. Кн.2 / Общая ред. А.И.Галушкина. М.: ИРПЖР, 2000. Справочник по теории автоматического управления / Под. ред. А.А.Красовского. М.: Наука, 1987. Емельянов
С.В.
Системы
автоматического
управления
с
переменной структурой. М.: Наука, 1967. Догановский С.А., Озерянный Н.А. Системы параметрического управления // Измерения, контроль, автоматизация. 1985. № 2. С. 58-75. Догановский С.А., Озерянный Н.А. Системы параметрического управления. Тенденции развития и применения // Изв. вузов. Приборостроение. 1988. № 2. С. 33-42.
36
Кульков
А.А.
Исследование
и
разработка
систем
с
логометрическим принципом управления. Автореф. дис … канд. техн. наук. М.: МЭИ, 1994. Колесников А.А. Синергетическая теория управления. М.: Энергоатомиздат, 1994. Катков М.С. Непрерывные системы адаптивного управления с идентификаторами. М.: Мир книги, 1992. Козлов Ю.М. Адаптация и обучение в робототехнике. М.: Наука, 1990. Павлов Б.В., Соловьев И.Г. Системы прямого адаптивного управления. М.: Наука, 1989. Чураков
Е.П.
Оптимальные
и
адаптивные
системы.
М.:
Энергоатомиздат, 1987. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990.
37
2. ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ. ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ И ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ В СИСТЕМАХ УПРАВЛЕНИЯ 2.1. Интеллектуальные системы управления До последнего десятилетия прошлого века в построении регуляторов доминировал традиционный подход. Однако регуляторы, построенные на основе указанного подхода, не всегда позволяют осуществлять робастное управление сложными нестационарными объектами. Данное обстоятельство послужило развитию нового научного направления – интеллектуальных систем управления [2.1, 2.2, 2.3]. Интеллектуальные системы управления – это системы управления способные к “пониманию” и обучению в отношении объектов управления, возмущений, внешней среды и условий работы. Основное отличие интеллектуальных систем – наличие механизма системной обработки знаний. Главная архитектурная особенность, которая отличает интеллектуальные системы управления от "традиционных" – это механизм получения, хранения и обработки знаний для реализации своих функций. В основе создания интеллектуальных систем управления лежат два принципа: ситуационное управление (управление на основе анализа внешних ситуаций или событий) и использование современных информационных технологий обработки знаний.
38
Существуют несколько современных информационных технологий позволяющих создавать данные системы управления: экспертные системы, искусственные нейронные сети, нечеткая логика, генетические алгоритмы и ряд других. Для разработки интеллектуальных систем управления данные методы должны быть объединены с достижениями современной теории управления. Интеллектуальные технологии между собой различает, прежде всего, то, что именно положено в основу концепции интеллектуальности – либо умение работать с формализованными знаниями человека (экспертные системы, нечеткая логика), либо свойственные человеку приемы обучения и мышления (искусственные нейронные сети и генетические алгоритмы). В инженерном контексте интеллектуальное управление должно обладать следующими свойствами: во-первых, способностью к обучению и адаптации; во-вторых, живучестью (устойчивостью к повреждениям и неполадкам);
в-третьих,
“дружественным
к
пользователю”
человеко-
машинным интерфейсом и, в-четвертых, способностью к включению новых компонентов. Структурно интеллектуальные СУ содержат дополнительные блоки, выполняющие системную обработку знаний на основе названных выше информационных технологий. Данные блоки могут выполняться либо как надстройка над обычным регулятором, настраивая нужным образом его параметры,
либо непосредственно включаться в замкнутый контур
управления. 2.2. Применение искусственных нейронных сетей в системах управления
Под искусственными нейронными сетями (далее просто нейронными сетями (НС)) подразумевают вычислительные структуры, состоящие из большого количества однотипных элементов, каждый из которых выполняет
39
относительно простые функции. Процессы в искусственных НС иногда ассоциируют с процессами происходящими в нервной системе живых организмов [2.1-2.14]. Бурно развивающийся в последние годы аппарат искусственных нейронных сетей предназначался в начале в основном для решения зада классификации, кластеризации и распознавания образов, но дальнейшее развитие данного направления значительно расширило сферу применения нейросетевого подхода, и он начал применяться, в частности, в задачах управления [2.1-2.3]. К настоящему времени разработано большое количество различных типов нейронных сетей, имеющих свои отличительные особенности.
В задачах управления наиболее широкое распространение получили многослойные нейронные сети прямого распространения или многослойные персептроны, сокращенно MLP (от Multi Layer Perceptron) [2.4-2.7]. Элементарным преобразователем в рассматриваемых сетях является искусственный нейрон или просто нейрон, названный так по аналогии с биологическим прототипом. Искусственный нейрон обычно представляют в виде структуры, приведенной на рис. 2.1.
x1 x2
W1 W2 y
s
F(s) xn
Wn b
Рис. 2.1. Структура искусственного нейрона
40
Такой нейрон имеет n входов x1, x2, …, xn и один выход y, а его математическая модель описывается соотношениями:
n
S
wi xi
b,
(2.1)
i 1
y = F(S), где w1, w2, … wn – весовые коэффициенты, b – постоянное смещение, F( ) – функция активации или передаточная функция нейрона. Обычно в качестве активационной функции используется сигмоид:
y
F(S)
1 , 1 exp( a s)
(2.2)
где а – некоторая положительная постоянная. Выходное значение нейрона лежит в диапазоне [0, 1]. Ценные свойства сигмоидальной функции – дифференцируемость на всей оси абсцисс и простое выражение для ее производной, что используется в некоторых алгоритмах обучения. Кроме того, она обладает свойством усиливать слабые сигналы лучше, чем большие, что предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон. Известно
также
большое
количество
других
разновидностей
активационных функций [2.4 - 2.7]. Нейронная сеть состоит из ряда связанных между собой нейронов, обычно образующих несколько слоев. На рис. 2.2 в качестве примера приведена простейшая двухслойная нейронная сеть.
41
Выходной слой
...
Скрытый слой
...
...
Входной слой
Рис. 2.2. Двухслойная нейронная сеть Отметим, что нейроны первого слева (входного) слоя сети на рис. 2.2 математических операций не выполняют, а служат лишь для размножения сигналов и при определении числа слоев не учитываются. Чтобы нейронная сеть могла решить поставленную задачу, ее предварительно необходимо обучить. Сущность обучения состоит в подстройке весов нейронов по примерам обучающей выборки [2.1 - 2.16]. Эффективность использования нейронных сетей устанавливается рядом так называемых теорем о полноте [2.7, 2.17-2.21]. Смысл данных теорем сводиться к тому, что любая непрерывная функция на замкнутом ограниченном множестве может быть равномерно приближена функциями, вычисленными нейронными сетями, при выполнении некоторых достаточно легко реализуемых условий; таким образом, нейронные сети являются универсальными аппроксиматорами. Основным алгоритмом обучения MLP использующихся в системах управления является алгоритм обратного распространения. В данном случае нейронная сеть обучается воспроизводить зависимость, заданную набором из
42
N пар точек
x n , yn
n=1, 2, … N, с минимизацией суммарной
квадратичной ошибки
Е
N
Еn ,
(2.3)
n 1
где E n
(y n
O n ) 2 , Оn – выход сети при поступлении на вход x n .
Алгоритм состоит в последовательном выполнении следующих шагов. 1. Задаются параметр
[0, 1] и некоторые малые случайные веса сети
w ijk – k-й вес j-го нейрона в i-м слое нейронной сети, а также Еmax –
максимальное значение суммарной функции ошибок сети. 2. Устанавливается n=1 – номер текущей обучающей точки и Е=0 – текущее значение суммарной функции ошибок сети. 3. Вводится очередная обучающая пара
x
xn и
y
yn .
Вычисляется выходной сигнал сети O n . 4. Производится корректировка весов по формуле:
wi
En , wi
wi
(2.4)
где wi – матрица весов i–го слоя нейронов, причем коррекция весов происходит в направлении от последнего слоя к первому, т.е.
i
последовательно меняется от М – число слоев в сети до 1. 5. Корректируются (наращивается) значение функции ошибки:
E
E (y n
On )2 .
6. Если n
Еmax , то переход к п.2.
(2.5)
43
8. Конец.
En понимается матрица элементами которой wi
В формуле (2.4) под
En . Элементы данной матрицы в ряде w jk
являются частные производные
случаев могут быть определены в аналитическом виде. Например, если нейроны сети описываются сигмоидальными функциями вида:
On
1
, 1 exp( w T j x n )
(2.6)
выходной x n - вектор входных сигналов нейрона, Оn – нейрона, w j - вектор весов нейрона; то для выходного нейрона сети: где
En WM
где
Оn – выход сети, O n
M 1
(y n
O n )O n (1 O n )O n ,
сигнал
(2.7)
M 1
- выходной сигнал М-1 слоя;
для предыдущего слоя нейронной сети:
En WM 1
(y n
где
On
O n )O n (1 O n )WM O n (1 O n )O n M 1
M 2
M 1
M 2
(2.8)
- выходной сигнал М-2 слоя.
Аналогично для всех остальных слоев сети. Если вид частных производных аналитически определить не удается, то
пользуются
производных:
приближенными
формулами
для
численной
оценки
44
En Wi
En . Wi
(2.9)
Рассмотренный алгоритм реализует процедуру градиентного метода наискорейшего спуска. Данный метод имеет линейную скорость сходимости, а также резкое замедление оптимизационного процесса в окрестности точки оптимального решения, что делает рассматриваемый алгоритм на практике малоэффективным. Тем не менее, благодаря своей простоте он остается одним из наиболее распространенных. Более эффективными методами настройки
весов
многослойной
сети
являются
квазиньютоновские
алгоритмы, например, методы переменной метрики (Бройдена-ФлетчераГольдфарба-Шенно,
Девидона-Флетчера-Пауэлла)
или
Левенберга-
Марквардта. При большом числе настраиваемых весов (десятки тысяч и более)
очень
хорошо
зарекомендовал
себя
алгоритм
сопряженных
градиентов, хотя при меньшей размерности он уступает квазиньютоновским алгоритмам. Разработано также большое число алгоритмов эвристического типа, не имеющих строгого теоретического обоснования, но показавших свою эффективность на практике; в качестве примеров таких алгоритмов можно привести: симплекс метод, Quickprop, RPROP и ряд других [2.6]. Как известно, перечисленные выше алгоритмы является алгоритмами локальной оптимизации, и для увеличения вероятности нахождения глобального экстремума необходимо проводить обучение несколько раз с разными начальными весами нейронов. Для надежного нахождения глобального решения разработан ряд алгоритмов глобальной оптимизации, наиболее известными из которых являются метод имитации отжига и генетические алгоритмы. Генетические алгоритмы более подробно рассмотрены ниже, в параграфе 2.3. Кроме многослойных персептронов в системах управления находят применение радиальные нейронные сети или RBF-сети (от Radial Basis
45
Function Network). Сеть RBF – это двухслойная нейронная сеть. Первый слой данной сети состоит из так называемых радиальных нейронов. Нейроны данного слоя описываются соотношением:
ok
(
x ck
),
(2.10)
k
где o k – выходной сигнал k-го нейрона; x – входной сигнал сети (данный
сигнал подается на каждый нейрон рассматриваемого слоя);
k,
ck –
постоянные параметры, которые могут настраиваться в процессе обучения. Часто в качестве ( ) используется функция Гаусса:
(s)
exp( s 2 / 2) .
(2.11)
Второй слой RBF-сети осуществляет линейное или нелинейное преобразование выходных сигналов первого слоя (в частности, если выходной сигнал сети – скаляр, данный слой состоит из одного нейрона). В обобщенно-регрессионных нейронных сетях или GRNN (от Generalized Regression Neural Network), являющихся разновидностью RBFсетей, второй слой осуществляет взвешенное суммирование выходных сигналов первого слоя:
M
w k ok o
k 1
,
N
(2.12)
ok k 1
где w k – веса, настраиваемые при обучении, M – число нейронов первого слоя.
46
Допустим, что обучающая выборка состоит из N пар значений x n , yn
, n=1, 2, …N. В простейшем случае при обучении формируется
радиальный слой из M=N нейронов с параметрами c k второго слоя выбираются из условия w k
x n , а параметры
y n . В описанном алгоритме
обучение GRNN происходит практически мгновенно (один такт). Однако сеть получается достаточно громоздкой, поэтому разработаны алгоритмы обучения GRNN в которых число радиальных нейронов меньше числа элементов обучающей выборки (M
k
радиальных базисных функций
(см. формулу (2.10)); 3) весов нейронов выходного слоя w k (см. формулу (2.12)). Разработано большое количество алгоритмов настройки указанных параметров [2.6]. Перечислим основные из них. Настройка параметров c k и k может осуществляться методом обратного распространения ошибки, аналогично тому, как это происходит в сигмоидальных нейронных сетях, например, градиентным методом. Кроме того, для определения координат центров c k
могут
использоваться алгоритмы обучения без учителя, помещающие центры радиальных функций в центры кластеров обучающих данных. Для определения
отклонений
k
также существуют различные
эмпирические методы, использующие в качестве исходной информации расстояния между центрами радиальных функций. Веса нейронов
выходного слоя w k обычно входят линейно в
выражение для выходного сигнала сети (см. формулу (2.12)), и их настройку
47
можно осуществить с помощью формул для определения коэффициентов линейной регрессии по методу наименьших квадратов. Наиболее сложным является выбор числа радиальных базисных функций M. Существует несколько методов и алгоритмов выбора М, однако данную задачу пока нельзя считать решенной [2.6]. Для радиальных сетей доказано ряд теорем, согласно которым, данные сети, при выполнении определенных условий, могут аппроксимировать произвольную гладкую функцию. Обычно RBF-сети обладают худшими обобщающими свойствами по сравнению с сигмоидальными нейронными сетями при больших объемах обучающей
выборки.
Особенно
сильно
это
проявляется
в
задачах
экстраполяции. Однако, сети RBF показали очень хорошие результаты в случае если объем обучающей выборки мал. В сетях RBF нет проблемы выбора числа слоев сети. Кроме того, большинство алгоритмов обучения RBF-сетей работают значительно быстрее по сравнению с алгоритмами обучения многослойных персептронов. Реализация динамических операторов нейронными сетями. Рассматриваемые
выше
нейронные
сети
могли
реализовывать
произвольную гладкую функцию. На рис. 2.3 показана одна из возможных структур реализации произвольного дискретного динамического оператора с помощью нейронной сети.
48
xk z-1
z-m
yk
MLP z-1
z -n +1
z-1
Рис. 2.3. Реализация дискретного динамического оператора с помощью многослойного персептрона Под z-i на рис. 2.3 понимается элемент задержки на i шагов. Дискретный динамический оператор, реализуемый рассматриваемой структурой имеет вид:
yk
(x k , x k 1,x k
m , y k 1 , y k 2 ,y k n )
(2.13)
где ( ) - функция реализуемая MLP. Причинами, послужившими применению нейронных сетей в системах управления, является следующее. 1.
Нейронные сети могут реализовывать произвольные гладкие
функции любой сложности. 2.
Для реализации нейросетевых систем управления необходимо
минимальная информация об объекте управления.
49
3.
При реализации нейронных сетей в виде специализированных
интегральных схем возможна параллельная обработка информации, что вопервых, значительно увеличивает скорость работы системы и, во-вторых повышает надежность системы. Приведем
основные термины, используемые в литературе по
нейросетевым системам управления [2.2]: 1) оперативное обучение – сеть обучается в процессе управления; 2) предварительное
обучение
–
сеть
обучается
перед
процессом
управления; 3) обобщенное обучение – нейронная сеть обучается воспроизводить заданный оператор (копировать заданную систему); 4)
специализированное (непосредственное) обучение – НС обучается выдавать нужные сигналы управления;
5)
прямое обучение (управление) – в схеме обучения (управления) не используется дополнительный обычный регулятор;
6)
непрямое обучение (управление) – в схеме обучения (управления) используется дополнительный обычный регулятор;
7)
инверсное обучение – нейронная сеть обучается воспроизводить обратный оператор объекта. Рассмотрим некоторые наиболее известные варианты построения
нейросетевых систем управления. 1. Последовательная схема нейросетевого управления. Простейшая последовательная схема нейросетевого управления показана на рис. 2.4 [2.22-2.25]. х
HC
u
OУ
y
f
Рис. 2.4. Последовательная схема нейросетевого управления
50
На рис. 2.4 приняты следующие обозначения: х – входной задающий сигнал системы (уставка), у – выходной сигнал системы, f – сигналы несущие информацию о контролируемых возмущениях. Обученная нейронная сеть стремится воспроизвести обратную динамику объекта управления, обеспечив тем самым, выполнение равенства у=х. В данном случае используется разомкнутая схема управления без отрицательной обратной связи. Достоинствами такой схемы являются простота и отсутствие проблем с устойчивостью. К недостаткам можно отнести следующее: при наличии неконтролируемых возмущений, а также нестационарности
объекта управления данная схема не гарантирует, что
выходной сигнал ОУ будет соответствовать опорному сигналу; эта схема не способна управлять неустойчивым объектом; сложности также возникают, если оператор ОУ не имеет обратного. Предложено несколько вариантов обучения НС для схемы на рис. 2.4. На рис. 2.5 показана схема предварительного обобщенного инверсного обучения НС [2.26].
u
OУ
y
e
u
HC
Рис. 2.5. Схема предварительного обобщенного инверсного обучения Нейронная сеть, предварительно обученная инверсной динамике объекта, затем используется в схеме на рис. 2.4.
51
При нестационарности ОУ применение предварительного обучения не позволяет получить хорошие показатели управления. В связи, с чем получили развитие схемы, допускающие оперативное обучение. Рис. 2.6 иллюстрирует процедуру специализированного обучения НС для последовательной схемы управления [2.26, 2.27].
u
х
y
HC
OУ e
Рис. 2.6. Схема специализированного обучения В данном случае (см. рис. 2.6) НС настраивается таким образом, чтобы получить наилучшее выполнение равенства у=х. Отметим, что здесь для обучения
НС
нельзя
применять
классический
метод
обратного
распространения с аналитически заданным градиентом, так как между выходом системы и НС стоит объект управления, якобиан которого в общем случае
не
известен,
и
приходится
применять
либо
численную
аппроксимацию якобиана системы, либо другие модернизации метода обратного распространения, не требующие информации о якобиане системы [2.2]. Другой подход состоит в том, чтобы в систему на рис. 2.6 добавить еще одну нейронную сеть (эмулятор), которая выполняет имитационное моделирование ОУ с целью определения его якобиана см. рис. 2.7.
52
х
u
y
HC1
OУ e'
HC2 e
Рис. 2.7. Схема с нейроэмулятором и нейроконтроллером На рис. 2.7 НС1 выполняет функции контроллера, а НС2 – эмулятора. При этом нейроэмулятор НС2 может использоваться как для определения якобиана объекта управления, так и для непосредственного обучения нейроконтроллера НС1. В литературе этот метод иногда называется как “обратное распространение во времени” [2.28-2.32]. Существует еще одна оригинальная схема реализации обратной динамики ОУ в последовательном контроллере, приведенная на рис. 2.8.
х
u
y
HC1
OУ e
копия
HC2
Рис. 2.8. Схема с обучением нейроконтроллера обратной динамике объекта управления
53
В схеме на рис. 2.8 нейроэмулятор НС2 обучается обратной динамике ОУ, а нейроконтроллер НС1 просто копирует нейроэмулятор НС2. 2. Параллельная схема контроллера нейросетевого управления. На рис. 2.9 приведена параллельная схема нейроконтроллера для последовательной схемы нейросетевого управления [2.33, 2.34].
Рис. 2.9. Параллельная схема нейроконтроллера Настройка НС заключается в том, чтобы подкорректировать сигнал обычного контроллера u2, если он не обеспечивает необходимое качество управления. В работах [2.35, 2.36] приводится так называемая структура “обучение с ошибкой обратной связи” параллельного нейроконтроллера (см. рис. 2.10).
Рис. 2.10. Схема “обучение с ошибкой обратной связи”
54
В данной схеме нейронная сеть, завершив обучение, принимает на себя управление объектом, устраняя действие контроллера обратной связи. Отметим, что образцовым регулятором в данном случае может выступать и человек-оператор. 3. Нейросетевое управление с обратной связью. Простейшая схема нейросетевого управления с обратной связью показана на рис. 2.11.
х
e
u
HC
y
OУ
Рис. 2.11. Нейросетевое управление с ОС Нейронная сеть выполняет функции регулятора замкнутой системы. Достоинствами такой схемы являются способность обеспечивать высокое качество управления при наличии неконтролируемых возмущений, а также нестационарности и неустойчивости ОУ. В данном случае задача настройки НС значительно сложнее: если при последовательной схеме управления известно, что НС должна реализовывать обратную динамику объекта, то в схеме с обратной связью оператор, который должна реализовывать НС неизвестен; ни связь, ни якобиан связи между показателем качества регулирования и параметрами НС также неизвестны. Можно обучать нейронную сеть аппроксимировать обратный оператор объекта, как это делалось для последовательного управления, однако качество управления при этом невысоко и такое обучение чаще всего используется лишь в качестве предварительного.
55
В общем случае для обучения нейронных сетей в системах управления с обратной связью приходится применять алгоритмы, не использующие аналитический вид якобиана связи критерия качества управления и весов нейронной сети. Данные алгоритмы отличаются невысокой скоростью работы. Значительное ускорение обучения достигается при применении системы с эмулятором и контроллером (рис. 2.12).
х
е
u
HC1
y
OУ e'
HC2
Рис. 2.12. Схема обучения нейроконтроллера обратной связи через нейроэмулятор В данной схеме нейроэмулятор НС2 обучается динамике ОУ, а нейроконтроллер обратной связи НС1 настраивается через нейроэмулятор. При этом обучение нейроконтроллера через нейроэмулятор может проходить значительно быстрее, чем непосредственно на объекте управления 4. Схема с обычным контроллером, управляемым нейронной сетью. В системе, приведенной на рис. 2.13 нейронная сеть используется для настройки
параметров
регулятора) [2.1, 2.37].
обычного
контроллера
(например,
ПИД-
56
HC
е
х
Обычный регулятор
u
y
OУ
Рис. 2.13. Схема, в которой нейронная сеть используется для настройки параметров обычного регулятора Данная схема получила название “схема нейросетевого управления с самонастройкой”. Несмотря на большое количество достоинств, системам управления на основе нейронных сетей свойственен и целый ряд недостатков. При оптимизации весов НС возникает проблема остановки
1. алгоритма
обучения
необходимости
в
локальном
применения
минимуме,
алгоритмов
что
глобальной
приводит
к
оптимизации,
которые работают достаточно медленно. Отсутствует строгая теория по выбору типа и архитектуры
2. НС,
что
приводит
к
необходимости
применять
алгоритмы
самоорганизации, которые также работают достаточно медленно. Всю информацию НС получает в процессе обучения, и
3.
никакую априорную информацию ввести в нейронную сеть невозможно. Обобщая указанное выше, можно отметить, что нейросетевые регуляторы имеют в ряде случаев неприемлемо длительное время обучения [2.2]. Известно несколько способов ускорения процесса обучения.
57
Встраивание знаний о структуре объекта управления в
1.
нейронные сети. Часто имеется априорная информация об объекте управления, которую можно учитывать в так называемых нечетких (гибридных) нейронных сетях, при этом данная информация не обязательно должна быть формализована, а может быть представлена в удобной для человека форме. Предварительное обучение. Перед процессом оперативного
2.
обучения нейронная сеть может быть предварительно обучена на объекте управления или его модели, что позволяет значительно сократить время обучения. Использование эффективных нейросетевых парадигм. Выше
3.
рассматривались системы управления, основанные на многослойных нейронных сетях прямого распространения, обучаемых с помощью алгоритма обратного распространения. Существует большое разнообразие типов нейронных сетей и способов их обучения, применение которых, возможно, позволит создать более эффективные системы нейросетевого управления. Эффективные
4. нейросетевых
систем
структуры
управления.
и
Выше
методы
построения
рассмотрено
несколько
известных структур нейросетевого управления, но возможно, существуют более эффективные подходы к их построению.
58
2.3. Применение эволюционных методов в системах управления Эволюционные методы, как и нейронные сети, позволяют решать вспомогательные задачи теории управления, не привлекая такие базовые понятия как интеграл, дифференциал, передаточная функция динамического звена и т.п. Приведем основные сведения об эволюционных методах [2.38]. В эволюционных методах вначале создается множество случайно сформированных объектов с заданной структурой (такое множество называется популяцией объектов) и функция, определяющая близость объекта к истинному решению, называемая функцией цены. Далее все эволюционные методы работают по общей схеме: определяется цена объектов в популяции, с учетом цены и при внесении элемента случайности создаются объекты для популяции следующей итерации. Данный процесс повторяется либо до получения решения, либо до окончания времени отведенного на решение. Популяция имеет "память" – в ней накапливаются лучшие результаты предыдущих итераций, и этим эволюционные методы отличаются от других методов случайного поиска. В создании нового объекта популяции обычно участвуют два существующих объекта, от каждого из которых новый объект отбирает часть свойств; этот процесс называется скрещивание или кроссовер. При кроссовере, кроме того, исходные объекты подвергаются некоторому случайному изменению – мутации. Иногда используется так называемая стратегия элитизма, при которой несколько лучших особей переходят в следующее поколение без изменений, не участвуя в кроссовере и отборе. Эволюционные методы представляют собой модель биологического процесса эволюции: в популяции идет борьба за существование; с течением времени объекты совершенствуются и выживают сильнейшие.
59
В литературе направление исследований, объединяющее различные эволюционные методы, получило название "эволюционные вычисления" [2.39, 2.40]. Обычно все алгоритмы эволюционных вычислений состоят из следующих шагов: 1) задается структура объектов, функция цены и условия останова; 2) создается популяция объектов P; 3) с помощью функции цены из популяции P выбирается множество лучших объектов; 4) с помощью операторов, поддерживающих эволюцию, из выбранных объектов создаются новые – претенденты на включение в следующую популяцию; 5) образуется новая популяция P из отобранных на четвертом шаге объектов; 6) шаги 3-5 повторяются до выполнения условия останова; 7) если итерации завершены успешно, то из итоговой популяции выделяется
объект с высшей ценой, который является искомым решением. Иначе выдается сообщение о невозможности получить решение. Объектами популяции могут быть структуры данных, автоматы, программы. Функция цены выбирается так, чтобы наибольшую цену имели объекты, лучше всего соответствующие целям эволюции. Широкому распространению эволюционных вычислений способствует три причины. 1. Данные алгоритмы для многих типов задач показали свою эффективность по сравнению с другими методами. 2. Естественный отбор устраняет необходимость заранее учитывать все особенности решения задачи. Можно успешно решать задачи, структуру решения которых программист не знает. Существует много примеров решения с помощью эволюционных вычислений многих практических задач
60
(задача коммивояжера, задачи распределения ресурсов; решение задач в реальном времени, связанных с управлением движущимися объектами). 3. Высокий параллелизм алгоритмов данного типа. Каждый объект популяции может обрабатываться независимо, что при применении мультипроцессорных компьютеров позволит достигать очень высоких скоростей работы. Эволюционные методы целесообразно применять, если задачи трудно формализуемы или требуется быстро получить грубый результат для принятия решений в реальном времени. Типичными представителями эволюционных вычислений являются: генетические
алгоритмы,
эволюционные
стратегии
и
генетическое
программирование. Отличие генетических алгоритмов [2.40, 2.41] и эволюционных стратегий [2.42-2.44] состоит в том, что в первых элементами популяций являются цепочки генов, а во вторых – действительные числа, являющиеся решениями задачи. Данные два направления очень близки между собой и иногда не различаются. Генетическое программирование – это способ создания компьютерных программ для задач, алгоритм решения которых неизвестен заранее. Здесь объектом эволюции являются программы. Популяция состоит из нескольких различных программ. Задаются функция цены и действие эволюционных операторов, модифицирующих программы. Программы обычно пишутся на языке Лисп [2.45-2.48]. Рассмотрим более подробно генетические алгоритмы [2.1, 2.49-2.51]. В генетике эволюция описывается как процесс воздействия нескольких видов возмущений на генетический материал – хромосомы. Хромосому можно в первом приближении рассматривать как цепочку генов. Каждый из них ответственен за определенные свойства организма. В процессе эволюции хромосомы подвергаются в основном двум видам возмущений (операторов):
61
кроссовер и мутация. Мутации случайным образом изменяют случайно выбранные гены в хромосоме. При кроссовере в двух хромосомах выбирается точка скрещивания, и затем происходит обмен частей хромосомродителей с образованием двух потомков. Возможны и более сложные реализации кроссовера с несколькими точками
скрещивания.
Иногда
применяется
инверсия
–
изменение
расположения генов. В качестве генов обычно используются двоичные цепочки. Иногда вместо двоичных цепочек используют цепочки в ячейках, которых расположены произвольные целые числа. На
рис.
2.14
показан
механизм
функционирования
основных
генетических операторов [2.1].
Рис. 2.14. Генетические операторы Сейчас превалируют гаплоидные алгоритмы с одной хромосомой, но для нестационарных сред и сложных систем могут быть полезны диплоидные или полиплоидные алгоритмы со сложным набором хромосом.
62
Иногда используются ламарковские генетические алгоритмы: в них цепочки дополнительно трансформируются во
время жизни между
применением генетических операторов. Применение таких схем иногда позволяет решать трудные для традиционных генетических алгоритмов задачи [2.52]. Существует много модификаций генетических алгоритмов, в связи с чем возникает задача сравнения эффективности разных методов. Чаще всего это удается сделать лишь прямым экспериментом на реальной или модельной задаче. В теоретических моделях генетические алгоритмы рассматриваются чаще всего как марковские процессы [2.53, 2.54]. В
качестве
примера
использования
генетических
алгоритмов,
рассмотрим задачу нахождение глобального экстремума. Задача нахождения глобального экстремума функций нескольких переменных имеет центральное значение в теории управления, по сути, к ней сводятся
задачи
синтеза
оптимальных
регуляторов
и
управляющих
воздействий, идентификации объектов и адаптации. Пусть имеется некоторая целевая функция от многих переменных
f (x1, x 2 , ..., x n ) , для которой необходимо найти глобальный максимум или минимум. Представим независимые переменные в виде хромосом. Для этого выполним кодирование независимых переменных в двоичной форме, используя m бит для каждого параметра (см. рис. 2.15).
63
x1 1
0
1
2
x2
...
1
1
1
m
1
2
...
xn
. . .
0 m
0
0
1
2
...
1 m
Рис. 2.15. Структура хромосомы Особенно хороший результат дает представление хромосом, в двоичном формате с использованием кода Грея. Код Грея имеет явные преимущества по сравнению с двоично-десятичным кодом, который при некотором стечении обстоятельств порождает своеобразные тупики для поискового
процесса
[2.1].
Далее
работа
генетического
алгоритма
оптимизации аналогична изложенной выше. Отметим, что кроме генетических алгоритмов известно несколько способов решения задач
глобальной
оптимизации: полный
перебор
возможных решений, случайный поиск (метод Моте-Карло), локально градиентный (случайный наброс в сочетании с локальной оптимизацией), использование аналогий с физическими системами (метод моделирования отжига) [2.50, 2.55]. По скорости определения оптимума целевой функции генетические алгоритмы на несколько порядков превосходят случайный поиск. Поскольку аналитические методы исследования скорости сходимости наталкиваются в этой области на серьезные проблемы, была разработана целая
система
тестовых
задач,
предназначенная
для
выявления
относительной эффективности различных методов глобальной оптимизации [2.1, 2.56, 2.57]. В частности показаны уникальные способности генетических алгоритмов в решении задач оптимизации.
64
В то же время многие исследователи подчеркивают, что применение генетических алгоритмов требует значительных усилий при настройке под конкретную задачу параметров алгоритма. В работе [2.1] высказана идея об адекватности сложности решаемой задачи и алгоритма решения, суть которой состоит в том, что чем проще задача, тем бессмысленнее становится подбирать кодировки генотипа и настраивать вероятности. В пределе, если целевая функция является гладкой и одноэкстремальной, применение генетических алгоритмов теряет всякий смысл, так как известные методы локальной оптимизации найдут решение быстрее и проще. Отсюда возникла идея гибридных алгоритмов, в которых вначале с помощью
генетического
алгоритма
находится
область
локализации
глобального экстремума, а затем используется метод локальной оптимизации (например, градиентный) [2.6]. В настоящее время большинство исследователей, признают, что генетические алгоритмы – один из самых эффективных методов решения задач многоэкстремальной оптимизации [2.1, 2.6, 2.58]. Литература к главе 2 2.1. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной
реальности
/
Г.К.Вороновский,
К.В.Махотило,
С.Н.Петрашев, С.А.Сергеев. Харьков: Основа, 1997. 2.2. Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения. Кн. 2 / Общая ред. А.И.Галушкина. М.: ИРПЖР, 2000. 2.3.
Интеллектуальные системы автоматического управления / Под. ред. И.М.Макарова, В.М.Лохина. М.: Физматлит, 2001.
2.4.
Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия – ТЕЛЕКОМ, 2001.
65
2.5.
Круглов
В.В.,
Дли
М.И.,
Голунов
Р.Ю.
Нечеткая
логика
и
искусственные нейронные сети. М.: Физматлит, 2001. 2.6.
Осовский С. Нейронные сети для обработки информации / М.: Финансы и статистика, 2002.
2.7.
Медведев В.С., Потемкин В.Г. Нейронные сети. MATLAB 6. М.: ДИАЛОГ-МИФИ, 2002.
2.8.
Галушкин А.И. Теория нейронных сетей. Кн. 1 / Общая ред. А. И. Галушкина. М.: ИРПЖР, 2000.
2.9.
Галушкин А.И. Нейрокомпьютеры. Кн. 3 / Общая ред. А. И. Галушкина. М.: ИРПЖР, 2000.
2.10. Гoрбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996. 2.11. Нейроноинформатика / А. Н. Горбань, В. Л.Дунин-Барковский, Е. М. Миркес и др. Новосибирск: Наука, 1998. 2.12. Уоссермен Ф. Нейрокомпьютерная техника. М.: Мир, 1992. 2.13. Хехт-Нильсен Р. Нейрокомпьютинг: история, состояние, перспективы // Открытые системы. 1998. № 4. 2.14. Галушкин А.И. Современные направления развития нейрокомпьютеров //
Зарубежная
радиоэлектроника.
Успехи
современной
радиоэлектроники. 1998. № 1. 2.15. Миркес Е.М. Нейрокомпьютер. Проект стандарта. Новосибирск: Наука, 1998. 2.16. Круглов В.В., Борисов В.В. Гибридные нейронные сети. Смоленск: Русич, 2001. 2.17. Hecht-Nielsen R. Kolmogorov’s Mapping Neural Network Existence Theorem // IEEE First Annual Int. Conf. On Neural Networks, San Diego, 1987. Vol. 3, Р. 11-13. 2.18. Muller B., Reinhart J. Neural Networks: an introduction, Springer-Verlag. Berlin: Heidelberg, 1990.
66
2.19. Cybenko G. Approximation by superposition of a sigmoidal function // Mathematics of Control, Signals and Systems. 1989. Vol. 2. Р. 303-314. 2.20. Hornik K., Stinchcombe M., Wite H. Multilayer Feedforward Networks are Universal Approximators // Neural Networks. 1989. Vol. 2. Р. 359-366. 2.21. Sandberg I.W. Approximation for Nonlinear Functionals // IEEE Trans on Circuits and System. 1: Fundamental Theory and Applications, Jap. 1992. Vol. 39. № 1. Р. 65-67. 2.22. Widrow B., Steains S.D. Adaptive Signal Processing, Prentice – Hall, Englewood Cliffs, New Jersey, 1985. 2.23. Kuperstein M., Rubinstein J. Implementation of an adaptive neural controller for sensory-motor co-ordination // IEEE Control Systems Magazine. 1989. Vol. 9. P. 25-30 2.24. Srinivasan V., Barto A.C., Ydstie B.E. Pattern recognition and feedback via parallel distributed processing. Annual Meeting of the American Institute of Chemical Engineers. Washington D.C. 1988. 2.25. Sanner R.M., Akin D.L. Neuromorphic pitch attitude regulation of an underwater telerobot. // IEEE Control Systems Magazine. 1990. Vol. 10. P. 62-68. 2.26. Psaltis D., Sideris A., Yamamura A. A Multilayered neural network controller // IEEE Control Systems Magazine. 1988. Vol. 8. P. 17-21. 2.27. Saertns R.M., Soquet A. A neural controller based on back propagation algorithm // Proc. of First IEE Int. Conf. on Artificial Neural Networks. London. 1989. P. 211-215. 2.28. Werbos P.J. Overview of designs and capabilities. // Neural Networks for Control. MIT Press. Cambridge. MA. 1990. P. 59-65. 2.29. Jordan M.I. Generic constraints on underspecified target trajectories // Proc. of Int. Joint Cont. on Neural Networks (IJCNN). Washington. 1989. Vol. 1. P. 217-225
67
2.30. Jordan M.I., Rumelhart D.E. Forward models: Supervised learning with a distal teacher // Cognitive Science. 1990. Vol. 16. P. 313-355. 2.31. Narendra K.S., Parthasarathy K. Identification and control of dynamical systems using Neural Networks // IEEE Trans. On Neural Networks. 1990. Vol. 1. P. 4-27. 2.32. Ngugen D.H., Widrow B. Neural Networks for selflearning control systems // IEEE Control Systems Magazine. 1990. Vol. 10. P. 18-23. 2.33. Gomi H., Kawato M. Neural Network control for a closed loop system using feedback error learning // Neural Networks. 1993. Vol. 6. P. 933946. 2.34. Suboptimal control for a non – linear system using neural networks / H. Kinjo, S.Omatu, T.Yamamoto, S.Tamaki // Proc. of lest Asian Control Conference. Tokyo. 1994. P. 551-554. 2.35. Kawato M., Furukawa K., Suzuki R. A hierarchical neural network model for control and learning of voluntary movement // Biological Cybernetics. 1987. Vol. 57. P. 169-185. 2.36. Hierarchical neural network model for voluntary movement with application to robotics / M. Kawato, Y. Uno, M. Isobe, R. Suzuki // IEEE Control Systems Magazine. 1988. Vol. 8. P. 8-16. 2.37. Saiful A., Omatu S. Neuromorphic self-tuning PID controller // Proc. of IEEE ICNN. San Francisco. 1993. P. 552-557. 2.38. Стецюра Г.Г. Эволюционные методы в задачах управления, выбора и оптимизации // Приборы и системы управления. 1998. № 3. С. 54-62. 2.39. Michalewicz Z. A perspective on evolutionary computation. // Progress in evolutionary computation. 1995. P. 73-89. 2.40. Холланд Дж. Генетические алгоритмы // В мире науки. 1992. № 9. С. 32-40. 2.41. Mitchell M. An introduction to genetic algorithms. MIT Press, 1996.
68
2.42. Schwefel H.-P. On the evolution of evolutionary / In Computational intelligence: imitating life // IEEE press. 1994. P. 246-260. 2.43. Schwefel H.-P. Evolution and optimum searching: Wiley, 1995. 2.44. Juille H. Incremental co-evolution of organisms: a new approach for optimization and discovery of strategies // Computers. 1995. Vol. 14. № 5. P. 246-260. 2.45. Koza J. GP2: automatic discovery of reusable programs. MIT press, 1994. 2.46. Robinson G., Mcilroy P. Exploring some commercial applications on genetic programming // LNCS. 1995. Vol. 993. P. 234-241. 2.47. Wong M.L., Leung K.S. The genetic logic programming system // IEEE Expert. 1995. Oct. P. 68-76. 2.48. Bolte A., Thonemann U. Optimizing simulated annealing schedules with genetic programming // European Journal. of operational research. 1996. № 2. P. 402-416. 2.49. Holland J.H. Adaptation in natural and artificial systems. An introductory analysis with application to biology, control and artificial intelligence. London: Bradford book edition, 1994. 2.50. Змитрович А.И. Интеллектуальные информационные системы. Минск: НТООО ТерраСистемс, 1997. 2.51. Курейчик В.М. Генетические алгоритмы. Обзор и состояние. // Новости искусственного интеллекта. 1998. № 3. 2.52. Tajima K. Genetic algorithms and their practical application // FUJITSU Sci. Tech. Journ. 1996. Vol. 32. № 2. P. 271-286. 2.53. Reynolds D., Gomatam J. Stochastic modeling of genetic algorithms // Artificial Intelligence. 1996. Vol. 82. № 1. P. 303-330. 2.54. Reynolds D., Gomatam J. Similarities and distinctions in sampling strategies for genetic algorithms // Ibid. 1996. Vol. 86. № 2. P. 375-390. 2.55. Стронгин Р.Г. Численные методы в многоэкстремальных задачах. М.: Наука, 1978.
69
2.56. Wang P. Continuous optimization by a variant of simulated annealing // Computational optimization and applications. 1996. Vol. 6. № 1. P. 59-71. 2.57. Whitley D. et al. Evaluating evolutionary algorithms // Artificial Intelligence. 1996. Vol. 85. № 1. P. 245-276. 2.58. Скурихин А.Н. Генетические алгоритмы // Новости искусственного интеллекта. 1995. № 4. С. 6-46.
70
3. ПРИМЕНЕНИЕ НЕЧЕТКОЙ ЛОГИКИ И ЭКСПЕРТНЫХ СИСТЕМ В ЗАДАЧАХ УПРАВЛЕНИЯ 3.1. Системы управления на основе методов нечеткой логики Предпосылкой
разработки
теории
нечетких
множеств
является
принцип несовместимости, согласно которому сложность системы и точность, с которой ее можно описать традиционными математическими методами, по своей сути противоречивы друг другу [3.1, 3.2]. Методы нечеткой логики позволяют строить логико-лингвистические модели, отражающие общую смысловую постановку задачи, используя качественные представления соответствующие "человеческим" способам рассуждений и принятия решений. Рассмотрим основные понятия теории нечетких множеств [3.3 – 3.20]. Пусть А – некоторое подмножество универсального множества Е, а х – элемент множества Е. В обычной (четкой) теории множеств функция принадлежности элемента х подмножеству А может принимать два значения: A
(x ) = 1, если х
Аи
A
(x ) = 0, если х
А. В теории нечетких множеств
функция принадлежности элемента х подмножеству А может принимать любые значения на отрезке [0, 1] т.е.
A
(x )
[0, 1], при этом подмножество А
называют нечетким. Рассмотрим поясняющий пример. Пусть Е=R1 – множество действительных чисел, тогда нечеткие множества: “большой отрицательный”, “приблизительно нулевой”, “большой
71
положительный” могут быть определены функциями принадлежности, приведенными на рис. 3.1. Замечание. В виду сложившихся традиций в рассматриваемой теории вместо термина “нечеткое подмножество” используют термин “нечеткое множество”. (x )
(x )
(x )
(x )
(x )
(x )
1
1
-a
N
x
1
-a
a
x
a
x
P
ZE
Рис. 3.1. Функции принадлежности нечетких множеств: “большой отрицательный” (N), “приблизительно нулевой” (ZE), “большой положительный” (P) Для
определения
вида
функций
принадлежности
разработаны
различные экспертные методы. В ряде случаев используют типовые формы функций принадлежности, тогда методом экспертных оценок определяется тип функций принадлежности и их параметры. Приведем некоторые типовые виды функций принадлежности. Кусочно-линейные функции принадлежности могут описываться уравнениями:
Z (x)
1
x a / , при x a 0, при x a
,
,
(3.1а)
72
N (x)
1
Z ( x ),
P (x)
при x
0,
0, при x
0,
1
при x
Z ( x ),
0, при x
(3.1б)
0,
0.
(3.1в) На рис. 3.2 приведен вид графиков функций принадлежности а) (3.1б), б) – (3.1а) и в) – (3.1в) соответственно, при a
0и
–
1.
Рис. 3.2. Кусочно-линейные функции принадлежности Показательные (Пуассона) функции принадлежности описываются уравнениями:
Z (x)
N (x)
P (x)
1
e
x a/
Z ( x ),
при x
0, при x
1
Z ( x ),
0,
0,
при x
0, при x
(3.2а)
,
0.
0,
(3.2б)
(3.2в)
73
На рис. 3.3 приведен вид графиков функций принадлежности а) – (3.2б), б) – (3.2а) и в) – (3.2в) соответственно, при a
0и
1.
Рис. 3.3. Показательные функции принадлежности
Гауссовы функции принадлежности описываются уравнениями:
Z (x)
N (x)
P (x)
1
e
x a
2
Z ( x ),
/
при x
0, при x
1
Z ( x ),
(3.3а)
,
(3.3б)
0,
при x
0, при x
0,
0,
(3.3в)
0.
На рис. 3.4 приведен вид графиков функций принадлежности а) – (3.3б), б) – (3.3а) и в) – (3.3в) соответственно, при a
0и
1.
74
Рис. 3.4. Гауссовы функции принадлежности По аналогии с обычной теорией множеств в теории нечетких множеств вводятся логические операции над множествами [3.7, 3.20 - 3.25]. Пусть А и В – нечеткие множества на универсальном множестве Е. 1. Равенство: А = В. А и В равны, если
x
E
2. Дополнение (отрицание):
A (x) =
А
B (x)
В
Обычно принимают, что операция, осуществляемая над функцией принадлежности
при
нахождении
дополнения
A (x) = n
(x) должны
обладать свойствами: 1) n[0] = 1 и n[1] = 0; 2) n[ ] – невозрастающая функция. Чаще всего функция дополнения определяется следующим образом:
x E
A ( x)
1
B ( x) ,
очевидно в этом случае А = В и В = А. 3. Пересечение:
A
B – наибольшее нечеткое подмножество,
содержащее одновременно А и В. Обычно функции принадлежности операции пересечения определяются в классе Т-норм, удовлетворяющих следующим свойствам: 1) T(0, 0)
0 ; T(
A , 1)
A;
T(1,
A)
A
– ограниченность;
75
2) T(
A,
B)
T(
C,
D),
3) T(
A,
B)
T(
B,
A)
4) T(
A , T( B ,
C ))
если
A
и
C
B
D
– монотонность;
– коммутативность;
T (T (
A,
B ),
C)
– ассоциативность.
Простейшие примеры операции пересечение:
min(
АВ
АВ
A,
(3.4)
B;
A
max( 0,
АВ
B );
A
B
(3.5)
1).
(3.6)
Более сложным примером является:
АВ (S)
При S
log S (1 (S
1) (S
A
B
1) /(S 1)), 0 S
0 выражение (3.7) совпадает с (3.4), при S
(3.5) и при S
.
(3.7)
1 совпадает с
совпадает с (3.6).
4. Объединение
A
– наименьшее нечеткое подмножество,
B
включающее как А так и В. Обычно функции принадлежности операции объединения определяют в классе Т-конорм (называемых также S-нормами). Определение Т-конорм основано на соотношении:
S(
A,
B)
1 T(1
A,1
B ).
T-конормы удовлетворяют следующим свойствам: 1) T(1, 1) 1; T(
A ,0)
A;
T(0,
A)
A
– ограниченность;
(3.8)
76
2) свойства аналогичные свойствам 2- 4 для Т-норм. Простейшими примерами операции объединения являются:
max(
А В
А В
А В
A
A,
B
min( 1,
B );
A
(3.9)
B;
(3.10)
B ).
A
(3.11)
Более сложным примером является:
А В (S)
1 log S (1 (S1
A
1) (S1
B
1) /(S 1)), 0 S
. (3.12)
Выражение (3.12) – аналог выражения (3.7) для Т-норм. При S (3.10) и при S Иногда
0 выражение (3.12) совпадает с (3.4), при S
1 совпадает с
совпадает с (3.11). функции
принадлежности
операций
пересечения
и
объединения определяют операторами более сложными, чем Т-нормы и Тконормы. В качестве примера приведем два варианта так называемого
-
оператора:
( 1,
2)
(
2)
1,
T T( 1 ,
(1
) T(
2)
1
1,
2)
; S( 1,
S(
2)
1,
2 ).
,
(3.13)
(3.14)
77
Очевидно, что при 1
( 1,
2)
( 1,
0
( 1,
2)
S( 1 ,
2)
( 1,
2)
2),
T( 1 ,
а при
2 ).
Применение различных видов операторов дополнения, объединения и пересечения,
позволяет
учесть
разнообразные
смысловые
оттенки
соответствующих им связок «НЕ», «И», и «ИЛИ» [3.7, 3.21 - 3.25]. Отметим, что применение операций min и max (см. выражения (3.4) и (3.9)) в качестве пересечения и объединения позволяет для нечетких множеств сохранить большинство свойств, известных из теории обычных множеств. В частности, в этом случае для нечетких множеств выполняются следующие свойства. Пусть А, В, С – нечеткие множества, тогда: 1)
2)
3)
4)
A
B
B
A
A
B
B
A
(A
B)
C
A
(B
C)
(A
B)
C
A
(B
C)
– коммутативность;
– ассоциативность;
A
A
A
A
A
A
A
(B
C)
(A
B)
(A
C)
A
(B
C)
(A
B)
(A
C)
= A, где
5) A x
6) A
– идемпотентность;
– дистрибутивность;
- пустое множество, т.е.
( x)
0 при
E;
=
;
7) A E = A, где E – универсальное множество, на котором определено А; 8) A E = E;
78
9)
A
B
A
B
A
B
A
B
– теоремы де Моргана.
В отличие от четких множеств, для нечетких множеств в общем случае:
Рассмотрим
понятия
A
A
,
A
A
E
нечеткой
и
лингвистической
переменных,
используемые при описании объектов и явлений с помощью теории нечетких множеств. Нечеткой переменной называют набор <
, X, A >, где
наименование переменной, Х – область определения
– (универсальное
множество), А – нечеткое множество на Х, описывающие ограничения на значения нечеткой переменной
(т.е.
A ( x ) ).
Если областью определения нечеткой переменной является множество действительных чисел Х = R, то такая нечеткая переменная называется действительным нечетким числом. Лингвистической переменной называют набор < , T, X, G, M >, где – наименование лингвистической переменной, Т – множество значений лингвистической
переменной
(терм-множество),
множество (область определения
),
Х
–
универсальное
G – синтаксическая процедура,
позволяющая оперировать элементами терм-множества Т, М – семантическая процедура,
позволяющая
превратить
каждое
новое
значение
лингвистической переменной, образуемое процедурой G, в нечеткую переменную. Пример.
Лингвистическая
переменная
“сигнал”
определена
на
множестве действительных чисел Х=R1 может принимать значения нечетких чисел «большой отрицательный», «приблизительно нулевой», «большой положительный» с функциями принадлежности, приведенными на рис. 3.1. Перейдем к рассмотрению нечеткого логического вывода.
79
Механизм нечеткого логического вывода в своей основе имеет базу знаний,
формируемую
специалистами
предметной
области
в
виде
совокупности нечетких продукционных правил:
если x есть А, то z есть С, где A и C – это нечеткие переменные, определяемые соответствующими функциями принадлежности. Отметим, что А идентифицируется n-мерной
функцией принадлежности (n – размерность вектора x ). Часть правила " x есть А" называется условием или предпосылкой, а "то z есть С" – следствием или заключением. Отметим, что предпосылки нечетких правил, обычно записываются отдельно для каждой компоненты вектора x , c использованием одномерных нечетких переменных. Например, в форме Мамдани (Mamdani) нечеткие продукционные правила имеют вид: если x1 есть А1 и если x2 есть А2 и … и если xn есть Аn , то z есть С, при этом, очевидно, A A1
A2
...
(3.15)
An .
Нечеткий логический вывод – это алгоритм, позволяющий на основании базы знаний из совокупности нечетких продукционных правил по заданному x x 0 определить заключение z z 0 . Проиллюстрируем механизм нечеткого логического вывода на примере вычисления значений некоторой функции z = f(x, y). Допустим, имеется база знаний состоящая из двух правил: П1: если х есть А1 и y есть В1, то z есть С1, П2: если х есть А2 и y есть В2, то z есть С2,
80
где Аi, Bi, Ci – нечеткие переменные, определенные на х, у, z и имеющие функции принадлежности
Аi
(x) ,
и
Bi ( x )
Ci ( x )
соответственно.
Отметим, что рассматриваемая задача легко обобщается на случай произвольного числа входных переменных и продукционных правил. Требуется: по конкретным значениям х = х0 и у = у0 определить z0. Логический вывод осуществляется за следующие четыре этапа. 1. Введение нечеткости (фаззификация, fuzzification). Для четко заданных входных значений рассчитываются принадлежности к отдельным термам. Для рассматриваемого примера определяют численные значения Ai
(x 0 ),
Ai
( y 0 ), i 1, 2.
2. Нечеткая импликация. Находят функции принадлежности предпосылок каждого отдельного правила при конкретных входных сигналах х0 и у0. Ai ( x 0 )
(i)
Bi ( y0 ),
i
1, 2.
Затем находят результирующие функции принадлежности каждого правила i (z)
3. Нечеткая
i
композиция.
Ci (z),
i
Находится
1, 2.
результирующая
функция
принадлежности всей совокупности правил при входных сигналах х0 и у0. ( z)
1 ( z)
2 ( z)
4. Приведение к четкости (дефаззификация, defuzzification). Используется,
если
необходимо
преобразовать
выходную
функцию
принадлежности в конкретное четкое число z0. Имеется большое количество методов дефаззификации, одним из наиболее распространенных является центроидный:
z z0
(z) z
R
(z) z R
.
(3.16)
81
Если в приведенном выше алгоритме логические операции пересечение реализуется как min (см. выражение (3.4)), а объединение как max (см. выражение (3.9)), то данный алгоритм называется алгоритмом Мамдани (в некоторых источниках алгоритмом Мамдани-Заде) [3.3, 3.4]; его графическая иллюстрация приведена на рис. 3.5.
A1
B1
C1
x A2
y B2
x0
x
z C2
y0
y
z
z0
z
Рис. 3.5. Иллюстрация работы алгоритма Мамдани На практике широкое распространение получил алгоритм нечеткого логического вывода Сугэно (Sugeno), в некоторых источниках известный как алгоритм Такаги-Сугено-Канга (TSK) [3.3, 3.4], отличающийся простотой вычислений. Продукционные правила в рассматриваемом алгоритме имеют вид:
82
если x1 есть А1 и если x2 есть А2 и … и если xn есть Аn , то z=f(x1, x2, … xn),
(3.17)
где f (x) f(x1, x2, … xn) – обычная четкая функция. Принципиальное отличие от алгоритма Мамдани в данном случае касается заключения, которое представляется в форме функциональной зависимости. Реализация алгоритма Сугэно состоит из трех шагов. 1. Введение нечеткости (фаззификация). Полностью аналогично алгоритму Мамдани. 2. Находятся функции принадлежности предпосылок каждого отдельного правила при конкретных входных сигналах x0 : i,
i
1, 2, ... M , где М – число продукционных правил. В классическом алгоритме Сугэно логические операции пересечение
реализуется как min (см. формулу (3.4)). 3. Определяется четкое значение выходной переменной:
M
fi (x 0 )
i
z0
i 1
,
M
(3.18)
i i 1
где i – текущий номер правила. В качестве функции f (x) часто используются полиномы 0-го или 1-го порядка:
f ( x) c .
f (x)
(3.19)
n
c
pj xj , j 1
(3.20)
83
В таких случаях обычно используют названия: алгоритм Сугэно 0-го и 1-го порядка соответственно. В алгоритме Сугэно 0-го порядка (называемом также упрощенным алгоритмом нечеткого вывода) продукционные правила имеют вид: если x1 есть А1 и если x2 есть А2 и … и если xn есть Аn , то z=сi,
(3.21)
а значение выходной переменной вычисляется по формуле:
M
ci
i
z0
i 1 M
.
(3.22)
i i 1
Отметим, что алгоритм Сугэно 0-го порядка можно интерпретировать, как частный случай алгоритма Мамдани, когда функции принадлежности заключений правил имеют вид:
i (x)
1, при x c i , 0, при x c i .
(3.23)
Графическая интерпретация алгоритма Сугэно 0-го порядка в случае двух входных переменных и базы знаний из двух продукционных правил приведена на рис. 3.6.
84
A1
B1
C1
x A2
B2
x0
x
c1
y
z
C2
y0
c2
y
z0
z
z
Рис. 3.6. Иллюстрация работы алгоритма Сугэно 0-го порядка Отметим, что известный в литературе алгоритм Ванга-Менделя [3.4] совпадает с алгоритмом Сугэно 0-го порядка, за исключением того, что степень принадлежности предпосылок правил в нем находится с помощью операции умножение (см. выражение (3.5)). Известно большое число алгоритмов нечеткого вывода, различающихся набором исходных правил, видом функций принадлежности, способами нечеткой импликации и композиции, а также методом приведения к четкости [3.3]. Рассмотрим наиболее распространенные методы приведения к четкости [3.3, 3.4].
85
Выше был приведен один из наиболее распространенных методов – центроидный (см. формулу (3.16)); обозначим результат, полученный с помощью этого метода через zc. На практике также часто встречаются: -
минимальный максимум: результат zcl – наименьшая точка, в которой
-
максимальный максимум: результат zcr – наибольшая точка, в которой
-
(z) достигает максимума;
(z) достигает максимума;
средний максимум: m
zi i 1
z CM
m
где zi – точки, в которых
, (z) принимает максимальное
значение, -
высотная дефаззификация: элементы области определения R, для которых значения функции принадлежности меньше, чем некоторый уровень
, в расчет не принимаются, четкое
значение определяется по формуле z C(z) dz z ch
C
C(z) dz
,
C
где C – нечеткое множество
уровня.
Графическая интерпретация приведенных методов деффазификации приведена на рис. 3.7.
86
(z)
zcl zc zch zcm
zcr
z
Рис. 3.7. Иллюстрация методов деффазификации Приведем еще один способ деффазификации – относительно средних центров [3.4]:
M i
Z CA
ci
i 1 M
,
(3.24)
i i 1
где
i
– значения функции принадлежности предпосылки i-го правила,
ci
z R
i ( z)
i (z)dz –
i (z)dz /
центр заключения i-го правила,
R
– функция принадлежности заключения i-го правила. Замечательной
особенностью
данного
способа
деффазификации
является, то что при его применении алгоритм с нечеткими правилами Мамдани, по сути, сводится к алгоритму Сугэно 0-го порядка. Эффективность применения аппарата нечеткой логики базируется на ряде теорем, аналогичных теоремам о полноте для нейронных сетей, смысл которых сводиться к тому, что система на основе алгоритма нечеткого вывода, при выполнении определенных, не очень жестких условий, является универсальным аппроксиматором [3.3, 3.4, 3.26].
87
Перейдем к рассмотрению регуляторов на основе нечеткой логики (нечетких логических регуляторов (НЛР)) [3.7, 3.27-3.36]. Идея работы нечеткого логического регулятора состоит в аппроксимации нелинейного оператора регулятора системой нечеткого вывода с базой данных в виде продукционных правил, определяемых специалистами в области управления данным объектом. Один из первых НЛР предложен в работах [3.37-3.39] и имеет базу данных состоящую из пяти правил: П1: если ек “большой положительный” и то
ек “приблизительно нулевой”,
Uк “большой положительный”; П2: если ек “большой отрицательный” и
то
ек “приблизительно нулевой”,
Uк “большой отрицательный”; П3: если ек “приблизительно нулевой” и
то
ек “приблизительно нулевой”,
Uк “приблизительно нулевой”; П4: если ек “приблизительно нулевой” и
то
ек “большой положительный”,
Uк “большой положительный”; П5: если ек “приблизительно нулевой” и
то где
ек “большой отрицательный”,
Uк “большой отрицательный”; ек – сигнал ошибки регулирования,
ек = ек - ек-1 – приращение сигнала ошибки регулирования, Uк = Uк – Uк-1 – приращение выходного сигнала регулятора. Функции принадлежности нечетких чисел «большой отрицательный», «приблизительно нулевой» и «большой положительный» приведены на рис. 3.1. Выходной сигнал регулятора определяется формулой:
Uк = Uк-1 +
Uк .
По сути, рассмотренный регулятор – это нечеткий ПИ-регулятор.
88
Известны также НЛР в которых используется обычный ПИД регулятор, а с помощью нечетких правил задается изменение его коэффициентов в зависимости от сигнала рассогласования [3.32 - 3.34, 3.40 - 3.43]. Нечеткий логический регулятор может иметь несколько параметров, которые настраиваются для получения наилучшего качества регулирования, однако, подавляющую часть информации, необходимой для управления он получает априорно. Известно большое количество примеров эффективного применения НЛР [3.7, 3.27 - 3.36]. Существенным недостатком НЛР является то, что набор постулируемых правил формируется экспертом-человеком и может оказаться неполным или даже
противоречивым,
вид
и
параметры
функции
принадлежности
выбираются также субъективно и могут оказаться не вполне отражающими реальную действительность. Указанные обстоятельства приводят к тому, что рассматриваемые нечеткие регуляторы в ряде случаев не позволяют получить удовлетворительного качества управления. 3.2. Регуляторы на основе нечетких нейронных сетей Основное достоинство систем с нечеткой логикой – это способность использовать условия и методы решения задач, описанные на языке, близком к естественному. Однако классическим системам с нечеткой логикой, не способным
автоматически
недостаток:
набор
обучаться,
нечетких
правил,
свойственен вид
и
и
определенный
параметры
функций
принадлежности, описывающие входные и выходные переменные системы, а также вид алгоритма нечеткого вывода выбирается субъективно экспертомчеловеком, и могут оказаться, как отмечалось, не вполне адекватными действительности.
89
Для устранения указанного недостатка был предложен аппарат нечетких нейронных сетей [3.3, 3.4]. Нечеткая нейронная сеть – это многослойная нейронная сеть, в которой слои выполняют функции элементов системы нечеткого вывода. Нейроны данной сети характеризуется набором параметров, настройка которых производится в процессе обучения, как у обычных нейронных сетей. Для примера на рис. 3.8 показана нечеткая нейронная сеть на базе алгоритма Сугэно 0-го порядка (см. формулу (3.22)). Слой 1 осуществляет фаззификацию, нелинейные функции
где i-номер продукционного правила, j-номер компоненты входного вектора x , соответствуют
функциям
принадлежности
предпосылок
ij ( x j ) ,
правил.
Настраиваемые параметры данного слоя – параметры используемых функций принадлежности. Слой 2 рассматриваемой сети осуществляет вычисление результирующих функций принадлежности предпосылок нечетких правил. В данном случае этот слой не имеет настраиваемых параметров. Слой 3, состоящий из двух нейронов, осуществляет суммирование и взвешенное суммирование выходных сигналов слоя 2. Параметрами данного слоя являются весовые коэффициенты сi. Слой 4 реализует операцию деления z=f1/f2 и не содержит настраиваемых параметров. Если в рассматриваемой сети использовать функции принадлежности ij ( x j ) гауссова
типа (см. формулу (3.3а)) с параметрами a ij и
ij ,
а для
вычисления результирующих функций принадлежности предпосылок правил (слой 2, см. рис. 3.8) – операцию умножение вместо операции минимизации (min), то приходим к достаточно распространенной нечеткой сети ВангаМенделя [3.4].
90
x1
(x1)
11
21(x1)
. . .
min
1
c1
m1 (x1)
x2
. . .
12(x2)
22(x2)
. . . m2
min
2
c2
z
(x2)
. . . xn
f1
. . .
(xn)
f2
1n
2n(xn)
. . . mn
min
m
cm
(xn)
Слой 1
Слой 2
Слой 3
Слой 4
Рис. 3.8. Нечеткая нейронная сеть на базе алгоритма Сугэно
91
Для сети Ванга-Менделя можно в аналитическом виде выразить градиент
функции ошибки от параметров сети, что позволяет для ее
обучения использовать метод обратного распространения, применяющийся в многослойных персептронах (см. параграф 2.2). Заметим, что параметры слоя 4 входят линейно в выражение для выхода сети z, и их настройка может проводиться за один шаг путем определения псевдообратной матрицы. Хорошо зарекомендовал себя гибридный алгоритм, в котором часть параметров настраиваются градиентным методом, а часть – с помощью вычисления псевдообратной матрицы. Известны также гибридные нечеткие нейронные сети, представляющие собой последовательное соединение системы нечеткого логического вывода и обычной нейронной сети, например, многослойного персептрона. Нечеткие нейронные сети могут использоваться во многих структурах нейросетевых систем управления, рассмотренных в параграфе 2.2. Следует отметить, в случае, если набор постулируемых правил нечеткой нейронной сети неадекватно описывает рассматриваемую задачу, никакой настройкой параметров добиться удовлетворительного результата не удается. Для указанного случая рядом авторов предложены адаптивные нечеткие
системы,
корректирующие
в
процессе
работы
набор
продукционных правил. В литературе описано небольшое количество идей, позволяющих строить адаптивные (самоорганизующиеся) нечеткие нейронные сети, при этом одна из наиболее распространенных базируется на аналогии между обобщенно-регрессионными нейронными сетями и нечеткими сетями ВангаМенделя, состоящей в том, что нелинейные функции, реализуемые GRNN и сетями Ванга-Менделя, при принятии одинаковых обозначений, совпадают (см. параграф 2.2). Это позволяет процесс обучения GRNN (добавление числа
92
нейронов первого слоя) интерпретировать, как процесс самоорганизации сети Ванга-Менделя. Две оригинальные идеи самоорганизации системы Ванга-Менделя содержаться в работах [3.4, 3.5].
В первом из них при поступлении очередной обучающей точки x, y определяются расстояния d i c i x , между центрами предпосылок имеющихся правил и точкой x . Если min( d1, d 2 , ... d M ) r , где r – постоянный параметр, то добавляется еще одно правило с центрами функций принадлежности в точке x и заключением z=y. Второй алгоритм отличается условием добавления нового правила, которое добавляется при выполнении неравенства y€ y e , где y€ – значение выхода сети при подаче на вход x , рассчитанное с использованием уже имеющихся продукционных правил, е – постоянный параметр, характеризующий точность аппроксимации. В настоящее время алгоритмы адаптации (самоорганизации) нечетких систем недостаточно развиты и нуждаются в дальнейшей разработке. Более подробно данные вопросы рассмотрены ниже, в главе 5. 3.3. Применение экспертных систем в системах управления Наряду использующей
с
нечеткой явное
логикой,
представление
интеллектуальной знаний,
являются
технологией, технология
экспертных систем, основанная на классической логике [3.36]. Экспертные системы могут использоваться в системах управления для организации обоснованного выбора необходимых управляющих воздействий и программно-аппаратных процедур управления в зависимости от состояния объекта управления и среды его функционирования. В классических экспертных системах вывод заключений, анализ и преобразование знаний осуществляется на основе формальных логических методов. При этом обычно
используются
следующие
строго
структурированные
формы
93
представления знаний: продукционные правила, предикаты, семантические сети и фреймообразные структуры. Все эти формы отличает наглядность знаний, представляемых в понятном и привычном для человека виде. К факторам, ограничивающим возможности экспертных систем можно отнести следующее: невысокое быстродействие, большие объемы необходимых знаний и памяти для их хранения [3.36]. На
рис.
3.9
представлена
система
управления
с
экспертным
регулятором [3.44, 3.45].
ЭС x
Регулятор
БИ u
ОУ
y
Рис. 3.9. Система управления с экспертным регулятором В системе на рис. 3.9 кроме основного контура управления включающего регулятор и объект управления ОУ, присутствует также интеллектуальный контур, содержащий блок идентификации объекта управления БИ и экспертную систему ЭС, которая автоматически подстраивает алгоритмы работы регулятора и идентификатора в зависимости от характеристик окружающей среды и объекта управления. Основной проблемой при создании экспертных регуляторов является разработка базы знаний о предметной области – теории автоматического управления. В работах [3.36, 3.44, 3.45] сделана попытка формализовать знания об областях использования алгоритмов идентификации и алгоритмов синтеза регуляторов.
94
Недостатком классических экспертных систем является их низкое быстродействие. Выходом из положения может служить применение гибридных интеллектуальных технологий, сочетающих в себе различные методы. Так, в работе [3.36] рассмотрена двухуровневый экспертный регулятор, в котором на верхнем уровне находится традиционная экспертная система, работающая в режиме off-line, а на более низком – нейросетевые идентификатор
и
интеллектуальная
надстройка
над
регулятором,
работающие в оперативном режиме on-line. Отдельный класс экспертных регуляторов – самообучающиеся, способные сами организовывать и пополнять базу знаний экспертной системы. В классических самообучающихся экспертных системах выделение аналогий происходит на структурно понятийном уровне. Инструментом для анализа
сложных
структурированных
представлений
служат
методы
правдоподобного вывода, основанные на использовании индуктивной логики Дж. Милля и позволяющие выдвигать обоснованные гипотезы о причинноследственных связях между наличием некоторых фактов и сопутствующих им явлений. В настоящее время наиболее перспективным представляется подход к самообучению экспертных систем, состоящий в использовании алгоритмов кластеризации на базе нейронных сетей, нечеткой логики или генетических алгоритмов [3.46, 3.47]. 3.4. Выводы по обзору литературных источников Приведенный в главах 1-3 обзор позволяет сформулировать следующее заключение. Системы управления, выполненные по традиционным принципам, не использующим современные информационные технологии, хотя и являются
95
в настоящее время наиболее распространенными, в ряде случаев не позволяют осуществлять качественное управление сложными объектами. Появившиеся
сравнительно
недавно
интеллектуальные
системы
управления, в которых применяются указанные выше технологии, такие как нейронные сети, генетические алгоритмы, нечеткая логика и экспертные системы показали свою высокую эффективность на практике. Каждая из информационных технологий имеет свои преимущества и недостатки. Так, нейронные сети и генетические алгоритмы способны автоматически обучатся и находить новые решения, не заложенные в них при разработке. В то же время данные технологии не позволяют использовать априорные знания людей-экспертов. Традиционные нечеткие и экспертные системы используют явное представление знаний, выраженное в удобной для человека форме, однако у них отсутствует механизм автоматического приобретения знаний. Указанное обстоятельство стимулирует разработку интеллектуальных гибридных
систем управления, использующих
сочетание нескольких
информационных технологий. Например, в качестве базовой технологии при создании таких систем можно выбрать нечеткую логику, а остальные технологии рассматривать, как надстройку, позволяющую осуществлять процесс автоматической адаптации системы управления. В свете изложенного, актуальной научно-технической проблемой представляется разработка методов анализа и синтеза гибридных систем управления на базе методов нечеткой логики. Данная общая цель может быть достигнута решением следующих задач: 1)
разработкой адаптивных систем нечеткого логического вывода для моделирования сложных динамических объектов;
2)
разработкой адаптивных структур систем управления на основе нечеткой логики;
96
3)
разработкой
методов
аналитического
исследования
систем
управления на основе нечеткой логики; 4)
разработкой эффективных алгоритмов численного исследования интеллектуальных систем управления.
Литература к главе 3
3.1.
Zaden L.A. Fuzzy sets // Information and Control. 1965. № 8. Р. 338-353.
3.2.
Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений М.: Мир, 1976.
3.3.
Круглов
В.В.,
Дли
М.И.,
Голунов
Р.Ю.
Нечеткая
логика
и
искусственные нейронные сети. М.: Физматлит, 2001. 3.4.
Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002.
3.5.
Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия – ТЕЛЕКОМ, 2001.
3.6.
Мелихов
А.Н.,
Берштейн
Л.С.,
Коровин
С.Я.
Ситуационные
советующие системы с нечеткой логикой. М.: Наука, 1990. 3.7.
Нечеткие множества в моделях управления и искусственного интеллекта / Под. ред. Д.А. Поспелова. М.: Наука, 1986.
3.8.
Поспелов
Д.А.
Логико-лингвистический
модели
в
системах
управления. М.: Энергоатомиздат, 1981. 3.9.
Поспелов Д.А. Ситуационное управление: теория и практика. М.: Наука, 1986.
3.10. Круглов В.В., Борисов В.В. Гибридные нейронные сети. Смоленск: Русич, 2001.
97
3.11. Нечеткие нейронные сети. Теория и решение военно-прикладных задач / О. В. Балашов, В. В. Борисов, В. В. Круглов, Е. В. Харитонов. Смоленск: Изд-во Военного ун-та войсковой ПВО ВС РФ, 2001. 3.12. Змитрович А. И. Интеллектуальные информационные системы. Минск: НТООО ТерраСистемс, 1997. 3.13. Кофман А. Введение в теорию нечетких множеств. М.: Радио и связь, 1982. 3.14. Прикладные нечеткие системы / Под ред. Т.Терано, К.Асаи, М.Сугэно. М.: Мир, 1993. 3.15. Трахтенгерц Э.А. Компьютерная поддержка принятия решений. М.: СИНТЕГ, 1998. 3.16. Силов В.Б. Принятие стратегических решений в нечеткой обстановке. М.: ИНПРО – РЕС, 1995. 3.17. Обработка нечеткой информации в системах принятия решений / А.Н.Борисов, А.В.Алексев, Г.В.Меркурнева и др. М.: Радио и связь, 1989. 3.18. Борисов А.Н., Крумберг О.А., Федоров И.П. Принятие решений на основе нечетких моделей: примеры использования. Рига: Зинатне, 1990. 3.19. Кофман А., Хил А.Х. Введение в теорию нечетких множеств в управление предприятием. Минск: Высшая школа, 1992. 3.20. Кандель А., Байатт У.Дж. Нечеткие множества, нечеткая алгебра, нечеткая статистика // ТИИЭР. 1978. Т. 66. № 12. С. 37-61. 3.21. Dubois D., Prade H. Fuzzy sets in approximate reasoning, part l: Inference with possibility distributions // Fuzzy Sets and Systems. 1991. № 40. Р. 143202. 3.22. Gupta M. M. J. Qi. Theory of t-norms and fuzzy inference methods // Fuzzy Sets and Systems. 1991. № 40. Р. 431-450. 3.23. Коврижкин О.Г. Интерпретация семантики нечетких операторов // Изв. АН. Техническая кибернетика. 1991. № 3. С. 63-68.
98
3.24. Коврижкин О.Г. Формирование простых компромистных правил нечеткого вывода // Изв. АН. Техническая кибернетика. 1992. № 5. С. 50-55. 3.25. Нечеткие множества и теория возможностей: последние достижения / Под ред. Р.Р.Ягера. М.: Радио и связь, 1986. 3.26. Kosko B. Fuzzy systems as universal approximations // Proceedings of lst IEEE International Conference on Fuzzy System (FUZZ_IEEE ’92), San Diego (Ca), USA. 1992. P. 153-162. 3.27. Алиев Р.А., Абдиенеев Н.М., Шахназарова М.Н. Производственные системы с искусственным интеллектом. М.: Радио и связь, 1990. 3.28. Алиев Р.А., Ульянов С.В. Нечеткие алгоритмы и системы управления. М.: Знание, 1990. 3.29. Алиев Р.А., Церковный А.Э. Интеллектуальные роботы с нечеткими базами знаний. М.: Радио и связь, 1990. 3.30. Алиев
Р.А.,
Церковный
А.Э.,
Мамедова
Г.А.
Управление
производством при нечеткой исходной информации. М.: Энергоиздат, 1991. 3.31. Новое поколение интеллектуальных регуляторов / И.М.Макаров, В.М.Лохин, Д.М.Еремин и др. // Приборы и системы управления. 1997. № 3. С. 2-6. 3.32. Захаров В.И., Ульянов С.В. Нечеткие модели интеллектуальных промышленных
регуляторов
и
систем
управления:
Научно-
организационные, технико-экономические и прикладные системы // Изв. АН. Техническая кибернетика. 1992. № 5. С. 171-196. 3.33. Захаров В.И., Ульянов С.В. Нечеткие модели интеллектуальных промышленных регуляторов и систем управления: Эволюция и принципы построения // Изв. АН. Техническая кибернетика. 1993. № 4. С. 171-196.
99
3.34. Захаров В.И., Ульянов С.В. Нечеткие модели интеллектуальных промышленных регуляторов и систем управления: Методология проектирования // Изв. АН. Техническая кибернетика. 1993. № 5. C. 197-216. 3.35. Ульянов С.В. Нечеткие модели интеллектуальных систем управления: теоретические и прикладные аспекты (обзор) // Изв. АН. Техническая кибернетика. 1991. № 3. C. 3-28. 3.36. Интеллектуальные системы автоматического управления / Под. ред. И.М.Макарова, В.М.Лохина. М.: Физматлит, 2001. 3.37. Assilian S. Artificial Intelligence Techniques in the Control of Real Dynamic Systems: Ph.D. thesis. Queen Mary College, University of London, London, UK, 1974. 3.38. Mamdani E. H. Application of fuzzy algorithm for simple dynamic plant / Proceedings IEEE 1974. № 12. P. 1585-1588. 3.39. Mamdani E. H., Assilian S. An experiment in linguistic synthesis whis a fuzzy logic controller // International Journal of Man-Machine Studies. 1975. № 7. P. 1-13. 3.40. Li M. X., Bruun P.M., Verbruggen H.B. Tuning cascade PID controllers using fuzzy logic // Mathematics and Computers in Simulation. 1994. № 37. P. 143-151. 3.41. Nauta Lemke van H.R., Krugsman A.J. Design of fuzzy PID supervisors for system with different performance requirements. In Proceedings IMACS’91. Dublin. Ireland, 1991. 3.42. Tzfestas S., Paranikolopoulos N.P. Incremental fuzzy expert PID control // IEEE Transactions on Industrial Electronics. 1990. № 5. P. 365-371. 3.43. Hsu Y.-Y., Liou K.L. Design of self-tuning PID power system stabilizers for synchronous generators // IEEE Trans. 1987. EC-2. P. 343-348.
100
3.44. Развитие
технологии
экспертных
систем
для
управления
интеллектуальными роботами / И.М.Макаров, Г.Н.Лебедев, В.М.Лохин и др. // Известия РАН. Техническая кибернетика. 1994. № 6. С. 161-176. 3.45. Применение
экспертных
регуляторов
для
систем
управления
динамическими объектами / И.М.Макаров, В.М.Лохин, Р.У.Мадыгулов и др. // Известия РАН. Техническая кибернетика. 1995. № 1. С. 5-21. 3.46. Optimization of fuzzy expert systems using genetic algorithms and neural networks / C.Perneel,
J.M.Themlin, J.M.Renders, M.Acheroy // IEEE
Transactions on Fuzzy Systems. 1995. № 3. P. 300-312. 3.47. Xue H. Applications of Genetic Algorithms in Optimization of FuzzyAssociative Memory Based Controllers: Ph. D. thesis. University of New Mexico, CAD Laboratory for Intelligent and Robotic Systems, Department of EECEy, 1994.
101
ЧАСТЬ 2 В этой части книги приведены некоторые результаты по анализу и синтезу интеллектуальных систем управления с нечеткой логикой. 4. АНАЛИТИЧЕСКОЕ ИССЛЕДОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ С НЕЧЕТКОЙ ЛОГИКОЙ 4.1. Вводные замечания Аналитические методы исследования систем управления позволяют получить связь между устойчивостью, а также показателями качества системы и ее параметрами, выраженную в аналитической форме, без привлечения численных расчетов. В настоящее время интерес к аналитическим методам в значительной степени ослаблен в связи с невозможностью с их помощью получить удовлетворительные результаты для многих практических задач. Некоторые исследователи вообще придерживаются мнения, что нет особой необходимости в разработке аналитических методов. В качестве примера приведем цитату из работы автора первой модели нечеткого логического регулятора Мамдани (Mamdani) [4.1]: “Промышленность никогда не требовала, чтобы математический анализ устойчивости являлся необходимым и достаточным условием для признания хорошо разработанной системы управления. Подобное условие – это просто желание ученых, но оно
102
не имеет никакой ценности за пределами академических кругов. Гораздо более важным, чем анализ устойчивости, является испытание прототипа; самостоятельный анализ устойчивости никогда
не может считаться
достаточным тестом. Более того, в любой практически полезной методологии этап анализа устойчивости – желательный, но только дополнительный, а отнюдь не необходимый этап”. В то же время, по всей видимости полностью отбрасывать аналитические методы исследования вряд ли целесообразно, ввиду того, что они в ряде случаев позволяют выявить наиболее “яркие” свойства изучаемых систем, что позволяет значительно уменьшить количество перебираемых вариантов на стадии проектирования, а также избежать грубых ошибок, которые могут возникнуть на этапе численного анализа. Одним из основных свойств системы, которое необходимо выяснить на стадии ее анализа, является проверка устойчивости. Объясняется это тем, что неустойчивая система не может правильно выполнять свои функции. Сформулируем для решения автономного разностного уравнения
xn
1
f (x n )
(4.1)
определение устойчивости по Ляпунову [4.2, 4.3]. Пусть состоянию покоя (равновесия) соответствует значение x уст , преобразующее (4.1) в верное тождество x n x n 1 x уст .
Если для любого сколь угодно малого положительного числа , можно указать такое положительное число
x0
, что из неравенства
x уст
( ),
(4.2)
103
где x 0 - значение вектора x n в начальный момент времени,
- евклидова
векторная норма, в силу уравнения (4.1), при n 1, 2, ... следует неравенство
xn то решение x n
x уст
,
n
(4.3)
0,
x уст уравнения (4.1) устойчиво по Ляпунову.
Если решение уравнения (4.1) устойчиво по Ляпунову и, кроме того, при любом x 0 справедливо lim x n
n
x уст ,
(4.4)
то говорят, что оно асимптотически устойчиво. При выполнении условий устойчивости для любых начальных точек
x 0 имеет место устойчивость в целом; при выполнении этих условий только для x 0 A , где А – некоторая односвязная область, имеет место устойчивость в области А. Равновесное состояние называется устойчивым в малом, если оно асимптотически устойчиво в достаточно малой своей окрестности. Аналитические методы анализа систем управления можно разделить на специализированные и универсальные. Специализированные методы анализа разрабатываются для систем конкретного узкого класса и используют особенности
изучаемых
систем
или
описывающих
их
уравнений.
Универсальные методы пригодны для анализа широких классов систем управления. Анализ литературных источников показывает, что практически все универсальные методы исследования сводятся к четырем подходам, достигшим своего наивысшего развития в 70-е годы прошлого века, см. табл.
104
4.1. В таблице кратко указаны достоинства и недостатки методов, а также приводятся ссылки на классические монографии с их описанием. Все указанные методы могут использоваться и для анализа систем с нечеткой логикой. Основной сложностью аналитического исследования устойчивости систем управления, в которых используется блоки, реализующие алгоритм нечеткого логического вывода, является существенная нелинейность данных блоков,
как
применения
правило,
не
аналитических
допускающая методов
линеаризации.
исследования
Рассмотрение
для
“обычных”
нелинейных систем позволяет предположить, что наилучшим результатом для систем управления с нечеткой логикой может быть получение "грубых", достаточно просто связанных с параметрами системы, оценок сравнительно несложными средствами. При этом литературные источники, посвященные аналитическим
методам
исследования
устойчивости
и
качества
рассматриваемых систем управления, практически отсутствуют. Следует также заметить, что в ряде случаев, математическая модель объекта управления неизвестна, и говорить в этом случае о теоретическом исследовании устойчивости системы управления не имеет смысла.
105
Таблица 4.1 Таблица приведена в конце книги
4.2. Характеристика блоков нечеткого логического вывода Ниже рассмотрен подход к анализу устойчивости систем управления с блоками нечеткого логического вывода (БНВ), при котором нелинейность данных
блоков
характеризуется
одним
параметром,
что
позволяет
определить устойчивость для всех систем, принадлежащих определенному классу. Рассмотрим блок нечеткого вывода с векторным входом x и скалярным выходом u, реализующий функциональную зависимость u ( x) .
Допустим,
для
определенности,
что
указанная
зависимость
определяется набором нечетких продукционных правил в форме Сугэно [4.9]: П1: если x1 есть А11 и x2 есть А12 и … xn есть А1n , то u=a1, П2: если x1 есть А21 и x2 есть А22 и … xn есть А2n , то u=a2, ………………………… Пm: если x1 есть Аm1 и x2 есть Аm2 и … xn есть Аmn , то u=am, где x1, x2, …, xn – компоненты вектора x ; Aij – нечеткие множества,
определенные на множестве действительных чисел R и имеющие функции принадлежности
ij ( x
j
) соответственно (i=1, 2, … m; j=1, 2, … n); a1, a2, … am
– действительные числа. Приведенные продукционные правила удобно представить в виде:
П1: если x есть А1 , то u=a1,
П2: если x есть А2 , то u=a2, …………………………
Пm: если x есть Аm , то u=am,
107
где Ai – фиктивные нечеткие множества, определенные на n-мерном множестве действительных чисел Rn и имеющие функции принадлежности 1 2 n i ( x ) min( i1 ( x ), i 2 ( x ), ... in ( x )) соответственно. Выходной сигнал БНВ u рассчитывается в соответствии алгоритмом нечеткого вывода Сугэно [4.9]:
m
u(x)
ai i 1 m
i (x)
i (x)
.
(4.5)
i 1
Критерий устойчивости системы управления с БНВ можно получить, воспользовавшись одним из методов, указанных в таблице 4.1, и аналитическим описанием БНВ (4.5). Однако указанная зависимость достаточно
сложна
для
непосредственного
построения
критерия
устойчивости, поэтому воспользуемся методом, изложенным ниже. Предположим, что зависимость u u(x) обладает свойством: u(0)
0
(в большинстве случаев добиться выполнения указанного свойства удается линейным преобразованием фазовых координат). Представим формулу (4.5) в виде: u(x)
k T (x) x ,
(4.6)
где k T ( x ) – коэффициент передачи БНВ, зависящий от входного сигнала x .
Воспользовавшись свойствами векторной нормы, можно записать [4.10]:
| u(x) |
k T (x)
x
(4.7)
108
откуда
| u(x) | x
k T (x) ,
(4.8)
что позволяет записать:
| u(x) | max x x Rn
(здесь
x
и
ниже
под
max x1 , x 2 , ... x n
max
x Rn
векторной
k T (x) .
нормой
(4.9)
понимается
l –
норма
, где n – размерность вектора x , а под
матричной нормой – максимальная строчная норма A
n
max 1 i ni 1
a ij , где a ij –
элемент матрицы A находящийся в i -й строке и j -м столбце [4.10]). В качестве характеристики нелинейной зависимости БНВ выберем параметр:
T max k (x) ,
KH
(4.10)
x Rn
Для определения которого в ряде случаев удобно воспользоваться следующей методикой. Область определения входного вектора x D разбивается на ряд
подобластей D1, D2, … DL:
D1
D2
...
DL
D . Для каждой из
подобластей определяется значение
K Hi
T max k (x) , x Di
(4.11)
109
i 1, 2, ... L . Далее параметр K H определяется в соответствии с формулой:
KH
max (K H1 , K H 2 , ... K HL ) .
(4.12)
Рассмотрим поясняющий пример. Пример 4.1. Рассмотрим БНВ, описываемый набором нечетких правил: П1: если x есть Z, то u=0, П2: если x есть PS, то u=1, П3: если x есть PM, то u=2, П4: если x есть NS, то u=-1, П5: если x есть NM, то u=-2. На рис. 4.1 приведены функции принадлежности нечетких множеств Z, PS, PM, NS и NM. м
NM
-2.5
-2
NS
-1.5
PS
Z
-1
-0.5
PM
1
0
0.5
1
1.5
2
2.5
Рис. 4.1. Функции принадлежности нечетких множеств
x
110
Выходной сигнал БНВ в данном случае определяется скалярным вариантом формулы (4.5). Разобьем область принадлежности входного сигнала x на подобласти:
D1
(2,
), D 2
(1, 2), D3
D6
( 1, 0.5), D 7
(0.5, 1), D 4
( 2, 1), D8
(
(0, 0.5), D5
( 0.5, 0),
, 2).
Для области D1 формула (4.5) принимает вид: 2 1 2 , K H1 1
u(x)
u(x) D1 x
max x
max x ( 2,
Аналогичные выкладки получаются для области D8: K H8
2 )x
1.
1.
Для области D2 получим: PS (x)
KH2
2 x,
max x D2
u(x) x
x (1, 2) x
max x
1 (2 x) 2 (x 1) (2 x) (x 1)
x 1, u ( x )
PM (x)
x и
1.
Аналогичные выкладки получаются для области D7: K H7
1.
Для области D3 будем иметь: Z ( x)
u(x)
1 x,
0 (1 x ) 1 (2 x 1) (1 x ) (2 x 1)
KH6
2x 1 x
2 1/ x и
1 x
2
u(x) D3 x
max x
2 x 1,
PS (x)
max x ( 0.5, 1)
1.
x
Аналогичные выкладки получаются для области D6: K H6
1.
Рассмотрим области D4 и D5:
u(x)
0
Z (x) Z (x)
0, K H5
u(x) D5 x
max x
0 0.5,0.5) x
max x (
0.
Подставляя частные результаты в формулу (4.12) получим: K H
1.
111
Заметим, что объем выкладок для многомерных БНВ значительно увеличивается по сравнению со скалярным случаем. Ввиду громоздкости и сложности определения значения K H для произвольного БНВ, воспользуемся его оценкой. Решая совместно (4.5), (4.6) и (4.10), получим:
m
ai KH
max
x Rn
i (x)
i 1
x
m
i (x)
.
(4.13)
i 1
Воспользовавшись свойством модуля функции [4.11], из предыдущего выражения получим:
m
ai KH
max
x Rn
i (x)
i 1
x
m
.
(4.14)
XC ,
(4.15)
i (x)
i 1
Заметим, что соотношение
m
ai
i (x)
i 1 m
i (x)
i 1
определяет, по сути, координату центра масс X C невесомого стержня с расположенными на нем грузами с массами i (x) в точках с координатами a i , где i = 1, 2, …m (дин из возможных вариантов расположения грузов на
стержне показан на рис. 4.2).
112
(x)
0
(x)
2
(x)
4
3
. . .
|a2|
. . .
|a4| |a3|
Рис. 4.2. Иллюстрация к формуле (4.15) Очевидно, что координата точки центра масс X C не может превышать координаты крайнего справа груза, имеющего массу, отличную от 0. Таким образом
XC
где 10 ( t )
max [ a1 10 ( 1 ( x)), a 2 10 (
1, при t
0,
0, при t
0.
2 ( x )), ...
a m 10 (
m ( x ))] ,
(4.16)
Сопоставляя соотношения (4.14), (4.15) и (4.16), можно записать:
KH
1 max max[ a 1 ( ( x )), a 2 10 ( 1 0 1 n x x R
2 ( x )), ...
a m 10 (
m ( x ))] .
(4.17)
Последнее выражение приводится к виду, дающему искомую оценку:
KH
€H K
a1 a2 am max( max , max , ... max ), x B1 x x B2 x x Bm x
(4.18)
113
где В1, В2, … Вm – носители нечетких множеств
А1, А2, … Аm
соответственно [4.9]. Методику использования соотношения (4.18) поясним на примерах. Пример 4.2. Рассмотрим БНВ из примера 4.1. Для правила 1 носитель нечеткого множества Z – x
a1
a1 0 , следовательно max x B1 x
0
max x
1, 1
x
0.
Для правила 2 носитель нечеткого множества PS – x
a1 1 , следовательно max
x 0 .5 , 2
1
1, 1 , значение
0.5, 2 , значение
2.
x
Для правила 3 носитель нечеткого множества PM – x значение a1
2
2 , следовательно max
x
x 1,
1 , следовательно
max x
2, 0.5
1 x
2 , следовательно
max x
, 1
2 x
2, 0.5 ,
2.
Для правила 5 носитель нечеткого множества NM – x значение a1
,
2.
Для правила 4 носитель нечеткого множества NS – x значение a1
1,
1,
,
2.
Подставляя данные частные результаты в выражение (4.18), получим €H K
max( 0, 2, 2, 2, 2, 2)
2.
На рис. 4.3 показаны зависимости u
u( x) , u
KH x и u
€H x . K
114
Рис. 4.3. Характеристика БНВ из примеров 4.1 и 4.2 Пример 4.3. Рассмотрим БНВ, описываемый набором нечетких правил: П1: если x1 есть P и x2 – произвольно, то u=1, П2: если x1 есть N и x2 – произвольно, то u=-1, П3: если x1 – произвольно и x2 есть P, то u=1, П4: если x1 – произвольно и x2 есть N, то u=-1, П5: если x1 есть Z и x2 есть Z, то u=0,
где x1 и x2 – 1-я и 2-я компоненты вектора x соответственно. На рис. 4.4 приведены функции принадлежности нечетких множеств Z, P и N. На рис. 4.5 показана зависимость u
u (x1 , x 2 ) .
115
P
N
1
Z
x1, x2 -2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
Рис. 4.4. Функции принадлежности нечетких множеств
u
x1
x2
Рис. 4.5. Вид зависимости u
Для x1
x1 1,
правила , x2
1,
max , x2
,
П1 ,
1 x
1.
носитель ,
u (x1 , x 2 )
нечеткого
значение
множества
a1 1 ,
A1
–
следовательно
116
Для x1
, 1 , x2
x2
,
правила , x1
1,
x 2 1,
,
,
, x1
x2
,
П3
Для 2,
,
2, 2 , x 2
1 x
правила 2 , x2
max
2, 2
носитель
нечеткого
значение
П4
носитель
,
,
, 1 , x1
, 1 , x1
a1
множества
1,
A2
–
следовательно
множества
a1 1 ,
A3
–
следовательно
1.
правила
max
нечеткого
значение
,
,
1 x
max
Для
x1
носитель
1 1. x
max
Для
x1
П2
, 1 , x2
x1
x2
правила
0 x
нечеткого
значение
a1
множества
1,
A4
–
следовательно
1.
П5
носитель
2,
2,
0.
Подставляя
€H выражение (4.18), получим K
нечеткого
значение данные
a1
множества
0,
частные
A5
–
следовательно результаты
в
max( 1, 1, 1, 1, 1, 0) 1 .
Укажем, что действительное значение K H
0.642 .
4.3. Анализ устойчивости систем управления с блоками нечеткого вывода Рассмотрим замкнутую автономную нелинейную импульсную систему автоматического
управления
приведенную на рис. 4.6.
с
нечетким
логическим
регулятором,
117
Рис. 4.6. Система управления с нечетким логическим регулятором Система состоит из линейного динамического звена ЛДЗ, импульсного элемента ИЭ с фиксатором нулевого порядка Фо и нечеткого логического регулятора НЛР, представляющего собой БНВ, реализующий статическую
нелинейную зависимость между своим входным x и выходным u сигналами. Указанная зависимость определяется набором нечетких продукционных правил. Используя описанную величины
методику определения численного значения
€ H , для произвольного НЛР можно получить критерии K
устойчивости системы на рис. 4.6. Для этого дополнительно предположим, что ЛДЗ описывается векторноматричным дифференциальным уравнением: dx dt
A x
b u,
(4.19)
где А и b – постоянные матрица и вектор соответственно.
Последовательное соединение импульсного элемента с фиксатором нулевого порядка и линейного динамического звена описывается разностным уравнением [4.3]: xk
1
A0 x k
b 0 u(x k ) ,
(4.20)
118
I) b , T0 – период работы импульсного элемента, I – единичная матрица, u ( x q ) – нелинейное преобразование
где
A0
e A T0 , b 0
A
осуществляемое НЛР, k Для
определения
1
(e A T0
0, 1, 2, ... . достаточного
условия
устойчивости
системы
воспользуемся вторым методом Ляпунова. В качестве функции Ляпунова выберем простейший ее вид – норму от вектора переменных состояния системы (при этом приходим к так называемому методу сжимающих отображений [4.2, 4.3]). Решая совместно (4.6) и (4.20) получим: xk
1
A0 x k
b 0 k T (x k ) x k .
(4.21)
Согласно принципу сжимающих отображений, достаточным условием асимптотической устойчивости положения равновесия системы (4.21) будет выполнение при произвольном x k неравенства:
A0
b 0 k T (x k )
1.
С учетом выражений (4.6) и (4.10) это неравенство
(4.22)
можно решить
относительно параметров системы. Пример 4.4. Рассмотрим автономную систему, приведенную на рис. 4.7.
119
Рис. 4.7. Система из примера 4.4 Объект W ( p)
управления
описывается
передаточной
функцией
k0 . Импульсный элемент с фиксатором нулевого порядка 1 p T
имеет период квантования T0 . Используется НЛР из примера 4.3. Для системы на рис. 4.7 справедливо разностное уравнение:
x 1k x
2
1
e
k 1
T0 T
k1
0 0
1
u( x k , x
где x 1k
y k , x 2k
x1k
2
x
k)
2
k
(1 e
T0 T
u ( x1k , x 2 k ) ,
) k0
0
K H T ( x 1k , x 2 k )
x 1k x 2k
,
k1 y k 1 .
Условие устойчивости (4.22) в рассматриваемом случае имеет вид:
e
T0 T
k1
0 0
(1 e
T0 T
0
) k0
K H T ( x 1k , x 2 k )
1 0 0 1
1.
На основании свойств матричной нормы [4.10], можно показать, что достаточным условием выполнения данного неравенства будет:
120
k1 e
T0 T
1, T0 T
€ H k 0 (e 2 K
1)
1
,
откуда достаточное условие асимптотической устойчивости положения равновесия рассматриваемой системы принимает вид:
k1 1, 1 e
k0
2 (1 e
€H Приняв K
T0 T T0 T
1 (из примера 4.3), k1
.
€H ) K
0.1 и T0
0.1, определим область
устойчивости рассматриваемой системы, что отображено на рис. 4.8 заштрихованной областью. Для сравнения на данном рисунке показана также действительная область устойчивости системы (закрашена серым). 4.4. Анализ устойчивости и показателей качества систем управления с одномерными блоками нечеткого вывода Определенное
распространение
на
практике
получили
системы
управления с одномерными блоками нечеткого логического вывода. Указанные блоки обычно используются в моделях объектов управления. Рассмотрим замкнутую автономную нелинейную импульсную систему автоматического управления, приведенную на рис. 4.9
121
k0
Рис. 4.8. Области устойчивости системы из примера 4.4
ОУ
ИЭ
x ЛР
ЛДЗ
u НЭ
Рис. 4.9. Система управления с односвязным объектом Система состоит из импульсного элемента с амплитудно-импульсной модуляцией ИЭ, линейного регулятора ЛР и объекта управления ОУ. Структурно объект управления состоит из последовательного соединения линейного динамического звена ЛДЗ и статического нелинейного элемента
122
НЭ. Зависимость между выходным u и входным x сигналами нелинейного элемента задается набором нечетких продукционных правил. Таким образом НЭ представляет собой БНВ. Используя описанную
методику определения численного значения
€ H , можно получить критерий асимптотической устойчивости величины K
системы на рис. 4.9. Если характеристика НЭ находится в 1 и 3 квадрантах, а импульсная линейная часть системы устойчива, к рассматриваемой системе применим геометрический критерий абсолютной устойчивости Цыпкина [4.2, 4.8]. Достаточное условие асимптотической устойчивости положения равновесия в данном случае определяется неравенством:
Re W* ( jw )
где
W * ( jw )
1 €H K
0,
(4.23)
– комплексный коэффициент передачи последовательно
соединенных импульсного элемента ИЭ, линейного регулятора ЛР и линейного динамического звена ЛДЗ. Отметим, что области устойчивости, полученные с помощью критерия Цыпкина, не уже областей, полученных с помощью второго метода Ляпунова с функцией в виде квадратичной формы от переменных состояния системы [4.3]. Получим оценку степени устойчивости системы. Напомним, что степенью устойчивости нелинейной импульсной системы называется максимальная величина
, для которой имеет место
отношение [4.8]:
lim y(n ) e n
n
0
(4.24)
123
Смысл этой оценки состоит в том, что процесс y(n) в нелинейной импульсной системе должен затухать быстрее, чем e
n
, т.е. степень
устойчивости характеризует скорость затухания процесса. В монографии [4.8] показано, что для одноконтурной нелинейной импульсной системы с устойчивой линейной частью степень устойчивости – максимальное значение
, при котором выполняется неравенство:
Re W* (
jw )
1 €H K
0.
(4.25)
Пример 4.5. Рассмотрим автономную систему, приведенную на рис. 4.9. Последовательно соединенные ЛР и ЛДЗ описывается передаточной функцией W (p)
k . Импульсный элемент с фиксатором нулевого 1 p T
порядка имеет период квантования T0 . Используется НЭ из примера 4.1. Для xm
1
e
T0 T
системы xm
на
рис.
u m k (1 e
4.1 T0 T
справедливо
разностное
уравнение
) [4.2, 4.3]. Комплексный коэффициент
передачи импульсной линейной части системы W * ( jw )
(1 e e jw
T0 T
) k
e
T0 T
. В
соответствии с неравенством (4.23), несложно получить достаточное условие асимптотической устойчивости положения равновесия рассматриваемой системы:
k
1 e (1 e
T0 T
T0 T
. €H ) K
124
Приняв
€H K
2 (из примера 4.1) и T0
0.1, определим область
устойчивости рассматриваемой системы рис. 4.10 (заштрихованная область). €H Если воспользоваться точным значением параметра БНВ K
KH
1,
получим условие устойчивости, являющееся необходимым и достаточным:
k
1 e (1 e
T0 T
T0 T
. ) KH
Соответствующая область на рис. 4.10 показана серым и совпадает с областью устойчивости, полученной путем имитационного моделирования.
Рис. 4.10. Область устойчивости системы из примера 4.5 Определим степень устойчивости системы. Согласно формуле (4.25) при k=5 и T=0.5 получим
0.5 . На рис. 4.11 показан график переходного
125
процесса в системе y(t ) , при y(0) 10 , а также кривые y(0) e y(0) e
t
t
и
.
Рис. 4.11. Переходный процесс в системе y( t )
Перейдем к рассмотрению более общего случая – систем с многосвязными объектами управления (см. рис. 4.12). Система состоит из импульсных элементов с амплитудно-импульсной модуляцией ИЭi (i=1, 2, … n), работающих синхронно и синфазно, линейного регулятора ЛР и объекта управления ОУ. Структурно объект управления состоит из линейного динамического звена ЛДЗ и статических нелинейных элементов НЭi (i=1, 2, … n). Допустим,
что
характеристики
всех
нелинейных
элементов
описываются наборами нечетких продукционных правил и находятся в 1 и 3 квадрантах.
Для каждого
из
НЭ
определены
( i 1, 2, ..., n ), которые представлены в виде матрицы
коэффициенты
K€ i
126
€H K
€1 K 0 ... 0
0 €2 K ... 0
... 0 ... 0 . ... ... €n ... K
(4.26)
Рис. 4.12. Система управления с многосвязным объектом Можно показать, что если импульсная линейная часть системы на рис. 4.12 устойчива и существует действительное число p такое, что выполняется неравенство
1 € p € Hp K H W * ( jw ) W * ( jw ) K 2
€ Hp K
1
0, 0
w
,
(4.27)
где W * ( jw ) – матрица комплексных коэффициентов передачи импульсной линейной части системы, то рассматриваемая система будет асимптотически устойчива [4.8].
127
Ограниченный объем книги не позволяет рассмотреть целый ряд важных примеров и приложений. Однако, как представляется, изложенного вполне достаточно для иллюстрации продуктивности предлагаемого подхода к построению аналитических методов исследования систем управления с нечеткой логикой.
Литература к главе 4
4.1.
Mamdani E.H. Twenty years of fuzzy control: experiences gained and lessons learnt. See IEEE, 1993.
4.2.
Видаль П. Нелинейные импульсные системы. М.: Энергия, 1974.
4.3.
Кунцевич В.М., Чеховой Ю.Н. Нелинейные системы управления с частотно- и широтно-импульсной модуляцией. Киев: Технiка, 1970.
4.4.
Бесекерский В.А. Теория систем автоматического регулирования. М.: Наука, 1975.
4.5.
Воронов А.А. Устойчивость, управляемость, наблюдаемость. М.: Наука, 1979.
4.6.
Хлыпало
Е.И.
Нелинейные
корректирующие
устройства
автоматических систем. Л.: Энергия, 1973. 4.7.
Пальтов И.П. Качество процессов и синтез корректирующих устройств в нелинейных автоматических системах. М.: Наука, 1975.
4.8.
Цыпкин Я.З., Попков Ю.С. Теория нелинейных импульсных систем. М.: Наука, 1973
4.9.
Круглов
В.В.
Дли
М.И.,
Голунов
Р.Ю.
Нечеткая
логика
и
искусственные нейронные сети. М.: Физматлит, 2001. 4.10. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир, 1989. 4.11. Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся вузов. М.: Наука, 1980.
128
5. АДАПТИВНЫЕ НЕЧЕТКИЕ НЕЙРОННЫЕ СЕТИ 5.1. Общие сведения Нечеткие нейронные сети могут оказаться малоэффективными в случае, если априорная информация, заложенная в их структуру, является неполной,
противоречивой
применяются
алгоритмы
или
неверной.
адаптации
Для
нечетких
указанных нейронных
ситуаций сетей,
настраивающие в процессе обучения не только параметры, но и структуру сети (число нечетких продукционных правил) [5.1]. Можно выделить несколько принципов построения алгоритмов адаптации нечетких нейронных сетей. 1. Алгоритмы,
использующие
аналогию
между
обобщенно-
регрессионными нейронными сетями (GRNN) и нечеткими сетями ВангаМеделя [5.2]. Ранее (см. параграф 2.2) уже были введены в рассмотрение обобщеннорегрессионные нейронные сети – двухслойные нейронные сети, являющиеся разновидностью сетей с радиальными базисными элементами. Напомним, что первый слой данной сети состоит из так называемых радиальных нейронов, описываемых соотношениями:
oi
(
x ci i
),
(5.1)
129
где
(s)
exp( s 2 / 2) , c i и
i
– постоянные параметры.
Второй же слой рассматриваемой сети в простейшем случае состоит из одного нейрона, реализующего соотношение:
M
w i oi i 1
y
,
N
(5.2)
oi i 1
где М – число нейронов первого слоя, w i – постоянные параметры. При выборе в качестве нормы
в соотношении (5.1) евклидову
векторную норму [5.3]:
n
x ci
(x j
c ij ) 2 ,
(5.3)
i 1
где cij – j-я компонента вектора c i , и решая совместно (5.1) – (5.3), получим:
M
n
w i exp[( y
i 1 M
(x j
i
j 1 n
exp[( i 1
2
c ij ) 2 ) /( 2
(x j
)]
. 2
2
c ij ) ) /( 2
i
(5.4)
)]
j 1
Рассмотрим простейший алгоритм самоорганизации GRNN. Пусть обучающая выборка состоит из N пар значений x i , y i
, i=1, 2,
… N. При обучении нейронной сети формируется радиальный слой из M=N нейронов с параметрами c i x i , а параметры второго слоя выбираются из условия w i
yi .
130
Допустим теперь, что имеется нечеткая нейронная сеть Ванга-Менделя, реализующая набор нечетких правил: если x1 есть Ai1 и если x2 есть Ai2 и … если xn есть Ain , y=wi ,
(5.5)
где i=1, 2, … M, при этом нечеткие множества Aij имеют функции принадлежности:
ij ( x j )
Для
определения
c ij ) 2
(x j
exp
2
2
.
(5.6)
0i
результирующих
функций
принадлежности
используем операцию “произведение”:
n
i (x)
ij ( x j ) ,
(5.7)
j 1
а для определения выходного сигнала нечеткой системы используем формулу:
M
i (x)
wi
i 1
y
M
i (x)
.
(5.8)
i 1
Введя, далее обозначения
i
0i
n,
(5.9)
131
и решая совместно (5.6) – (5.9), получим, что выходной сигнал нечеткой сети Ванга-Менделя описывается формулой (5.4). Таким
образом,
для
адаптации
сети
Ванга-Менделя
можно
использовать алгоритм адаптации обобщенно-регрессионной нейронной сети. Допустим, как и ранее, что обучающая выборка состоит из N пар x i , y i , i=1, 2, … N. При адаптации сети Ванга-Менделя, значений согласно
рассматриваемому
методу, продукционных правил с параметрами c i
формируется M=N x i , и w i yi .
нечетких
Достоинством описанного алгоритма является простота и высокая скорость работы. К недостаткам алгоритма можно отнести то, что получаемая нечеткая сеть очень громоздка (число правил равно числу обучающих точек). Кроме того, для выбора параметров функций принадлежности
0i
необходимо
использовать отдельную процедуру. 2. Алгоритмы сокращения нечетких нейронных сетей (алгоритмы редукции) [5.4, 5.5]. Суть алгоритма сокращения состоит в следующем. Формируется нечеткая нейронная сеть, имеющая избыточное количество продукционных правил. Параметры сети оптимизируются путем применения того или иного алгоритма обучения. Затем происходит исключение части продукционных правил. Цикл “оптимизация параметров – исключение правил” может повторяться несколько раз. Для выбора исключаемых правил можно использовать следующие принципы: исключать
правила,
для
которых
результирующая
функция
принадлежности меньше определенного порога, как мало влияющие на окончательный результат;
132
исключать противоречивые правила, как взаимно компенсирующиеся; исключать одно из двух совпадающих правил, как не несущее новой информации. Существенным
недостатком
алгоритмов
сокращения
является
необходимость оптимизировать параметры заведомо избыточной по размеру нечеткой нейронной сети. Данные алгоритмы работают очень медленно, а в ряде случаев и вообще не могут решить задачу за приемлемое время. 3. Алгоритмы
наращивания
нечетких
нейронных
сетей
(конструктивные алгоритмы) [5.4, 5.5]. Изложим идею алгоритма наращивания нечеткой нейронной сети. Формируется
начальная
база нечетких
продукционных правил.
Производится оптимизация параметров нечеткой нейронной сети. После этого добавляется одно или несколько продукционных правил. Затем параметры сети снова оптимизируются. Цикл “добавление правил – оптимизация параметров” повторяется несколько раз. Данные алгоритмы могут быть совмещены с алгоритмами сокращения, описанными выше [5.6, 5.7]. Алгоритмы
наращивания
сети,
хотя
обычно
быстродействующие, чем алгоритмы сокращения, все равно
и
более работают
крайне медленно. 4. Модифицированные алгоритмы, использующие аналогию между обобщенно-регрессионными нейронными сетями и нечеткими сетями ВангаМеделя. В работах [5.5, 5.8] предлагается, в отличие от классического алгоритма описанного в п.1, при поступлении очередной обучающей точки x, y ' определять расстояния d i ci x , между центрами предпосылок имеющихся правил и точкой x . Если min( d1 , d 2 ,... d M ) R , где R – некоторый параметр, то добавляется еще одно правило с центрами функций
133
принадлежности в точке x и заключением y
y ' . В случае невыполнения
указанного неравенства добавления продукционного правила не происходит. Алгоритм, предложенный одним из авторов книги в монографии [5.4], отличается от описанного выше условием добавления нового правила, здесь правило добавляется при выполнении неравенства
y€ y '
, где y€ –
значение выхода сети при подаче на вход x , рассчитанное по имеющимся
продукционным правилам,
– постоянный параметр, характеризующий
точность аппроксимации. Изучение литературных источников
позволяет сформулировать
следующие выводы по алгоритмам адаптации нечетких нейронных сетей. 1. Все авторы рассматривают лишь адаптацию сетей Ванга-Менделя. 2. За
исключением
алгоритмов
сокращения
и
наращивания,
обладающих крайне низким быстродействием, рассматривается случай, когда исходная база знаний пуста, т.е. не содержит априори задаваемых правил. 3. Во всех алгоритмах адаптации основное внимание уделено определению центров функций принадлежности, а такие параметры функций принадлежности как, например, отклонения рекомендуется выбирать отдельно, с помощью специально разработанных для этого обучающих процедур. 4. Наиболее перспективным для дальнейшей модернизации является алгоритм, предложенный в работе [5.4], как обладающий высоким быстродействием и возможностью априорного задания точности.
5.2.
Описание базового алгоритма
Предлагаемый алгоритм рассмотрим на примере задачи построения аппроксимационной
модели
многофакторного
статического
объекта.
134
Заметим, что к задаче аппроксимации функций сводятся, по сути, многие практические задачи: распознавание образов, прогнозирование процессов, оптимизации и т.п. Предположим, что объект имеет n входов (векторный вход х
размерности n) и один выход у. Входы и выход объекта связаны некоторой причинно-следственной связью; при условии статичности объекта это означает, что х и y связаны некоторой нелинейной зависимостью:
y где
( x) e ,
(5.10)
(x) – функция неизвестного вида, e – случайная аддитивная помеха
(отражающая
действие
неучитываемых
факторов)
с
нулевым
математическим ожиданием и произвольным (неизвестным) распределением на ( e m , e m ) . Пусть необходимо провести аппроксимацию неизвестной зависимости (5.10) на n-мерном гиперкубе с размером грани l (данное ограничение не является принципиальным и легко снимается путем преобразования системы координат). Допустим также, что о зависимости (5.10) имеется априорная информация, записанная в виде совокупности m0 продукционных нечетких правил вида: Пr: если х1 есть Аr1 и х2 есть Аr2 и … и хn есть Аrn, то у = уr, где
r =1, 2, … m0 – номер правила в базе знаний, xj (j=1, 2, …, n) – компоненты вектора х , Arj – некоторые нечеткие числа, имеющие функции принадлежности
rj ( x j ) .
135
Отметим, что данная априорная информация может и отсутствовать (при этом m0 = 0). Предположим далее, что на объекте может быть реализован эксперимент, заключающийся в регистрации N пар значений < x i , y i > (верхние индексы i=1, 2, …, N указывают на порядковый номер опыта), при этом x i и y i измеряются без ошибок. Алгоритм состоит в реализации последовательности следующих шагов. Шаг 0.
Задается
– погрешность аппроксимации. Устанавливается
текущее: число правил в базе знаний m=m0 и номер обучающей точки i=1. Шаг 1. Выбирается очередная точка x i . Если формируемая база знаний пуста, переход к шагу 3, иначе с помощью алгоритма нечеткого вывода Сугэно
(Sugeno)
порядка
0-го
и
с
использованием
имеющихся
продукционных правил, рассчитывается прогнозируемое значение y€i [5.1]:
m
y€i
€( x i )
i
yr r 1 m
r (x
i r (x )
)
,
(5.11)
r 1
где
r (x i )
min
r1 ( x 1
i
),
r 2 (x 2
i
), ...
rn ( x n
i
)
–
степень
истинности
предпосылок r-го правила. Шаг 2. Проверяется неравенство:
y€i
yi
.
(5.12)
При невыполнении неравенства (5.12) переход к шагу 3, иначе переход к шагу 5. Шаг 3. База знаний пополняется правилом вида:
136
Пm+1: если х1 есть А(m+1)1 и х2 есть А(m+1)2 и … хn есть А(m+1)n, то уm+1= y i , где A(m+1)1, A(m+1)2, … A(m+1)n – нечеткие числа с треугольными функциями принадлежности [5.1]:
( m 1) j ( x j )
1 0,
где a ( m a (m
xj
a (m
1) j
, если x j
a (m
1) j
если x j
a (m
1) j
,
(5.13)
,
– центры нечетких чисел A(m+1)j, при значениях a ( m
1) j i
1) 2 =x2 ,
... a ( m
1) n =xn
i
i
1)1 =x1 ,
соответственно (фактически добавление нового
продукционного правила сводится к добавлению в базу знаний строки вида <x1i, x2i, … xni, yi >);
– постоянный параметр, значение которого выбирается
на шаге 4. Значение m модифицируется: m:=m+1. Если точка x i совпадает с какой-либо из имеющихся точек < a r1 , a r 2 , … a rn >,
то указанное пополнение базы знаний не производится, а
осуществляется замена yr на (yi+yr)/2, после чего переход к шагу 5. Шаг 4. Параметры функций принадлежности
всех правил
корректируется в соответствии с формулой:
l, если (m - m 0 ) 2 n , l /( n (m m 0 ) 1), если (m - m 0 ) 2 n . При такой коррекции значение параметра
(5.14)
будет приблизительно
равно среднему расстоянию между обучающими точками, добавляемыми в базу знаний.
137
Шаг 5.
Проверяется правило останова: "просмотрены" ли все N
обучающих точек. Если правило останова не выполняется, то i:=i+1 и переход к шагу 1, в противном случае останов, база знаний считается сформированной. Рассмотренный алгоритм будем называть далее базовым нечетким дополняющим алгоритмом. Свойства моделей, полученных с помощью
5.3.
нечеткого дополняющего алгоритма В данном параграфе приведен теоретический анализ сходимости и точности моделей, получаемых с помощью нечеткого дополняющего алгоритма для случая расположения обучающих точек в узлах равномерной прямоугольной сетки.
5.3.1.
Сходимость и точность моделей
Получим достаточное условие сходимости рассматриваемых моделей к аппроксимируемой зависимости. Утверждение 5.1. Пусть обучающие точки расположены в узлах равномерной прямоугольной сетки на n-мерном гиперкубе задаваемые
правила
, априорно
отсутствуют параметр (m 0 0) , аппроксимируемая зависимость (x) является интегрируемой на для x выполняется соотношение:
lim
(x) y€(x)
0,
N
где y€(x) – выход модели, N – число обучающих точек.
0,
, тогда
(5.15)
138
Доказательство. Рассмотрим вначале скалярный случай. При этом формула (5.11) принимает вид
N
y€( x )
(x i )
xi )
(x
r 1
,
N
(5.16)
i
(x
x )
r 1
где
x xi i
(x x )
1
, если x x i
0,
если x x i
если N
l,
, ,
2,
l /( N 1), если N
2.
Перепишем формулу (5.16) в виде
N
y€( x )
(x i )
(x
x i ) ( N 1)
xi / l
i 1
,
N
(x
x i ) ( N 1)
xi / l
i 1
где x i – расстояние между обучающими точками. Из последней формулы при N
получим:
N
y€( x )
(x i )
(x x i ) x i
i 1 N
, i
(x x ) i 1
x
i
139
где ( ) –
-функция Дирака,
откуда
(x)
( x ) dx
y€( x )
(x) , ( x ) dx
что и доказывает приведенное утверждение для одномерного случая. Доказательство для случая произвольной размерности проводится аналогично, при этом используются суммы и интегралы кратности n по всем компонентам входного вектора. Следует подчеркнуть,
что для сходимости алгоритма не требуется непрерывности аппроксимируемой функции (x) , что делает указанные условия сходимости значительно менее жесткими по сравнению с аналогичными для других методов (например, локальной аппроксимацией или многослойными персептронами [5.1, 5.5, 5.9]). Проанализируем точность рассматриваемых моделей. При анализе точности вначале ограничимся двухфакторным объектом, для случая, когда априорно задаваемые правила отсутствуют, а параметр 0.
Пусть
обучающие
точки
расположены
в
узлах
равномерной
прямоугольной сетки, при этом, если число правил базы знаний m > 22 = 4, из формулы (5.14) следует, что параметр
будет равен шагу сетки.
Как следует из вида функций принадлежности (5.13), для данного случая выход модели y€ €(х) определяется только четырьмя точками базы знаний, задающими квадрат внутри которого находится точка x (см. рис. 5.1).
140
х2 x4
x3 x*
x1
x2
х1 Рис. 5.1. Иллюстрация к анализу точности модели
Введем в рассмотрение точку x* , расположенную на пересечении диагоналей квадрата на рис. 5.1. Решая совместно (5.11) и (5.13), получим:
y€*
€( х * )
1 ( y1 4
y2
y3
y 4 ),
(5.17)
где y1 , y 2 , y 3 и y 4 – значения аппроксимируемой функции (5.10) в точках x 1 , x 2 , x 3 и x 4 соответственно.
Предположим далее, что аппроксимируемая функция (x) является, по крайне мере, дважды дифференцируемой по каждому из аргументов и в окрестности точки x* представима в виде полинома 2-й степени [5.3]: y( x )
где Гессе
(x)
y*
b T (x * ) x
b( x * ) – вектор-градиент функции
функции
( x)
в
точке
x* ,
1 T * x B( x ) x , 2
(5.18)
(x) в точке x * , B( x * ) – матрица y* – значение x x x* ,
аппроксимируемой функции (5.10) в точке x* . Подставляя координаты точек x 1 , x 2 , x 3 и x 4 в (5.18), получим:
141
y1
y*
b T (x * )
y1
y*
b T (x * )
/2 /2 /2
/2 /2 y 3 y* b T (x * ) /2 /2 y 4 y* b T (x * ) /2
1 ( 2
/2
1 ( 2
/2
1 ( 2
/2
1 ( /2 2
/ 2)B( x * )
/2 , /2 /2 / 2)B( x * ) , /2 /2 / 2)B( x * ) , /2 /2 / 2)B( x * ) . /2
(5.19)
Поскольку рассматриваемая модель справедлива для значений x ,
являющихся внутренними или граничными точками квадратной области на рис. 5.1, ее максимальная погрешность будет соответствовать некоторой из указанных точек. Нахождение данной точки – задача достаточно сложная, поэтому
будем
погрешность
приближенно
достигается
в
предполагать, что эта максимальная точке x* . Для нахождения указанной
погрешности подставим (5.19) в (5.17):
y( x * )
y*
y€
(1
1 8
2
1 (1 1)B( x * ) 1
1 1)B( x * ) 1
( 1
( 1 1)B( x * )
1)B( x * )
1 1
1 1
.
(5.20)
Воспользовавшись известным неравенством [5.3]: xT B x
и выбрав в качестве
B
2 x ,
l - норму [5.3], из формулы (5.20) получим:
(5.21)
142
y( x )
1 2
sup B ( x ),
2
(5.22)
x H
где H – область аппроксимации. Подставляя в (5.22) соотношение (5.14) и учитывая, что при
0 m=N
(все обучающие точки попадают в базу знаний), можно записать:
l2
y( x ) 2
N 1
sup B( x ) .
2
(5.23)
x H
Формула (5.23) характеризует потенциальную минимально возможную погрешность аппроксимации, из нее, в частности, вытекает, что параметр
,
определяющий допустимую погрешность модели, необходимо выбирать из соотношения:
l2 2
N 1
2
sup B ( x ) .
(5.24)
x H
Формулу (5.23) легко обобщить на случай произвольной размерности (ввиду своей громоздкости данный вывод здесь не приводится):
y( x )
2n
3
l2
(n N 1) 2
sup B ( x ) , x H
(5.25)
143
Модели линейных объектов
5.3.2.
Рассмотрим особенности построения моделей линейных объектов с помощью
нечеткого
дополняющего
алгоритма.
Аппроксимируемая
зависимость в данном случае имеет вид: (x)
b0
bT x ,
(5.26)
где b 0 и b – постоянные параметры. Пусть
обучающие
точки,
расположены
в
узлах
равномерной
прямоугольной сетки. Минимальное возможное количество обучающих точек N
2 n (в данном случае они расположены в вершинах n-мерного
гиперкуба). Согласно формуле (5.25), в этом случае модель будет иметь нулевую погрешность. Однако формула (5.25) является приближенной, и действительная погрешность модели будет отлична от нуля. Рассмотрим
следующий
зависимости (x1 , x 2 )
пример.
Проведем
аппроксимацию
2 x1 3 x 2 10 в квадратной области с вершинами
(0, 0), (0, 1), (1, 0), (1, 1). График относительной погрешности аппроксимации рис. 5.2.
[%] показан на
144
Рис. 5.2. График относительной погрешности аппроксимации
Из рис. 5.2 видно, что погрешность аппроксимации равна нулю в точках расположенных по периметру области аппроксимации, а также в точке, являющейся центром симметрии данной области. Отметим,
что
нулевую
погрешность
аппроксимации
линейных
зависимостей можно получить, используя алгоритм нечеткого вывода ВангаМенделя [5.5] (в этом случае результирующие функции принадлежности предпосылок нечетких правил – см. соотношение (5.11) – будут определяться согласно формуле: r ( x i ) ( r1 ( x1i ) r 2 ( x 2 i ) ... rn ( x n i ) ). В частности, при этом, для двумерного случая, выход модели внутри квадратной области на рис. 5.1 определяется соотношением:
y€(x1, x 2 ) c0 c1x1 c 2 x 2 c3 x1x 2 , где c 0 , c1 , c 2 , c3 – постоянные коэффициенты.
(5.27)
145
Модификации алгоритма
5.4.
Различные условия построения моделей делают целесообразным рассмотрение следующих модификаций базового нечеткого дополняющего алгоритма. 1. Алгоритмы с различными вариантами функций принадлежности и процедурой нечеткого вывода. В
нечетких
продукционных
правилах,
кроме
рассмотренных
треугольных, могут использоваться различные функции принадлежности, имеющие симметричный вид [5.1], например, двойная экспоненциальная:
rj ( х j ) е
х j а rj /
,
(5.28)
или гауссова:
rj ( х j )
где a rj и
е
( х j а rj )2 / 2
,
(5.29)
– постоянные параметры.
Алгоритмы могут также отличаться используемыми процедурами нечеткого вывода. Например, если использовать функции принадлежности гауссова типа (5.29), для определения результирующих функций принадлежности нечетких правил – алгебраическое умножение, а для приведения к четкости центроидный метод, то формула (5.11) принимает вид:
146
m
у€i
(x i )
n
r
y exp( r 1 m
( x ji
a rj ) 2 /
2
j 1 n
exp( r 1
) .
( x ji
2
a rj ) /
2
(5.30)
)
j 1
В качестве алгоритма нечеткого вывода можно использовать алгоритм Мамдани (Mamdani), при этом добавляемые правила имеют вид: Пm+1: если х1 есть А(m+1)1 и х2 есть А(m+1)2 и … и хn есть А(m+1)n, то у есть В(m+1), где A(m+1)1, A(m+1)2,…A(m+1)n и B(m+1) – некоторые нечеткие числа, имеющие заданные функции принадлежности. Отметим, что применение алгоритма нечеткого вывода Мамдани требует больших вычислительных затрат по сравнению со случаем, когда применяется алгоритм упрощенного нечеткого вывода (Сугэно 0-го порядка). Применение алгоритма Мамдани, по всей видимости, целесообразно только для ситуаций, когда априорная информация задана в виде продукционных правил, имеющих форму, соответствующую указанному алгоритму. 2. Алгоритмы с различными условиями добавления нового правила в базу знаний. В базовом алгоритме добавление нового правила в базу знаний происходит, если абсолютная погрешность аппроксимации превышает заданную (см. формулу (5.12)). Можно предложить и другие условия добавления правил, например, по превышению относительной погрешности:
у€i
yi y
i
,
(5.31)
147
где
- заданная относительная погрешность аппроксимации. 3. Алгоритмы с различными правилами останова. Можно предложить большое количество правил останова. Приведем
некоторые из них: 1) останов, если выбраны все N пар значений < x i , y i >, i=1, 2, … N;
2) останов, если выбор подряд N0 обучающих точек не приводит к модификации базы знаний; 3) останов, если оценка средней квадратичной ошибки модели
е
не
превышает заданную величину. 4. Алгоритмы с различными вариантами определения параметров функций принадлежности. Способы выбора параметров функций принадлежности
могут
отличаться по следующим признакам: 1) изотропный – 2) анизотропный – 3) явный –
одинаково для всех правил; для каждого правила устанавливается индивидуально;
устанавливается априори до работы алгоритма и определяется
эвристически с учетом количества обучающих точек и объема покрываемого пространства; 4) адаптивный –
изменяется в процессе работы алгоритма.
5. Алгоритмы, отличающиеся порядком добавления обучающих точек в базу знаний. Если все обучающие точки известны до построения модели (режим off-line), то можно добавлять в базу знаний в первую очередь те, для которых погрешность модели
i
y€i
y i наибольшая. Применение такой
разновидности алгоритма позволяет несколько уменьшить погрешность моделей.
148
Экспериментальное исследование алгоритма
5.5.
Ниже представлены некоторые результаты численных исследований нечеткого дополняющего алгоритма. 1. Влияние параметра
, типа функций принадлежности и реализации
операции объединения предпосылок нечетких продукционных правил. Для примера на рис. 5.3 показаны зависимости средней абсолютной погрешности аппроксимации Еср функции z
x2
y 2 от параметра
для
алгоритмов с явным его заданием при различных типах функций принадлежности
и
видах
определения
результирующих
функций
принадлежности предпосылок продукционных правил, а также для базового нечеткого дополняющего алгоритма. Ответим, что зависимости, приведенные на рис. 5.3, является типичными для многих объектов. Проведение большого количества численных экспериментов позволяет сделать следующие выводы: 1) потенциальная
точность
алгоритма,
оптимальном выборе параметра
достигаема
при
и практически одинакова
при разных видах функций принадлежности; 2) погрешность базового дополняющего алгоритма обычно не более, чем на 20 % превышает погрешность при оптимальном выборе параметра
.
149
Рис. 5.3. Зависимость средней абсолютной погрешности аппроксимации Еср от параметра функций принадлежности
2. Потенциальная точность моделей, полученных с помощью базового дополняющего алгоритма. В
качестве
примера
экспериментальной
проверки
нечеткого
дополняющего алгоритма рассмотрим задачу аппроксимации в области х [-5, 5] и y [-5, 5] следующих существенно нелинейных функций: z1( x, y)
z 4( x, y)
exp( ( x 2
(x
2
2
y 2 )) ,
z2( x, y)
y ) sin x sin y , z5( x , y)
sin x sin y , x y
z3(x, y) 1/ x 1/ y ,
sin x sin y , z6( x, y) x y
sin
x2 x2
y2 y2
150
и
z7 Fuzzy (x, y) , заданную набором из пяти нечетких продукционных
правил: П1: если x "положительна", то u = 1, П2: если x "отрицательна", то u = -1, П3: если x "приблизительно равна нулю" и y "приблизительно равна нулю", то u = 0, П4: если y "положительна", то u = 1, П5: если y "отрицательна", то u = -1. Функции
принадлежности
переменных
"отрицательна"
(N),
"приблизительно равна нулю" (ZE), "положительна" (P) приведены на рис. 5.4.
Рис. 5.4. Функции принадлежности переменных "отрицательна" (N), "приблизительно равна нулю" (ZE), "положительна" (P) Четкое значение z7 определяется с помощью алгоритма Сугэно 0-го порядка [5.1]. Графики функций z4, z5, z7 показаны на рис. 5.5а – рис. 5.5в соответственно. Во всех случаях использовались 64 обучающие точки. Какая-либо другая информация об аппроксимируемых функциях не задана. Точность
моделей
проверялась
по
принадлежащим множеству обучающих точек.
400
тестовым
точкам,
не
151
а)
б)
в) Рис. 5.5. Аппроксимируемые функции
152
Для получения аппроксимирующей модели применялись следующие методы: 1) рассмотренный выше базовый нечеткий дополняющий алгоритм (ДА); 2) метод ближайшего соседа [5.9, 5.10] (МБС); 3) метод
локальной
аппроксимации
с
линейными
локальными
функциями и числом ближайших узлов М = 3 [5.9, 5.10] (ЛА); 4) регрессионная модель третьего порядка z = b0 +b1x + b2y + b3xy + b4x2 + b5y2 + b6x2y + b7xy2 +b8x3 + b9y3 , коэффициенты b0 – b9 определяются по методу наименьших квадратов [5.11] (РМ 3); 5) регрессионная модель четвертого порядка: z = b0 +b1x + b2y + b3xy + b4x2 + b5y2 + b6x2y + b7xy2 +b8x3 + b9y3 + b10x2y2 + b11x3y + b12x3y + b13x4 + b14y4, коэффициенты b0 – b14 определяются по методу наименьших квадратов [5.11] (РМ 4); 6) регрессионная модель пятого порядка z = b0 +b1x + b2y + b3xy + b4x2 + b5y2 + b6x2y + b7xy2 +b8x3 + b9y3 + b10xy4 +b11x2y2 +b12x3y + b13x4 + b14y4 + b15xy4 + b16x2y3 + b17x3y2 + b18x4y + b19x5 + b20y5 , коэффициенты b0 – b20 [5.11] (РМ 5); 7) кубическая двумерная сплайн интерполяция [5.12, 5.13] (КСИ); 8) двухслойная нейронная сеть прямого распространения (многослойный персептрон) с сигмоидальными функциями активации и 10-ю нейронами в скрытом слое [5.1, 5.4] (НС 2); 9) трехслойная нейронная сеть прямого распространения (многослойный персептрон) с сигмоидальными функциями активации и 10-ю нейронами в 1-м и 5-ю во втором скрытых слоях [5.1, 5.4] (НС 3). Значения
средней
абсолютной
погрешности
моделей
при
расположении обучающих точек в узлах равномерной прямоугольной сетки для различных тестовых функций приведены в табл. 5.1.
153
Таблица 5.1 Средняя абсолютная погрешность аппроксимации при регулярном расположении обучающих точек
Z1 Z2 Z3 Z4 Z5 Z6 Z7
ДА
ЛА
КСИ
МБС
РМ 3
РМ 4
РМ 5
НС 2
НС 3
0.0161 0.2718 0.6998 2.2130 0.0229 0.0279 0.0564
0.0186 0.2795 0.6998 2.5943 0.0264 0.0314 0.0565
0.0187 0.2793 0.7308 1.9642 0.0123 0.0140 0.0539
0.0221 0.2560 0.6093 4.8559 0.0548 0.0636 0.0660
0.0506 0.4339 1.0580 9.4163 0.1741 0.2030 0.1614
0.0500 0.4339 1.0580 8.6314 0.1049 0.0940 0.1614
0.0500 0.4369 1.0364 8.6314 0.1049 0.0940 0.1174
0.0436 0.3990 1.2609 9.2408 0.0575 0.0269 0.1397
0.0073 0.3830 1.0506 9.4369 0.0651 0.0372 0.1086
Значения
средней
абсолютной
погрешности
моделей
при
расположении обучающих точек случайным образом по равномерному закону для различных тестовых функций приведены в табл. 5.2. Таблица 5.2 Средняя абсолютная погрешность аппроксимации при случайном расположении обучающих точек
Z1 Z2 Z3 Z4 Z5
ДА 0.0216 1,0885 3,4574 5,2297 0,0542
ЛА 0.0142 1,3214 4,0280 4,4404 0,0138
МБС 0.0201 1,0891 3,4350 5,7390 0,0691
РМ 3 0.0803 1,3902 3,8946 10,209 0,2046
РМ 4 0.0743 1,4822 4,2724 9,7917 0,1055
РМ 5 0.0918 1,6388 4,9621 13,079 0,1381
НС 2 0.1505 1,1545 3,0852 7,9824 0,1450
НС 3 0.0191 1,0625 3,1202 7,9747 0,0654
Из табл. 5.1 и табл. 5.2 видно, что точность моделей, полученных с использованием дополняющего алгоритма, близка к точности локальноаппроксимационных моделей, моделей полученных с помощью кубической сплайн-интерполяции, многослойных персептронов и существенно выше, чем у моделей, полученных другими методами.
154
В то же время расчеты показывают, что при случайном выборе обучающих точек дисперсия погрешности моделей, полученных с помощью нечеткого
дополняющего
алгоритма
ниже,
чем
у
локально-
аппроксимационных и нейросетевых моделей. 3. Влияние наличия априорной информации на точность моделей. Рассмотрим нелинейную функцию z( x, y)
x2
Рис. 5.6. Зависимость z( x, y)
y 2 (см. рис. 5.6).
x2
y2
По виду зависимости на рис. 5.6 определены априорные нечеткие продукционные правила правила: П1: если x "положительна" и y "приблизительно равна нулю", то z = 1, П2: если x "отрицательна", и y "приблизительно равна нулю", то z = 1, П3: если x "приблизительно равна нулю" и y "положительна", то z = -1, П4: если x "приблизительно равна нулю" и y "отрицательна", то z = -1, Функции принадлежности нечетких переменных "отрицательна" (N), "приблизительно равна нулю" (ZE), "положительна" (P) приведены на рис. 5.7.
155
Рис. 5.7. Вид функций принадлежности На рис. 5.8 показана зависимость, определяемая данными нечеткими правилами, при использовании алгоритма нечеткого вывода Сугэно.
Рис. 5.8. Зависимость, задаваемая априорными правилами Аппроксимация проводилась в области Использовалось
10
обучающих
точек,
х [-5, 5] и y [-5, 5].
расположенных
случайно
по
равномерному закону в указанной области. Для определения точности модели использовалось 400 тестовых точек. Значения средней абсолютной погрешности моделей для случая наличия априорных правил и при их отсутствии приведены в табл. 5.3.
156
Таблица 5.3 Средняя абсолютная погрешность аппроксимации Без априорных правил 0.268
При наличии априорных правил 0.198
Из табл. 5.3 видно, что наличие априорных правил уменьшает погрешность модели более чем на 30%. 4. Алгоритмы с различным порядком добавления обучающих точек в базу знаний. Проведем сравнение классического on-line алгоритма и off-line алгоритма, в котором базу знаний в первую очередь пополняют обучающие точки, для которых погрешность модели
i
y€i
y i принимает наибольшее
значение. Рассмотрим z1( x, y)
exp( ( x 2
задачу
аппроксимации
нелинейных
функций
y 2 )) в прямоугольной области х [-5, 5] и y [-5, 5].
Используются 64 обучающие точки. Точность моделей проверяется по 400 тестовым точкам, не принадлежащим множеству обучающих точек. Параметр
0.2 .
Результаты моделирования приведены в табл. 5.4.
157
Таблица 5.4. Средняя абсолютная погрешность аппроксимации и число правил в сформированной базе знаний при применении оn-line и off-line алгоритмов Тип расположения обучающих точек
Регулярная сетка Случайно по равномерному закону
On-line алгоритм Число продукционных правил 6 12
Off-line алгоритм
Средняя аб- Число солютная продукпогрешность ционных правил 0.1724 6 0.1315
13
Средняя абсолютная погрешность 0.1447 0.0978
Результаты, приведенные в табл. 5.4, а также рассмотрение других численных примеров показывает, что применение off-line алгоритма позволяет несколько повысить точность моделей.
5.6.
Модели динамических объектов
В составе практически любой интеллектуальной системы управления используется модуль эмуляции (идентификации) объекта. Качество всей системы управления во многом зависит от этого модуля, что определяет актуальность задачи моделирования динамических объектов. Ниже рассмотрен алгоритм идентификации динамических объектов на основе рассмотренного выше нечеткого дополняющего алгоритма. 5.6.1. Описание алгоритма
158
Допустим, что объект имеет скалярные вход ( t ) и выход ( t ) , как это показано на рис. 5.9. Предлагаемый подход несложно расширить и на многомерные динамические объекты.
(t )
ОБЪЕКТ
(t )
Рис. 5.9. Одномерный динамический объект Предположим, что регистрация входного и выходного сигнала объекта происходит в дискретные эквидистантные моменты времени ti, интервал между которыми значительно меньше постоянных времени объекта. Допустим далее, что на объекте может быть реализован эксперимент, заключающийся в регистрации N пар значений < i ,
i >,
при этом
i
и
i
измеряются без ошибок. Вход и выход исследуемого объекта связаны некоторой причинноследственной связью, которую для стационарного объекта можно отразить некоторым нелинейным разностным уравнением m-го порядка:
i
( i,
i 1 ,..., i m , i 1 , i 2 ,..., i m ) .
(5.32)
С другой стороны, такую модель можно интерпретировать как модель многофакторного статического объекта с числом входов n 2m 1, при этом, заменяя в (5.32) переменные, приходим к соотношению:
yi
(x i ) ,
(5.32)
159
где компоненты x ji (j=1, 2, ... n) входного вектора x соответствуют
значениям вектора
, а yi
i , i 1 ,, i m , i 1 , i 2 ,, i m
i
– выходу
объекта (верхние индексы i=1, 2, …, N указывают на порядковый номер опыта). При этом, в соответствии с вышеизложенным, известны N пар значений (примеров) < x i , yi > (если i=1, то значения 0, 0,
1, 1,
, ,
m
отражают
предысторию
m
– начальные условия).
входного
сигнала,
а
Соотношение (5.34) позволяет использовать нечеткий дополняющий алгоритм, рассмотренный в п. 5.2, для моделирования динамических объектов. 5.6.2. Численное исследование алгоритма моделирования динамических объектов Рассмотрим
пример
моделирования
дискретного
объекта. Пусть имеется объект, имеющий один вход
динамического
и один выход
.
Состояние входа и выхода объекта изменяется в дискретные моменты времени i = 0, 1, 2, … . Объект
имитируется
существенно
нелинейным
разностным
уравнением
i
3 sin(
i 2
/ 5) 8 cos(
i 1 / 5)
1000
sin(
i
0.25
i 2
sin(
/ 10) sin( i 1 / 10) 1 i 1 / 4 0.1
i 2
i 2 ),
при этом входной сигнал объекта представляет собой дискретный шум i
( 200, 200) . Зависимость уi+2(yi, yi+1) при ui = 0 приведена на рис. 5.10.
160
Рис. 5.10. Зависимость уi+2(yi, yi+1) при ui=0 Для идентификации использовалась выборка из 200 отсчетов. Эмуляция объекта производилась с помощью следующих моделей: 1) многослойного персептрона, содержащего три слоя нейронов: 1-й слой – 10 нейронов, 2-й – 5 нейронов, 3-й – 1 нейрон с сигмоидальными функциями активации [5.4, 5.5]. 2) сигма-пи (
) нейронной сети, реализующей квадратичную
функцию €i
b0 b7
b1 i
b2
i
b8
i 2
b12
i 1
b17
i 1
€i 2
2
b18
b3
i 1
€i
i
b13
i 2 2
i 2
1
i 2
b9 €i
i
b14
1
b19 €i
b 4 €i 1 b 5 €i 2 b 6 €i 2 b10 i 1 i 2 b11
2 2
i 2
b 20 €i
€i
2 2
2
b15 €i
1
i
€i
i 1 i 2
€i
2
b16
1 2 i
,
и настраиваемой по методу наименьших квадратов [5.1, 5.4]. 3) разработанного базового нечеткого дополняющего алгоритма.
161
На рис. 5.11 показан процесс изменения ошибки модели е i
€i
i
в
процессе обучения.
Рис. 5.11. Изменение ошибки модели в процессе обучения На рис. 5.12 показан процесс на выходе объекта (сплошная линия) и на выходе модели (линия, помеченная звездочками).
Рис. 5.12. Процесс на выходе модели и объекта В табл. 5.3 приведены значения средней абсолютной погрешности моделей еср, полученных разными методами при тестировании данных моделей реализацией входного сигнала, отличной от обучающей.
162
Таблица 5.5 Модель еср
Многослойный персептрон 10.7
Дополняющий алгоритм нейронная сеть 14.3 11.3
Из данных табл. 5.5 видно, что ошибки аппроксимации всех трех используемых моделей приблизительно соизмеримы, однако нечеткий дополняющий алгоритм выгодно отличается от многослойного персептрона тем, что в нем не возникает проблемы выбора структуры нейронной сети, а от сигма-пи нейронной сети тем, что позволяет аппроксимировать зависимость ( ) произвольного (нелинейного) вида. Необходимо отметить, что полученные с помощью предложенного алгоритма модели для гладких зависимостей
( ) обладают несколько
худшими аппроксимирующими свойствами по сравнению с нейросетевыми моделями (при правильном выборе структуры сети). 5.6.3. Выбор порядка модели Остановимся на вопросе о выборе порядка модели m. В работе [5.14] рекомендуется последовательно увеличивать порядок модели до получения минимального значения оценки средней погрешности. В то же время, численное моделирование показывает, что зависимость средней погрешности eср(m) от порядка модели m представляет собой унимодальную функцию дискретного аргумента (возрастание средней погрешности
при
превышении
порядком
модели
порядка
объясняется недостатком информации для обучения модели).
объекта
163
В качестве иллюстрации на рис. 5.13 приведена данная зависимость для рассмотренного выше примера.
Рис. 5.13. Зависимость средней ошибки аппроксимации от порядка модели Воспользовавшись тем, что зависимость eср(m) унимодальна, а также тем, что максимальное значение порядка модели m обычно выбирается не больше 5-7, можно рекомендовать для поиска оптимального значения m дискретный вариант метода дихотомии [5.15].
5.7.
Некоторые обобщения и выводы
Можно сформулировать ряд требований к методам построения моделей, основными из них являются: 1) универсальность,
хорошие
аппроксимирующие
свойства
(возможность построения адекватных моделей для широких классов существенно нелинейных объектов);
164
2) отсутствие априори задаваемых параметров, существенно влияющих на качество моделей
(например, порядок аппроксимирующего
полинома, число слоев нейронной сети и т.п.); 3) возможность использовать в моделях априорную информацию об аппроксимируемой зависимости, представленную в удобной для человека форме; 4) последовательная обработка экспериментальных данных (работа в режиме on-line); 5) простота алгоритма вычислений. На предмет наличия указанных свойств были проанализированы следующие, широко известные алгоритмы построения моделей: 1) метод ближайшего соседа [5.9, 5.10] (МБС); 2) метод локальной аппроксимации [5.9, 5.10] (ЛА); 3) сплайн интерполяция [5.12, 5.13] (СИ); 4) регрессионные модели [5.11] (РМ); 5) многослойный персептрон [5.1, 5.5] (МП); 6) нечеткая нейронная сеть [5.1, 5.5] (ННС); а также предложенный выше нечеткий дополняющий алгоритм (ДА). Результаты анализа сведены в табл. 5.6. Таблица 5.6. Сравнение различных алгоритмов построения моделей МБС ЛА СИ РМ МП ННС ДА Универсальность, хорошие – + + – + – + аппроксимирующие свойства Отсутствие априори задаваемых параметров, существенно влияющих на качество моделей Возможность использовать в моделях априорную информацию об аппроксимируемой зависимости Последовательная обработка экспериментальных данных Простота алгоритма вычислений
+
+
+
–
–
–
+
–
–
–
–
–
+
+
+
+
–
+
–
–
+
+
+
–
–
–
–
+
165
Данные, приведенные в табл. 5.6 показывают, что всем выделенным свойствам в совокупности удовлетворяет только нечеткий дополняющий алгоритм. Таким образом, рассматриваемый алгоритм может быть рекомендован для построения моделей объектов самой различной природы. Литература к главе 5
5.1.
Круглов В.В., Дли М.И., Голунов Р.Ю. Нечеткая логика и искусственные нейронные сети. М.: Физматлит, 2001.
5.2.
Jang
R.
Neuro-Fuzzy
Modeling:
Architectures,
Analyses
and
Applications: Ph.D. University of California. Department of Electrical Engineering and Computer Science. Berkeley, 1992. 5.3.
Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир, 1989.
5.4.
Круглов В .В., Борисов В. В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия – ТЕЛЕКОМ, 2001.
5.5.
Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002.
5.6.
Cheng Y.H., Lin C.S. Learning algorithm for radial basis function network with the capability of adding and pruning neurons. Conf. ICNN. Orlando. 1994. P. 797-801.
5.7.
Tarassenko L., Roberts S. Supervised and unsupervised learning in radial basis function classifiers // IEEE Proc. Vis. Image Signal Process. 1994. Vol. 141. P. 210-216.
5.8.
Platt J. A resource-allocating network for function interpolation // Neural Computation, 1991. Vol. 3. P. 213-225.
166
5.9.
Дли
М.И.
,
аппроксимационные
Круглов модели
В.В.,
Осокин
М.В.
социально-экономических
Локальносистем
и
процессов. – М.: Наука. Физматлит, 2000. 5.10.
Катковник В.Я. Непараметрическая идентификация и сглаживание данных. M.: Наука, 1985.
5.11. Планирование
эксперимента
в
исследовании
технологических
процессов / Э.Лецкий, К.Хартман, В.Шефер и др. М.: Мир, 1977. 5.12.
Завьялов Ю.С., Квасов Б.И., Мирошниченко В.П. Методы сплайнфункций. М.: Наука, 1980.
5.13. Завьялов Ю.С., Леус В.А., Скороспелова В.А. Сплайны в инженерной геометрии. М.: Машиностроение, 1985. 5.14. Гаврилов А.И. Нейросетевая реализация процедуры идентификации динамических систем // Автоматизация и современные технологии. 2002. № 3. С.22-25. 5.15. Аоки М. Введение в методы оптимизации. М.: Наука, 1977.
167
6. АЛГОРИТМИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ИССЛЕДОВАНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ УПРАВЛЕНИЯ 6.1. Алгоритмы для численного исследования систем управления В процессе проектирования систем управления часто возникает необходимость получить зависимость значений показателей качества управления от параметров системы, а также начальных значений переменных состояния.
Определяются
данные
зависимости
путем
многократных
вычислительных экспериментов на модели системы управления, что занимает значительное время. Интеллектуальные
системы
управления
обладают
большой
сложностью. Однократный расчет переходного процесса в данных системах, даже при использовании компьютеров последнего поколения, занимает значительное количество машинного времени. Проведение многократных имитационных экспериментов в данном случае, как правило, весьма затруднительно. Таким образом, возникает определенное противоречие между сложностью системы, обусловленной требованием достижения заданного качества управления, и возможностью исследования свойств системы, и как следствие, непредсказуемостью характеристик ее поведения. Поэтому актуальной становится задача рационального использования ограниченной информации, полученной в результате небольшого числа циклов имитационного моделирования системы. Ниже изложены некоторые подходы к решению указанной задачи.
168
1. Применение моделей зависимости показателей качества системы управления от ее параметров. В работе [6.1] основой для построения таких моделей
предлагается
использовать
искусственные
нейронные
сети.
Необходимая для обучения нейронной сети выборка может быть получена на основе экспериментов на имитационной модели системы. Представляется, что использование в данном случае дополняющего алгоритма адаптации нечетких нейронных сетей, рассмотренного в главе 5, будет иметь ряд преимуществ, по сравнению с применением нейронных сетей: 1) возможность использовать априорную информацию о зависимости показателей качества системы управления от ее параметров (в большинстве случаев данная информация имеется, например, для многих систем повышение коэффициентов передачи приближает систему к границе устойчивости); 2) модель может последовательно уточняться по мере поступления новых экспериментальных данных; 3) значительно меньшие вычислительные затраты по сравнению со многими
типами
нейронных
сетей
(например,
многослойным
персептроном); 4) сформированные
нечеткие
продукционные
правила
могут
использоваться для дальнейшего анализа пользователем; 5) эксперименты показывают, что при малом объеме обучающей выборки дисперсия погрешности рассматриваемых моделей ниже, чем при использовании
большинства
других
известных
методов
(например,
многослойных персептронов или локальной аппроксимации). 2. Применение алгоритмов с укороченным циклом моделирования. В процессе определения зависимости показателей качества системы (или области устойчивости) в пространстве начальных условий переменные состояния системы попадают в область, для которой ранее уже определены показатели качества системы. Таким образом, нет необходимости проводить
169
полный цикл моделирования. Описанная модернизация алгоритма позволяет уменьшить в среднем в 3 раза число необходимых для определения искомой области вычислений. На практике получили распространение три метода определения областей качества в пространстве параметров или начальных условий: метод слежения вдоль границ, метод рассечения параллельными прямыми и веерный метод построения областей заданного качества управления [6.2]. Ниже рассмотрен алгоритм определения областей качества систем, основанного на веерном методе и позволяющего оценить данные области с заданной точностью. Допустим известна некоторая точка О внутри искомой области (см. рис. 6.1).
Рис. 6.1. Иллюстрация веерного метода построения точек границы области Проведем из точки О горизонтальный луч в направлении увеличения координаты по оси абсцисс (т.е. под углом
0 ). Найдем точку
1
пересечения данного луча с границей области А1. Изменим угол наклона луча на
и проведем второй луч из точки О под углом
2
. Найдем точку
пересечения данного луча с границей области А2. Проводя лучи под углами
170
N
i
, i 1, 2, ... N ( N
2
), получим ряд точек границы области А1,
А2, … АN . Соединив попарно отрезками точки А1 и А2, А2 и А3, А3 и А4 и т.д., получим оценку искомой области. Пересечение лучей с границей области можно найти с любой априори заданной погрешностью (в пределе равной нулю), однако при этом все равно имеется погрешность в определении границ области за счет конечности числа точек N [6.2]. Допустим, что искомая истинная область является выпуклой. В этом случае определенная с помощью веерного метода оценка области будет целиком лежать внутри истинной области. В качестве меры относительной погрешности между истинной областью и ее оценкой по конечному числу N точек удобно выбрать относительное отклонение площади найденного N-угольника SN и истинной площади области S:
N
S SN 100% . SN
(6.1)
Оценим эту погрешность. Рассмотрим сектор, образованный лучами, проходящими под углом и
i 1.
i
Площадь сектора образуемого данными лучами и границей искомой
области, как известно, определяется формулой [6.3]:
i 1
r 2 ( )d ,
S
(6.2)
i
где r( ) – зависимость длины радиус-вектора от угла
.
171
Теперь допустим, что площадь рассматриваемого сектора оценивается по двум точкам Аi и Аi+1 [6.3]:
Sоцен
r( i ) r(
i 1)
sin(
i).
i 1
(6.3)
Абсолютная погрешность определения площади:
S S Sоцен .
(6.4)
Если зависимость r( ) непрерывна, а граница области выпукла, то всегда можно выбрать такое малое приращение угла котором
i 1
i,
при
длину радиус-вектора r( ) можно приблизительно считать
постоянной: r( )
r0
const ,
[ i,
i 1].
Решая совместно (6.2) – (6.4), получим:
S(
Учитывая малость sin(
)
1 6
3
r0 2 [
)
sin(
и разлагая sin(
)] .
(6.5)
) в ряд Маклорена,
... , на основании (6.5) будем иметь:
S(
m
)
1 m3
S(
),
(6.6)
где m – положительное целое число. Из соотношения (6.6) следует, что если в веерном методе увеличить число точек в m раз, то отклонение площади истинной области от ее оценки уменьшится, по крайне мере, также в m раз:
172
1 m
Sk m
где
Sk ,
(6.7)
S k – погрешность определения площади области по k точкам, Sk m – погрешность определения площади области по k m точкам. Полученные соотношения позволяют найти оценку отклонения (6.1)
без знания истинной величины S . Действительно, определяя область заданного качества системы по k и по k m точкам, можно записать
Sk ,
S Sk
(6.8)
Sk m .
S Sk m
(6.9)
где S – истинная площадь области,
Sk – площадь области, определенной по k точкам,
S k m – площадь области, определенной по k m точкам, откуда (с использованием (6.1) и (6.7)):
km
Sk m Sk 100% . (m 1) Sk
(6.10)
В данное соотношение входят площади многоугольников, заданных своими вершинами. Эти площади можно определить по формуле [6.4]:
SN
1N 1 (x i y i 2i1
1
xi
1
y i ) x N y1
xi yN ,
(6.11)
173
где N – число вершин,
x i , yi
– координаты вершин многоугольника,
i 1, 2, ... N . Приведенные выкладки проиллюстрируем примером. Пример 6.1. Рассмотрим x2 4
y2
область
в
форме
эллипса,
заданного
1.
Определяя площадь эллипса веерным методом по k 4
уравнением
и начальным углом
числа лучей в два раза ( m
1
0 , получим S8
2 ) будем иметь S16
8 лучам с шагом
5.364 ; при увеличении
6.0011.
Подставляя теперь данные численные значения в формулу (6.10), получим оценку
16
10.616% .
Как несложно определить, истинная площадь эллипса равна S 6.283 , и погрешность определения площади составляет
16
S S16 S
4.487% , что
соответствует найденной оценке. Изложенное
позволяет
сформулировать
следующий
алгоритм
определения областей качества систем с заданной точностью. Шаг 1. Из эмпирических соображений выбираются параметры алгоритма k и m, а также заданная относительная погрешность . Шаг 2. Проводится определение областей веерным методом по k и k m точкам.
Шаг 3. По формуле (6.10) определяется относительная погрешность kn.
Шаг 4. Сравниваются погрешности
km
и
, и если
km
, то в
качестве окончательной области принимается область, определенная по k m точкам, в противном случае k : k m и переход к шагу 2.
174
Выше приведен алгоритм определения областей качества систем в плоскости двух параметров, случай же произвольного числа параметров можно свести к двумерному, рассматривая сечения многомерных областей плоскостями. 6.2. Программное обеспечение для исследования систем управления На основании изложенных в п. 6.1 методов и алгоритмов разработан программный пакет для численного анализа систем управления Nonlinear Control Analysis (NCA). По сути, данный программный продукт представляет собой пакет расширения системы MATLAB. Пакет NCA 1.0 обеспечивает: численное исследование динамических систем заданных в виде S-моделей в среде Simulink 4.0/4.1/5.0; построение
зависимостей
показателей
качества
системы
управления (время переходного процесса, перерегулирование, интегральные оценки качества) от параметров системы или начальных условий; построение областей заданного качества систем управления (области устойчивости, области в которых показатели качества находятся в заданном диапазоне) в пространстве параметров системы или начальных условий; отображение результатов как в виде семейства 2-D графиков, так и в виде 3-D графиков; вывод результатов моделирования в отдельных окнах, число которых не ограничено. На рис. 6.2 показано главное окно русскоязычной версии пакета NCA 1.0 на переднем плане окна с S-моделью системы управления.
175
Рис. 6.2. Главное окно пакета NCA 1.0 Данное окно имеет четыре поля: построение зависимостей показателей качества от параметров системы; построение
зависимостей
показателей
качества
от
начальных
условий; построение областей заданного качества в пространстве параметров; построение областей заданного качества в пространстве начальных условий. Каждое поле содержит кнопку “Пуск” для запуска процесса моделирования, кнопку “Параметры” для открытия окна параметров
176
моделирования и кнопку “Настройка” для открытия окна настроек процесса моделирования. В окнах “Параметры” задаются: показатель качества системы управления и диапазон его нахождения (для случая построения областей заданного качества); параметры системы или начальные условия, влияние которых исследуется, а также диапазон их изменения; способ отображения зависимостей (семейство 2-D графиков или 3-D графики). В окнах “Настройки” задаются: используемые алгоритмы; способы автоматического определения параметров системы.
Литература к главе 6 6.1. Хо Д.Л. Синтез адаптивных динамическими
объектами
на
систем управления нелинейными базе
нечетких
регуляторов
и
нейросетевой технологии. Дис … докт. техн. наук. М.: МЭИ, 2002. 6.2.
Анализ и оптимальный синтез на ЭВМ систем управления / Под. ред. А.А.Воронова и И.А. Орурка. М.: Наука. 1984.
6.3.
Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся вузов. М.: Наука, 1980.
6.4.
Математика и САПР: В 2-х кн. Кн. 1 / П.Шенен, М.Коснар, И.Гардан и др. М.: Мир, 1988.
177
Научное издание Усков Андрей Александрович Круглов Владимир Васильевич ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ НА ОСНОВЕ МЕТОДОВ НЕЧЕТКОЙ ЛОГИКИ Издательство «Смоленская городская типография» 214000, Смоленск, Маршала Жукова, 16 Тел.: (08122) 3-28-65
Подписано в печать 17.03.2003. Формат 60x84/16 Бумага офсетная. Усл. печ. л. 11.25. Тираж 100 экз. Заказ 2809. Смоленская городская типография 214000, Смоленск, Маршала Жукова, 16. Тел.: (08122) 3-28-65
Таблица 4.1 ОСНОВНЫЕ АНАЛИТИЧЕСКИЕ МЕТОДЫ ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ Название метода Суть метода Достоинства Недостатки Литерату ра 1. Первый метод Производится анализ линеаризоЛяпунова ванных уравнений системы.
2. Второй (прямой) Сводит задачу исследования усметод Ляпунова тойчивости системы к исследованию функции Ляпунова.
3. Метод гармонической линеаризации (гармонического баланса, описывающих функций)
Расчет производится только по нескольким первым (обычно одной первой) гармоникам сигналов, действующих в системе.
4. Метод Попова (для непрерывных систем). Геометрический критерий устойчивости, критерий Цыпкина (для дискретных систем)
Позволяет определить сектор, при нахождении в котором характеристики статического нелинейного элемента система будет устойчива в целом (абсолютная устойчивость).
Применим для систем любой структуры.
Универсальность. Позволяет определить область устойчивости относительно начальных условий, а так же некоторые показатели качества системы. Позволяет определить некоторые показатели качества системы. Простота, наглядность.
Позволяет определить некоторые показатели качества системы. Простота, наглядность.
Дает лишь необходимые условия устойчивости. Система должна содержать только линеаризуемые нелинейности. Дает лишь достаточное условие устойчивости. Сложность выбора функции Ляпунова. Громоздкость выкладок. Не является ни необходимым, ни достаточным. Применим для нелинейных систем специального вида (выделенная линейная и нелинейная части). Необходимо выполнение гипотезы фильтра. Дает лишь достаточное условие устойчивости. Применим для нелинейных систем специального вида (выделенные линейная и нелинейная части).
[4.2 – 4.5]
[4.2 – 4.5]
[4.2, 4.4, 4.6, 4.7]
[4.2, 4.4, 4.5, 4.8]
179