Е. В. Белогорцев
АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ ( СЛОЖНЫЕ СИСТЕМЫ ) Учебное пособие для студентов, обучающихся по специальности “Механика”
Белогорцев Е.В. Автоматизированные системы управления (Сложные системы) [Электронный ресурс]: Учебное пособие. — Электрон. текст. дан. (715 кб). — Мн.: “Электронная книга БГУ”, 2004. — Режим доступа: http://anubis.bsu.by/publications/elresources/MathematicsMechanics/ belogortsev2.pdf. — PDF формат, версия 1.4 . — Системн. требования: Adobe Acrobat 5.0 и выше.
МИНСК «Электронная книга БГУ» 2004
© Белогорцев Е.В., 2004 © Научно-методический центр «Электронная книга БГУ», 2004 www.elbook.bsu.by
[email protected]
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕХАНИКО − МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ Кафедра теоретической и прикладной механики
АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ ( СЛОЖНЫЕ СИСТЕМЫ ) Учебное пособие для студентов, обучающихся по специальности “Механика”
МИНСК 2004
1
Автор Е. В. Белогорцев , кандидат физико − математических наук
Утверждено Ученым советом механико−математического факультета Рекомендовано для студентов 4−5 курсов
В учебном пособии рассматриваются вопросы моделирования автоматизированных систем управления с точки зрения представления их сложными системами . Основное внимание уделяется вопросам повышения их эффективности с использованием соответствующих методов оптимизации . Представленный материал носит общий характер и может быть использован как дополнение к традиционным обучающим курсам по автоматизированным системам управления .
2
СОДЕРЖАНИЕ
1. Введение в автоматизированные системы управления (АСУ)
4
2. Алгоритмы оптимизации непрерывных параметров АСУ
11
3. Вопросы оптимизации взаимодействия подсистем АСУ
19
4. Сложные системы
27
5. Статистический анализ динамических систем управления
36
6. Общие характеристики моделей систем
43
7. Стационарная вероятностная модель АСУ
49
8. Модель системы с несколькими источниками сообщений
53
9. Эволюция АСУ
57
10. Надежность функционирования сложных систем
63
11. Выражение характеристик процесса через характеристики его поведения в интервалах между попаданиями в некоторое состояние
64
12. Модель живучести АСУ
66
Литература
69
ВВЕДЕНИЕ В СИСТЕМЫ
АВТОМАТИЗИРОВАННЫЕ УПРАВЛЕНИЯ (АСУ)
К автоматизированным системам управления ( АСУ ) мы будем относить множество систем определяемых как форму организации управления (включающую технические средства , математические методы , алгоритмы и соответствующее программное обеспечение ) сложным объектом на базе кибернетики ( исследующей процессы управления в живой и неживой природе ) и информатики (объединяющей методы переработки , средства хранения , использования и передачи информации ) . Основы создания АСУ . Под сложными объектами обычно понимают системы , состоящие из большого количества элементов и обладающих многоуровневой структурой (имеющих несколько уровней иерархии) . Элементом называют структурную составляющую не подлежащую более мелкому разбиению . В зависимости от выбора характеристик структурной составляющей , методов описания взаимодействия их друг с другом и конечной целью , преследуемой при создании системы , “элемент “ сам может представлять собой объект , который может быть подвергнут дальнейшему разбиению . Таким образом , понятие “ элемент “ является довольно относительным , как и “ большое “ количество элементов . Любая форма организации управления характеризуется ее качеством , которое в формальном выражении представляется соответствующей целевой функцией , зависящей от структуры системы , элементов , их параметров и видов взаимодействия . Следовательно , необходимое качество функционирования АСУ определяется экстремумом выбранной целевой функции , который достигается соответствующим выбором структуры , элементами с их связями , характеристиками и параметрами . На следующем рисунке приводится наиболее общая схема любой автоматизированной системы управления .
4
АСУ
ОУ − объект управления СУ − средства управления АУ − аппарат управления
ИС Функционирование АСУ осуществляется посредством информационных связей , таких как : прямые (ПИС) и обратные (ОИС) внутрисистемные информационные связи , задающие параметры функционирования отдельным элементам ; внешние информационные связи (ИС) , отражающие взаимодействие АСУ с вышестоящими и нижестоящими средствами управления и внешней средой . Основной целью , преследуемой при создании любой АСУ , является разработка и реализация эффективных управляющих решений на базе соответствующих управляющих алгоритмов с использованием значительного объема разнообразной информации . Это , в основном , и является причиной широкого использования вычислительной техники и применения экономико – математических методов . Иными словами , АСУ − человеко−машинная система с автоматизированной технологией получения результативной информации , необходимой для оптимизации процесса управления в различных сферах человеческой деятельности . На представленной обобщенной схеме АСУ в нее (ограниченной штрих – пунктирной линией) включен и объект управления ; этим подчеркивается тот факт , что , в силу возможных обратных связей непосредственно системы и ОУ , характеристики системы могут существенно изменяться с течением времени и соответственно корректироваться .
5
Развитие АСУ . Исторически этапы развития АСУ в период СССР тесно связаны с существовавшими тогда пятилетними планами развития народного хозяйства . Кратко упомянем основные показатели , характеризующие эти этапы развития автоматизированных систем управления . Период с 1956 – 1960 г.г. характеризуется появлением 1 – го поколения ЭВМ . Решаются локальные задачи экспериментального характера . Закладывается первый опыт в использовании ЭВМ и экономико – математических методов , включающих методы линейного и нелинейного программирования , для решения транспортных задач . С 1961 г. по 1965 г. создаются АСУ на опытно – показательных предприятиях ; осуществляются первые шаги в проектировании автоматизированных систем . Этап с 1966 г. по 1970 г. характерен внедрением первых очередей АСУ в масштабах СССР . Разработан 3 – х летний план создания таких АСУ , как АСОУ – организации управления ; АСУП – управления предприятиями ; ОАСУ – отраслевые АСУ ; АСУТП – технологическими процессами . Инвестирован 1 млрд . рублей на внедрение вычислительной техники ( по тем временам немалые деньги ). В период с 1971 г. по 1975 г. в развитие технической базы АСУ вкладывается 4 млрд . рублей ; в разработке , внедрении и эксплуатации систем занято около 300 тыс. специалистов . Примерно , 2300 АСУ создано . С 1976 г. по 1980 г. заметно совершенствуется техническая база , развиваются действующие АСУ . Начинается переход к внедрению качественно новых направлений в вычислительной технике это : − создание интегрированных АСУП ; − ввод в действие высокопроизводительных ( для того времени ) ВЦ коллективного пользования ; − развитие периферийных систем и устройств . С 1981 г. по 1985 г. начинают внедряться персональные ЭВМ . Это позволяет локально , на рабочем месте использовать универсальные ЭВМ , что дает доступ к вычислительным и информационным ресурсам для решения задач в реальном времени . В период 1986 – 1990 г.г. предусматривалось создание и массовое внедрение автоматизированных рабочих мест (АРМ) ,
6
развитие систем автоматизированного проектирования (САПР) элементов АСУ , но развал СССР внес свои коррективы ( не всегда положительные ) в развитие промышленности , науки и , в целом , общества , что существенно отразилось и на развитии АСУ . Настоящий период характеризуется широким внедрением ПЭВМ со все увеличивающейся мощностью , объединением их с соответствующими периферийными устройствами в локальные сети , предназначенными для автоматизации управления в различных сферах человеческой деятельности и создания глобальных сетей . Принципы создания и функционирования АСУ . Академиком бывшего СССР В.М. Глушковым первоначально были сформулированы рекомендации по проектированию АСУ , которых следует придерживаться при создании систем . Эти рекомендации с течением времени сложились как основные принципы создания АСУ , краткое содержание которых сводится к − системности , подразумевающей рассмотрение системы как единого целого с установлением связей , обеспечивающих целостность ; − развитию , обеспечивающему возможность наращивания вычислительных мощностей , задач и информационных фондов ; − совместимости , при которой АСУ различных видов и уровней могут быть объединены в более мощную систему с минимальными изменениями ; − стандартизации и унификации используемых элементов , программного и алгоритмического обеспечения функционирования АСУ ; − эффективности , подразумевающей выбор подходящей целевой функции ( функции качества ) , зависящей от параметров АСУ , оптимальные значения которых определяются путем нахождения экстремума функции качества . Основные элементы АСУ . Обычно подразумевают технологический и функциональный аспекты рассмотрения АСУ в соответствии с которыми последняя может быть разбита на несколько подсистем . Технологический аспект. Согласно данному аспекту рассмотрения системы в управляющей части ( органе управления ) выделяют аппарат и средства управления , а также технико – экономическую информацию и средства ее технологической обработки :
7
Управляющая часть
аппарат и средства управления технико − экономическая информация методы и средства ее обработки
Обычно управляющая часть в приведенном виде называется автоматизированной системой обработки данных (АСОД) , замыкающей через себя прямые и обратные информационные связи между объектом управления (ОУ) и аппаратом управления (АУ) , что иллюстрируется следующей схемой : ОУ
АСОД
АУ
Функции АСОД определяют ее структуру , которая включает подсистемы : 1) сбора и регистрации данных ; 2) подготовки информационных массивов ; 3) обработки , накопления и хранения данных ; 4) выпуск документов с результатной информацией ; 5) передачи данных от источников возникновения к месту обработки , а результатов расчетов к потребителям информации для принятия управляющих решений . В состав технических средств АСОД входят : 1) вычислительная техника , включающая , обычно , мощную ЭВМ , а также ПЭВМ ; 2) технические средства подготовки и хранения информационных массивов , устройства обработки и регистрации данных , каналы связи , аппаратура дистанционной передачи данных и т.п. Материальные ресурсы и обслуживающий персонал должны быть организованы так , чтобы достигался необходимый экономический эффект . Большое значение имеет выбор организации и использования вычислительной техники , являющейся одним из важнейших элементов АСОД в частности , и АСУ − в целом .
8
На практике сложились следующие формы организации вычислительной техники : а) децентрализованная ; б) централизованная ; в) смешанная . Децентрализованная форма ориентирована на массовое внедрение ПЭВМ для рабочих исполнителей . На этой технической базе создаются АРМ и локальные вычислительные сети . Централизованная форма предусматривает наличие вычислительного центра , где сосредоточены мощные вычислительные , информационные , программные и другие ресурсы , включая квалифицированных специалистов по эксплуатации технических средств , проектированию и программированию новых задач , созданию и внедрению новых информационных массивов . Смешанный вариант подразумевает широкое использование мощных ЭВМ совместно с ПЭВМ . При этом , обычно , вычислительный центр занимает доминирующее положение в организации разветвленной вычислительной сети . Функциональный ( или содержательный ) аспект рассмотрения элементов АСУ позволяет выделить обеспечивающие и функциональные подсистемы . Обеспечивающая часть АСУ автоматизирует решение задач с использованием ЭВМ и других технических средств управления . Состав обеспечивающей части АСУ , как правило , однороден для различных систем , что позволяет реализовать принцип совместимости различных систем . Обязательными элементами обеспечения АСУ являются : − информационное − математическое − лингвистическое − правовое − техническое − организационное − программное − эргономическое включает технические Информационное обеспечение АСУ средства и персонал , обеспечивающий надежность хранения , своевременность и качество технологии обработки информации . Лингвистическое обеспечение (ЛО) содержит совокупность языковых средств для формализации естественного языка в ходе общения персонала АСУ со средствами вычислительной техники . ЛО обычно включает : информационные языки для описания структурных единиц информации базы АСУ ; языки управления и манипулирования данными информационной базы АСУ ; языковые средства автоматизированного проектирования АСУ .
9
Техническое обеспечение (ТО) включает комплекс технических средств , обеспечивающих работу АСУ ( технические средства сбора , регистрации , передачи , обработки , отображения , оргтехника т.п. ). (ПО) − комплекс программ , Программное обеспечение реализующий функции и задачи АСУ и обеспечивающий устойчивую работу комплексов технических средств . Математическое обеспечение (МО) содержит совокупность методов , моделей и алгоритмов обработки информации , используемых в процессе автоматизации проектировочных работ АСУ . Организационное обеспечение (ОО) − комплекс документов , регламентирующих деятельность персонала АСУ в условиях функционирования . ОО реализуется в различных методических и руководящих материалах на стадиях разработки , внедрении и эксплуатации АСУ . Правовое обеспечение (ПО) содержит совокупность правовых норм , регламентирующих правоотношения в создании и внедрении АСУ ( договорные отношения разработчика и заказчика при создании систем и т.п. ) . Эргономическое обеспечение (ЭО) − совокупность методов и средств для создания оптимальных условий высокоэффективной и безошибочной деятельности человека в АСУ для ее быстрейшего освоения . Классификация АСУ . Разнообразие автоматизированных систем управления дает возможность классифицировать их , в основном , по следующим признакам : 1) виду управляемого процесса ( технологический , организационный , информационный , обучающий и т.п. ) ; 2) сфере функционирования объекта управления (конкретная отрасль , регион ) ; 1) уровню государственного управления ; 2) методу интеграции АСУ ; 3) функциям хозяйственного управления . Приведем несколько примеров типичных автоматизированных систем . АСУТП−АСУ технологическими процессами ; вопросы , связанные с принятием управляющих решений остается , как правило , за человеком ;
10
АСОУ−системы организационного управления , где объектом управления являются отношения производственные , социально – экономические на всех уровнях народного хозяйства ; АСОИ−автоматизированные системы обработки информации ; объектом служат массивы данных , процессы по их формированию , накоплению , обработке ; прежде всего подобные системы ориентированы на обработку технической , патентной , библиотечной , архивно – справочной информации : АСНИ−системы , ориентированные на повышение качества и эффективности научных исследований ; САПР−обеспечивают автоматизацию сложных и трудоемких работ по созданию и совершенствованию новых изделий , оборудования , автоматизированных систем управления ; основой является моделирование типовых конструкторских элементов проектируемых процессов на основе развитой системы баз данных , алгоритмах и программах , использовании различных ( по экономической эффективности и точности вычислений ) ЭВМ ; АОС−автоматизированные обучающие системы , обеспечивающие подготовку специалистов в учебных заведениях . Более подробное рассмотрение некоторых АСУ будет приведено в последующем материале .
АЛГОРИТМЫ ОПТИМИЗАЦИИ НЕПРЕРЫВНЫХ ПАРАМЕТРОВ АСУ В самом широком смысле задача оптимизации непрерывных параметров сложных систем , в том числе и АСУ , заключается в отыскании экстремума критерия оптимальности ( целевой функции ) при ограничениях типа равенств и неравенств соответственно : F (x) ;
h 1 (x) , ... , h n (x) ; g n+1 (x) , ... , g p (x) ;
где x = { x 1 , ... , x m } T – вектор – столбец в Rm ( евклидовом пространстве ) . Тогда задача заключается в том , чтобы найти min F(x) при x∈R
h j (x) = 0 , j = 1 , ... , n
и
g j ≥ 0 , j = n+1 , ..., p
11
В математическом программировании выделяют следующие основные разделы : 1) линейное программирование { F(x) и ограничения линейные } ; 2) нелинейное программирование {F(x) и ограничения нелинейные }, где возможно − выпуклое программирование { F(x) и множество x выпуклы}; − квадратичное программирование { F(x) – квадратичная функция и множество x – линейно } . Рассмотрим следующие алгоритмы оптимизации . 1) оптимизация одномерного унимодального критерия ; 2) оптимизация методом последовательного изменения переменных ; 3) оптимизация методом прямого поиска ; 4) метод сопряженных направлений ( метод Дэвидона – Флэтчера – Пауэлла ); 1) метод штрафных и барьерных функций . 2) минимизация функции максимума . Следует отметить , что методов оптимизации значительно больше , но для того , чтобы составить общее впечатление о методах оптимизации мы ограничимся названными . Кроме того , чтобы выбрать конкретный метод оптимизации необходимо четко определиться с априорной информацией о функциях F(x) , h j (x) , g j (x) . Обычно эффективность алгоритмов характеризуется следующими параметрами : скоростью сходимости , устойчивостью , универсальностью и объемом затрат , связанных с подготовкой задачи на ее решения на ЭВМ . 1 . Минимизация одномерного унимодального критерия В этом случае полагается , что F(x) является одномерной действительной функцией на [ a , b ] и при этом она унимодальна , т.е. для любых x 1 и x 2 принадлежащих интервалу [ a , b ] справедливо : F(x1) < F(x2) для x 0 < x1 < x2 ; F(x1) > F(x2) для x1 < x2 < x0 , где x0 является единственной точкой минимума функции F(x) на [ a , b] . Для нахождения точки минимума применяются следующие широко используемые методы : метод золотого сечения , метод чисел Фибоначчи , метод деления пополам и другие .
12
Ниже на рисунке приведены унимодального критерия . F(x)
возможные
F(x)
x0
b
x a
F(x)
функции
F(x)
x a
варианты
x0
x
b
a
x0 b
Под числами Фибоначчи понимают числа , для которых выполняются соотношения : Fk-1 / Fk+1 → 0.382 при k→∞ Fk / Fk+1 → 0.618 . a k tk
tk ’ b k
x
Поэтому можно записать для последовательностей
чисел t k и t k′
t k = a k + 0,382 ( b k – a k ) t k′ = a k + 0,618 ( b k – a k ) . 2 . Метод поочередного
изменения
переменных
В данном случае траекторией поиска является ломанная линия , стороны которой параллельны осям пространства оптимизируемых параметров Rm . Выбирается начальная точка , из которой 0 0 0 T начинается поиск x = {x1 , ... , xm } . Затем начинают изменять x10 каким либо способом до тех пор пока уменьшается F (x) при неизменных остальных координатах x20 , ... , xm0 . Пусть точка x11 будет точкой минимума F(x) . Тогда аналогичную процедуру начинают уже из точки с координатой x11 вместо точки После осуществления аналогичных операций по всем x10 . переменным осуществляется следующая итерация из точки
13
x1={x11,..., xm1} . Итерации продолжаются до тех пор пока F(x) продолжает уменьшаться . Если существуют производные функции F(x) , то одномерная оптимизация может осуществляться методом − ∂F(x)/∂xn . Эта наискорейшего спуска , т.е. в направлении модификация алгоритма называется методом Гаусса – Зейделя . Следует отметить , что данная модификация неэффективна для , так называемых , ″ гребневых ″ функций F(x) . Данный алгоритм целесообразно применять для сепарабельного программирования , т.е. для функций вида *
m
F(x) = F (x) + ∑ Fi ( xi – xi* ) , i =1
где Fi( ) – унимодальные функции с минимумом в начале координат . Примером могут служить функции эллиптического типа : F(x1 , x2) = F* ( x1*,x2* ) + c1( x1 – x1* ) 2 + c2( x2 – x2* ) 2 . 3 . Метод прямого поиска На первом этапе осуществляется исследующий поиск вокруг начальной точки с которой начинается оптимизация ( базисной точки ) . Для этого в циклическом порядке изменяются поочередно все переменные и вычисляются F(x) , т.е. из точки x0 меняется x1 на x1 + ∆x1 , если F(x) не улучшилось , то делают x1 − ∆x1 , если и здесь не произошло улучшения функции качества , то оставляют x1 исходным . Так поступают для всех переменных и находят новую базисную точку x01 . В результате поиска находят направление минимизации . Это вектор удачных изменений переменных ∆ x = x01− – x0 . Затем делается последовательность шагов в этом направлении до тех пор , пока происходит улучшение функции F(x) , Таким образом , итерационный процесс соответствует формуле : x i k+1 = x ik + µ ( x i k – x i 0 ) , i = 1 , m 4 . Алгоритм Дэвидона – Флэтчера – Пауэлла Метод переменной метрики или алгоритм направлений , предназначен для безусловной
сопряженных оптимизации
14
дифференцируемой функции нескольких переменных . Особенность его состоит в том , что поиск минимума осуществляется вдоль направления − B∇F(x) , где ∇F(x) = {∂F/∂x1 , ... , ∂F/∂xm} T и В является положительной матрицей являющейся аппроксимацией матрицы D , обратной матрице H = { ∂ 2F/∂xi∂xj } , i , j = 1,m . Основная идея алгоритма заключается в том , что F(x) можно представить в окрестности точки xmin , где функция F(x) достигает минимального значения , в виде разложения в ряд Тейлора : F(x) ≈ F(xmin ) + (x – xmin ) T H (x – xmin ) / 2 . Тогда градиент этой функции будет равен ∇F(x) = H ( x – xmin )
откуда xmin = x – H − 1∇F(x) ≈ x - B∇F(x) .
Последнее выражение наталкивает на мысль , что можно построить итерационный процесс в виде : x k+1 = x k − α k B k∇F(x k ) , k = 1 , …. где B k является аппроксимацией матрицы H –1 на к – ом шаге , αk – число , обеспечивающее локальный минимум вдоль направления ∇k = − Bk∇F(x k ) . Смысл переменной метрики заключается в том , что на к – ом шаге направление ∇F(xk) изменяется за счет матрицы Bk . Матрица Bi+1 вычисляется по формуле : Bi+1 = Bi + ( vi viT ) / ( viT wi ) – ( Bi wi wiT Bi ) / ( wiT Bi wi ) , vi = α∇i ;
где
wi = ∇F( xi+1 ) − ∇F( xi ) .
Различный выбор матрицы B и алгоритмов с переменной метрикой .
порождает
выбор
различных
5 . Алгоритмы штрафных и барьерных функций . В данном случае предполагается , что ограничения заданы в виде: gi(x) ≤ 0 . Исходная функция F(x) преобразуется в другую с помощью функции A(x) , которая называется функцией штрафа ,
15
определяющей наказание за выход допустимых значений за ограничения . Вместе с тем нельзя штрафовать допустимые точки . Обычно употребляют следующий вид штрафных функций : n
p
i=1
i = n+1
A(x) = ∑ H [ hi(x) ] + ∑ G [ gi(x) ]
, где
H(z) = 0 , если z = 0 , и H(z) > 0 , если z ≠ 0 ; G(z) = 0 , если z ≤ 0 , и G(z) > 0 , если z > 0 . Алгоритм . 1 . Сначала задается исходная точка x0 , начальное значение ( коэффициент штрафного увеличения ) и ε параметров β0 , k0 ( параметр точности ) . 2 . На ( к + 1 ) при начальном x k решается задача минимизации функции Fβ(k) (x) = F ( x ) + βk A ( x )
,
x∈Rm.
3 . В точке минимума проверяется условие βkA(xk+1) < ε : если исход проверки положительный , то считается , что оптимальное решение найдено ; в противном случае полагается βk+1 = kββk , заменяется k на k+1 и переходят к пункт 2 . При таком подходе целесообразно начинать с таких βk , чтобы величина βkA(x) была примерно одного порядка со средним значением F(x) на множестве допустимых значений . Если βk велико , то минимум такой F(x) будет трудно найти , т.к. в результате минимизации Fβ(k) (x) будут находиться в основном допустимые значения x . Метод барьерных функций наиболее эффективен в том случае , когда ограничения имеют вид : g i (x) ≥ 0 , i = n+1 , ... , p . При этом в качестве барьерной функции выбирается функция p
B(x) = ∑ G { g i (x) } ; G(z) ≥ 0 i = n+1
В качестве типичной функция вида
при z < 0 и G(z) →∞ при z↑0 (стремление к 0 слева) барьерной функции может быть взята
G { g i (x) } = − 1 / g i (x) .
16
Итерационный процесс строится аналогично итерационному процессу метода штрафных функций , т.е. Fα(k) (x) = F(x) + αk B(x) , x ∈ Rm . 5 . Минимизация
функции максимума .
Пусть заданы функции f i(x) ( i = 1 , ... , L ) , которые задают i –ую характеристику качества синтезируемой системы , зависящие от вектора x ее параметров . В качестве целевой функции качества выберем функцию максимума : max f i (x) . i∈L
Тогда задача заключается в том , чтобы найти такой вектор параметров x , который обеспечивает функции максимума минимальное значение , т.е. min max f i (x) , x
i
x min ≤ x ≤ x max , i = 1 , ... , L .
В силу того , что функция максимума не имеет непрерывной производной градиентные методы применить для нахождения локального минимума нельзя . Для решения этой проблемы вводится понятие обобщенного градиент . Будем считать , что каждая функция f i (x) непрерывно дифференцируема по x n т.е. можно определить градиент Gi (x) = { ∂fi/∂x1 , ... , ∂fi/∂xm } для каждой i – ой функции . Тогда в качестве обобщенного градиента выбирается ближайший к началу координат вектор , принадлежащий линейной оболочке построенной на векторах Gi(x) . Алгоритм определения обобщенного градиента . На первом этапе выбирается из множества векторов Gi(x) вектор с минимальной нормой [ т.е. с минимальным скалярным произведением ( Gi , Gi ) ] , min ( Gi , Gi ) = (G0 , G0 ) i
17
Вектор G0 является нулевым приближением . В качестве первого шага принимается операция нахождения вектора , для которого скалярное произведение нулевого приближения с остальными векторами Gi минимально , т.е. Gk = G0 и шаг 1 : min ( Gk , Gi ) = ( Gk , Rk ) i
шаг 2 : на векторе Rk – Gk находится точка Gk+1 = Gk + t ( Rk – Gk ) для которой скалярное произведение (Gk+1 , Gk+1 ) является минимальным . Параметр t находится из этого условия и является равным (Gk – Rk , Gk ) / Gk - Rk2 . Таким образом , в качестве следующего приближения в определении направления наилучшего движения для нахождения обобщенного градиента выбирается вектор, который будет ближе к началу координат , чем предыдущее приближение Gk . Затем по обычной процедуре за Gk принимается вектор Gk+1 и итерация повторяется ( переход на шаг 1 ) . На практике для определения обобщенного градиента используется заданное конечное число итераций . Рисунок поясняет данный итерационный процесс . G В приведенном примере линейной оболочкой Gk+1 является плоскость пост − Rk роенная на векторах G0 , Gi Gi и Rk . Обобщенным градиентом является век− GR тор Gk+1 . G0
∂ƒi(x)/∂x1
∂ƒi(x)/∂x2 Теперь , зная компромиссное направление движения , вектор параметров x , доставляющий минимум функции максимума находится по обычной итерационной формуле :
18
xk+1 = xk – Hk ( Gk / Gk2 ) . Число итераций для нахождения вектора оптимальных параметров x также задается конечным и заранее . Движение в выбранном направлении с шагом Hk происходит до тех пор пока целевая функция уменьшается , затем находится новое направление движения ( новый обобщенный градиент в точке xk+1 ) и осуществляется следующая итерация . Следует отметить существенное достоинство использования функции максимума для оптимизации сложных систем . Так как обычно на каждый критерий качества ( функцию f i (x) ) при проектировании системы задается граничное значение d i , которое этот критерий качества достигал бы при оптимальном векторе параметров x , то выбирая в качестве обобщенного критерия качества функцию max [ f i (x) – d i], мы можем сразу видеть как выполнены требования проектирования системы при оптимальном выборе параметров x в случае минимизации такой модифицированной функции максимума . ВОПРОСЫ ОПТИМИЗАЦИИ ВЗАИМОДЕЙСТВИЯ ПОДСИСТЕМ А С У i
j
Будем предполагать , что ACУ состоит из подсистем и при этом их можно пронумеровать по i∈ I = { 1 , ... , N } . В дискретные моменты времени t = 0, 1, ... они находятся в состояниях xs(i) в пространстве Xi = { xs(i) , 1 ≤ s ≤ mi }. Когда реализуется состояние x = =( x(1) , ... , x(N) )∈Π Χi , то i – ая подсистема ( в дальнейшем система ) может получить выигрыш M (x,t) . Степень влияния i – ой системы на j – ую характеризуется коэффициентом влияния bij(t) в момент t ; если bij(t) ≥ 0 , то i –ая система влияет на j – ую положительно, иными словами не приносит убытков , и наоборот , если bij(t) < 0 , то взаимодействие носит отрицательный характер и i – ая система наносит убытки j – ой системе . Таким образом , отношение i− ой
19
системы со всеми остальными системами характеризуется вектором bi(t) = { bi1 , ... , biN }. В общем случае bij(t) ≠ bji(t) . Если At(i) = { j ; bij (t) > 0 } и Bt(i) = { j ; bji(t) > 0 } , то множество Nt(i) = At(i)∩ ∩Bt(t) соответствует системам положительно влияющим друг на друга . Пусть { Hν } есть совокупность всех возможных состояний взаимодействия систем и pij – вероятности переходов из Hi в Hj . Задача заключается в том , чтобы максимизировать вероятность pi ( b1 , ... , bN ) = { j ; M(i)(Hj , t) ≥ M(i)(Hµ , t), µ = 1 , r } соответствующим выбором bi . Тогда наиболее предпочтительное состояние системы будет при таком bi0, которое удовлетворяет условию : Pi(bi0) = max min Pi ( b1, ... , bN ) i
j≠i
где минимум определяется по всем векторам bj ( j ≠ i ) и максимум отыскивается по всем векторам bi . Иными словами , система считается оптимальной в том случае , когда в наихудших условиях система выбирает такой вектор состояния bi который обеспечивает ей наилучшие условия функционирования , т. е. максимальное значение указанной вероятности . Известно , что фундаментальной проблемой общей теории сложных систем является выяснение законов , определяющих принципы образования , поведения и развития любых реальных систем . Любая сложная система , в том числе и АСУ , определяется структурой ( числом элементов и их связями ) и поведением (реакциями на воздействия ) . Обычно различают внутреннее и внешнее поведение. Внутреннее поведение поддерживает ее бесперебойное функционирование , а внешнее поведение направлено на достижение поставленной внешней цели. Построение любых сложных систем с учетом их внутреннего и внешнего поведения при последующей эксплуатации в весьма неопределенных условиях ставит различные задачи оптимизации систем АСУ . При этом , вообще говоря , должны учитываться такие проявления сложности как надежность , помехоустойчивость , управляемость и самоорганизация . Для характеристики возможностей функционирования системы в сложных условиях вводится понятие предельной эффективности сложной системы . Пусть имеется две системы А и В , которые находятся во взаимодействии, при этом они могут переводить себя в различные состояния как под воздействием из вне так и результате внутренних изменений . Обозначим через А и В соответственно цели систем А
20
и В . Целесообразность структур Α и Β систем А и В соответственно и целенаправленность поведения //А// и //В// оценивается той эффективностью , с которой системы достигают своих целей А и B . Функционирование системы можно представить как серию обменов ею некоторых количеств расходуемых ресурсов w на некоторое количество потребляемых v ресурсов . Такой обмен называют ( v , w ) – обменом . Целью любой системы можно считать такой обмен , который бы обеспечивал наиболее выгодный ( v , w ) – обмен . Иными словами , за минимальные расходуемые ресурсы получить максимально потребляемые . Такой обмен является сложной функцией структуры и поведения систем А и В : V = V ( w , A , B ) = V ( w , | Α | , | Β | , //A// , //B// ) В результате взаимодействия систем А и В могут быть реализованы такие ( v , w ) – обмены , которые удовлетворяют следующим уравнениям : Va = Va(wa , A0 , B0 ) = max min Va ( wa , A , B ) {//A//,|Α|} {//Β//,|Β|}
Vb = Vb(wb , A0 , B0 ) = max min Vb ( wb , A ,B ) {//Β//,|Β|} {//Α//,|Α|}
В этом случае системы A0 и B0 считаются оптимальными . При этом системы могут варьировать ( v , w ) – обмены в пределах : V1 ≤ Va ≤ //V1// ,
V2 ≤ Vb ≤ //V2//
При значениях V1 и V2 системы являются наиболее противодействующими , т.е. антагонистичными . Значения //V1// и //V2// соответствуют наиболее осторожному взаимодействию систем . Взаимодействие систем является строго антагонистичным в случае , когда ( v , w ) – обмен для одной является положительным и для другой отрицательным , т.е. Va = − Vb . Так как ( v , w ) – обмены носят стохастический характер , то можно говорить о некоторой вероятности Р ( v , w ) достижения системой своей цели . В этом случае можно ввести понятие предельной эффективности системы : т.е. максимальное значение вероятности Р ( v ,w ) и определяется как предельная эффективность системы . В указанных случаях поиск
21
оптимальной системы сводится к нахождению минимума функции максимума , что само по себе является достаточно сложной задачей . Метод решения в каждом конкретном случае определяется математической формулировкой задачи . Покажем как можно находить функцию максимума в двух конкретных случаях : 1) оптимальное решение является решением непрерывной задачи ; 2) численное нахождение функции максимума в дискретной формулировке . При этом следует еще раз подчеркнуть , что синтез оптимальной системы из расчета минимума функции максимума позволяет реализовать систему на “ наихудший “ случай , т.е. в наиболее неблагоприятных условиях функционирования ( внутреннее и внешнее поведение подсистем с которыми взаимодействует рассматриваемая система ) реализуется максимально эффективная система . ВЫЧИСЛЕНИЕ max min и min max В НЕПРЕРЫВНОМ СЛУЧАЕ Будем предполагать , что математическая формулировка задачи выглядит в следующей виде . Так как согласно одной из основных теорем теории игр максимум минимума равен минимуму максимума соответствующих функционалов , то для рассматриваемого случая можем записать , что V = max min ∫ P(x) ϕ(x) [1 − ψ(x) ] dx = min max ∫ P(x)ϕ(x) [1 − ψ(x)] dx ϕ
ψ Ω
ψ
ϕ
Ω
со следующими ограничениями : ∫ ϕ(x) dx = 1 ,
Ω
∫ ψ(x) dx = ε .
Ω
Предположим , что рассматриваемая система ( система 2 ) находится в состоянии ψ0(x) и это является известным фактом для системы 1 , которая находится во взаимодействии с системой 2 , если функция P(x)[1 − ψ0(x)] имеет максимум , то с точки зрения первой системы всегда необходимо выбирать такое x , которое соответствует максимуму и будет всегда находится в наилучших условиях
22
( иными словами получать наилучший результат ) . Поэтому второй системе следует выбирать такое состояние , при котором ее функция состояния имела несколько максимумов , а еще лучше была бы плоской . Теперь предположим , что система 1 находится в состоянии ϕ0(x) и система 2 выбирает свое состояние исходя из этого . Тогда вторая система будет выбирать минимум и соответствующее x для функции P(x)ϕ0(x) . Поэтому с точки зрения системы 1 ей следует стремиться к выбору состояния , при котором система 1 обеспечивала бы функции P(x)ϕ0(x) постоянное значение . Поэтому оптимальные состояния для систем 1 и 2 можно найти соответственно из следующих условий : Система 1 : P(x)ϕ0(x) = h откуда ϕ0(x) = h / P(x) при P(x) ≥ K и ϕ0(x) = 0 при P(x) < Κ . При этом из условий нормировки следует , что ∫ h/P(x) dx = 1 откуда h = 1 / ∫ dx/P(x) при m = { x : P(x) ≥ K } m
m
Система 2 : P(x)[1 − ψ0(x)] = H откуда ψ0(x) = 1 – H/P(x) при P(x) ≥ H и равна 0 при P(x) < H . Из условий нормировки следует , что ∫ [ 1 – H/P(x) ] dx = ε ,
L
L = { x : P(x) ≥ H }
Для характеристики взаимодействия систем вводится такое понятие как цена взаимодействия ( или с точки зрения теории игр стоимость игры ) , которую в данном случае можно вычислить по следующей формуле : V= ∫ P(x)ϕ(x)[1-ψ(x)] dx = ∫ P(x)h/P(x)[1–1 + H/P(x)] dx = hH∫ dx/P(x) = ⊕ Ω
L
L
∫ [1 – H/P(x)] dx = ε → L − ε = H∫ dx/P(x)
L
L
⊕ = hH/H(L − ε) = h(L − ε) .
Возможно графическое решение приведенной задачи , которое ясно из приводимого ниже рисунка .
23
Оптимальное состояние системы 2
Оптимальное состояние системы 1
1/P(x)
1/P(x)
1/H
1/K
x
x
L
L
Для системы 2 заштрихованная площадь равна ε/Η , для системы 1 заштрихованная площадь равна 1. ϕ0
ψ0
x
x
ЧИСЛЕННЫЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ДИСКРЕТНЫХ ВЗАИМОДЕЙСТВИЙ СИСТЕМ Идея метода . Для определения решения дискретного взаимодействия систем с матрицей взаимодействия A = ||aij|| проигрывают это взаимодействие много раз , выбирая такое чистое состояние ( чистую стратегию ) , которое является наилучшим при
24
учете всех проведенных взаимодействий с рассматриваемой системой до настоящего момента . Пусть N – номер взаимодействия ( номер партии проигрывания ) ; i(N) , j(N) − чистые состояния 1− ой и 2 – ой взаимодействующих систем в N − ом взаимодействии ; Kj(N) – общий выигрыш 1 –ой системы после N взаимодействий , если 2 – ая система находилась все время в j – ом состоянии ( применяла j – ую стратегию ) ; Hi(N) – общий проигрыш 2 – ой системы после N взаимодействий , если 1 – ая система все время находилась в i – ом состоянии ( применяла i – ую стратегию ) . Тогда совокупность относительных частот взаимодействий систем ( применения чистых стратегий ) приближенно может быть принята в качестве оптимального смешанного взаимодействия систем ( оптимальных смешанных стратегий ) , а средний выигрыш можно принять за приближенное значение цены взаимодействия ( приближенное значение цены игры). Пусть наименьший средний выигрыш 1− ой системы после N взаимодействий будет V(N) = min Kj(N) / N
j
а наибольший проигрыш 2 – ой системы −
V(N) = max Hi(N) / N . i
Алгоритм . 1 . Будем считать , что 1 – ая система находится в состоянии i(1) = 1 в результате чего она может получить один из выигрышей К1(1) , ... , Kn(1) . 2 . Затем будем считать , что 2 – ая система находится в состоянии j(1) таком , что min [ K1(1) , ... , Kn(1) ] = Kj(1)(1) и при этом 2 – ая система при следующем взаимодействии может проиграть одно из H1(1) , ... , Hm(1) значений . В дальнейшем i(N) и j(N) выбирают следующим образом . 3 . а) выбирается i(N) , которое является наименьшим целым числом , при котором max [ H1(N−1) , ... , Hi(N) (N−1) , ... , Hm(N−1) ] = Hi(N)(N−1)
25
б) при этом j(N) является наименьшим целым числом , при котором min [ K1(N) , ... , Kj(N) (N) , ... , Kn(N) ] = Kj(N)(N) . 4 . Последующие значения Hi(N) и Kj(N) определяются по формулам : а)
Hi(1) = aij(1) ;
б)
Hi(N) = Hi(N – 1) + aij(N) ; N > 1
в)
Kj(1) = ai(1)j ;
г)
Kj(N) = Kj(N – 1) + ai(N)j ; N > 1 .
5 . Цена взаимодействия систем определяется приближенно как а) б)
V(N) = Kj(N)(N) / N ;
V(N) = Hi(N)(N) / N .
Истинное значение цены игры есть
V(N) ≤ V ≤ V(N) .
После N шагов проигрывания оптимальные смешанные стратегии можно определить приближенно: X(N) = x1(N) , ... , xn(N) , Y(N) = y1(N) , ... , yn(N) N
xi (N) = [ ∑ i*(k) ] / N , ( i = 1, ... , m ) k=1 N
yj (N) = [ ∑ j*(k) ] / N , k=1
( j = 1, ... , n ) , где
i* (k) = 1 [ или j*(k) = 1 ] , если на k [ ( k+1 ) – м ] шаге проигрывания система 1 ( система 2 ) выбирает i – е ( j – е ) чистое состояние , и i*(k) = 0 [ j*(k) = 0 ] в противном случае . Сходимость к точному решению довольно слабая . Сходимость улучшается при m= n .
26
СЛОЖНАЯ
СИСТЕМА
Ранее отмечалось , что сложная система - система с “ большим “ количеством элементов , многоуровневой структурой и , как правило , многообразными прямыми и обратными связями между элементами системы . Понятно , что утверждение “ большое “ количество элементов - утверждение относительное , определяемое конкретной системой , ее моделью и целями , которые она эффективно должна достигать . Рассматривая , например , такие системы как система управления полетом крупного аэродрома , организация управлением городского транспорта , автоматизация производственного процесса , информационные и другие системы можно видеть , что степень детализации структуры , вариантов взаимодействия ее элементов и конечные цели , ради которых создается соответствующая система и определяют ее “сложность“ . Любая система может быть представлена как совокупность групп элементов со связями между собой и другими группами , которые называют подсистемами . Использование этого понятия полезно в тех случаях , когда в качестве подсистем выступают достаточно самостоятельно функционирующие части системы . В примере с АСУ полетами самолетов можно выделить следующие подсистемы : 1) система дальнего обнаружения и управления ; 2) система многоканальной дальней связи ; 3) многоканальная система слепой посадки и взлетов самолетов ; 4) система диспетчеризации ; 5) бортовая аппаратура самолета . Очевидно , что каждая подобная подсистема может рассматриваться , при надлежащем подходе , как сама по себе сложная система . В сложных системах поддержание нужных режимов функционирования обеспечивается за счет управления отдельными элементами системы и АСУ в целом . В связи с этим удобно при анализе и проектировании систем из совокупности элементов системы выделить две , может быть , самые основные группы элементов : управляющие устройства и управляемые объекты . Управление , как правило , является результатом процесса переработки внутрисистемной и внесистемной ( оказывающей влияние на функционирование системы ) информации . В сложных системах , в основном , удается выделить один или несколько
27
контуров управления . В примере с управлением полетами самолетов естественным образом можно выделить два разграниченных контуров управления : 1) самолет − система дальнего обнаружения → система диспетчеризации → система слепой посадки и взлетов самолетов ; 2) самолет − радиолокатор аэродромного обзора → аппаратура съема данных → вычислительное устройство → аппаратура выдачи команд → станция передачи команд → самолет . Второй контур является замкнутым или контуром управления с обратной связью . Естественно , что приведенное разбиение управления на контуры не единственное , как и утверждение по отношению к системе , что она является “ сложной “ или “ простой “ . Как правило, сложные системы ( в том числе и АСУ ) функционируют в обстановке , при которой информация на входе подвержена случайным воздействиям ; иными словами состояние системы , выработка ее управляющих решений и соответствующих сигналов управления должна учитывать как случайный характер мешающих воздействий , так и , возможно , случайный характер полезной информации . Успешный анализ и синтез сложных систем требует достаточно глубокой количественной оценки их поведения с помощью соответствующих числовых характеристик . Последние должны удовлетворять , по крайней мере , следующим трем требованиям : 1) представлять величину , которую можно вычислить из математического описания системы ; 2) давать , по возможности , наглядное представление об одном из свойств системы ; 3) допускать достаточно простую приближенную оценку с использованием экспертных данных . Эффективность . Числовые характеристики АСУ , описывающие ее основные свойства обычно принимаются за показатели эффективности системы , которые , в зависимости от стоящих перед ней задач могут существенно варьироваться . В качестве примера рассмотрим некоторый производственный процесс . Цель функционирования – выпуск определенного вида изделий . Возможны следующие различные варианты выбора показателя эффективности для такой системы . Пусть , например , сначала показателем эффективности будет производительность , измеряемая средним числом изделий в течение заданного интервала времени ( например , за смену ) . При таком подходе при совершенствовании системы , естественно , будет меньше уделяться внимания таким сторонам организации
28
производственного процесса ( не связанным непосредственно с производительностью ) , как качество изделий , экономия сырья , энергии и фонда зарплаты и т.п. Если в качестве показателя эффективности выбрать среднюю величину себестоимости продукции , то на первом плане будут : экономия сырья , износ оборудования , расход энергии и фонда зарплаты . На второй план отойдут производительность оборудования и качество продукции . В связи с приведенным примером наиболее перcпективным подходом к определению эффективности системы является многокритериальный : любая сложная система должна удовлетворять нескольким основным показателям эффективности ( критериям качества ) , отражающим возможность достижения конечных целей , стоящих перед системой . Для характеристики эффективности сложной системы также применяются такие ее функциональные показатели как помехозащищенность , устойчивость , сложность , управляемость . Все эти качества , если их можно формализовать в виде некоторых числовых зависимостей от соответствующих параметров системы , могут выступать как частные критерии оптимальности . Тогда выбор соответствующей комбинации частных критериев оптимальности , адекватно отвечающей конечной цели создания системы с необходимыми качествами определяет параметры ( структуру , связи , состав компонентов ) , обеспечивающие экстремальное ( минимальное или максимальное ) значение комбинационного критерия качества . Анализ сложных систем . Аппарат теории стационарных , в широком смысле, случайных процессов и марковские процессы с конечным или счетным множеством состояний являются простейшими в теории случайных процессов , используемых , тем не менее , достаточно широко для анализа сложных систем. Однако , следует отметить , что возможности марковских процессов используются в расчетах , связанных со сложными системами , далеко не полно , в противоположность корреляционной теории стационарных процессов . Поэтому основное внимание здесь мы уделим использованию марковских процессов . Марковский процесс задается множеством состояний Z , которое должно быть конечным или счетным , начальным распределением { pk (t 0) , k ∈ Z } и набором интенсивностей перехода λ i j (t) , i ∈Z , j ∈ ∈Z , i≠j , ( иными словами “ интенсивность перехода из i в j в момент времени t “ ) ; при этом функция
29
λ i (t) = ∑ λ i j (t) i≠ j
называется интенсивностью выхода из состояния i в момент t . Обычно марковский процесс можно интерпретировать тремя способами , которые являются эквивалентными . Здесь будем использовать следующий . Инфинитезимальная интерпретация . Полагаем , что в момент t 0 реализуется случайная ситуация , исходом которой может быть любой элемент k множества Z с вероятностью pk (t 0) , т.е. состояние процесса в момент t 0 . Тогда можно назвать марковским процессом такой процесс ζ(t) , для которого P[ ζ(t 0) = k] = pk (t 0) , k∈ Z, P[ ζ(t + dt) = j ζ(t) = i ] = λ i j (t)dt , j ≠ i , P[ ζ(t + dt) = i ζ(t) = i ] = 1 − λ i j (t)dt , причем вероятности P[ ] соответствующих событий не изменятся , если помимо условия ζ(t) = i можно добавить условие , касающееся поведение процесса до момента t . Приведем некоторые предпосылки , достаточные для использования приведенной схемы . Полагаем , что физическая система в любой момент времени t может пребывать в состояниях дискретного ( конечного или счетного ) множества Z . Пусть в момент t состояние системы есть i . Представим , что существует некоторое число физических факторов , способных вывести систему из состояния i ; воздействие j – го фактора может привести к тому , что она перейдет в состояние j . Основное предположение состоит в том , что воздействие различных факторов независимы в совокупности и что время , которое пройдет с момента t до того , как воздействует j – ый фактор , есть случайная величина η(t,i,j) , не зависящая от поведения системы до момента t . В таком случае от распределений случайной величины η(t,i,j) легко перейти к интенсивности перехода из состояния i в состояние j . Рассмотрим случаи , когда число состояний марковского процесса невелико , либо когда путем группировки состояний можно привести процесс к более простому , или при малой насыщенности матрицы λ i j(t) ненулевыми элементами , возможно предпринять аналитическое исследование характеристик марковского процесса .
30
Для подобных условий приведем основные формулы , по которым можно находить характеристики последнего с конечным или счетным множеством состояний . Будем полагать , что марковский процесс ζ(t) характеризуется интенсивностями перехода λ i j (t) , i∈X , j∈ X , i ≠j . Одной из основных характеристик является вероятность перехода pi j (t) , определяемая как условная вероятность события ζ(t)=j при условии , что ζ(0) = i . Уравнения относительно pij (t) при большом числе состояний можно составить следующим образом . При этом вначале следует составить перечень возможных физических причин , обуславливающих переходы из одних состояний в другие (отказы элементов системы , появление или окончание обработки сообщений уход сообщений из очереди и т.д. ) и затем для каждой из причин перебрать все состояния и просмотреть куда из данного состояния может перейти система под действием данной причины и с какой интенсивностью . Тогда , взяв j – ое состояние , подсчитываем λ j (t) - сумму λ j k (t) по всем возможным состояниям , в которые можно попасть из этого состояния и , затем перебираем все состояния (k) , из которых можно попасть в j – е состояние . При этом получим уравнение p′i j (t) + λ j p i j (t) = ∑ λ k j (t) p i k (t) . k≠j
Подобное уравнение можно составить для любого состояния j ∈ Z . Тогда получим систему уравнений , которая обладает ( в принятых нами предположениях ) единственным решением , удовлетворяющим начальным условиям Pi j (0) = δ i j = { 1 при i = j , и 0 при i ≠j }, означающим стохастическую непрерывность процесса ζ(t) . Часто представляет интерес определение характеристик p(t,B) – вероятности того , что за время t процесс ни разу не выйдет из множества состояний В при условии , что ζ(0) = i . Нахождение этой функции сводится к предыдущему . Действительно ,
31
p(t,B) = ∑ pi j (t) , j ∈B
где pi j (t) - вероятность сложного события такого , что процесс ни разу не выйдет из множества В и при этом в момент t будет принимать значение j . Введем вспомогательный процесс ζ(t) , у которого состояниями являются все j , принадлежащие множеству В , и еще одно состояние β ; интенсивности перехода данного процесса задаются формулой λ i j (t) = { λi j (t) , если j ∈ B , i ∈ B ,
∑λ i k (t) , если j=β , i=B }.
k∈B
Нетрудно видеть , что p i j (t) есть обычная вероятность перехода нового процесса ζ(t) за время t из состояния i в состояние j . Пусть теперь известно , что ζ(0) = i ∈ B . Требуется найти среднее время Tj(B) до выхода процесса из множества состояний В . Для этого используется известная формула ∞
Ti (B) = ∫ pi (t,B) dt . 0
Очень часто представляют интерес стационарные распределения вероятностей состояний марковского процесса . Их можно искать в случае , когда λij(t) → λij при t → ∞ . Стационарное распределение является неотрицательным решением системы уравнений λ jp j = ∑ λ kj p k , k≠j
где λ j = ∑ λ j k k≠j
подчиняются условию
∑ p j= 1 .
j∈Z
Если эта система уравнений обладает единственным неотрицательным решением , приписывающим положительную вероятность любому из состояний , это решение называется эргодическим распределением процесса ζ(t) . В таком случае , независимо от начального состояния системы в момент t 0 , с течением времени устанавливается один и тот же случайный режим . Вероятность pj можно интерпретировать как среднюю долю времени , на протяжении которого процесс пребывает в состоянии j . Для сложных систем представляет интерес также исследование распределения вероятностей состояний марковского процесса при периодической интенсивности переходов :
32
λ i j (t) = λ i j (t +τ ) ,
i , j ∈Z,
Тогда естественно ожидать , что стационарный периодический режим :
t≥0.
в
системе
установится
pi j (nτ + t ) → p j(t) i,j ∈ Z , n→∞
где p j (t) – некоторые периодические функции с периодом τ . Для нахождения последних имеем систему уравнений p′j (t) + λ j (t) pj (t) = ∑λ k j (t) pk (t) k≠j
,
j ∈Z , 0 ≤ t ≤ τ ,
с условиями pj (0) = pj (τ) , ∑ p j (t) = 1 , 0 ≤ t ≤ τ .
j∈Z
Нетрудно видеть , что в одном частном случае , когда λi j (t) = λi j ω(t) , где ω (t) есть периодическая функция , стационарный режим не зависит от t . В этом легко убедится , заметив , что для некоторой монотонно возрастающей до ∞ функции α (t) процесс ζ{α(t)} будет однородным марковским процессом с интенсивностью перехода λ i j . При математическом анализе сложных систем типичной является следующая ситуация . Если вероятностный закон функционирования системы определяется набором распределений вероятностей F1(x) , F2(x) , … , Fm(x) , то интересующий показатель эффективности системы зависит от { Fi(x) } сложным образом , тогда , в этом случае аналитическим формулам предпочитают метод Монтэ – Карло ; в то же время , если допустить , что функции Fi(x) зависят от некоторого малого параметра ε , то при удачном выборе этого параметра можно построить асимптотическое разложение показателя эффективности по степеням ε , и воспользоваться этим в приближенных расчетах . Однако , эта ситуация характеризуется тем , что построение каждого нового члена асимптотического разложения связано со все усложняющимися формулами . Поэтому возникает задача построения вычислительных методов , которые позволили бы эффективно находить асимптотические разложения . Рассмотрим решение этой задачи в случае , когда система удовлетворяет тому условию , что
33
существуют моменты времени , когда вся информация о предыдущем поведении системы , которая может повлиять на прогноз ее поведения в будущем , сосредотачивается в некотором дискретном параметре . Иными словами , рассмотрим случай поведения сложных систем при малоинтенсивных внешних воздействиях . Аналитико – стстистический метод расчета вероятностных характеристик сложных систем . Постановка задачи . Будем полагать , что функционирование системы описывается случайным процессом z(t) в фазовом пространстве Z . При этом данный процесс удовлетворяет следующим условиям . Существует конечное множество Z0 ⊂ Z состояний системы ( Z 0 = [ 0 , 1 , … , m ] ) с такими свойствами : 1) при z(t0) = i∈Z0 , дальнейшее течение процесса после момента t 0 зависит только от i и не зависит от поведения z(t) до момента t 0 ; 2) при фиксированном z (t0) = i ∈ Z0 при t > t0 поведение z (t – t0) не зависит от t0 ; 3) при условии z(t0) = i ∈ Z0 распределение времени от t0 до следующего момента попадания в множество Z0 имеет конечный первый момент ; 4) поведение z(t) определяется некоторой внутренней случайностью , свойственной системе , и воздействием внешнего случайного фактора . Иными словами . Пусть z(t0) = i∈Z0 . Тогда определяется некоторый процесс z i (t,ω) для 0 < t ≤ τ i (ω) , причем z i (τ i(ω)) ∈ Z 0 ; элемент zi(t) ∈ Z0, t∈ (0,τ i (ω)) , где ω − случайный вероятностного пространства Ω , и условный процесс z(t) = z I(t − t 0,ω), t0 < t ≤ t0 + τi(ω) . Смысл сказанного заключается в следующем . Если от момента t0 до момента t0 +τ i (ω) на систему не будет оказано входное воздействие , то при всех t 0 < t ≤ t 0 +τ i (ω) будет z(t) = z(t) . Если же в некоторый момент t ′∈( t0 ,t 0+τi(ω)) поступит воздействие ( сообщение) , тогда только z(t) = z(t) , при t 0 < t ≤ t ′ . Далее , реализуется случайный элемент ω′∈Ω , независимый от ω , и определяется функция z d( t , ω ′ ) , 0 ≤ t ≤ τ d( ω ′ ) ,
34
(z d (τ d (ω′) , ω′) ∈ Z 0) , где d = z (t′) − значение процесса в момент поступления воздействия ( сообщения ) .Далее , как и выше , определяется условный процесс z(t) = z d( t − t′ , ω′ ) , t ′≤ t ≤ t ′+ τ d (ω′) ,
и т.д.
Теперь остается схематизировать поступление входных сообщений ( воздействий ) . Будем полагать , что они полностью задаются интенсивностью λ(z) , так что если в момент t состояние процесса равно z , то вероятность поступления сообщения в интервале (t, t + dt) составляет λ(t)dt . Этими условиями полностью определяется процесс z(t) как случайный процесс, если задано его начальное распределение . Рассмотрим некоторые характеристики системы , описываемой процессом z(t) . 1 . Пусть А − некоторое подмножество множества Z . Нас может интересовать случайный процесс ∆А(t) ,определяемый следующим образом : ∆A(t) = { 1 , если z(t) ∈ A в момент t ; 0 в противном случае } . 2 . В практическом отношении представляет случайный процесс с характеристиками : а) PA(t) − вероятность того , что в момент t процесс z(t) принадлежит множеству А , т.е. PA(t) = P( ∆A (t) = 1 ); б) QA(t) − вероятность попадания в множество А за время от 0 до t ; в) распределение время пребывания в множестве А процесса z(t) за время t , т.е. величины , подчиняется соотношению t
I A(t) = ∫ ∆ A (u)du . 0
Все эти функционалы при конкретизации множества А могут быть интерпретированы как основные показатели эффективности и надежности сложных систем .
35
СТАТИСТИЧЕСКИЙ СИСТЕМ
АНАЛИЗ ДИНАМИЧЕСКИХ УПРАВЛЕНИЯ
Известно , что одним из основных инструментов исследования систем управления являются методы математического моделирования . Наиболее эффективным методом описания функционирования динамических систем управления является метод пространства состояний использующий систему уравнений : .
dx /dt = x(t) = F [ x(t) , u(t) , ξ(t) , t ] y(t) = G [ x(t) , u (t) , η(t) , t ] , где x(t) – вектор состояния системы размерности n 1 ; y(t) – вектор наблюдаемых выходных сигналов размерности n 2 ; u(t) – вектор управляющего сигнала размерности n 3 ; ξ (t) и η (t) − соответственно шумы системы и погрешности измерений размерностей n 4 и n 5 ; t ∈ ∈Т = [ t 0 , t 1 ] − скалярный параметр времени. Для линейной системы управления эти уравнения существенно упрощаются : dx / dt = F(t)x(t) + G(t)u(t) + I(t)ξ(t) y(t) = C(t)x(t) + D(t)u(t) + R(t)η(t) , где F(t) , G(t) , I(t) , C(t) , D(t) , R(t) - есть матрицы соответствующих размерностей . Для линейной стационарной системы , для которой эти матрицы не зависят от времени и I(t) = R(t) = 0 уравнения принимают вид : dx / dt = Fx(t) + Gu(t) y(t) = Cx(t) . Известно , что данная система уравнений может быть заменена эквивалентным скалярным дифференциальным уравнением dn
d n–1
d n–1
y + a 1 y + … + a n y = b 1 u + … + b n u. dtn d t n–1 d t n–1
36
Из теории линейных систем известно , соответствует передаточная функция ∞
H (z) = ∫ exp ( − zt ) h (t) dt 0
К тому же формуле :
что
этому
уравнению
∞
и
y(t) = ∫ h ( τ ) u ( t − τ ) dτ . 0
передаточная функция может быть вычислена по
H(z)= B(z)/A(z)=(b1z n + …+ bn – 1 z+b n )/( z n+a 1z n – 1 + … …+ a n ) . Приведенные соотношения относятся к детерминированным системам управления . В наиболее общем случае стохастических систем методы моделирования основываются на стохастических дифференциальных векторных уравнениях вида : dx = f (x,t)dt + σ(x,t) dw , [ w(t) , t ∈ T ] . w(t) – так называемый , скалярный винеровский процесс , определяемый как 1) w(t0 ) = 0 ; 2) w(t) для всех t ≥ t 0 имеет нормальное распределение с нулевым математическим ожиданием ; 3) w(t) имеет независимые стационарные приращения, т.е. w(t 1 ) , w(t 2 ) – w(t 1 ) , … , w(t k+1 ) – −w(t k ) являются взаимно независимыми и разности зависят только от t – s . Частным случаем ( боле простым , чем общий случай ) является уравнение dx = A(t)x(t)dt + dw . Это уравнение эквивалентно интегральному стохастическому уравнению t x(t) = Φ(t,t 0 )x(t 0 ) + ∫ Φ ( t,s ) dw (s) , t0 где квадратная матрица Φ (t,s) удовлетворяющая дифференциальному уравнению d Φ (t,t 0 ) / dt = A(t) Φ(t,t 0 ) с начальным условием Φ (t 0, t 0) = E есть ковариационная функция процесса . Решением наиболее простого уравнения является случайный процесс со средним значением m x (t) и ковариационной функцией K(s,t) , где
37
dm / dt = A(t) m , m (t) = m , K(s,t) = { Φ(s,t)P(t) при s ≥ t ; P(s)ΦT(t,s) при s < t } и dP / dt = AP + PAT + R1 при P(t 0) = R 0 . Общий вид систем с дискретным временем , когда t – ряд чисел T = ={…, −1,0,1, ... } система будет описываться разностными уравнениями : x(t+1) = F [ x(t) , u(t) , t ] есть n – мерный вектор состояния системы y (t) = C [ x(t) , u(t) t ] есть l – мерный вектор наблюдений u(t) − вектор управления . При необходимости учета случайных факторов система уравнений преобразуется к виду : x(t +1) = F [ x(t) , u (t) , t ] + w [ x(t) , t ] y(t) = C [ x(t) , u(t) , t ] + v [ x(t) , t ] Статистический анализ динамических систем с дискретным временем . Будем полагать , что входными сигналами являются стохастические процессы с дискретным временем ; система описывается линейными уравнениями . Большое количество задач оптимизации параметров систем основано на оценке критерия эффективности , который , как правило , является функционалом F(m o u t , Do u t ) , где m o u t , D o u t есть соответственно среднее значение и дисперсия выходного сигнала . Пусть система имеет один вход и один выход , y i n − входной сигнал со средним значением my i n и ковариационной функцией Ky in (s,t) . Тогда t
∞
i=−∞
i=0
y o u t (t) = ∑ h (t – i ) y i n (i) = ∑ h (i) y i n (t – i ) , где h(i) − весовая функция системы и h(i) = 0 при i < 0 . Справедлива следующая теорема . Если y i n (t) есть случайный процесс с m y in и K y in (s,t) , тогда выходной процесс y o u t(t) есть случайный процесс с ∞
∞ ∞
i=0
i=0 j=0
m y out (t) = ∑ h(i) m y in (t – i ) и K y out (s,t) = ∑ ∑ h(i)h(j)K y in (s – i , t – j) .
38
Ковариационная соотношением :
функция
входа
и
выхода
системы
связаны
∞
K y in , y out (s,t) = ∑ h (i) K y in(s,t – i ) I=0
Если входной процесс стационарный в широком смысле , то m y in (t) = const = m y in , K y in (s,t) = K y in (s – t ) . Известно , что передаточная функция преобразование весовой функции h(t) , т.е.
системы
есть
z –
∞
H (z) = ∑ z – i h (i) i=0
Пусть S y in (ω) , S y out( ω ) − соответственно спектральные плотности yin и yout .В случае , стационарного в широком смысле , входного процесса и выходной процесс так же является стационарным , в широком смысле , процессом с математическим ожиданием на выходе m y out= H(f) m y in , спектральной плотностью S y out (ω) = =H (ω ) S y in (ω ) и спектральной плотностью входа и выхода равной S y in , y out ( ω ) = H (ω )* S y in (ω ) . Таким образом , если измерить спектральные плотности входа и выхода системы , то можно определить частотную характеристику системы H (ω) , где ω − циклическая частота . Передаточная функция для таких систем может быть выражена в виде H(z) = B(z) / A(z) , где A(z) = a 0 z n + … + a n и B(z) = b 0z n + … + b n , z = exp (jω) и n ≥ 1 , a 0 > 0 . Если на вход системы действует белый шум с дисперсией D in , то дисперсия на выходе определяется выражением ∞
D o u t = D i n / j ∫ H [jω] H [− jω ] exp (− j ω ) d[exp(jω)] = D i n / j ∫ H(z) * −∞
z = 1
*H(z −1)dz/z . Пример управления технологическим параметром . Концепция управления заключается в следующем . Использование ЭВМ для управления производственным оборудованием , в общем случае с обратной связью в реальном времени , позволяет реализовать сложные концепции управления оборудованием с переменными параметрами . Целью такого управления является коррекция технологических параметров относительно заданного уровня на
39
основе данных измерений . В производственных условиях существует множество помех от внешних источников , которые изменяют требуемые значения параметров . Кроме того , обслуживающий персонал тоже может изменить случайно значения параметров . В таких случаях в функцию системы управления входит обеспечение коррекцией технологических параметров в соответствии с новым значением параметра . Любое отклонение последнего от заданного называют ошибкой рассогласования . Ошибка может быть положительной , в случае превышения и отрицательной , в случае уменьшения . В качестве примера рассмотрим изменение координаты рабочего органа робота . Рисунок поясняет рассматриваемую ситуацию . x B A t1 t2 t3 t Во время перерегулирования система управления определяет знак ошибки и производит коррекцию . В конце концов колебания при перерегулировании уменьшаются до 0 и рабочий орган выходит в заданную координату В . Естественно , желательно быстрее скомпенсировать ошибки , но это и приводит к перерегулированию , которое может быть очень велико , что приведет к большим колебаниям системы . При этом ряд последующих перерегулирований может привести к увеличению позиционирования . Такая система называется “ неустойчивой “ . Одним из методов борьбы с указанным отрицательным явлением является , так называемое , “ демпфирование “ . Под коэффициентом демпфирования понимается отношение амплитуд последовательных циклов перерегулирования . x
1 B
2
40
3 A t На рисунке приведены характеристики систем с различным быстродействием . Видно , что кривые соответствуют 1 − неустойчивому состоянию системы ; 2 − частичному демпфированию ; 3 − критическому демпфированию , после которого никакое перерегулирование невозможно . Различают следующие виды управления , которые позволяют уменьшать колебания системы в той или иной степени . Пропорциональное управление . Наиболее понятная концепция управления заключается в том , что компенсация ошибки рассогласования производится без задержки пропорционально значению этой ошибки . Такой тип управления называется пропорциональным и описывается уравнением : C p (t) = K pe (t) , K p – коэффициент пропорциональности , e (t) – ошибка , C p (t) – величина коррекции. Если K p велик , то система будет быстродействующей , если очень велик , то система становится неустойчивой . При таком способе регулирования возникает статическая ошибка рассогласования , которую затем необходимо компенсировать . Интегральное управление . Иногда такой тип управления называют управлением с компенсацией запаздывания или с “ коррекцией “ ошибки , так как он предусматривает накопление информации об ошибке за весь рассматриваемый промежуток времени : T
C i (t) = K i ∫ e (t) dt 0
есть величина интегральной коррекции за время Т . Интегральное управление вполне может компенсировать остаточную ошибку возникающую при пропорциональном управлении . Поэтому целесообразно использовать пропорционально –
41
интегральное управление ; причем пропорциональное − для формирования сигнала об ошибке , а интегральное − для компенсации ошибки рассогласования . Дифференциальное управление . Такой тип управления является более сложной концепцией управления ; управление в функции скорости . Этот тип управления применяется не столь широко , в основном в сочетании с другими видами . Дифференциальное управление описывается уравнением : Cd = Kdde(t) / dt . Данный тип управления позволяет до некоторой степени прогнозировать протекание процесса . Действие дифференциального управления в начальный момент компенсации ошибки рассогласования противоположно действию пропорционального управления , поскольку пропорциональное управление учитывает вектор ошибки к перерегулированию . Дифференциальное управление можно использовать для демпфирования перерегулирования . В наиболее сложных системах управления используются все три вида управления в форме : C(t) = Cp (t) + Ci (t) + Cd (t) Такую величину называют результирующей коррекцией ошибки рассогласования. Это уравнение обычно используется при требовании , чтобы коэффициент усиления системы удовлетворял всем трем типам управления . Регулируемым параметром при интегральном управлении является интегральный период Ti , связанный с коэффициентом усиления G соотношением K i = G / Ti . Регулируемым параметром для дифференциального управления является дифференциальный период Td , связанный с соответствующим коэффициентом усиления соотношением K d = G Td . Выражение для полного управляющего сигнала на выходе устройства управления имеет вид : T
P = P0 + G p (t) + G / Ti ∫ e(t)dt + GT de(t) / dt , 0
где P0 – начальное значение процесса . Вопрос оптимизации управления сводится к выбору оптимального сочетания K p , K i , K d для всех типов управления .
42
ОБЩИЕ ХАРАКТЕРИСТИКИ МОДЕЛЕЙ СИСТЕМ Как указывалось ранее взаимодействие систем или подсистем может оцениваться посредством ( v , w ) − обмена . Для АСУ в качестве v – ресурса может использоваться поток информации о состоянии управляемого процесса , характеристиках среды и состоянии самой системы и ее подсистем ; в качестве w – ресурса тогда можно использовать поток управляющих воздействий ; т. е. имеет место взаимодействие двух потоков v и w . В общем случае возможно следующее разделение моделей : а) аналитические модели , в которых установлена прямая аналитическая связь между параметрами системы и ее показателями качества ; достоинством такой модели является то , что сразу можно определить характеристики системы в широком диапазоне входных данных ; б) имитационные модели , в которых с помощью алгоритмов и программ , имитирующих функционирование АСУ ( с ее структурными связями между узлами системы ) определяются ее качественные показатели ; достоинством таких моделей является возможность сколь угодного усложнения описания функционирования элементов АСУ в результате чего можно практически очень точно имитировать конкретную систему при этом , используя датчики случайных величин с различными законами распределения можно имитировать функционирование АСУ при самых разнообразных , как внешних , так и внутренних воздействиях и состояниях . Иерархия моделей . В связи с тем , что АСУ является представителем сложных систем ( имеющих несколько уровней иерархии в структуре ) , то можно выделить , в основном , 3 уровня иерархии в таких моделях : А − микроуровень ( устройства первичного сбора и обработки информации : АЦП , фильтры , спецвычислители и микропроцессоры ) . Здесь обработка информации максимально ускорена и на выходе уже подготовлена к использованию на уровне В; В – промежуточный уровень ( программы и алгоритмы оценивающие состояние различных компонент АСУ ) . С − макроуровень . Здесь оценки о состоянии управляемого объекта и элементов АСУ поступают в аппарат управления , который и генерирует соответствующие управляющие решения .
43
Следует отметить , что v и w потоки должны быть согласованы по времени между уровнями А , В , С . Проблема адекватности . Степень адекватности модели можно проверить , измерив показатели качества на реальной АСУ и сравнив их с модельными . Это возможно , когда реальная АСУ существует . Естественно , что при проектировании новой системы такой возможности не существует . Одним из способов преодоления этой трудности является детализация модели АСУ , т.е. усложнение модели , что зачастую не оправдано . Поэтому надо стремится иметь в распоряжении несколько моделей системы с различным уровнем детализации , позволяющих адекватно имитировать функционирование АСУ в заданных условиях . Проблемы аналитических моделей . Всегда присутствует проблема детализации : глубокая детализация приводит к сильному усложнению аналитических выражений , что зачастую не оправдано увеличивает сложность вычислений ( часто необходимо применять численные методы , усложняется программа ) . Однако , в силу малой чувствительности некоторых параметров модели на конкретный показатель качества в такой детализации нет необходимости . Следовательно , желательно иметь несколько моделей АСУ с различной степенью детализации , позволяющие адекватно описать процесс взаимодействия v и w потоков и в соответствии с этим установить адекватную связь между параметрами системы и ее показателями качества , что позволит решать задачу об оптимальном выборе параметров АСУ . К числу наиболее существенных показателей качества систем относятся − пропускная способность АСУ по отношению v и w потоков ; − коэффициент использования ; − среднее время ответа АСУ ( время выдачи управляющего воздействия ) . Очереди в АСУ . С целью повышения загрузки системы могут образовываться очереди по обслуживанию . Наличие очереди на соответствующих уровнях иерархии или между ними позволяет сократить время простоев соответствующих подсистем АСУ и увеличить производительность системы в целом ( например очередь команд в центральном процессоре ) . Как правило , очередь в потоках v и w наиболее эффективно реализуется аппаратными средствами ; однако , в зависимости от согласования времени между уровнями иерархии эти требования могут решаться и программно .
44
Показатели качества систем . Модель системы создается для того , чтобы оценить какие - то показатели качества . Для моделей с очередью прежде всего надо оценить загруженность системы . Простейшим показателем загруженности системы является нагрузка , которая определяется через среднее время между поступлениями сообщений λ и среднее время обслуживания одного сообщения µ по формуле ρ = λ/µ . Если ρ>1 , то сообщения поступают быстрее , чем их обрабатывает аппарат управления АСУ . Коэффициент использования ( коэффициент загрузки аппарата управления ) . Под этим понимается доля времени , в течение которого аппарат управления (АУ) занят ; эта величина равна u . Пусть аппарат управления имеет L идентичных каналов обработки сообщений , тогда за длительный промежуток времени Т поступит сообщений по каждому каналу равное λΤ/L , в предположении , что сообщения равномерно распределены по L каналам . Поскольку каждое сообщение требует в среднем длительности обслуживания 1/µ , то общее среднее время занятости L – того канала АУ будет равно λΤ/µL . Поделив на Т получим u = λ/µL . Поскольку канал АУ не может быть занят больше 100% времени , то u не может превосходить 1 . Таким образом , коэффициент загрузки для АУ с L каналами равен u = min ( λ/µL , 1 ) . Для L=1 , u совпадает с ρ , если λ/µ<1 , то коэффициент загрузки совпадает с нагрузкой . Пропускная способность . Под этим показателем понимают среднее число сообщений за единицу времени , равное min ( λ , µL ) , т.е. равно интенсивности поступления сообщений до тех пор , пока λ меньше максимальной интенсивности обслуживания Lµ . Время выдачи управления ( Т j ). Пусть W будет время ожидания , которое равно времени от момента поступления сообщения в систему до момента времени , когда начинается обслуживание . Тj – время от момента поступления сообщения до момента завершения обслуживания . S – длительность обслуживания. Таким образом , T = W + S . В стационарном режиме используется их среднее значение при t→∞ ( j→∞) , т.е. вместо W и T соответственно берутся их средние значения E[W] и E[T]. Длина очереди . Пусть Q(t) есть число сообщений в момент времени t ; N(t) будет числом сообщений , находящихся в системе , либо в очереди , либо на обслуживании в аппарате управления . Иными словами это есть длина очереди . Если в АУ есть L каналов ,
45
то Q(t) = max ( 0 , N(t) – L ) . Изучение числа сообщений , ожидающих обслуживания , требуется , например для оценки буферной памяти , необходимой для размещения поступающих сообщений . Для стационарного режима последовательности Q(t) и N(t) заменяются их средними значениями E[Q] и E[N] соответственно при t→∞ . Если Р0 - вероятность простоя устройства управления (УУ) , то 1 – Р0 есть вероятность того , что УУ работает . Тогда в установившемся режиме интенсивность поступления сообщений в систему равно интенсивности ухода обслуженных сообщений , т.е. λ = (1−Ρ0)µ . Для таких систем управления , обслуживающих сообщения в стационарном режиме справедливы две основных формулы , называемые формулами Литтла . Формула 1 . Среднее время выдачи управления E[T] и среднее число сообщений , находящихся в системе в установившемся режиме E[N] связаны соотношением E[N] = λE[T] . Формула 2 . Если E[Q] есть средне число сообщений , ожидающих обслуживания и E[W] − средне время ожидания обслуживания , то E[Q] =λE[W]. Структура
АСУ
с очередью . Аппарат управления
очередь АСОД
ВУР
v − поток информационных сообщений АСОД − автоматизированная система обработки ВУР − выработка управляющих решений
w − поток управляющих сообщений данных
46
Выбор сообщения из v – потока происходит в соответствии с некоторым правилом , называемым дисциплиной обслуживания . Относительно v – потока , механизма обслуживания и дисциплины обслуживания могут быть сделаны различные предположения . V – поток информационных сообщений может быть конечен и бесконечен . В последнем случае результаты получить проще . Поэтому , когда поток сообщений конечен делают иногда предположение о его бесконечности ( в том случае , когда он достаточно велик ) . Другая характеристика − статистическая картина поступления информационных сообщений . Наиболее простой вариант − регулярный поток , когда сообщения поступают в равноотстоящие промежутки времени через ∆t сек , тогда интенсивность потока будет равна 1/∆t . Оказывается , что с точки зрения получения результатов наиболее простым потоком является пуассоновский . Пуассоновский поток получается из следующих предположений . Случайный процесс , процесс принимающий целочисленные значения , равные числу информационных сообщений , поступивших за промежуток времени ( 0 , t ) . Пусть вероятность поступления одного сообщения за h сек. . равна λh + 0(h) , где λ − интенсивность сообщений ( количество сообщений в единицу времени ) , 0(h) – вероятность поступления 2-х и более сообщений (т.е. lim 0(h)/h = 0 , 0(h) стремится к нулю быстрее , чем h) . Тогда вероятность отсутствия сообщения будет равна 1 – ( λh + 0(h) ) . Будем предполагать , что v – поток является совершенно случайным , т.е. вероятность поступления или не поступления сообщения на интервале h статистически независимы для двух непересекающихся интервалах времени . Тогда поступление сообщения на интервале h это « успех » в схеме испытания Бернулли и число поступивших сообщений за ( 0 , t ) , где t=mh приближенно равно числу « успехов» в m испытаниях Бернулли , которое имеет биномиальное распределение Cnm [ λh + 0(h) ] n [ 1 – ( λh + 0(h) ] m – n При h → 0 и m → ∞ и сохраняя при этом mh = t величиной постоянной получим число поступивших сообщений X(t) на интервале ( 0,t ) , имеющих распределение
47
P{ X(t) = n } = (λt) n e−λ t / n ! Математическое ожидание и дисперсия случайной величины n совпадают и равны λt . Если τ1 , ... , τk , ... являются моментами времени поступления сообщений , то тогда функция распределения интервалов τk − τk-1 ≤ t ( т.е. поступило хотя бы одно сообщение ) равна 1 – P{X(t) =0} , t ≥ 0 . Значит Fk (t) = 1 – e −λ t , t ≥ 0 , т.е. для пуассоновского входящего потока промежутки времени между событиями статистически независимы и имеют одинаковое экспоненциальные распределения . Механизм обслуживания . Количественной характеристикой обслуживания объекта управления служит длительность сообщения . В зависимости от природы длительность сообщения может измеряться в различных единицах ( если сообщения программы , то обслуживающее устройство ( ОУ ) − центральный процессор ( ЦП ) и длительность сообщения может измеряться в количестве команд , если v – поток сообщений , то длительность может измеряться в битах или байтах ) . Быстродействие механизма обслуживания измеряется количеством обрабатываемых сообщений в единицу времени и равно С . Если S есть длительность всего сообщения , то длительность обработки одного сообщения равна S/С . Обратная к ней величина называется интенсивностью обслуживания . Если Е[S] есть средняя длительность сообщения , то µ = C/E[S] . Пусть Yk - длительность обслуживания к – го сообщения , и они независимы в совокупности , одинаковы распределены и не зависят от входящего потока , то такое обслуживание сообщений от объекта управления называется рекуррентным . Поступившее сообщение может обслуживаться любым обслуживающим устройством . Если в наличии в системе АСУ имеется L обслуживающих устройств , то быстродействие всей системы обслуживания определяется системой с наименьшей скоростью С , т.е. C(n) = Cmin (n,L ) , где n – число сообщений , находящихся в системе обслуживания . Дисциплина обслуживания . Наиболее простая и известная дисциплина обслуживания ( первым пришел – первым обслужен ) , т.е. v – поток обслуживается по мере прихода сообщений . Однако часто бывает , что одни заявки важнее других , что необходимо в первую очередь обработать конкретный вид сообщений. Поэтому должны быть введены приоритеты . Есть системы с абсолютными
48
приоритетами : обработка текущего сообщения прекращается сразу же как поступило такое сообщение ( с более высоким приоритетом). Если же прерывание обслуживания текущего сообщения не допускается , то такая дисциплина обслуживания называется дисциплиной обслуживания с относительными приоритетами . Некоторые типы часто применяемых на практике распределений Экспоненциальное распределение . Пусть S есть случайная величина , время t ≥ 0 и µ − параметр распределения, тогда функция распределения для данного случая будет иметь вид : Fs ( t ) = P ( S ≤ t ) = 1 – e −µ t Соответствующая плотность распределения есть f s ( t ) = Fs ` ( t ) = µe −µ t , t ≥ 0 . Среднее значение случайной величины S и ее дисперсия соответственно равны Е[S] = 1 / µ и σ 2 = D(S) = 1 / µ2 . Гамма – распределение . Плотность распределения выражается формулой fs(t) = e − αt ( αt ) −β−1 / Γ(β) при t ≥ 0 ;
вероятностей
данного
и равно 0 при t< 0
∞
Γ (β) = ∫ y β − 1 e – y dy ; E[S] = β/α , σs2 = β/α2 0
где α и β положительные постоянные .
СТАЦИОНАРНАЯ
ВЕРОЯТНОСТНАЯ МОДЕЛЬ АСУ
Предполагаем , что входной поток v информационных сообщений и выходной поток w управляющих воздействий являются установившимися , т.е. их средние характеристики не изменяются с
49
течением времени . Будем предполагать , что A(t) – процесс , принимающий в момент t значение , равное числу поступивших информационных сообщений . D(t) – процесс , принимающий к моменту t значение, равное числу моментов tj , соответствующих j– ым обработанным информационным сообщениям . Тогда число сообщений , находящихся в системе равно N(t) = A(t) − D(t) . При этом предполагается , что A(t) , D(t) , N(t) являются случайными процессами . Такая модель может быть использована как для входных и выходных информационных сообщений системы автоматизированной обработки данных (АСОД) так и для подсистемы аппарата и устройств управления . Рассмотрим процесс N(t) со следующими свойствами . Предполагаем, что к моменту времени t в системе находилось N(t) = m сообщений , а за промежуток времени h их стало N(t+h) = n . Тогда переходная вероятность из состояния m в состояние n равна p m , n = P[ N(t)=m N(t+h)=n ] , не зависит от t и подчиняется следующим условиям : λ m − интенсивность поступления 1) p m , m+1 (h) = λ m h + o(h) сообщений ( число сообщений в секунду) 2) p m , m –1 (h) = µ m h + o(h) 3) p m , m (h) = 1 – [ λ m + µ m ]h + o(h) µ m − интенсивность обработанных сообщений 4) p m , n (h) = o(h) , m − n > 1 . Найдем вероятность того , что через h секунд в системе тоже будет находится n сообщений . Это возможно в следующих случаях : − если система находилась в состоянии n , то она и осталась в состоянии n ; − если система находилась в состоянии n – 1 , то перешла в состояние n ; − если система находилась в состоянии n + 1 , то перешла в состояние n ; − система перешла через 2 или более промежуточных состояний ; эта вероятность бесконечно мала , т.е. равна p m , n (h) =o(h) при m–n>1. Так как условия 1) – 3) взаимоисключающие , то общая вероятность Pn (t + h) равна сумме вероятностей 1) – 3) : Pn (t+h) = Pn (t) [ 1 – (λ n + µ n )h ] + Pn – 1 (t)λ n – 1 h + Pn + 1 µn+1h
50
или [Pn(t+h) – Pn(t)]/h = − (µ n +λ n)Pn(t) + Pn − 1(t)λ n - 1 + Pn + 1(t)µ n + 1 . Последнее выражение представляет собой оценку производной вероятности того, что система находится в состоянии n . При этом P0/ (t) = − λ 0 P0 (t) + µ 1 P1 (t) . Для стационарных процессов P0/ (t) = Pn/ (t) = 0 , следовательно и lim Pn(t) = Pn .
t→∞
В таком случае мы получаем систему линейных уравнений : λ nPn − µn+1Pn+1 = λn – 1 Pn – 1 − µn Pn ; n = 0 , 1 , ... λ0 P0 = µ1 P1 → λn – 1 Pn – 1 = µnPn ; n = 1 , 2 , ... Данные соотношения можно представить диаграммой переходов , приводимой ниже : λ0 P0
λ1 P1
µ1
λn−1
λn
........
Pn
µ2
µn
µn+1
Иными словами интенсивности переходов из состояния n – 1 в состояние n и из состояния n в n – 1 уравновешены , т.е. интенсивность переходов λ n – 1 Pn – 1 из состояния n – 1 в n равна интенсивности переходов µ n Pn из n в состояние n − 1 . Из приведенных соотношений нетрудно получить рекуррентное соотношение для вычисления вероятности Pn : n
Pn = Pn −1*λ n –1 /µ n = P0Λ(n) / M(n) , где Λ(n) = Π λ i =1
n
i–1
; M(n) =Π µi i =1
∞
Вероятность Р0 определяется из условия Σ Pi = 1 , так как Рi есть i=0 распределение вероятностей .
51
Таким образом , если поток информационных сообщений и число моментов обслуживания представляют собой стационарные случайные процессы ( A(t) и D(t) ) , то можно определить по рекуррентному соотношению вероятность Рn того, что система находится в состоянии n , т.е. в системе находится n информационных сообщений . При этом должны выполняться 4 условия для переходных вероятностей с интенсивностями λ m и µm, соответственно интенсивностью появления нового сообщения ( сообщения аппарату управления автоматизированной системы управления ) , либо исчезновение одного сообщения ( т.е. произошла обработка одного сообщения аппаратом управления ) . Простейшая система управления с одним каналом поступления сообщений . Предполагаем , что входной поток сообщений пуассоновский с интенсивностью λ ; длительность обслуживания имеет экспоненциальное распределение с параметром µ : P{X(t) = n} = (λt) n e − λ t / n! ; Fe (t) = 1 – e − µ t . Рекуррентное соотношение в этом случае примет вид : Pn = Pn – 1 λ/µ=ρ Pn – 1 = ρ P0 , если n
∞
n
ρ < 1 , то ряд 1 + ∑ Π λ i – 1 /µi ∞
сходится . Следовательно , P0 = ( 1 + ∑ ρ образом,
n =1 i = 1
n
)
– 1
= 1 − ρ .Таким
n=1
вероятность того , что в системе управления находится n сообщений равна Pn = (1− ρ)ρ n при n ≥ 0 . При этом среднее число сообщений в системе есть ( с использованием формулы Литтла ) __
_ N = ∑ n Pn = ρ/ ( 1 − ρ ) = λ T ∞
n=0
Тогда среднее время ответа аппарата управления определяется из этого соотношения и будет равно _ T = ρ / [ λ ( 1 − ρ) ] .
АСУ
52
МОДЕЛЬ АСУ С НЕСКОЛЬКИМИ ИСТОЧНИКАМИ СООБЩЕНИЙ Общие свойства . Предполагается , что в аппарат управления информация об окружающей среде и состоянии блоков АСУ поступает по нескольким каналам (схема приводится ниже ) . 1 11 2 . . .
АУ Очередь
Аппарат Управляющие управления сообщения
K Пусть λ есть пропускная способность , т.е. число сообщений завершающих обработку информации в единицу времени в АСУ . Тогда интенсивность поступлений и уходов сообщений равна λ . Определим случайную величину U как время обдумывания равное интервалу времени с момента завершения поступления сообщения в АУ до момента поступления следующего информационного сообщения , и время ответа Т как интервал времени с момента поступления сообщения до момента завершения его выполнения АСУ . Время обдумывания и время ответа в сумме составляют цикл одного взаимодействия канала с АУ. Из формулы Литтла следует , что λ (T ‘+ U ‘) = K / λ , где T’ и U’ есть средние значения . Для справедливости этого соотношения не требуется независимости времени обдумывания и специальных предположений о виде их распределения . Все , что здесь требуется так это существование установившегося режима АСУ. Пусть P0 будет вероятность простоя АУ в установившемся режиме и E[S] – средняя длительность обработки одного информационного сообщения . Тогда в установившемся режиме АУ может обработать ( 1 – P0 ) / E[S] информационных сообщений в единицу времени т.е. λ = ( 1 – P0 )/
53
/E[S] . Это соотношение справедливо при весьма общих предположениях . Ограничение здесь состоит в том , чтобы АУ не простаивал при наличии необработанных сообщений , иначе длительность обработки сообщений будет зависеть от дисциплины обслуживания. Из приведенных соотношений легко получается выражение для среднего времени ответа : _ _ _ T = K S / ( 1 – P0 ) – U , где Символы с чертой обозначают средние значения этих значений . Пусть интенсивность обработки сообщений и интенсивность поступления сообщений будут соответственно равны : _ _ µ = 1 / S и ν = 1 / U , и их отношение χ= µ/ν. _ _ В этом случае нормированное среднее время ответа (т.е. T / S ) будет равно _ µT = K / ( 1 – P0 ) − χ . В силу того , что при выводе этой формулы не делалось никаких предположений , то она верна практически при любых распределениях U и S , а дисциплина обработки может быть любой не допускающей простоев АУ при наличии необработанных сообщений . При этом времена обдумывания U и длительности обработки S не обязательно должны быть последовательностями независимых одинаково распределенных случайных величин . Средняя длина очереди в установившемся режиме N ( число сообщений , ожидающих и находящихся на обработке в АУ ) получается из формулы Литтла : _ N = K – ( 1 – P0 ) χ . АСУ с квазислучайным источником сообщений . Предполагаем , согласно приведенной выше схеме , что система имеет К каналов поступления сообщений . За время h с t до t + h с вероятностью νh + +0(h) поступают сообщения по каждому каналу независимо от канала . Таким образом промежутки от t до поступления сообщения имеют экспоненциальное распределение со средним 1/ν . При этих предположениях К – каналов образуют квазислучайный поток
54
сообщений . интенсивность
Тогда
общий
поток
сообщений
будет
иметь
λ n = ( K – n ) ν при 0 ≤ n ≤ К и 0 при n > K .
Предположим , что длительность обработки сообщений АУ имеет экспоненциальное распределение со средним 1/µ . Тогда ∞
∞
n
1 + ∑ Λ(n)/M(n) = 1 + ∑ Π λ i – 1 / µ i = P0 – 1 (n) n=0
n=0 i=1
K
и
P0− 1 (n) = θ (K) = ∑ K! / [(K – n) χ n ] , Pn(K) = P0(K) K! / (K – n) при n=0
и χ = µ/ν . Тогда среднее 0 ≤ n ≤ K поступивших на обработку будет равно
число
сообщений
,
∞
E[N(K)] = ∑ n Pn(K) = K − χQ(K – 1,χ) / Q(K,χ) n=0
P(K,λ) = e
−λ K
, где
K
λ / K! ; Q(K,λ) = ∑ P(i,λ) , 0 ≤ K ≤ ∞ ; I=0
Pn(K)=P(Kn,χ)/Q(K,n) . Так как качество работы АУ характеризуется временем выработки управляющего сообщения , то нормированное среднее время ответа будет равно Y(K) = K/[1 – P0(K)] − χ= K /[1 – P(K,χ)/Q(K,χ) ] − χ=KQ(K,χ)/Q(K1,χ)χ . АСУ с различными типами сообщений . Модифицируем предыдущую систему следующим образом . Будем предполагать , что в аппарат управления поступает K различных типов сообщений подчиняющихся пуассоновскому закону распределения, т.е. для i – го типа сообщения вероятность появления n сообщений за время t равна Pi (n) = (λ i t ) n e − λ(i) t / n! , 0 ≤ i ≤ K .
55
В этом случае ясно , что длительность обработки сообщений будет зависеть от загруженности АУ . Введем плотности распределения i – го типа сообщений трех видов . 1)f i 1 (t) – плотность распределения вероятностей того , что АУ свободен ; 2)f i 2 (t) – плотность распределения вероятностей того , что АУ обрабатывает 1 сообщение ; 3)f i 3(t) – плотность распределения вероятностей того , что ожидается поступление двух и более сообщений . При этом будем предполагать , что 1) ν i1(t) – среднее число сообщений i – го типа поступившими первыми ; 2) νI2(t) – среднее число поступивших сообщений i – го типа в случае , когда АУ занят обработкой одного сообщения и других сообщений нет ; 3) ν i3(t) – среднее число поступивших сообщений i – го типа в случае , когда их поступило 2 и более . Теперь можно посчитать среднее время , когда АУ занят обработкой i – го типа сообщений ; оно будет равно ∞
Т i = ν i j ∫ s f i j (s) ds = ν i j S i j , i = 1 , K ; j = 1 , 3 . 0
При этом среднее время , когда АУ свободен будет равно Т с = t −∑ ∑ νi j S i j i
j
Так как интенсивность поступления сообщений i –го типа равна λ i , то интенсивность поступивших сообщений , когда АУ свободен будет равна ν i j (t) = λ i Tc + o (t) и когда занят − ν 1 2 (t) + ν 1 3 = λ i ∑ ∑ νi j (t) S i j + o(t) . i
Пусть
время
t=h
АУ
j
занят и в течение промежутка времени
56
exp ( −λ i h ) не получает сообщений i – го типа , а в течение времени K
Te = ∏ exp ( − λ i h ) = exp ( − λ t ) i=0
не получает никаких сообщений . Тогда с момента времени h до момента h+dh вероятность получить сообщение типа i будет равна exp(−λ h)λ i dh . Следовательно , АУ всего будет занят в течение времени S S
Ts = ∫ e −λ h λ i dh = λ i ( 1 – e −λ s ) / λ . 0
Теперь нетрудно вычислить среднее время , в течение которого аппарат управления занят обработкой первого поступившего сообщения i –го типа и других сообщений нет . Это время будет равно ∞
ν i 2 (t) = ∫ ∑ ∑νi j (t) f i j (s) (1 – e −λ s ) λ i /λ ds + o(t) = 0 i
j
= λ i /λ ∑ ∑νi j (t)( 1 – Li j ) + o(t) , i
j
∞
где
L i j = ∫ f i j (s) e −λ s ds . 0
ЭВОЛЮЦИЯ
АСУ
В этом разделе мы рассмотрим каким образом можно описывать изменение состояния систем с течением времени . В связи с тем , что любая сложная система , в том числе и автоматизированная система управления , состоит из множества взаимодействующих подсистем , представляет интерес процесс перехода , как подсистем, так и системы в целом из одного состояния в другое с течением времени . Мы будем предполагать , что система ( подсистема ) переходит из одного состояния в другое под воздействием поступающей на ее вход ( входы ) информации ( информационных сообщений ) , ее возможности перерабатывать эти сообщения и выдавать управляющие воздействия . Ясно , что в
57
каждом конкретном случае необходимо конкретизировать вид поступающей информации , характеристики системы и условия ее функционирования . В связи с этим должен использоваться адекватный математический аппарат . Так как общим случаем является случай , когда системы функционируют в недостаточно определенных условиях ( случайный характер поступающей информации , случайные мешающие воздействия на характеристики системы и т . п . ) наиболее подходящим математическим аппаратом описания состояния подобных систем является аппарат случайных функций . В связи с этим приведем некоторые сведения из теории случайных функций и случайных процессов представляющих интерес для рассматриваемых конкретных здесь задач . Наибольший интерес для таких задач представляют процессы , называемые марковскими , в силу их достаточно полного соответствия рассматриваемой практической задаче и наиболее законченной разработке в теоретическом плане . Марковские случайные процессы . Будем считать , что система может находится в одном из состояний Е1 , Е2 , … Для удобства будем их обозначать просто соответствующими номерами 1 , 2 и т.д . Если состояние системы меняется в зависимости от времени t и случайных вмешательств , то под χ(t) будем понимать состояние системы в момент времени t. Параметр t может принимать либо целые , либо действительные числа . При этом соблюдается следующее условие : если в момент времени s система находится в состоянии i , то в последующий момент времени t система будет находится в состоянии j с вероятностью pij (s,t) независящей от поведения системы до момента времени s . Такой процесс называют цепью Маркова . Вероятности pij (s) называют переходными вероятностями . Обычно рассматривается поведение цепи χ(t) с некоторого начального времени t = t0 . Тогда , если задать начальное распределение вероятностей pi0 = P { χ(t0) = i } ( i = 1 , 2 , … ) , то P { χ(t 0) = i , χ(t1) = i1 , … , χ(t n) = i n } = pt0 p (t 0, t1) … p(t n−1, t n) для любых i , i1, … , i n и t 0 ≤ t1 ≤ … ≤ t n .
58
Однородность процесса . Марковская цепь χ(t) называется однородной , если переходные вероятности p ij (s,t) зависят лишь от разности t − s , т.е. зависит от сдвига во времени : p i j (s,t) = p i j ( t – s )
(i,j=1,2,…).
При этом переходные вероятности удовлетворяют следующему уравнению : p i j (s,t) = ∑ p i k (s,u) p k j (u,t) k
марковской
цепи
( i,j = 1 , 2 , … ) ,
где s ≤ u ≤ t . Если χ(t) – однородная марковская цепь и ее рассматривать лишь в дискретные моменты времени t = nh ( n = 0 , 1 , … ) , то вероятности перехода за n шагов однозначно определяются по вероятностям p i j = p i j (h) “перехода за один шаг “ : p i j (nh) = ∑ p i k p kj [(n−1)h] = ∑ p i k [(n-1)h] p kj k
k
( i,j = 1 , 2 , )
при всех n = 1 , 2 , … Если величины p i j (nh) образуют матрицу π n , то нетрудно видеть , что она равна произведению π 1 π 1 … π 1 = π 1s . И , поскольку , при всяком начальном состоянии χ i выполняется равенство N
∑ pik = 1 k
то ни один столбец , как и ни одна строка матрицы не состоят сплошь из нулей . В том случае , когда P(t) есть бесконечная матрица с элементами p i j (t) , то P(t+h) = P(t)P(h) . Полагаем , что p i j (t) непрерывны при t = 0 и lim p i j (t) равен 1 при i=j и равен 0 в противном случае . По определению a ii = lim [ p ii(t) – 1 ] / t , i ∈ Ε ; a ij = lim p ij (t) / t , i ≠ j ∈ Ε t→0
t→ 0
матрицей переходных где матрицу A = a ij называют интенсивностей . Теперь , дифференцируя P(t)P(h) по t ( при t → 0 )
59
получают соответственно прямое и обратное уравнения Чемпмена – Колмогорова : P ′ (t) = P (t) A ;
P ′ (h) = A P(h) ;
Если вернуться к рассмотрению стационарной вероятностной модели АСУ , то нетрудно видеть , что эти уравнения примут следующий вид : dpi j (t) / dt = λ j – 1 p i , i – 1 − ( λ j + µ j ) p i j (t) + µ j+1p i , j +1 (t) dpi j (h) / dh = λ j p i + 1, j (h) – ( λ i + µ i ) p i j (h) + µ i p i – 1 , j (h) . Дискретные цепи Маркова . В этом случае параметр t ( в данном случае время ) принимает дискретные значения т.е. t = 0 , 1 , 2 , … . Тогда однородная цепь Маркова определяется переходными вероятностями p i j = P { z(t) = j ; z(t−1) = i } при i,j ∈ Ε . При этом P = p i j есть матрица переходных вероятностей . Стационарное распределение , если оно существует , удовлетворяет системе линейных уравнений : ∞
∞
i=0
j=0
P j = ∑ P i p ij , ∑ Pj = 1 . В качестве применения вышеприведенных теоретических положений рассмотрим следующий пример . Предположим , что на некоторую АСУ поступает поток сообщений , образующих пуассоновский процесс с параметром λ , причем на обработку каждого отдельного сообщения затрачивается случайное время τ , распределенное по экспоненциальному закону с параметром µ , т.е. P { τ > t } = exp (− µ t ) . Рассмотрим два состояния системы автоматизированного управления : E 1 − АСУ свободна , E 2 – АСУ занята . Пуассоновский поток сообщений обладает тем свойством , что появление очередного сообщения после любого фиксированного времени t = t 1 не зависит от характера поступления сообщений до этого момента . Поэтому , если АСУ в некоторый момент времени t 1 находится в состоянии Е 1 , то ее дальнейшее поведение не зависит от предшествующего , и , в частности , в последующий
60
промежуток времени за t 1 промежуток ∆t она с вероятностью λ∆ t + +o(∆t) перейдет в состояние Е 2 ( с такой вероятностью в указанном промежутке времени поступит очередное сообщение ) . Будем полагать , что в момент t 2 система находится в состоянии Е 2 . Пусть τ есть случайный момент перехода из состояния Е 2 в состояние Е 1 ( τ − момент окончания обработки сообщения ) . Согласно экспоненциальному закону распределения времени обработки сообщений , имеет место равенство P { τ > t ; τ > t2 } = exp [− µ ( t – t2 ) ] , ( t > t 2) . Видно , что в промежутке времени от t2 до t АСУ с вероятностью 1−exp[− µ(t−t2)] переходит в состояние Е 1 независимо от ее поведения до момента t2 . Таким образом , эволюция системы описывается марковским процессом с двумя состояниями E 1 и Е 2 и соответствующими плотностями перехода λ и µ . Пусть pij (t) есть соответствующие переходные вероятности . В рассматриваемом случае p12(t) = 1 – p11(t) , p21(t) = 1 – p22(t) , и система дифференциальных уравнений Колмогорова распадается на следующие два отдельных уравнения : p’11(t) + ( λ + µ ) p 11(t) = µ , p’22(t) + ( λ + µ ) p 22(t) = λ , решения которых выражаются формулами p 11(t) = [ 1 − µ / (µ+λ) ] exp [−(λ+µ)t] + µ / ( µ+λ ) , p 22(t) = [ 1 − λ / (λ+µ) ] exp [−(λ+µ)t] + λ / ( µ+λ ) . Пример многоканальной АСУ. В этом случае мы предполагаем , что система может одновременно обслуживать m сообщений . Будем считать , что имеется m каналов и очередное сообщение поступает по одному из каналов , если хотя бы один из них свободен ; в противном случае поступающее сообщение пропускается и покидает систему . Предположим , что поток сообщений является пуассоновским с параметром λ0 и время обработки каждого сообщения в каждом из m каналов распределено по
61
экспоненциальному закону с параметром λ , причем сообщения обрабатываются независимо друг от друга . Рассмотрим такие состояния Е0 , E1 , … , Em , когда состояние Еk означает , что занято ровно k каналов обработки сообщений . В частности состояние Е0 означает , что АСУ свободна , а состояние Еm − что система полностью занята . Переход АСУ из состояния в состояние с течением времени t представляет собой марковский процесс , для которого плотности перехода имеют вид λ0j = −λ0
при j = 0
и λ0j = λ0
при j = 1 ;
λ i j = iλ при j=i−1 , λ i j = −(λ0+iλ) при j=i , λi j=λ0 при j=i+1 , (1≤ i < m) λ m j =mλ при j=m−1 , λ m j = −mλ при j=m . При t → ∞ переходные вероятности p i j (t) экспоненциально быстро стремятся к своим граничным значениям Pj , j = 0 , … , m . Граничные вероятности Pj могут быть найдены из следующей системы уравнений : − λ0 P0 + λ P1 = 0 , λ0 Pk-1 − ( λ0 + kλ ) Pk + ( k+1) λ Pk+1 = 0 (1 ≤ k < m) , λ0 Pm-1 − mλPm = 0 , решение которой известно и имеет вид : m
Pk = M k / L k , где M k = (λ0 /λ) / k! , L k = ∑ (λ0/λ) i / i! , k = 0 , 1 , … , m k
i =1
Данные выражения формулами Эрланга .
для
граничных
вероятностей
называют
62
НАДЕЖНОСТЬ ФУНКЦИОНИРОВАНИЯ СЛОЖНОЙ СИСТЕМЫ Будем полагать , что элементы системы могут выходить из строя с некоторой плотностью вероятности . Интенсивность отказов будем считать равной λ(z)=λ0(z)ε , где ε > 0 − малый параметр , λ0 (z) – множитель пропорциональности , представляющий собой некоторую ограниченную функцию . Такая модель охватывает системы с произвольно распределенной длительностью безотказной работы подсистем ( элементов ) . Следует отметить , что ограниченность функции λ0(z) ограничивает класс рассматриваемых функций распределения . Пусть z(0) = i , t 1< t 2< … < t n< … , − моменты следующих после t = 0 попаданий z(t) в множество состояний Z0 . Обозначим через P0{ … } вероятность событий , соответствующих случаю ε = 0 . Предположим , что для любых i ≠ j найдется такое n = n(i,j) , что P0{z(t)=j/z(0)=i} > 0 . Это условие обеспечивает сообщаемость состояний множества Z0 . Для дальнейшего вводятся следующие понятия . 1 . Найдутся такое состояние i∈Z0 и такое ε′ > 0 , а также множества A0 , A1 , … , Ar (A)=A , что : а) множество тех t , для которых z i(t, ω) ∈ A0 и 0 < t < 1/ε′ , равномерно по ε > 0 ; б) для любого m = 0 , 1 , … , r(A) – 1 и любых z′∈Am множество тех t , для которых z z ′ (t,ω)∈ A m+1 и 0 < t < 1/ε′ , с вероятностью , большей ε′ , имеет меру , большую ε′, равномерную по ε > 0 . 2 . Пусть i ∈ Z0 , m < r(A) . Определим z i(t 0, ω 0) = a1 ,
z a1(t1, ω1) = a2 ,
z a2(t2, ω2) = a 3, … , z am(tm, ωm) = a m+1 . Тогда с вероятностью 1 относительно независимых элементов ω0 , ω1 , … , ωm вероятностного пространства Ω имеем a m+1 ∈ A при любых t 0 < τi(ω0) , t1< τ a1 (ω1) , t2 < τa2(ω2) , … .
63
Следует отметить , что существование ранга налагает некоторые условия на закон изменения процесса z(t) . Если ранг существует, то он имеет достаточно простой смысл . Попадание из некоторого состояния i ∈Z0 в множество А имеет положительную вероятность при условии , что до следующего попадания процесса в множество Z0 произойдет r(A) воздействий ; если же число воздействий меньше r(A) то при этом условии вероятность попадания в А при любом i равна 0 . ВЫРАЖЕНИЕ ХАРАКТЕРИСТИК ПРОЦЕССА z (t) ЧЕРЕЗ ХАРАКТЕРИСТИКИ ЕГО ПОВЕДЕНИЯ В ИНТЕРВАЛАХ МЕЖДУ ПОПАДАНИЕМ В НЕКОТОРОЕ СОСТОЯНИЕ ИЗ МНОЖЕСТВА Z 0 Пусть индекс ε обозначает вероятность какого – либо события или распределение какой – либо случайной величины , а также числовые характеристики этого распределения при фиксированном значении ε > 0 . В данном случае понадобятся следующие характеристики : z(t) в множество πi(А) – вероятность попадания процесса состояний А между двумя попаданиями в состояние i ∈Z0 ; Ti(A) – математическое ожидание времени пребывания процесса z(t) в множестве состояний А в интервале между двумя попаданиями в состояние i∈Z0 ; Ti′(A) – математическое ожидание квадрата времени пребывания процесса z(t) в А в интервале между двумя попаданиями в состояние i∈Z0 при условии , что попадание в А имело место ; ui – математическое ожидание времени возвращения в состояние i∈Z0. Если эти характеристики известны хотя бы для одного фиксированного i∈Z0 , тогда основные характеристики , имеющие отношение к рассматриваемым вопросам , при ε → 0 будут иметь следующее приближенное выражение : где
PA(t) = Ti(A)/ui + γA(t) + ο(1) , γA(t) = ο ( Ti(A)/ui ) ,
ε→0, t→∞,
64
QA ( ui/πi(A)t ) = e − t + (1),
ε → 0.
Для распределения функционала IА(t) имеют место следующие соотношения . Случай 1: предельная теорема для tπi(A)/ui → ∞ . В этом случае , и при условии , что время возвращения в состояние i имеет конечную дисперсию , а отношение среднеквадратического времени пребывания процесса z(t) в множестве состояний А в интервале между двумя попаданиями в состояние i∈Z0 к математическому ожиданию этой же случайной величины ограничено , тогда случайная величина IA(t) асимптотически нормальна . Асимптотическое выражение математического ожидания нормального закона есть tTi(A)/ui ; формула для асимптотического выражения дисперсии имеет вид : D[IА(t)] ~ tπi(A)Ti′(A)/ui . Таким образом , время пребывания в множестве состояний А асимптотически нормально с данными средним значением и дисперсией . Случай 2 : в этом случае величина tπi(A)/ui . Тогда IA(t) будет в пределе иметь распределение суммы пуассоновского числа случайных величин . Пусть f(s) = Me− sηi , где ηi – время пребывания процесса z(t) в множестве состояний А между двумя попаданиями в состояние i при условии , что между этими двумя попаданиями попадание в А имело место . Также пусть
ϕ(s)=Me− sIA(t) . Тогда верно соотношение : ∞
ϕ(s)→ ∑ µk e− µ f k (s) / k! = e− µ [ 1− f (s) ] , ε→0 k=0
где µ = tπi(A)/ui . При этом имеет место равномерная сходимость по s : Re s ≥ 0 . Последняя формула дает исчерпывающую характеристику предельного распределения случайной величины IA(t). В частности , ее можно использовать для расчета моментов этого распределения .
65
МОДЕЛЬ
ЖИВУЧЕСТИ
АСУ
Ранее отмечалось , что в качестве одного из критериев оптимальности при создании АСУ используется живучесть системы , подразумевающая способность системы сохранять рабочие характеристики в заданных пределах при отрицательных , в общем случае , внешних и внутренних воздействиях на компоненты системы . Одна из формализованных моделей , описывающих указанную ситуацию может быть представлена следующим образом . Будем предполагать , что взаимодействуют две системы А и В. В качестве одной из систем может выступать внешняя противодействующая среда . Тем не менее будем полагать , что все элементы систем можно разбить на три группы : − рабочие , жизненно важные элементы ; − защитные элементы ; − внешние активные , обычно моделирующие воздействие на внешнюю среду элементы . Приводимый ниже рисунок поясняет моделируемую ситуацию . а − элементы
σbman
Cb− элементы
σbmRn Ra− элементы
σbmCn
Rb− элементы σamCn
Ca− элементы система А
σamRn σ
b− элементы
a
mbn
система В
66
Таким образом полагаем , что для систем А и В соответственно : a и b – рабочие элементы ; R a и R b – защитные элементы ; C a и C b – внешние активные элементы ; Взаимодействие систем происходит на интервале времени 0 ≤ t ≤ T , причем на момент t = 0 системы А и В имеют соответственно − A j и B j рабочих элементов ( j = 1 , … , n a (n b ) ) ; − α m и β m защитных элементов ( m = 1 , … , r a (r b ) ) ; − ν ma и ν mb внешних элементов ( m = 1 , … , s a ( s b ) ) . На основе экспертных оценок вводятся ценности рабочих элементов a j и b j , которые в общем случае зависят от времени и количества элементов . Ясно , что на нулевой ( начальный ) момент времени соответственно сумма всех рабочих элементов равна N a (0) и N b (0) ; защитных элементов равна N Ra (0) и N Rb(0) ; внешних активных элементов равна M a (0) и M b (0) . При этом предполагается , что структуры систем А и В равномерно заполнены всеми типами элементов , т.e. характеристики всех элементов не зависят от взаимного расположения . Все элементы систем А и В в одинаковой степени досягаемы для C a и C b − элементов соответственно . Взаимодействие систем заключается в том , что каждая на интервале времени 0 ≤ t ≤ Т в дискретные t i ( i = 1 , N ) определяет свое поведение − i
A ={µ
a
mωn
( t i) , σ
−
a
mωn
(t i ) } и Bi = { µ bm ω n (t i ) , σ bm ω n (t i ) } ,
где µ a (b)m ω n (t i ) и σ a (b)m ω n (t i ) есть порции R a (b) и С а (b) элементов m − го типа направленных на защиту и уничтожение ω − элементов n − го типа соответственно . Со временем один ω − элемент n − го типа системы А ( или В ) выходит из строя по воздействием одного C a ( C b ) элемента m − го типа с вероятностью P am ω n , P bm ω n . Будем считать , что качество ( v , w ) − обмена определяется уровнем живучести системы , который указывает на степень близости системы к моменту выхода из строя и зависит от количества не выведенных из строя рабочих элементов . Считается , что системы А ( или В ) выходят из строя , если к моменту t ≤ T выполняются соотношения :
67
na na ∑ a j A j (t) ≤ ∑ θ a j a j A j (0)
j=1
j=1
и
nb nb ∑ b j B j (t) ≤ ∑ θ b j b j B j (0) ,
j=1
j=1
где 0 ≤ θ a j ,θ b j ≤ 1 определяются спецификой систем . Из этих соотношений ясно , что чем меньше числа θ , тем более жизнеспособной является система . Выбор функции выигрыша . Задание функции выигрыша необходимо для получения количественной оценки исхода взаимодействия систем А и В в конфликтной ситуации . Вид функции существенно зависит от степени конфликтности ситуации , т.е. как влияет система А на достижимость цели системой В . В подобных случаях целеустремленность может быть выражена в виде некоторой фиксированной последовательности состояний системы . Основой этой последовательности служит величина потерь жизненно важных элементов обеими системами . Ценность этих потерь можно выразить в виде величин na nb Q a = ∑ a i [ A i (0) – A i (T) ] , Q b = ∑ b i [ B i (0) – B i (T) ] i=1
i=1
Интенсивность конфликтной ситуации зависит от Q = Q a + Q b . Чем ближе Q стремится к na nb Q 0 = ∑ a i A i (0) + ∑ b i B i (0) i=1
i=1
тем интенсивнее конфликт . Максимального значения конфликт достигает при достижении Q величины Q0 . При Q → 0 интенсивность конфликта падает , функция выигрыша в общем случае может меняться с течением времени t . Таким образом , данная ситуация может достаточно полно описываться функциями выигрыша для систем А и В соответственно na nb v a = ∑ a i A i (T) , v b = ∑ b i B i (T) . i=1
i=1
68
ЛИТЕРАТУРА 1. Оптнер С.Л. Системный анализ для решения деловых и про − мышленных проблем . Пер. с англ. Изд−во “Советское радио “, 1969 . 2. “Наука − техника − управление “. Сб . статей . Пер . с англ . Изд − во “Советское радио “, 1966 . 3. Бусленко Н.П. Моделирование сложных систем . Изд − во “Наука” , 1968 . 4. Хедли Дж. , Уайтин Т. Анализ систем управления запасами . Пер. с англ . Изд − во “Наука” , 1969. 5. Понтрягин Л. С. и др. Математическая теория оптимальных процессов . Физматгиз , 1961. 6. Зубов В. И. Теория оптимального управления . Изд − во “Судостроение “ , 1966. 7. Бесекерский В. А. , Попов Е.П. Теория систем автоматизирован − ного регулирования . Изд − во “ Наука “ , 1966 . 8. Красовский Н. Н. Теория управления движением . Изд − во “Наука” , 1968. 9. Калман Р. , Фалб П. , Арбиб М. Очерки по математической теории систем . Изд − во “ Мир” , 1971. 10. Гнеденко Б. В. , Коваленко И. Н. Введение в теорию массового обслуживания . Изд − во “Наука” , 1966. 11. Коваленко И. Н. Некоторые задачи массового обслуживания с ограничением . “ Теория вероятностей и ее применение “ , 1961 , т. 6, N2 . 12. Баруча − Рид А.Т. Элементы теории марковских процессов и их приложения . Изд − во “Наука” , 1969 . 13. Бусленко Н.П. Об одном классе сложных систем . Сб . “Проб − лемы прикладной математики и механики “ . Изд − во “Наука” , 1971. 14. Нечипоренко В. И. Структурный анализ и методы построения надежных систем . Изд − во “Советское радио” , 1968. 15. Карачаров К. А. , Пилютик А. Г. Введение в техническую теорию движения . Физматгиз , 1962. 16. Кушнер Г. Дж. Стохастическая устойчивость и управление . Изд − во “ Мир” , 1969.
69
17. Чжун Кай − лай . Однородные цепи Маркова . Изд − во “Мир” 1964 . 18 Кокс Д.Р. , Смит В. Теория восстановления . Изд − во “ Советское радио “ , 1967 . 19. Калашников В.В. О задаче исследования устойчивости функционирования сложных систем . ДАН СССР , 1967 , т.177 , N6 . 20. Коваленко И. Н. О некоторых классах сложных систем . “Известия АН СССР” , Техническая кибернетика , 1964 . N6; 1965 , N1 и N3 . 21. Калашников В.В. Анализ процессов функционирования сложных систем с помощью качественных методов . В сб. “ Вопросы конкрет − ных системных исследований “. Изд − во МДНТП, 1970. 22. Климов Г.П. Стохастические системы обслуживания . Изд − во “Наука” , 1966. 23. Ушаков И. А. О вычислении среднего стационарного времени пребывания полумарковского процесса в подмножестве состояний . “Известия АН СССР” , Техническая кибернетика , 1969 , N4.
70