А.К. Погодаев С.Л. Блюмин
Липецк
2003 -0-
ЛИПЕЦКИЙ
ЭКОЛОГО-ГУМАНИТАРНЫЙ
ИНСТИТУТ
А.К. Погодаев С.Л. Блюмин
Липецк
2003 -1-
ББК 22.18 УДК 681.3:62-52 П50
Погодаев А.К., Блюмин С.Л. Адаптация и оптимизация в системах автоматизации и управления: Монография. – Липецк: ЛЭГИ, 2003. – 128 с. В монографии приведено описание современного подхода для решения проблем при разработке математического и программного обеспечения автоматизированных систем управления производственными и технологическими процессами. В качестве примера представлены результаты реализации подхода для металлургического предприятия. Издание утверждено НТС и РИС ЛЭГИ и рекомендовано научным сотрудникам и специалистам, занимающимся вопросами проектирования автоматизированных систем управления. Ил. 11. Библиогр.: 125 назв.
Рецензенты: каф. мат. анализа, алгебры и геометрии ЛГПУ , г. Липецк, докт. физ-мат. наук, профессор А.С. Калитвин докт. техн. наук, профессор О.Я. Кравец (ВГТУ, г. Воронеж)
ISBN 5-900037-35-5 © Липецкий эколого-гуманитарный институт, 2003
-2-
ОГЛАВЛЕНИЕ Введение .................................................................................................... 4 1. Основные виды обеспечения автоматизированных систем........ 5 1.1. Математическое обеспечение систем автоматизации и управления.....5 1.1.1. Имитационное системное моделирование.....................................5 1.1.2. Идентификация в моделировании технологических связей ........8 1.3.2. Оптимизация в задачах автоматизированного управления........12 1.2. Программное обеспечение систем автоматизации и управления........14 1.2.1. Корпоративные и проблемно-ориентированные автоматизированные системы и пакеты программ......................14 1.2.2. Системы автоматизации и управления в металлургии ...............16 2. Математические основы адаптивного моделирования ............. 19 2.1. Объектно-структурное моделирование многоэтапных производств ..19 2.2. Адаптивная линейная идентификация технологических связей .........25 2.3. Блочная адаптивная идентификация линейных моделей.....................29 2.4. Адаптивная нелинейная идентификация технологических связей .....33 2.5. Блочная адаптивная идентификация нелинейных моделей .................42 2.6. Суперпозиционная идентификация........................................................48 2.7. Рекуррентно-итерационные алгоритмы ньютоновского типа .............52 2.8. Метод оптимального моделирования технологических связей...........57 3. Математические основы адаптивной оптимизации.................... 61 3.1. Адаптивная оптимизация структурных моделей ..................................61 3.2. Адаптивные методы определения приоритетов в многокритериальных задачах .................................................................63 3.3. Адаптивные алгоритмы решения многокритериальных задач............68 3.4. Статистические оценки точности оптимальных решений ...................74 4. Адаптация и оптимизация моделей металлургического производства....................................................................................... 81 4.1. Объектно-структурное моделирование металлургического производства ............................................................................................81 4.2. Адаптивная идентификация технологических связей листопрокатного производства..............................................................93 4.3. Адаптивная оптимизация моделей качества листового проката .........99 Заключение........................................................................................... 107 Приложения.......................................................................................... 109 Список литературы ..............................................................................122 -3-
ВВЕДЕНИЕ Современное состояние проблем, связанных с решением задач автоматизации и управления в промышленных системах, влечет за собой разработку и применение новых математических методов и компьютерных технологий. При этом практически невозможно обойтись без наличия гибкого, многофункционального, универсального математического и программного комплекса. Сегодня на различных промышленных предприятиях функционирует большое число разнообразного программного обеспечения для сбора, хранения и обработки информации, решения прикладных задач. Среди них можно выделить корпоративные системы, проблемноориентированные системы и пакеты программ. Все они обладают определенными свойствами, которые при различных условиях могут интерпретироваться как достоинствами, так и недостатками. Эффективность применения того или иного программного обеспечения определяется функциональными возможностями, его стоимостью и соотношением затрат: лицензия/внедрение/оборудование. Но в любом случае, как правило, системы автоматизированного управления сложными производствами должны: использовать положения математического моделирования и программирования, учитывать многокритериальность оптимизационных задач, нелинейность моделей технологических связей, наличие ограничений, условия неопределенности при принятии решений, непрерывное обновление производственной информации, исключать субъективность и трудоемкость процедуры опроса специалистов при экспертном оценивании. Особенности оптимизационных задач в реальных условиях создают существенную проблему, связанную с адаптацией структуры и параметров моделей, весовых коэффициентов частных критериев и самих решений этих задач к постоянным изменениям состояния производства. Следует отметить, что промышленные объекты отличаются сложной структурой потоков (например, с множеством последовательнопараллельных технологических этапов, наличием разнообразного оборудования, многообразием видов продукции и т.д.). Поэтому при создании автоматизированных систем управления сложными производственными процессами целесообразно использовать объектно-ориентированный подход, обладающий высокой степенью универсальности при описании схем производств, расширении круга задач, модифицикации и развитии систем в перспективе.
-4-
1. ОСНОВНЫЕ ВИДЫ ОБЕСПЕЧЕНИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ 1.1. Математическое обеспечение систем автоматизации и управления 1.1.1. Имитационное системное моделирование
Широко признанным методом анализа, оптимизации и проектирования систем управления различными техническими, технологическими, социальными, экономическими и другими процессами является имитационное моделирование (ИМ). По определению Р. Шеннона [119], имитационное моделирование есть процесс конструирования модели реальной системы и постановки экспериментов на этой модели с целью либо понять поведение системы, либо оценить (в рамках ограничений, накладываемых некоторым критерием или совокупностью критериев) различные стратегии, обеспечивающие функционирование данной системы. Методология имитационного моделирования широко начала развиваться в составе теории системного анализа во второй половине XX столетия. За почти полувековую историю существования, огромный вклад в ее развитие внесли такие западные ученые, как Дж. Клейнен и Р. Шеннон [91, 119], а также отечественные представители этого направления Н.П. Бусленко, В.Н. Бусленко, В.В. Калашников, А.А. Вавилов и др. [25, 26, 27, 51]. Как мощный инструмент исследования сложных систем, имитационное моделирование опирается и использует в своей основе различные теории и методологии построения моделей, алгоритмизации объектов, моделирования элементов системы и межэлементных отношений [25, 27, 28, 49, 56, 75, 113, 114, 118]. Все алгоритмы, использующие системный или объектно-ориентированный подход к программному описанию объектов системы, так или иначе, учитывают стохастический или детерминистический характер их поведения. В этой связи, в процессе моделирования различных классов систем, происходит определенное расхождение методов моделирования и возможных стандартных схем моделирования отдельных объектов. Однако, при том имеет место один существенный недостаток, связанный с тем, что структура моделирующего алгоритма и структура информации определяется математической моделью, а не структурой и свойствами исследуемого процесса. Существенную роль в имитационном моделировании процессов функционирования широкого класса систем играют модели систем массового обслуживания (СМО) [26, 49, 75]. Моделирование СМО возмож-5-
но с использованием аналитических и статистических методов [75]. Наибольшее практическое применение в настоящее время получил метод статистического моделирования СМО вследствие целого ряда положительных свойств, основными из которых можно считать: – большую адекватность между физической сущностью описываемого процесса и его математической моделью; – охват более широкого класса систем по сравнению с аналитическими методами; – возможность моделирования работы систем при различных законах распределения множества случайных величин; – возможность моделирования систем как в установившихся, так и в переходных режимах. Однако следует отметить, что модель СМО описывает лишь процессы обслуживания некоторых абстрактных объектов. В классических СМО совершенно не рассматривается природа обслуживаемых объектов, их первоначальные и приобретенные в результате обслуживания физические свойства, не учитывается технология обслуживания, в результате воздействия которой изменяются свойства объектов обслуживания. Существенными являются лишь моменты появления различных событий, так как от этого зависит эволюция рассматриваемой модели во времени [49]. Ярким примером производства со сложной структурой является металлургическое. Оно характеризуется большой энергоемкостью, длительностью цикла производства, отсутствием строгих математических моделей, описывающих физические процессы и связывающих свойства готового продукта с технологией его получения, наличием многих случайных факторов, влияющих на динамику производства [105]. Таким образом, эта производственная система представляет собой совокупность взаимосвязанных элементов, каждый из которых осуществляет определенную переработку некоторого полуфабриката в готовый продукт. Следует отметить, что в современной литературе не достаточно описана методология имитационного моделирования в области исследования металлургических процессов. Так, например, в [68] рассмотрено возможное аналитико-имитационное описание содержательной и концептуальной модели металлургических производственных систем с выделением элементарных звеньев в структурном описании модели и введением возможных функций, управляющих их функционированием, дано описание моделируемого производственного процесса на примере схемы листопрокатного производства (ЛПП) ОАО «НЛМК». Однако не рассматриваются аспекты автоматизации моделирования процессов лис-6-
топрокатного производства, не учитываются особенности производства с наличием множества различных технологических маршрутов, наличие для потока обрабатываемой продукции обратных связей. Специалисты фирмы SIEMENS представляют автоматизированную систему HYBREX, функция которой заключается в моделировании технологических операций [99]. Функционирование системы показано на примере расчета производительности широкополосного стана горячей прокатки в зависимости от имитации параметров прокатки: скорости, нагрузки на двигатели главных приводов клетей чистовой группы, температуры рулона и т.д. Это является определенным ограничением использования этой системы для исследования других технологических операций из-за программной реализации лишь характерного для стана горячей прокатки набора параметров. В [29] представляется имитационная модель контроля качества функционирования определенного технологического процесса, реализованная в виде диалоговой программы, позволяющей лицу, принимающему решение, варьируя начальными условиями и параметрами, экспериментировать с построенной моделью технологического процесса и оценить такие важные характеристики, как себестоимость и время изготовления партии изделий, средние себестоимость и время изготовления одного изделия, степень загрузки отдельных операций, максимально целесообразный объем буферных складов, процент выхода годных изделий и т.п. Недостатками построенной модели являются: наличие только диалогового режима функционирования модели, используемого во всех случаях возможных альтернативных решений; отсутствие реального применения и результатов моделирования для конкретного технологического процесса. В целом известные моделирующие системы, как правило, имеют выразительную ориентацию на модели “одного сеанса”. Поэтому, они не могут быть использованы для многократного имитационного эксперимента без периодической адаптации моделей к реальным производственным процессам. Система моделирования сложных производств с возможностью многократного использования моделей, ориентированных на проблемное исследование, должна опираться на универсальный подход и основополагающие принципы, обеспечивающих исходную инвариантность системы к предметной области и простую его настройку на выбранное производство. Модель металлургического производства характеризуется сетевой структурой потока обрабатываемой продукции [60], имеющей прямые и обратные связи. Рассматривая это производство как сеть, в которой поэтапно обрабатывается продукция с целью получения готового образца, -7-
можно сделать вывод, что он представляет собой многошаговый процесс, оптимизация которого, в общем случае, есть развитие задачи отыскания кратчайшего пути в направленной сети с альтернативными маршрутами. Для решения подобных задач могут быть использованы методы динамического и линейного программирования [110]. Возможность их применения доказана для решения таких производственных задач как: оптимальное распределение ресурсов, оптимальное следование единицы продукции по этапам обработки, анализ критических участков технологии, определение участков с максимальным количеством брака, оптимальное распределение нагрузки на оборудование цеха и на склады продукции и т.п. Динамическое программирование, как метод, позволяющий оптимизировать функции многих переменных в результате многошагового процесса, используется для решения задач в ациклических сетях. В реальных же условиях в производственном процессе могут появляться циклы, например, когда производственный процесс проходит несколько стадий на одном и том же оборудовании, когда возникает исправимый дефект обрабатываемой продукции, когда осуществляется переработка отходов и т.д. Линейное программирование обеспечивает решение многомерных задач, определенных в сетях с циклами [52], однако не позволяет оценить промежуточные оптимальные решения, что характерно для метода динамического программирования. 1.1.2. Идентификация в моделировании технологических связей
При моделировании технических систем, характеризующихся числовыми параметрами, широко используется аппарат дифференциальных и разностных уравнений, уравнений математической физики, теории вероятностей и математической статистики и других разделов современной математики. Однако на сегодня не созданы достаточно универсальные и бесспорные способы моделирования [48, 58, 107]. Наиболее распространенным на практике подходом к моделированию зависимостей является регрессионный анализ, опирающийся на метод наименьших квадратов (МНК) [3, 8, 32, 33, 46, 111, 121 и др.]. В общем случае МНК рассматривается как способ решения задачи безусловной оптимизации [14, 31, 40]: найти min f ( x ) =
-8-
m
1 2 1 R ( ξ) = ∑ ru2 ( ξ) , 2 2 u =1
где R ( x ) = [ r1 (ξ),..., rm (ξ)]T ∈ ℜ m – векторная функция векторного аргумента ξ = (ξ1 ,..., ξ n ) ∈ ℜ n (функция невязок). Если ξ = β – параметры регрессионной зависимости, которые необходимо определить, а R(β) определяет структуру этой зависимости, то МНК используется для решения задач структурной и параметрической идентификации. В контексте задач регрессии часто возникает линейная задача о наименьших квадратах (ЛЗНК), когда модель линейна относительно параметров β (например, [3, 4, 33, 78, 85, 101, 106]): y = ϕ T ( x)β =
n
∑ ϕ i (x1 , ..., x k )β i ,
i =1
где y – отклик, зависящий от факторов x ∈ ℜ k ; ϕi (x ), 1 ≤ i ≤ n – базисные функции линейной регрессионной модели. В этом случае вектор невязки определяется в виде R (β) = y − Φβ , Φ = [ϕ i ( x u )] ∈ ℜ m × n , 1 ≤ i ≤ n, 1 ≤ u ≤ m . В простейших вариантах ϕi ( x)
могут быть одночленами различных степеней относительно факторов x ∈ ℜ k , что приводит к регрессии – линейной по параметрам β ∈ ℜ n , полиномиальной по факторам. Разработано большое число методов, алгоритмов и пакетов прикладных программ для решения ЛЗНК (например, [1, 4, 33, 50]). Среди разнообразных методов весьма эффективным в формальном, а по мнению ряда специалистов, и в вычислительном отношении является метод псевдообращения [4, 12, 13, 14, 78, 101, 108, 120]. Следует отметить, что тогда решение ЛЗНК можно записать в виде β = Ф+y (Ф+ – псевдообратная матрица к Ф) – предельно простом, прозрачном и охватывающем случаи, различающиеся при других подходах. Однако, известно, что в большинстве случаев технологические процессы целесообразно описывать регрессионными зависимостями с нелинейными структурами как по факторам, так и по параметрам, т.е. решается нелинейная задача о наименьших квадратах (НЗНК). Так, например, в металлургии физико-химические процессы, происходящие в стали при ее обработке, могут носить нелинейный характер и возникает вопрос о приемлемости линейных уравнений для моделирования этих процессов. Это утверждение подкрепляется теоретическими и экспериментальными исследованиями в металлургии [19, 64, 71, 100, 115]. В этой связи ставится вопрос о применении нелинейных структур в производственных моделях. Задача создания универсального алгоритма структурной идентификации нелинейных моделей по данным пассивного эксперимента в -9-
ближайшее время, по всей вероятности, решена не будет. Так в [87] высказано, что никакая функция не может быть в принципе выведена из результатов наблюдений объективными методами математической статистики, т.к. невозможны алгоритмы, которые выводили бы новые закономерности из результатов новых наблюдений. Тем не менее, существуют некоторые рекомендации специалистов в этом направлении. Математическая модель с позиций системного подхода – есть единство топологии, структуры и параметров. По мере возможности выбор единственной в требуемом роде полностью определенной модели является результатом последовательного раскрытия неопределенности на этапах топологического, структурного и, наконец, параметрического синтеза. При этом в ряде методов (например, группового учета аргументов (МГУА) [48], баз и контрольных сумм [76], селективной идентификации полиномиальной структуры (СИПС) [73]) задачи последовательного раскрытия неопределенности итоговой полиномиальной модели ставятся в соответствие с кластеризацией исходного массива данных. При этом проблемой и для идентификации, и для реконструкции остается нахождение “истинных” структурных компонентов, на основе которых синтезируется модель. Авторами фундаментальных работ по статистическому моделированию (см., например, [7]) справедливо отмечено, что определять структуру нелинейной регрессии необходимо, исходя из теоретических и экспериментальных исследований в предметной области. Однако, как правило, эти формулы рассматриваются в ограниченных технологических фрагментах и не учитывают большинства факторов, влияющих на конечные свойства продукции. Между тем многообразие различных нелинейных моделей более или менее общей природы чрезвычайно велико (например, [1, 33, 35, 37, 38]). Отметим некоторые наиболее характерные их классы [2, 19, 22, 34, 40, 47]: − квазилинейные модели считаются простейшими из нелинейных; − степенные модели – частный случай квазилинейных; − логлинейные модели – другой частный случай квазилинейных; − сигномиальные многочленные модели; − полилинейные модели; − дробнолинейные модели; − производственные функции представляют класс нелинейных функций. Основу моделирования, в этом случае, определяют фундаментальные математические положения аппроксимации и оптимизации набора данных некоторыми функциональными структурами [30, 77]. Следует отметить, что определять оптимальный базис аппроксимации экспериментальных данных правомочно, оперируя лишь эмпирикой. Признается, что выборка трудна для интерпретации, но и, одновременно, очень от-10-
крыта, доступна для нее. Подобный подход реализован в ряде численных методов [39]. Численные методы включают в себя и решение вопроса о существенности связи “фактор-отклик”. Задачи о наименьших квадратах допускают, по меньшей мере, две специфические постановки, истоки которых нагляднее всего прослеживаются в задачах регрессии, где может изменяться как количество членов модели, так и размер выборки экспериментальных данных. В каждом случае возникает необходимость пересчета уже имеющихся результатов. В этих случаях применение классического МНК затруднительно: одна проблема связана с обращением информационных матриц большой размерности без уверенности в их корректности, вторая – с корректировкой связей “фактор-отклик”, требующих изменений выборки данных во времени и при этом использования полного повторения всех вычислений. Именно поэтому получил распространение в теории идентификации и адаптивного управления рекуррентный МНК [88]. Один из видов рекурсий, использующий хорошо известный метод пошаговой линейной регрессии [4, 106], широко применяется при решении производственных задач [63, 81, 103, 125 и др.]. В линейной пошаговой регрессии распространены такие мотивировки: факторы последовательно включаются в регрессионную модель в порядке убывания корреляционной связи с откликом; остаточная дисперсия, показывающая степень расхождения между данными и прогнозируемыми моделью значениями отклика, неприемлемо велика, для преодоления чего и пополняется модель [1]. Однако, несмотря на целесообразность использования идей пошаговой регрессии в решении НЗНК, в литературе эта интерпретация, по-видимому, не рассматривалась. О другом виде рекурсии МНК можно говорить, когда число параметров неизменно, но их оценки рассчитываются последовательно. Алгоритмы, использующие рекурсии этого типа, нашли широкое применение в адаптивной идентификации как линейных [61, 79, 88, 116, 117], так и нелинейных по параметрам моделей [14, 79, 104]. Тем не менее, адаптивные рекуррентные алгоритмы параметрической идентификации, также как и пошаговой регрессии, часто не удовлетворяют критериям их стабильной работы, т.к. не всегда информационные матрицы обладают свойствами обратных, а следовательно, в этих случаях рекуррентное обращение этих матриц невозможно. Более того, решая производственные задачи, целесообразно использовать в рекуррентных алгоритмах блочные процедуры, так как обычно технологическая информация для настройки моделей поступает в системы идентификации в виде порций данных о режимах обработки партий продукции. Именно рекуррентное псевдообращение, являющееся более общим по отношению к традиционным ме-11-
тодам пошаговой регрессии и адаптации моделей [4, 14], дает основу разработкам устойчивых алгоритмов. 1.3.2. Оптимизация в задачах автоматизированного управления
Оптимизация в контуре управления сложной системой является компромиссом между взаимно противоречивыми требованиями комплекса выходных свойств конечного продукта. В математической постановке эта задача традиционно формулируется как оптимизация комплексного критерия качества методами математического программирования [43, 61, 74, 92], которой предшествуют решения, как минимум, еще трех подзадач: − выбрать структуру функции-свертки для формирования комплексного критерия качества; − рассчитать весовые коэффициенты, определяющие значимость частных критериев в общей модели качества; − выбрать алгоритм оптимизации комплексного критерия. При создании автоматизированных систем управления технологическими процессами возникают принципиальные трудности, которые часто обусловлены противоречивостью свойств этих процессов, их различной физической природой, наличием случайных факторов, а также ограниченностью или отсутствием информации о структуре объекта и его функциональных внутренних взаимосвязей. Эти причины вызывают необходимость решения многокритериальной оптимизационной задачи. Вопросам решения многокритериальных задач в промышленности посвящено много работ, базирующихся на самых различных математических и технологических принципах (см., например, [24, 43, 92, 103 и др.]). Показано, что наиболее приемлемы при решении практических задач функции-свертки, обладающие свойствами изотонности, например m [24, 92]: взвешенная сумма V = ∑ λ i s i ; средневзвешенное степенное i =1 m
m
i =1
i =1
λi
V = ( ∑ λ i s zi )1 / z ; взвешенное произведение V = ∏ s i
; взвешенное
минимальное V = min(s i / λ i ) ; взвешенное максимальное V = max(s i λ i ) i
и др.
-12-
i
Несмотря на множество вариантов исполнения сверток, каждая частная производственная задача требует дифференцированного подхода при комплексной оценке частных критериев. Составной единицей комплексных критериев являются весовые коэффициенты λ частных критериев. Для определения λ в комплексных критериях обычно применяются методы экспертного оценивания (см., например, [36, 74, 92]), которые позволяют ранжировать частные критерии качества по относительной их важности. Распространенные подходы обработки экспертной информации основываются на: − статистических методах (например, ранжирования, преобразованных рангов, парных сравнений и др.) [10, 92]; − методах кластерного анализа (иерархический агломеративный, K-средних и др.) [41, 44]. Общими недостатками применения экспертного оценивания частных критериев в задачах автоматизированного управления являются элементы субъективности и трудоемкость процедуры опроса специалистов. При этом значительно утрачивается возможность периодической адаптации коэффициентов к реальному производству, а экспертный опрос разрывает контур непрерывной автоматизации. Решение многокритериальной задачи оптимизации – есть совокупность значений независимых переменных, удовлетворяющих ограничениям и соответствующих минимальному или максимальному значению комплексного критерия. Методам решения оптимизационных задач посвящено очень большое число работ, например, для практического применения могут быть использованы монографии [24, 31, 40, 45, 47, 82, 83, 102, 112]; этот перечень может быть продолжен, так как число отечественных и зарубежных работ, посвященных этим вопросам, постоянно растет. В [14] представлена классификация оптимизационных алгоритмов, обобщающая их в классы по существующим на сегодняшний день признакам. В [40, 82, 112] описаны методы с приложением их программных реализаций на алгоритмических и псевдоалгоритмических языках. Большое внимание уделяется тестированию алгоритмов оптимизации [14, 40, 47, 112]. Остается актуальной проблема выбора методов для решения той или иной оптимизационной задачи: в [40, 112] рассматриваются критерии оценки их эффективности, в [45] представлены алгоритмы глобальной оптимизации. Хотя в литературе и рассматриваются некоторые подходы к решению этой проблемы (см., например, [31, 98] и др.), универсальный аппарат, основанный на четком обосновании его применения, до сих пор не разработан. Проблемой остается преодоление у алгоритмов недостатков, связанных в основном с «проклятьем» раз-13-
мерности, структурой целевой функции и ограниченностью области допустимых значений переменных. Следует обратить внимание в [40] на глубокий анализ квазиньютоновских оптимизационных методов, где обращено внимание на двойственность, которой пронизан вывод основных формул секущих, названных положительно определенной и обратной положительно определенной. Обращает на себя внимание и присутствие в этих итерационных формулах и их выводах элементов, характерных для формул рекуррентного обращения и псевдообращения матриц специальной природы. Достаточно отметить, что существенно используемая здесь лемма Шермана-Моррисона-Вудбери [31, 42, 83] приводится в [4] именно в контексте рекуррентного псевдообращения. Кроме того, строгий вывод указанных формул глубоко уходит своими корнями в задачи матричных уравнений [20, 21, 23]. Однако отмеченные выше специфические постановки, характерные для задач о наименьших квадратах в контексте общих задач оптимизации в литературе практически до сих пор не рассматривались. 1.2. Программное обеспечение систем автоматизации и управления 1.2.1. Корпоративные и проблемно-ориентированные автоматизированные системы и пакеты программ
Сегодняшнее состояние рынка компьютерных систем в России обусловлено, в первую очередь, историческим развитием российских систем и приходом западных разработчиков на российский рынок. Одновременно происходит процесс сближения российских и западных систем, которые успешно конкурируют за право работать на предприятиях [54]. Вместе с системами управления производством появились и системы управления качеством. Так как эти процессы управления взаимосвязаны, то подавляющее большинство систем управления качеством входят в состав корпоративных информационных системам, которые предназначены для среднесрочного, краткосрочного планирования и оперативного управления производством. Среди больших корпоративных систем наиболее известны: R/3 (SAP AG), BAAN (BAAN), BPCS (ITS/SSA), Oracle Applications (Oracle) [6, 54]. Системы обладают большими функциональными возможностями, которые определяют их немалую стоимость. Представителями средних и малых корпоративных систем являются [5, 54, 109]: JD Edwards (Robertson & Blums), MFG-Pro (QAD/BMS), MAX (ISL), Platinum -14-
(Platinum Software Corporation), Scala (Scala CIS), БОСС («АйТи»), Галактика («Галактика-Парус»), CA-PRMS (Acacia Technologies) и др. Как правило, современные корпоративные системы поддерживают концепцию баз данных, модель вычислений клиент-сервер, объектноориентированную технологию, развитый графический интерфейс для работы в среде Windows. Модули этих систем соответствует требованиям стандартов, выполняют задачи планирования, контроля и управления качеством материалов, продуктов и процессов в рамках всего производства – от сырья до готовой продукции. Они интегрированы в виде подсистем, что позволяет обеспечить единый подход к определению, сбору и управлению данными качества по всему предприятию. В табл. 1.1 [54] приведены оценочные результаты статистических исследований на стадии внедрения корпоративных систем. Таблица 1.1 Внедрение, соотношение затрат и стоимостные оценки корпоративных систем Малые Средние сисКрупные системы темы системы Поэтапное или Только поПоэтапное, Внедрение коробочный ваэтапное сложное риант Более 6-9 ме- Более 9-12 меБолее 4 месяцев сяцев сяцев Комплексный Комплексное управление: учет, Функциональная учет и управление управление, производство полнота финансами Соотношение затрат 1/1/1 1/2/1 1/1-5/1 лицензия/внедрение/ оборудование 50-300 200-500 500 тысяч, Ориентировочная тысяч USD тысяч USD > 1 млн USD стоимость Следует отметить, что крупные и средние корпоративные системы обладают довольно высокой относительной стоимостью, настройка их является сложной и длительной процедурой из-за возможности формирования альтернативных цепей программных модулей. Системы, разработанные зарубежными фирмами, часто не учитывают организационную специфику действующих российских предприятий, обычно к ним приходится дополнительно разрабатывать программную надстройку, компенсирующую это несоответствие. Малые системы, как правило, ограничены функционально, решая лишь задачи комплексного учета и управления финансами и, как правило, практически не применяются на производстве [54]. -15-
В связи с отмеченными недостатками корпоративных систем на предприятиях часто используются проблемно-ориентированные пакеты прикладных программ, предназначенные для решения конкретных производственных задач. В настоящее время существует множество таких программ российских и зарубежных разработчиков (например, Factory Suite, TRIMQM, 1С и др.) [53, 54, 94]. Обычно проблемно-ориентированные пакеты программ разрабатываются по принципу интеграции компонентов в единую систему, имеют сетевую клиентно-серверную архитектуру с возможностью работы в пределах локальной, корпоративной или глобальной компьютерных сетей. Следует отметить, что модули проблемно-ориентированных пакетов программ (как и корпоративных систем) обычно содержат “зашитый” математический аппарат. Такое математическое обеспечение нельзя модернизировать, включать элементы адаптивных алгоритмов и мобильно использовать его для решения произвольного спектра задач, связанных с гибким управлением технологических процессов и качеством продукции. Поэтому предприятия часто при решении производственных задач вынужденно предпочитают интегрированным системам и пакетам программ математические пакеты прикладных программ для обработки данных, которые не привязаны к производству. Например, среди доступных в России пакетов можно назвать Statistic (StatSoft), SAS (SAS Institute), SPSS (SPSS), Statgraphics (Statistical Grafics) [89]. Однако производственный персонал, не имеющий специальной математической подготовки, при работе с такими пакетами объективно испытывает определенные затруднения.
1.2.2. Системы автоматизации и управления в металлургии
Одной из важнейших проблем остается разработка и внедрение систем контроля и управления качеством продукции в металлургии. Приведем некоторые примеры использования таких систем. В [80] предложен вариант управления механическими свойствами стального проката в процессе производства горячекатаных полос на непрерывном широкополосном стане 2000 на базе АСУ ТП Череповецкого металлургического комбината. Механические характеристики горячекатаной стали зависят от ее химического состава и технологических параметров горячей прокатки. Таким образом, колебания химического со-16-
става в пределах, допустимых для марки стали, являются возмущающим фактором (при регулируемой технологии не учитывается). Возмущающее влияние химического состава на уровень механических свойств проката компенсируется процессами регулирования. Разработанная в АО «Северсталь» совместно с ИЧМ НАН Украины АСУ, представляет собой программно-технический комплекс, интегрированный с компьютерной системой управления производством. В МГИСиС разработали программу [80], реализующую модель взаимосвязи процессов формирования микроструктуры с температурноскоростными условиями прокатки и охлаждения металла на широкополосном стане горячей прокатки. Программа позволяет прогнозировать механические свойства по длине горячекатаной полосы. Модель может быть использована для оптимизации технологии производства горячекатаной полосы с заданными механическими свойствами, контроля качества и проектирования оборудования. Автоматизированные системы управления технологией на станах холодной прокатки решают задачи, направленные, как правило, на стабилизацию процесса прокатки, минимум расхода энергии, обеспечение качества поверхности и геометрических характеристик полосы с максимальной производительностью стана (см., например, [62, 90, 124] и др.). За рубежом для эффективного управления производством и устойчивого обеспечения заданных показателей качества металлопродукции на некоторых предприятиях осуществляется организация автоматизированного контроля и управления технологии с учетом нескольких этапов обработки стали. Так, например, на заводе Florange фирмы Sollac (Франция) [124] разработаны и внедрены программы и методы управления, дающие возможность проследить и оценить изменение технологических параметров во времени, обнаружить тенденцию их отклонения от оптимальных значений и своевременно оказать влияние на ход технологического процесса. Управление распространено на 26 агрегатов. На металлургическом заводе фирмы «Син – Ниппон Сэйтэцу» (Япония) [90] – одном из наиболее автоматизированных предприятий этой отрасли – используется система управления цехом горячей прокатки, подключенная к общезаводской сети на базе ЭВМ. Сеть имеет систему групповой обработки, включающую четыре подчиненных системы: централизованного общезаводского управления, постоянного контроля за производством, постоянного контроля за качеством продукции и основной массив данных. Система групповой обработки связана с неавтономными системами управления отдельными крупными производствами, такими, как доменные печи, сталеплавильный цех, цех горячей прокатки и т.д. -17-
Существуют отечественные разработки автоматизированных систем, охватывающих управление сквозной технологией производства и качеством продукции [63, 69, 70, 72, 125 и др.]. Но, к сожалению, полномасштабной реализации на металлургических предприятиях они до сих пор не получили.
-18-
2. МАТЕМАТИЧЕСКИЕ ОСНОВЫ АДАПТИВНОГО МОДЕЛИРОВАНИЯ 2.1. Объектно-структурное моделирование многоэтапных производств Современные производственные процессы описываются как иерархически сложные системы, в которых каждый объект представляет собой систему, которая, в свою очередь, состоит из объектов более низкого уровня иерархического представления, имеет собственную структуру и к тому же является частью некоторой более общей производственной системы. При решении производственных задач, связанных с исследованием технологических процессов, динамики потоков продукции, структурная модель предприятия с любым характером производства представляется на разных уровнях иерархии. Иерархическая модель сложного производства не накладывает ограничений на степень детализации представленных в ней объектов. Скорее, степень детализации зависит от возможности выделения во всем процессе элементарных объектов производства. Как правило, отдельным объектам соответствуют отдельные агрегаты, станки или рабочие места, на основе которых определяются самостоятельные технологические операции. Такое деление называют разделением по производственным операциям [84]. Производственные системы отличаются сложной структурой потоков (например, с множеством последовательно-параллельных технологических этапов, наличием разнообразного оборудования, многообразием видов продукции и т.д.). Каждому этапу потока соответствует определенный объект производства. Совокупность взаимодействий между ними отражается отношениями, которые могут иметь различный характер. В технологических производственных системах выделены следующие классы объектов [51]: • класс агрегатов, в которых согласно технологии имеет место целенаправленное изменение состояния продукции, положения в пространстве, внутреннего строения, формы и т.п.; • класс складов, в которых не происходит изменения состояния продукции, например, склады полуфабрикатов и готовой продукции и т.п.; • класс контролеров, в которых исследуется состояние продукции, например, испытание, контроль, тестовая проверка и т.п., влияющих на траекторию следования заготовок, полуфабрикатов и готовой продукции. -19-
В общем случае каждому технологическому агрегату предшествует склад, управляющий механизмом поступления единиц продукции на обработку и предписывающий траекторию дальнейшей их обработки. Механизм использования продукции со склада данного этапа также может включать требования к ее промежуточному состоянию. Сказанное соответствует дисциплине оценки (контроля) состояния продукции, которая осуществляется практически на каждом этапе обработки. Оценка состояния может влиять, например, на организацию очереди следования продукции на обработку, на настройку технологических параметров агрегата, следующего за складом продукции и т.п. Таким образом, дисциплину складирования (ожидания) и контроля состояния продукции можно объединить в рамках единого объекта «склад». Агрегаты участвуют в обработке продукции, поступающей с объектов «склад», в зависимости от ее промежуточного состояния. При этом агрегаты могут выполнять различные технологические операции, каждой из которых соответствует объект «агрегат». Модель взаимодействия выделенных объектов «склад» и «агрегат» может быть представлена в виде структуры нового объекта (этапа производственного процесса) [69]. Производственная система представляет собой совокупность взаимосвязанных этапов. Для ее описания требуется отыскать единое представление не только одного этапа, но и полной модели производства, причем создать возможность детализации объектов и их свертки в соответствии с иерархической структурой системы. Для построения структурной модели всего процесса может быть использована объектная модель производства (рис. 2.1). Из рис. 2.1 видно, что объекты «склад» и «агрегат» всегда являются частью объектов более высоких уровней. В простейшем случае они объединены «этапом производства». Отсюда, схема любого уровня иерархической модели производства представляет собой сеть. При этом возможно объединение в единые сети объектов с разных уровней иерархической модели производства. Структурная модель производственного процесса представляет собой сложную сеть взаимосвязанных по технологическому потоку этапов производства. Типы структурных взаимодействий между этапами могут быть последовательные, параллельные или с обратной связью. Последовательное соединение этапов. Два объекта Е1 и Е2 соединены последовательно, если выход первого объекта непосредственно воздействует на вход второго (рис. 2.2 а). Последовательное соединение из К объектов – наиболее распространенная форма структурной организации технологических производственных систем. -20-
ОБЪЕКТ ПРОИЗВОДСТВА
СКЛАД
ОЧЕРЕДЬ
АГРЕГАТ
ВХОДЯЩИ Й ПО ТОК
ЕДИНИ ЦА ПРОДУКЦИ И
КАН АЛ ОБСЛУ ЖИВАНИ Я
ЭТАП ПРОИЗВОДСТВА
ОТДЕЛЕНИЕ
ПРОИ ЗВО ДСТВО
ПРЕДПРИЯТИЕ
Рис. 2.1. Объектная модель производственного процесса: Отношение данного типа означает «общность», т.е. объекты одного класса связаны с объектами другого класса по принципу «склад – ЭТО объект производства»; Отношение данного типа означает «агрегативность», т.е. объекты связаны между собой в отношении «часть» – «целое»; Отношение данного типа означает «ассоциативность», т.е. объекты одного класса «ассоциируются» с объектами другого класса
-21-
Е1
Е 1
Е2
а)
Е1
Е1
Е2
Е2
б)
в)
Рис. 2.2. Взаимодействия этапов: а – последовательное соединение; б – параллельное соединение; в – соединение с обратной связью
Параллельное соединение этапов. Два объекта Е1 и Е2 соединены параллельно, если объединяются соответственно входы и выходы этих объектов (рис. 2.2 б). Параллельное соединение объектов в технологических производственных системах применяется для увеличения интенсивности обработки материального потока на различных этапах производства. Структура с обратной связью. Два объекта Е1 и Е2 образуют структуру с обратной связью, если выход Е1 подается на вход Е2 и, наоборот, выход Е2 соединяется с входом Е1 (рис. 2.2 в). Комплексные структуры. Реальные производственные системы в общем случае имеют комплексную структуру, т.е. такую структуру, в которой объединяются все три типа рассмотренных выше соединений объектов. Принимая во внимание все возможные структурные взаимодействия этапов производства и структуру самого этапа (см. рис. 2.1), получаем возможность структурного описания производственной системы. Поток продукции движется по этапам обработки по схеме «S[i]–A[i]–S[i+1]» («склад–агрегат–склад»), где i – номер производственного этапа [93]. Состояния продукции могут содержать «фиктивные склады», использующиеся для формализации структурной модели, если для какого-либо реального этапа производства отсутствуют объекты складирования или контроля за состоянием продукции (чаще всего такое возможно для производственных процессов с непрерывным характером технологии). Такая структура может быть описана в виде ориентированного графа с вершинами, обозначающими склады, и ребрами, нагруженными агрегатами. Математически ориентированный граф легко описывается при помощи матрицы инцидентностей. -22-
Структура производственной системы в виде графа используется для наглядного изображения и оценки объемов необходимой информации для ее представления в ЭВМ. Для хранения информации о структуре производственного процесса достаточно массива информации размером {mS, nA}, где mS – количество складов (состояний), nA – количество агрегатов, а элементами массива будут числовые значения из множества {0,+1,-1}, характеризующие характер связи объектов системы [92]. Элемент матрицы {mi, nj}, равный +1 обозначает, что i-й склад формирует поток продукции для j-го агрегата. Если j-го агрегата после обработки передается продукция для складирования (анализа состояния) на i-й склад. То есть происходит передача объектов обработки на следующий этап обработки. Во всех остальных случаях, когда склады и агрегаты не связаны технологическим потоком, элементы матрицы инцидентностей равны нулю. Агрегаты пронумерованы в соответствии с набором правил, опирающихся на правила построения графа событий и работ теории расписаний, которая используется в различных задачах планирования: – на схеме технологического процесса выбирается один или несколько объектов класса «склад», соответствующих хранилищу заготовок обрабатываемой продукции, то есть таких складов, с которых начинается производственный процесс или до них он не рассматривается; – выбранные склады определяют нулевой ранг схемы производства, от которого строится прямая последовательность технологических этапов по схеме «склад–агрегат–склад»; – объекты схемы нумеруются слева направо, от начального к конечному, при чем склады и агрегаты имеют собственные последовательности номеров; – объекты одного ранга (при параллельном соединении объектов производства) нумеруются сверху вниз; – объекты, связанные с прямой последовательностью технологических этапов посредством обратных связей, нумеруются подряд за объектами прямой последовательности. Для соблюдения корректности представления производственного процесса в виде последовательности «склад» – «агрегат» – «склад» все обратные связи должны быть помечены объектом типа «агрегат». Обычно в данном случае имеется транспортное устройство, влияющее на положение единицы продукции в пространстве (в соответствии с проведенной выше классификацией такой объект относится к классу «агрегатов»). Если в реальном технологическом процессе, при возврате продукции на предыдущий этап обработки, не происходит никаких технологических действий, то в системе для формализации вводится фиктивный агрегат. -23-
В соответствии с иерархией представления производств, могут присутствовать и глобальные обратные связи, которые соединяют объекты разных производств. Такие глобальные связи присутствуют в различных отраслях, на различных предприятиях, производствах, а значит, они могут отражать связи не только внутри одного уровня представления модели производственной системы, но и использоваться для отражения взаимодействия на разных уровнях иерархии. Отсюда следует, что методика графового представления имеет место для описания любой схемы производственного процесса, построенной с разной степенью детализации. Результатом структурного моделирования является декомпозиция производственного процесса до необходимого уровня иерархического представления, выделение необходимой схемы для анализа, формирование ориентированного графа, описываемого матрицей инцидентностей складов и агрегатов, включающего в себя наборы реальных и фиктивных объектов производства. 2.2. Адаптивная линейная идентификация технологических связей Пусть отклик у зависит от вектора факторов x ∈ ℜ k и для описания этой зависимости выбрана модель, включающая вектор параметров β ∈ ℜn : y = ϕ( x ; β) = ϕ( x1,..., x k ; β1,...,β n ).
Пусть имеется массив данных – выборка объема m {x u ; y u } = {x1u ,..., x ku ; y u }, 1 ≤ u ≤ m ,
(2.1) (2.2)
которую удобно представлять в матрично-векторной форме {X;Y}, где X ∈ ℜ mxk – матрица значений факторов; Y ∈ ℜm – вектор значений от-
клика. Подстановка данных x u в модель определяет векторную функцию факторов Φ (β) ∈ ℜ m с координатами ϕ( x u ; β) = ϕ u (β ) и в то же время вектор прогнозируемых моделью значений отклика Y€ ∈ ℜm с координатами y€u = ϕ u (β) , отличающимися от данных y u , определяет векторную функцию невязки R (β) = Y€ − Y = Φ (β) − Y ∈ ℜ m с координатами ru (β) = y€u − y u = ϕ u (β) − y u , 1 ≤ u ≤ m .
-24-
Если
модель
линейна
относительно
параметров
βi ,
т.е.
n ϕ(x;β) = ϕ T (x)β = ∑ ϕ (i) (x)β i , ϕ(x) ∈ ℜ n – векторная функция, координаi =1 тами которой являются базисные функции ϕ( i) ( x ) , не обязательно ли-
нейные относительно факторов x j , подстановка в которые данных x u определяет матрицу Φ = [ϕ (i ) ( x u )] ∈ ℜ m × n , то оценка β€ находится путем решения линейной задачи о наименьших квадратах (ЛЗНК): m n 1 2 β€ = arg min f (β), f (β) = 1 / 2 Φβ − Y = 1 / 2 ∑ [ ∑ ϕ(i) ( x u )βi − y u ]2 = ε , (2.3) 2 u =1 i =1 β ∈ ℜn
где ε = Φβ − Y 2 - невязка уравнения Φ β = Y . Введем обозначения: ϕ(1) ( x ) L ϕ ( n) ( x1 ) 1 , Φ = Φ < m, n > = M ϕ ( i) ( x u ) M ( n ) ( x ) ϕ (1) ( x ) L ϕ m m β1 y1 M M < m , n . > < m > β =β = β i , Y = Y = yu . M M y m β n
В линейной регрессии рекуррентные процедуры оценивания разработаны [4] в связи со следующими ситуациями: с увеличением числа оцениваемых параметров (членов модели, слагаемых во внутренней сумме (2.3), столбцов матрицы Ф); с увеличением числа данных (объема выборки, слагаемых во внешней сумме (2.3), строк матрицы Ф). Первая ситуация характеризуется как пошаговая регрессия, вторая – как рекуррентный МНК. Решение ЛЗНК записывается как нормальное псевдорешение уравнения Φ β = Y в виде β€ = Φ + Y,
(2.4)
где Φ + ∈ ℜ n × m – матрица, псевдообратная к Ф.
-25-
Уточним обозначения векторов и матрицы в (2.3) [11]: < m, n > = argmin f(β < m, n > ), β€ β < m, n > ∈ℜ n
(2.5) 1 < m, n > ε . 2 Пусть число слагаемых во внутренней сумме модели увеличилось на единицу (увеличилось на единицу число оцениваемых параметров) так, что она приняла вид n +1 n +1 < m, n +1> ϕ (i ) ( x ) = , n +1> ϕ ( n +1) ( x ), β ∑ i ∑ βi< m, n +1> ϕ(i) (x u ) + β
= f (β< m, n + 1 > ), argmin β< m, n + 1 > ∈ ℜn + 1 (2.6) 2 1 f (β< m, n + 1 > ) = 1/ 2 Φ< m, n + 1 >β< m, n + 1 > − Y< m > = ε< m, n + 1 > , 2 f(β < m, n > ) = 1/2 Φ < m, n > β < m, n > − Y < m >
2
=
причем матрица Φ < m,n +1> связана с матрицей Φ <m,n > из (2.5) соотноше| нием Φ < m, n +1> = Φ < m, n > ϕ < m, n +1> , где дополнительный столбец | имеет вид ϕ < m,n +1> = [ϕ ( n +1) ( x1 ) L ϕ ( n +1) ( x m )]T , а вектор β€<m,n+1> имеет структуру T
| , n +1> β€< m, n +1> = β€( T β€
[
]
T где β€<( nm), n +1> = β€1< m, n +1> Lβ€ . В соответствии с (2.4) реше-
ние задачи (2.6) запишется в виде β€< m, n +1 > = Φ< m, n +1 > +Y< m > или β€< m, n +1> + (n ) | (2.7) − − − − − = Φ < m, n > ϕ < m, n +1> Y < m > . | β€< m, n +1> n +1 В основу получения процедур оценивания параметров модели положены рекуррентные алгоритмы Гревиля и Клайна псевдообращения матриц [4]. -26-
Алгоритм Гревиля, записываемый “по наращиванию столбцов” (пошаговая регрессия), определяет следующее выражение этого решения через решение β€< m, n > задачи (2.5) [14]:
β€ = l < m , n +1> T Y < m > , β€< m, n +1> = β€< m, n > − Φ < m, n > + ϕ < m, n +1>β€< m, n +1> , (n) n +1
(2.8) (2.9)
где вектор l <m,n+1>T определяется в виде 2 < m,n +1>+ = c <m,n +1>T c < m,n +1> , если c c < m,n +1> = I − Φ < m,n > Φ < m,n >+ ϕ< m,n +1> ≠ 0; l <m,n +1>T = в остальныхслучаях <m,n+1>T <m,n> + T <m,n>+ <m,n+1> [Φ ] Φ k , ϕ 2 где k <m,n +1> = 1 + T <m>+ ϕ< m .
[
]
(2.10)
В случае если rg Φ < m,n > = m , то выражение (2.10) упрощается: l < m, n +1> =
(
ϕ < m, n +1> T Φ < m, n > Φ < m, n > T
(
1 + ϕ < m , n + 1> T Φ < m , n > Φ < m , n >
)−1
)−1ϕ< m, n +1>
.
(2.11)
Рассмотрим ситуации, когда увеличивается объем выборки, что обуславливает необходимость в рекуррентных процедурах адаптации моделей. Пусть увеличилось на единицу число слагаемых во внешней сумме соотношения (2.3) (увеличился на единицу объем выборки), т.е. 2 < m + 1 , n > ( i ) β ϕ (x u ) − y u , i u =1 i =1
m +1 n
∑ ∑
β€< m + 1, n > =
и решается задача:
f(β < m + 1, n > ), argmin < m + 1, n > n β ∈ℜ
f(β< m + 1, n > ) = 1/2 Φ< m + 1, n > β< m + 1, n > − Y< m + 1 >
(2.12) 2
1 = ε < m + 1, n > , 2 m 1 , n < m , < + > связана с матрицей Φ n > из (2.5) соотнопричем матрица Φ
Φ < m,n>
шением
Φ < m +1,n > = − − − − − − , < m+1,n> ϕ
где дополнительная строка имеет вид
-27-
ϕ < m +1, n > = [ϕ (1) ( x m +1 ) Lϕ ( n ) (x m +1 )] , а вектор Y <m+1> имеет струкT
туру Y <m +1> = Y < m >T y m +1 . В соответствии с (2.4) решение задачи | |
(2.12) запишется в виде β€< m + 1, n > = Φ< m + 1, n > + Y< m + 1 > или Φ < m, n > β€< m +1, n > = − − − − − ϕ < m +1, n >
+
Y < m > − − − − . y m +1
(2.13)
Алгоритм Гревиля рекуррентного псевдообращения матриц, записанный “по наращиванию строк”, определяет следующее выражение это<m,n > го решения через решение β€ задачи (2.5) [14]:
β€<m+1,n> = β <m,n > + l <m+1,n > [ y <m+1> − ϕ<m+1,n >β€<m,n > ] ,
(2.14)
< m + 1, n > + = c < m + 1, n > T c < m + 1, n > , если c c < m + 1, n > = ϕ < m + 1, n > I − Φ < m , n > + Φ < m , n > ≠ 0; < m + 1 , n > (2.15) l = в остальных случаях < m,n > + ( Φ < m , n > + ) T ϕ < m + 1, n > T k < m + 1, n > , Φ 2 где k < m + 1, m > = 1 + ϕ < m + 1, n > Φ < m , n > + . 2
[
]
В случае если rg Φ <m,n > = n , то выражение (2.15) упрощается: l
< m +1, n >
−1 ( Φ < m, n > T Φ < m > ) ϕ < m +1, n > T = −1 1 + ϕ < m +1, n > (Φ < m +1, n > T Φ < m +1, n > ) ϕ < m +1, n > T
(2.16)
(это выражение является аналогом (2.11)). Следует отметить определенное отличие структуры рекуррентного выражения (2.14) от рекуррентных выражений (2.8), (2.9). А именно, в (2.14) “корректирующий член” пропорционален разности между добавленным значением ym+1 и его “предсказанной” по предыдущим значениям y1,…, ym величиной ϕ <m+1,n> β€<m,n> , так что новое значение β€< m+1,n> получается в виде суммы его предыдущего значения β€< m,n > и
члена, пропорционального ошибке предсказания по нему добавленного
-28-
значения ym+1. Вектор пропорциональности l < m +1, n > , часто называемый “вектором сглаживания”, не зависит от значений yu, u = 1,…, m+1. Следует отметить, что формулы (2.8), (2.9), (2.14), в любых ситуациях дают решение или псевдорешение (если rg Φ < m,n > ≠ m – для пошаговой регрессии или rg Φ < m,n > ≠ n – для рекуррентного МНК), в отличие от рекуррентных процедур, часто используемых в системах управления (см., например, [1, 104, 116, 117] и др.). 2.3. Блочная адаптивная идентификация линейных моделей Выше были рассмотрены алгебраические основы алгоритмов адаптации, когда в модель последовательно включаются единичные дополнительные параметры или исходная выборка наблюдений пополняется единичными измерениями. Однако в реальных условиях производства чаще встречаются следующие ситуации: модель пополняется блоком параметров (например, при осуществлении контроля за технологией некоторого агрегата, который характеризуется блоком факторов [22]); блочное поступление и накопления технологических данных (например, при контроле обработки партии продукции, состоящей из нескольких единиц изделий [16]). Первая ситуация связана с блочной регрессией; она допускает и такую трактовку, что число параметров неизменно, но их оценки рассчитываются последовательными блоками. Вторая ситуация связана с блочным рекуррентным методом наименьших квадратов. Пусть теперь число слагаемых во внутренней сумме увеличилось на p. Это предполагает включение в модель дополнительный блок p оцениваемых параметров. Тогда n +1
< m, n + p > ( i )
∑ βi
ϕ
i =1
n
(x u ) =
и решается задача β€< m, n + p > =
< m, n + p > ( i )
∑ βi
i =1
ϕ
(x u ) +
n+p
∑ β ϕ (i) ( x u ),
i = n +1
f(β< m, n + p > ), argmin < m, n + p > n + p β ∈ℜ
f(β< m, n + p > ) = 1/2 Φ< m, n + p >β< m, n + p > − Y < m >
(2.17) 2
1 = ε < m, n + p > . 2 < m,n + p> связана с матрицей Φ < m, n > из (2.5) Причем матрица Φ
| < m ,n + p > = Φ < m,n > Φ <m,( p ) > , где дополнительный соотношением Φ | -29-
ϕ ( n +1) ( x ) L ϕ ( n +p) (x1 ) 1 блок имеет вид Φ < m,( p )> = M ϕ (i ) ( x u ) M , а вектор ϕ ( n +1) ( x ) ( n + p ) L ϕ ( x m ) m
< m, n + p > T | €< m, n + p > T β€< m,n + p> имеет структуру β€< m, n + p > = β€( n ) β , где | ( p) T
T
β€( = β€1< m,n + p> Lβ€ , β€<(pm),n+ p> = β€ Lβ€ .
В соответствии с (2.4), решение задачи (2.17) запишется в виде
β€< m, n + p > = Φ< m, n + p > + Y< m > или
β€< m, n + p > + (n) | (2.18) − − − − − = Φ < m, n > Φ < m, ( p) > Y < m > . | β€< m, n + p > ( p) Формула Клайна псевдообращения блочных матриц определяет следующее выражение этого решения через решение β€<m,n > задачи (2.5)
[14]: β€<( pm), n + p > = L< m, n + p > Y < m > ,
(2.19)
β€<( nm), n + p > = β€< m, n > − Φ < m, n > + Φ < m, ( p) >β€<( pm), n + p > , где матрица L<m,n +p> определяется в виде
[
(2.20)
]
L< m,n + p> = C <m,n + p>+ + I − C <m,n + p>+ C <m,n + p> ×
[
× K <m,n +p> Φ < m,n> + Φ <m,( p)>
[
]T Φ <m,n>+ [I − Φ <m,(p)> C<m,n+p>+ ], ]
(2.21)
C <m,n +p> = I − Φ <m,n > Φ < m,n >+ Φ < m,( p)> ,
[
(
)]
T I + Φ < m,n >+ Φ <m,( p)> I − C <m,n + p>+ C <m,n + p> × K <m,n + p> = < m , n > + < m , ( p ) > < m , n + p > + < m , n + p > × Φ I−C C Φ
[
В случае, если rg Φ (2.21) упрощается:
-30-
(
< m, n >
= n,
)]
−1
.
< m , n + p > то C = 0 и выражение
[
]
−1 -1 L< m, n + p > = I + Φ < m, ( p ) > T Φ < m, n > Φ < m, n > T Φ < m, ( p) > ×
[
]-1
(2.22)
× Φ < m, ( p ) > T Φ < m, n > Φ < m, n > T (это выражение непосредственно обобщает (2.11)).
Если rg Φ <m,n + p> = n + p , то L<m,n + p> = C < m,n + p> +
(это выражение непосредственно обобщает формулу (2.10)). Если rg Φ<m,n+p> = m , то
[
L<m,n+p> = Φ<m,(p)>TC<m,n+p>
]−1C<m,n+p>T .
Пусть теперь число слагаемых во внешней сумме соотношения (2.3) увеличилось на q (увеличился объем выборки на q наблюдений), т.е. 2
m +q n
<m + q,n > (i ) ϕ (x u ) − y u , ∑ ∑ βi u =1 i=1
и решается задача: β€< m + q, n > =
f(β< m + q, n > ), argmin β < m + q, n > ∈ ℜn
(2.23)
2 1 f(β < m + q, n > ) = 1/2 Φ< m + q, n >β< m + q, n > − Y< m + q > = ε < m + q, n > , 2
причем матрица Φ <m+q,n > связана с матрицей Φ <m,n > из (2.5) соотноΦ < m, n > < m + q, n > = − − − − − − , где дополнительный блок имеет вид шением Φ < ( q ), n > Φ ϕ (1) ( x L ϕ ( n ) ( x m +1 ) m +1 ) Φ < ( q ), n > = M ϕ (i) ( x u ) M , ϕ (1) ( x ( n) ) L ϕ ( x ) m+q m + q
а вектор
Y <m + q >
имеет структуру
T
| Y <m +1> = Y < m>T Y <( q ) >T , |
[
]
где Y <m> определен, как и выше, а Y <(q ) > = y m +1 L y m + q T . В соответствии с (2.4) решение задачи (2.23) запишется в виде -31-
β€< m + q,n > = Φ< m + q,n > + Y< m + q >
или +
Φ <m,n > Y <m> β€<m+q ,n > = − − − − − − − − − . (2.24) <(q ),n > <(q ) > Y Φ Формула Клайна псевдообращения блочных матриц, записанная в транспонированном виде, определяет следующее выражение этого решения через решение β€<m ,n > задачи (2.5) [14]: β€< m + q, n > = β€< m ,n > + L< m + q, n > [ y < ( q) > − Φ < ( q), n > β < m, n > ], <m +q , n >
определяется в виде
где матрица L
[
]
(2.25)
L< m + q , n > = C < m + q , n > + + I − C < m + q, n > + Φ < (q ), n > Φ < m, n > + ×
[
]
[
T × Φ < (q ), n > Φ < m , n > + K < m + q , n > I − C < m + q, n > C < m + q, n > +
[
]
(2.26) ] −1 I + [(I − C < m + q , n > C < m + q, n > + )Φ < (q ), n > Φ < m, n > + ]× K < m + q, n > = . T < m + q , n > < m + q , n > + < ( q ), n > < m , n > + × [(I − C )Φ ] C Φ
C < m + q, n > = Φ < ( q ), n > I − Φ < m, n > + Φ < m , n > ,
< m + q ,n >
Выражение для L то С < m + q,n > = 0 и
[
упрощается, если rg Φ < m ,n > = n ,
L<m +q > = Φ <m,n >T Φ <m,n >
[
]
-1
Φ <(q ),n >T ×
]
(2.27) −1 -1 × I + Φ <(q ),n > Φ <m,n >T Φ <m,n > Φ <( q ),n >T (это выражение непосредственно обобщает (2.16) и является аналогом (2.21)). Необходимо отметить, что аналогов блочных алгоритмов (2.19), (2.20), (2.25) практически не существует.
-32-
2.4. Адаптивная нелинейная идентификация технологических связей В нелинейной регрессии также могут возникать ситуации, связанные с увеличением числа оцениваемых параметров модели и числа данных [11, 17, 122]. Предварительно отметим, что НЗНК относится к задачам нелинейной оптимизации, для решения которых используются итерационные методы [40], и в рассматриваемом случае возникает необходимость сочетания их с рекуррентными процедурами оценивания. Результаты находят выражение в установленных ниже рекуррентноитерационных процедурах. Для получения этих результатов на основе рекуррентных алгоритмов псевдообращения сами итерационные методы решения НЗНК требуют определенной модификации (пример такого рода представлен ниже). В связи с рекуррентными МНК в [4] отмечено, что во множестве современных приложений поток поступающих данных образует временную последовательность и всегда желательно, чтобы в любой момент времени оценка МНК полностью использовала всю накопленную к этому моменту информацию. Рекуррентный МНК разработан для второй из указанных выше ситуаций, когда оценка МНК должна обновляться в момент поступления новой информации. В нелинейной регрессии подобная ситуация может возникать на некотором шаге итерационного процесса. Оценку МНК можно обновить, не дожидаясь его окончания. Именно для этого служит рекуррентно-итерационная процедура рекуррентного нелинейного МНК. Пошаговая регрессия разработана для первой из указанных выше ситуаций, когда оценка нового вектора параметров определяется с использованием уже имеющейся оценки старого. В нелинейной регрессии подобная ситуация может возникнуть на некотором шаге итерационного процесса: о том, что f(β€) предвидится неприемлемо большой, можно судить еще до его окончания. Однако, если увеличение числа слагаемых во внешней сумме (2.3) может трактоваться (по крайней мере, формально) так же, как в формуле (2.4), то внутренняя сумма в формуле (2.3), вообще говоря, отсутствует. В нелинейную по параметрам модель можно ввести дополнительно параметр различными способами. Задача в конечном счете сводится к ключевому этапу исследования зависимостей, посвященному выбору общего вида функций регрессии и будет рассмотрена далее.
-33-
Метод Ньютона-Гаусса с псевдообращением Оценка β€ вектора параметров β по данным {X;Y} находится путем решения нелинейной задачи о наименьших квадратах (НЗНК): 2 2 β€ = arg min f (β), f (β) = 1 / 2 R (β) = 1 / 2 Φ(β) − Y = β∈ℜn (2.28) m 2 m = 1 / 2 ∑ ru (β) = 1 / 2 ∑ [ϕ( x u ; β) − y u ] 2 . u =1 u =1 Итерационные методы минимизации функции f (β) позволяют по текущей точке βс определить следующую точку β + так, что построенная последовательность точек будет сходиться к β€ [40]. Итерационные методы весьма многообразны. Они могут применяться при решении как НЗНК, так и ЛЗНК, но структура ЛЗНК и ее связь с псевдообращением позволяют получить решение уравнения (2.5) за один шаг итерационного процесса. НЗНК в общем случае не допускает такую возможность. Однако учет ее структуры позволяет разработать итерационные методы, ориентированные специально на ее решение и допускающие использование псевдообращения. В основе этих методов лежит линеаризация функции Φ(β) [или, что равносильно, R (β) ] в окрестности текущей точки βс итерационного процесса. Рассмотрим один из них. Введем обозначение для матрицы Якоби векторной функции Φ(β) : ∇ Т ϕ (β) ∂ϕ u (β) / ∂β1 1 ∈ ℜ n , u = 1,…, m. m × n M M J (β) = ∈ℜ ; ∇ϕ u (β) = Т ∂ϕ u (β) / ∂β n ∇ ϕ m (β)
Так как R (β) = Φ(β) − Y , то матрицы Якоби функций R (β) и Φ(β) совпадают. Запишем аффинную модель функции Φ(β) ( R (β) ) в окрестности βс : ~ ~ Φ(β) ≈ Φ(β) = Φ(β c ) + J(β c ) ∆β(R (β) ≈ R (β) = R (β c ) + J(β c ) ∆β), ∆β = β − β c . Заменим НЗНК (2.28) на ЛЗНК (2.4) вида:
-34-
2 ~ 2 ∆β€ = arg min f c (β), f c (β) = 1 / 2 R (β) = 1 / 2 R (β) + J(β c )∆β = ∆β ∈ ℜ n
(2.29)
2 2 = 1 / 2 J(β c )∆β − ( −R (β c )) = 1 / 2 J(β c )∆β − (Y − Φ(β c )) . Для решения (2.29) используем формулу (2.5): € (2.30) ∆β = − J + (β c )R (β c ) = J + (β c ) Y − J + (β c )Φ (β c ), β + = β c + ∆β€. Так определенный процесс назовем методом Ньютона-Гаусса с псевдообращением для решения НЗНК [14]. Метод Ньютона-Гаусса в классическом варианте [1, 7, 33, 40] получается как частный случай (2.30) при традиционном предположении rgJ(β) с = n , когда T 1 T J + = ( J T J ) −1 J T [4]: β + = β с − (J (β с ) J(β с )) − J (β с )R (β с ) .
Соотношение (2.30), являясь наиболее общей и компактной формулировкой метода Ньютона-Гаусса, служит отправной точкой при построении рекуррентно-итерационных процедур оценивания в нелинейной регрессии. Пошаговая нелинейная регрессия Как уже отмечалось, представление о пошаговой регрессии связано с увеличением числа оцениваемых параметров. Для удобства изложения обозначим: вектор параметров через β < n > ∈ ℜ n , а модель через ϕ < n > (x; β < n > ) . Переходя к учету данных, вектор отклика обозначим
Y < m > , аргумент векторной функции факторов, саму эту функцию, ее матрицу Якоби, функцию невязки – β < m, n > ∈ ℜ n , Φ < m, n > ∈ ℜ m , J < m, n > ∈ ℜ m × n , R < m, n > ∈ ℜ m соответственно, их значения в текущей
m, n > итерационного процесса < m , n > точке β < Φc = Φ < m , n > (β c< m, n > ) c и т.д. С учетом этих обозначений соотношение (2.30) запишется в виде m , n > + R < m , n > = J < m , n > + Y < m > − J < m, n >+ Φ < m , n > , ∆ β€< m , n > = − J < c c c c c
m, n > = β < m, n > + ∆β€< m, n > . β< + c
(2.31)
Пусть на некотором шаге итерационного процесса по точке m, n > рассчитана точка β < m, n > , т.е. вычислен вектор ∆β€< m, n > β< c +
в соответствии с соотношением (2.31). В это же время принято решение об увеличении числа оцениваемых параметров, т.е. о введении дополни-35-
тельного параметра, обозначаемого β< (1) > , так что оценивается новый
T
вектор β < n + 1 > = β << n >> β < (1) > , где β << n >> – старый вектор
T
(такое обозначение вместо β < n > связано с тем, что введение нового параметра, вообще говоря, влечет за собой изменение оценки старого вектора параметров). Из различных способов введения параметра β < (1) > в модель рассмотрим простейший, когда новая модель связана со старой соотношением ϕ < n + 1 > ( x; β < n + 1 > ) = ϕ < n + 1 > ( x; β << n >> , β < (1) > ) = = ϕ < n > ( x; β << n >> ) + ϕ < (1) > ( x; β < (1) > ),
где ϕ< (1) > ( x; β < (1) > ) – аддитивная добавка к старой модели, нелинейная относительно β< (1) > . Учет этих данных приводит к следующим взаимосвязям: Φ < m, n + 1 > β < m, n + 1 > = Φ < m, n + 1 > β < m, < n >> , β < m, (1) > = = Φ < m, < n >> β < m, < n >> + Φ < m, (1) > β < m, (1) > ; J < m, n + 1 > β< m, n + 1 > = J < m, < n >> β < m, < n >> J < m, (1) > β< m, (1) > ; R < m, n + 1 > β < m, n + 1 > = R < m, < n >> β < m, < n >> + R < m, (1) > β < m, (1) > .
(
)
(
)
m, < n >> текущей точки β < m, n + 1 > итеВ качестве составляющей β < c c m, n + 1 > , рационного процесса, предназначенного для определения β€< c m, n > ; при этом с учетом формулы (2.31) имеем принимаем точку β < c m, < n >> = Φ< m, < n >>; J< m, < n >>β< m, < n >> = J< m, < n >>; Φ< m, < n >>β< c c c c m, < n >> = R< m, < n >>. R< m, < n >>β< c c Составляющую β c< m, (1) > выбираем из тех же соображений, из
-36-
которых выбирается обычно начальная точка в итерационных методах m, (1) > = Φ < m, (1) > и т.д. [14], и полагаем Φ < m, (1) > β < c c
Запишем соотношение (2.31) для нового вектора параметров: + ∆β€< m, n + 1 > = −J c< m, n + 1 > R с< m, n + 1 > , m, n + 1 > = β < m, n + 1 > + ∆β€< m, n + 1 > , β< (2.32) + c β < m, < n >> β < m, n > €< m, < n >> + = c + ∆β , < m , ( 1 ) > < > m , ( 1 ) β β ∆β€< m, (1) > + c
где ∆β€< m, < n >> отличается от ∆β€< m, n > из формулы (2.31). Представленная ниже рекуррентно-итерационная процедура по-
зволяет пересчитать ∆β€< m, < n >> , а значит и ∆β€< m, n + 1 > , с использованием уже вычисленной ∆β€< m, n > , не прибегая к псевдообращению m, n + 1 > , следующим образом. Алгоритм Греви«большей» матрицы J < c ля с учетом установленных взаимосвязей дает + ∆β€< m , < n >> | m , (1) > < m , n > m , (1) > = + Φ< = − J < m , < n >> J < Rc c | c ∆ β€< m , (1) > c + < m , (1) > < 1, m > < m , < n >> + − J < m , < n >> J Kc Jc c c m, n + 1 > , = − − − − − − − − − − − − − − − − − − − − − − − − − − R< c < 1 , m > kc
+ T где k < 1, m > = l < m,1 > = l < m,1 >
l < m,1 >
+ 0 ≠ l < m ,1 > = I m − J < m, < n >> J < m , < n >>
k < 1, m > =
J < m, (1) >
1 +
2
∈ ℜ1 × m , если
< m , (1) > J ∈ ℜm × 1 и
T < m, < n >> + T < m, < n >> + J J
+ J < m, < n >> J < m, (1) >
2
, если l < m,1 > = 0 .
-37-
Отсюда
с
использованием
аффинной
модели
функции
Φ < m, (1) > β < m, (1) > и с учетом формулы (2.31) получаем рекуррент
но-итерационную процедуру метода Ньютона-Гаусса с псевдообращением для пошаговой нелинейной регрессии: 1, m > R < m, n + 1 > = ∆β€< m, (1) > = −k < c c 1, m > R < m, n > + Φ < m, (1) > = = −k < c c c m, (1) > = 1 , m m , n 1 , m m < > < > < > (2.33) Y − kc = kc + Φ< Φc c 1, m > Y m − k < 1, m > Φ < m, n > ; = k< c c c m , ( 1 ) m , ( 1 ) < > < > € β+ = βc + ∆β < m, (1) > ; ~ m, (1) > ~ < m, (1) > < m, (1) > < m, (1) > + J < m, (1) > ∆β€< m, (1) > ; Φ< =Φ β + = Φc + c
m, < n >> = β< m, n > + ∆β€< m, < n >> , β< + c m, n > + R < m, n > − J < m, n > + Φ < m, (1) > − ∆β€< m, < n >> = −J < c c c c + − J c< m, n > J c< m, (1) > − k c< 1, m > R c< m, n + 1 > = ∆β€< m, n > −
(2.34)
+ − J c< m, n > (Φ c< m, (1) > + J c< m, (1) > ∆β€< m, (1) > ) = + ~ m, (1) > . = ∆β€< m, n > − J c< m, n > Φ < +
Эти соотношения, в отличие от формулы (2.32) не требуют псевm, n + 1 > . Они используют: дообращения «большей» матрицы J < c 1) результаты расчетов выполненных до введения дополнительно+
го параметра, т.е. Φc< m, n > , R c< m, n > , Jc< m, n > , Jc< m, n > , ∆β< m, n > – непосредственно и через K ; 2) величины, характеризующие новую модель, точнее, аддитив~ < m, (1) > ную добавку к старой, т.е. Φ c< m, (1) > , J , Φ . +
-38-
Рекуррентный нелинейный МНК Как указано выше, представление о рекуррентном МНК связано с увеличением числа данных. Пусть на некотором шаге итерационного процесса по точке m , n < > рассчитана точка β < m, n > , т.е. вычислен вектор ∆β€< m, n > в βc + соответствии с формулой (2.31), и в это время исходная выборка объема m пополнилась данными {x m + 1; y m + 1} = x1 m + 1,..., x k m + 1; y m + 1 . Учет
{
}
этих данных приводит к изменению величин, входящих в формулу (2.31). Обозначим новый вектор отклика через Y < m + 1 > , аргумент векторной функции факторов, саму эту функцию, ее матрицу Якоби, функцию невязки соответственно через β < m + 1, n > ∈ ℜ n , Φ < m + 1, n > ∈ ℜ m + 1 , J < m + 1, n > ∈ ℜ ( m + 1) × n , R < m + 1 > ∈ ℜm + 1 . В
m + 1, n > итерационного процесса, исполькачестве текущей точки β < c m, n > ; значения указующего пополненную выборку, примем точку β < c занных выше величин в этой точке обозначим через Φ < m + 1, n > , J < m + 1, n > , R < m + 1, n > = c c c
Φ < m + 1, n > − Y < m + 1 > . c
этом имеют место взаимосвязи: Φ < m, n > Y< m > < m + 1, n > c < + > m 1 = − − − − − − , Φ = − − − − − − , Y c ϕ Ym + 1 m + 1, c R < m, n > J << m >, n > c < m + 1, n > c < + > m 1 , n = − − − − − −, J = −−−−−− = R c c r J < (1), n > m + 1, c c J < m, n > J < m, n > c c = − − − − − − = − − − − − − , ∇ T ϕ T m + 1, c ∇ rm + 1, c
При
(2.35)
где ϕ m + 1, c = ϕ( x m + 1 ); rm + 1, c = ϕ m + 1, c − y m + 1. Применяя формулу (2.31) к пополненной выборке, получим -39-
+ ∆β€< m + 1, n > = −J c< m + 1, n > R с< m + 1, n > = (2.36) + < m +1 > + < m + 1, n > < + > < + > m 1 , n m 1 , n = Jc − Jc Φс Y , m, n > + ∆β€< m + 1, n > в отличие от β < m, n > = причем β <+ m + 1, n > = β < c + < m , n > < m , n > < m , n > € € = βc + ∆β , где ∆β вычисляется непосредственно по
формуле (2.31). Представленная ниже рекуррентно-итерационная процедура позволяет пересчитать ∆β€< m + 1, n > с использованием уже вычисленной ∆β€< m, n > , не прибегая к псевдообращению «большей» матрицы J c< m + 1, n > , следующим образом. Алгоритм Гревиля с учетом установ-
ленных взаимосвязей дает
J < m, n > c < + > m 1 , n ∆β€ = − − − − − − − ∇ T r m + 1, c
+
R < m, n > c − − − − − − = r m + 1, c
< m, n > + < n,1 > R c < m, n > + < n,1 > T < > m , n = − J c − sc ∇ rm + 1, c J c sc − − − − − − , rm + 1, c
+ T где s < n,1 > = t < 1, n > = t < 1, n >
t < 1, n >
2
∈ ℜ n ×1, если
+ 0 ≠ t < 1, n > = J < (1), n > I n − J << m >, n > J << m >, n > ∈ ℜ n × 1 и T + + T J << m >, n > J << m >, n > J < (1), n > s < n,1 > = , 2 + 1 + J < (1), n > J << m >, n > если t < 1, n > = 0 . Отсюда с использованием аффинной модели функции ϕ m + 1 β < m, n > rm + 1 β < m, n > и с учетом формулы (2.31) получим
(
-40-
)
рекуррентно-итерационную процедуру метода Ньютона-Гаусса с псевдообращением для рекуррентного нелинейного МНК [14]: ∆β€< m + 1, n > = ∆β€< m, n > − s < n ,1 > ~rm + 1,+ , c
(2.37)
T ~ ~ € m, n . где ~rm+1,+ = ϕ ϕ m+1,+ − y m+1, m+1, + = ϕm+1,c + ∇ ϕm +1,c ∆β Эти соотношения, в отличие от выражения (2.36), не требуют m + 1, n > . Они используют: псевдообращения «большей» матрицы J < c 1) результаты расчетов выполненных до пополнения выборки, т.е. m, n > , R < m, n > , J < m, n > , J < m, n > + , ∆β€< m, n > – непосредΦ< c c c c
ственно и через s < n,1 > ; c
2) величины, характеризующие пополненную выборку, точнее добавленные данные, т.е. ϕ m + 1, c , ∇ T ϕ m + 1, c , ϕ m + 1,+ . Следует подчеркнуть отличие структуры рекуррентного соотношения (2.37) от соотношений (2.33), (2.34) пошаговой регрессии. А именно в соотношении (2.37) «корректирующий член» пропорционален разности между «предсказанным» по ∆β€< m, n > значением аффинной модели ~ ϕm + 1,+ и добавленным значением y m + 1 . Тем самым «новый» вектор β€< m + 1, n > , рассчитанный по пополненной выборке, получается путем вычитания из «старого» вектора ∆β€< m, n > величины, пропорциональной ошибке предсказания (по этому «старому» вектору) добавленного значения y m + 1 . Вектор пропорциональности s < n,1 > (или c s < n,1 > ), часто называемый «вектором сглаживания», не зависит от данных y u , u = 1,..., m + 1 .
Следует отметить, что различные варианты алгоритмов рекуррентного нелинейного МНК, основанные на тех или иных исходных посылках и методах оптимизации, предлагались независимо разными авторами, как правило, в связи с задачами адаптивной идентификации динамических объектов, в которых представление о последовательно поступающих данных трактуется наиболее естественным образом [79, 104]. Так, в [79] рекуррентные методы ошибки предсказания строятся на основе предположения о том, что на каждом шаге итерационного процесса -41-
( )
значение β c действительно минимизирует функцию f (β ) и ∇f β c = 0 ; ясно, что такая посылка выглядит нереально (что, впрочем, признается и самим автором). В работе [104] рассмотрен традиционный случай, когда rgJ (βc ) = n . Предложенные в данном разделе рекуррентно-итерационные процедуры метода Ньютона-Гаусса с псевдообращением охватывают известные ранее варианты алгоритмов рекуррентного нелинейного МНК. Алгоритмы же пошаговой нелинейной регрессии, насколько известно, ранее не рассматривались. Дальнейшее развитие предложенного подхода предполагает, прежде всего, исследование его аналитических и статистических аспектов, т.е. рассмотрение вопросов сходимости рекуррентно-итерационных процедур, сопровождение их надлежащими статистическими оценками (например, доверительными интервалами для регрессионных моделей), пересчитываемыми в процессе наращивания моделей или пополнения выборки (см. далее). Необходимо также подчеркнуть, что алгоритмы успешно апробированы на реальных данных (см. далее). 2.5. Блочная адаптивная идентификация нелинейных моделей Выше были рассмотрены алгебраические основы алгоритмов адаптации, когда в модель последовательно включаются единичные дополнительные параметры или исходная выборка наблюдений пополняется единичными измерениями. Однако в реальных условиях производства чаще встречаются следующие ситуации: модель пополняется блоком параметров (например, при осуществлении контроля за технологией некоторого агрегата, который характеризуется блоком факторов [22]); блочное поступление и накопления технологических данных (например, при контроле обработки партии продукции, состоящей из нескольких единиц изделий [16]). Первая ситуация связана с блочной регрессией; она допускает и такую трактовку, что число параметров неизменно, но их оценки рассчитываются последовательными блоками. Вторая ситуация связана с блочным рекуррентным методом наименьших квадратов. Отсюда следует цель исследований – применительно к НЗНК сочетать блочные рекуррентные процедуры с итерационными процедурами нелинейной оптимизации. Основой для блочных алгоритмов является метод Ньютона-Гаусса с псевдообращением.
-42-
Предварительно для удобства дальнейших формулировок уточним обозначения векторов и матриц в (2.28): найти min f ( ∆β < m,n > ) , ∆β < m,n > ∈ ℜ n , для f (∆β < m, n > ) = 1 / 2
2
m, n > ) + R < m > (β < c
= ε < m, n > 2 . (2.38)
+ J < m, n > (β c< m, n > )∆β < m, n >
При блочном пересчете координат точки βс в координаты точки β+ на отдельно взятой итерации, рассматриваемом как вариант методов блочнопокоординатной оптимизации, обозначим через β < m, ν > , 0 ≤ ν ≤ n, промежуточные точки такие, что β <m,0> = β <m,n> , β <m,n > = β <m,n > , +
c
∆β<m,n> = β<m, ν> − β<m,ν− p> , 0 ≤ ν- p , ∆β<m, ν+ p> = β<m, ν+p> −β<m,ν> ,
ν + p ≤ n, причем у точки β< m,ν+ p> последние n – (ν + p) координат совпадают с координатами точки β . При пересчете очередного блока координат, вообще говоря, пересчитываются и все ранее найденные координаты, что отражено в принятых обозначениях. ∆β <m,ν> ищется как решение задачи: найти Вектор < m,ν> < m,ν> ) , ∆β min f ( ∆β ∈ ℜ , для f (∆β< m, ν > ) = 1/ 2
R < m > (β< m, ν − p > ) +
2
+ J < m, ν > (β< m, ν − p > )∆β< m, ν >
= ε< m, ν > 2 ,
(2.39)
а вектор ∆β < m,ν+p> – как решение задачи: найти min f (∆β <m ,ν + p > ) , ∆β < m,ν+ p> ∈ ℜ n , для R< m > (β< m, ν > ) + f (∆β< m, ν + p > ) = 1/ 2 + J< m, ν + p > (β< m, ν > )∆β< m, ν + p >
2 = ε< m, ν + p > 2. (2.40)
Матрица J < m, ν + p > из (2.40) структурно связана с матрицей J < m, ν > из (2.39) соотношением
ν | < m,( p) > . (2.41) J < m, ν + p > = J < m, > J | Следует отметить, что матрица J < m,ν > здесь вычисляется в точке β < m, ν > , тогда как в (2.39) эта же матрица вычисляется в точке
-43-
β < m, ν − p > . Тем самым, в отличие от ЛЗНК, в данном случае на сле-
дующем шаге рекурсии не удается непосредственно использовать результат предыдущего шага, а именно псевдообратную матрицу +
J <m,ν> (β <m,ν− p ) . Приходится определять вспомогательную матрицу
[J m,ν (β m,ν )] , <
>
+
<
т.е. дополнительно псевдообращать ту же матрицу
J < m, ν > , но вычисленную в уже найденной точке β < m, ν > . В этом состо-
ит особенность формируемой рекуррентной процедуры применительно к НЗНК в отличие от ЛЗНК. Тем не менее, сохраняется основной смысл рекуррентного псевдообращения: сведение псевдообращения матрицы определенного размера к псевдообращению матрицы меньшего размера. Дополнительный блок J < m, ( p) > матрицы J < m, ν + p > имеет вид ∂r1 / ∂β ν +1 . . . ∂r1 / ∂β ν + p . J < m ,( p ) > = . . . . . ∂rm / ∂β ν +1 . . . ∂rm / ∂β ν + p Причем
<m,ν+ p>
∆β (ν )i
<m,ν+ p>
= βi
− β ,
i = 1, 2, …, ν,
∆β <( pm) i, ν+ p > = β i< m, ν + p > − β , i = ν + 1, 2, …, ν + p, так как пересчет
каждого очередного блока координат, вообще говоря, влечет пересчет предшествующих координат. В соответствии с (2.30), решение задачи (2.40) запишется в виде
[
]+
∆β <m,ν+ p> = − J < m,ν + p> (β < m,ν> ) R < m> (β < m,ν> )
или
∆β <m,ν+p> + ( ν) = −J <m,ν> (β <m,ν> ) J <m,p> (β <m,ν> ) R <m> (β <m,ν> ). ∆β <m,ν+p> ( p)
Формула Клайна псевдообращения блочных матриц определяет следующее выражение этого решения через решение ~ ∆ β <m,ν> вспомогательной задачи типа (2.39), в которой β < m,ν− p> заменено на β <m ,ν > : <m,ν+ p>
∆β (p)
[
= − L< m,ν+ p> R < m> (β < m,ν > ) ,
]
+ ~ ∆β<(νm),ν+p> = ∆β <m,ν> + J <m,ν> (β<m,ν> ) J <m,( p)> (β <m,ν> )∆β( ,
-44-
(2.42) (2.43)
где матрица L<m,ν+p> определяется в виде L< m,ν + p> = (C < m,ν + p> ) + + [ I − (C < m,ν+ p> ) + (C < m,ν+ p> )] × × K < m,ν + p> [( J < m,ν> (β < m,ν> )) + J <m,( p)> (β < m,ν> )]T (J < m,ν> (β <m,ν> )) + × × [I − J < m,(p)> (β < m,ν > )(C < m,ν + p> ) + ],
причем C < m,ν + p> = [ I − J < m,ν > (β < m,ν > )J < m,ν > (β < m,ν > )) + ]J < m,(p)> (β < m,ν > ), K <m, ν+ p> = {I + [( J <m, ν> (β < m,ν > )) + J < m,( p )> (β < m,ν> ) × × ( I − (C < m,ν + p > ) + C < m, ν+ p> )]T [( J < m, ν> (β <m, ν> )) + J < m,( p )> (β < m,ν> ) × × ( I − (C < m,ν + p > ) + C < m, ν+ p> )]} −1 .
Выражение для L<m,ν+p> в ряде случаев упрощается. Так, если матрица Якоби в точке β <m,ν> удовлетворяет условию ×ν < m,ν> (β < m,ν> ) = m, то C < m,ν + p> = 0 и J < m,ν> (β < m,ν> ) ∈ ℜ m m , т.е. rg J
L< m,ν + p> = {I + (J <m,( p)> (β < m,ν> )) T [J < m,ν> )(β <m,ν> ) × × ( J < m,ν > (β < m,ν > )) T ] −1 J < m,( p)> (β < m,ν> )}−1 ×
(2.44)
× ( J < m,( p)> (β < m,ν> )) T [J < m,ν> (β < m,ν> )( J < m,ν> (β < m,ν> )) T ] −1 .
Если матрица J <m,ν+ p> (β <m,ν> ) ∈ ℜ νm+×p(ν+p) , т.е. rg J <m,ν+ p> (β <m,ν> ) = ν + p, то L< m,ν + p> = (C < m,ν + p> ) + . ×( ν+ p) Если матрица J < m,ν+ p> (β <m,ν> ) ∈ ℜ m , m
т.е. rg J <m,ν+ p> (β <m,ν> ) = m, то L< m,ν + p> = {(J < m,( p)> (β < m,ν> )) T C < m,ν+ p> }−1 (C < m,ν + p> ) T .
(2.45) Следует отметить, что при использовании в (2.42), (2.43) формулы
(2.41), для L<m,ν+p> справедливо соотношение ε < m , ν + p > = ε < m , ν > − C < m , ν + p > ∆β
< m, ν + p > ( p)
2
,
а при использовании формулы (2.45) – соотношение < m, ν + p > T ε < m, ν + p > = ε < m, ν > − ( J < m , ( p) > (β < m , ν > ) ∆β ( p) ) × × [ I − J < m, ν > (β < m, ν > )( J < m, ν > (β < m, ν > )) + ]R < m > (β < m, ν > ).
-45-
~ Вычитаемые в этих соотношениях, как и добавка к ∆ β <m,ν> в (2.43), трактуются как “корректирующие члены” при рекуррентной блочно-покоординатной оптимизации на каждом шаге итерационного процесса Ньютона-Гаусса. Пусть теперь число компонент вектор-функции R увеличилось на q, так что ∇T r r1 1 M M r <m > ∇ T rm J < m,n > < + > < + > R m q m m q , n = = = T R = , J . rm+1 R <( q )> ∇ rm+1 J <(q ),n > M M rm + q ∇ T r m + q
Следующая точка β + = β <+m +q ,n > определяется в этом случае в виде β <+m +q ,n > = β + ∆β < m +q ,n > , где ∆β <m+q,n > является решением задачи: найти min f ( ∆β < m +q ,n > ) , ∆β <m+q,n> ∈ ℜ n , для
m, n > ) + R < m + q > (β < c f ( ∆β < m + q , n > ) = 1 / 2 m, n > ) ∆β < m + q, n > + J < m + q , n > (β < c
2 =
(2.46)
= ε < m + q, n > 2 .
Здесь матрица J < m + q, n > (β c< m, n > ) непосредственно связана с матрицей J < m, n > (β c< m, n > ) из (2.38) соотношением
J <m,n > (β < m,n > ) J <m +q,n > (β c<m,n > ) = <( q ),n > c<m,n > . (β c ) J В соответствии с (2.30), решение задачи (2.46) запишется в виде ∆β <m+q,n > = −[ J < m+q,n > (β i< m,n> )]+ R < m+q> (β ) или +
J < m, n > (β < m,n > ) < m > ∆β < m + q, n > = − <(q ),n > c< m,n > R<( q ) > . (β c ) R J
Формула Клайна псевдообращения блочных матриц, записанная в транспонированном виде, определяет следующее выражение этого решения через решение ∆β <m,n> задачи (2.38): -46-
∆ β < m + q , n > = ∆ β < m, n > − L
< m + q ,n >
[ R < (q ) > (β
< m,n > + J < ( q ), n > (β c ) ∆β < m, n > ], где матрица L<m,ν+p> определяется в виде
< m,n > )+ i
(2.47)
L< m + q, n > = (C < m + q, n > ) + + [ I − ( C < m + q, n > ) + J < ( q ), n > (β c< m, n > )] × × ( J < m, n > (β c< m, n > )) + [ J < (q ), n > (β c< m, n > )(J < m, n > (β c< m, n > )) + ]T × × K < m + q, n > [ I − C < m + q, n > ( C < m + q, n > ) + ], причем C < m+ q,n > = J < (q ),n > (β )[ I − J < m,n> (β )) + J < m,n> (β )],
K < m + q ,n > = {I + [(I − (C < m + q ,n > )(C < m + q, n > ) + ) J < (q ), n > (β ) × × ( J < m, n > (β )) + ][( I − C < m + q ,n > (C < m + q, n > ) + )J < (q ), n > (β ) × × J < m, n > (β )) + ][( I − C < m + q, n > (C < m ,ν + p > ) + )J <( q ), n > (β ) × × ( J < m, n > (β )) + ] T } −1 . Выражение для
L< m,ν + p> в ряде случаев упрощается. Так,
×n , т.е. rg J < m, n > (β < m, n > ) = n, то если матрица J < m,n > (β c<m,n > ) ∈ ℜ m n c
C < m + q , n> = 0 и
L<m + q,n > = [( J <m,n > (β c< m,n > )) T J < m,n > )(β c<m,n > )] −1 × × (J <(q ),n > (β c<m,n > )) T {I + J <( q ),n > (β c< m,n > ) × × [( J < m,n > (β c<m,n > )) T J <m,n > (β c< m,n > )] −1 ( J <( q ),n > (β c<m,n > )) T } −1 . Следует отметить, что основу алгоритмов нелинейной идентификации параметров моделей, учитывающих последовательное и блочное поступление данных, составляют аппроксимация функции R(β) в окрестности текущей точки βс ее аффинной моделью и структурная связь матриц Якоби типа (2.35), (2.41). Таким образом, модель может быть адаптирована к новым составляющим в виде линейных аддитивных добавок произвольной функциональной структуры (например, нелинейных по параметрам). Адаптация же структуры к нелинейным добавкам требуется применения операции суперпозиции (функций связи исходной модели и дополнительных ее параметров), основы которой представлены в п. 2.6. -47-
В параметрической адаптации основу рекуррентно-итерационных процедур представляет метод Ньютона-Гаусса с псевдообращением. В п. 2.7 представлены алгоритмы, которые позволяют сочетать методы ньютоновского типа и Левенберга–Маркварта с блочными рекуррентными процедурами без использования механизма псевдообращения. В то же время вычислительные процедуры, описанные в п.п. 2.22.5, являются алгебраической основой для алгоритмов идентификации, которые будут представлены далее. 2.6. Суперпозиционная идентификация Общим способом описания структурных преобразований модели при введении дополнительных параметров, как уже было сказано, является суперпозиция исходной модели и дополнительных параметров при помощи некоторой функции связи. Именно в этом смысле трактуется суперпозиционная регрессия, которая устанавливает соотношения между итерационными приближениями к оценкам параметров, полученными на основе исходной и расширенной модели [18, 123]. Пусть верны предположения: 1) известно, что отклик y зависит от вектора x ∈ ℜ k факторов x , i
1 ≤ i ≤ k; 2) имеется
массив
m×k
данных
{X;Y}
этой
зависимости,
X ∈ℜ , Y ∈ ℜ , т.е. наборов {xu; yu} = {x1u, …, xku; yu}, 1 ≤ u ≤ m; 3) избрана модель y = ϕ(x , β) , для описания этой зависимости, m
включающая вектор β ∈ ℜ n параметров; 4) оценка β€ вектора β по данным {X;Y} находится путем решения НЗНК. Пусть для описания той же зависимости избрана другая модель y = ω( x, θ) , включающая вектор θ ∈ ℜs параметров, так что в
соответствующих
обозначениях
( ϕ ↔ ω, β ↔ θ, Φ ↔ Ω, ∇Φ = )
= ∇ β Φ ↔ ∇ β Ω = ∇Ω для этой модели оценка θ€ , аналогично (2.30), на-
ходится по формуле: ∆θ€ = (∇ T Ω(θ c )) + ⋅ (Y − Ω(θ c )), θ + = θ c + ∆θ€. (2.48) Пусть (не связывая пока модели φ и ω, не смотря на используемые обозначения) вектор θ разбит на подвекторы β∈ ℜ n , γ∈ ℜp : θT = [βT|γT], -48-
n + p = s, так что ω( x; θ) = ω( x ; β, γ ) . Линеаризация функций ωu (β, γ) в окрестности θc = (βc , γ c ) дает T ω (β , γ ) ∇T ω (β , γ )]∆β . ωu (β, γ ) ≈ ωu (βc , γ c ) + [∇β u c c γ u c c ∆γ ∆β
Этим определяется линеаризация Ω(β, γ ) ≈ Ω c + [∇ T Ω c ∇Tγ Ωc ] , β ∆γ
так что (2.48) принимает вид
[
]
∆ β€ + T T = ∇ β Ω c | ∇ γ Ω c ( Y − Ω c ), ∆ γ€ β + = β c + ∆ β€, γ + = γ c + ∆ γ€.
(2.49)
В соответствии с формулой Клайна псевдообращения блочных матриц: + T + T ∇ βT Ω c | ∇ Tγ Ω c = ∇ β Ω c I − ∇ γ Ω c ⋅ L c , Lc (2.50)
] (
[
( ⋅ (I − ∇
)(
)
)
L c = C c + + I − C c + ⋅ C c ⋅ K c ⋅ ∇ γ Ω c ⋅ (∇ β Ω c ) + × × (∇ βT Ω c ) +
(
T γ Ωc
)
⋅Cc+ ,
)
(
C c = I − ∇ βT Ω c ⋅ (∇ βT Ω c ) + ⋅ ∇ Tγ Ω c , K c = I + M c T ⋅ M c
(
M c = (∇ βT Ω c ) + ⋅ ∇ Tγ Ω c ⋅ I − C c + ⋅ C c
)
)
−1
,
С использованием этих соотношений (2.49) запишется в виде ∆γ€ = Lc ⋅ (Y − Ωc ), ∆β€ = (∇βTΩc )+ ⋅ (Y − Ωc ) − (∇βTΩc )+ ⋅ ∇γTΩc ⋅ ∆γ€,
(2.51)
γ + = γc + ∆γ€, β+ = βc + ∆β€. Связь моделей ϕ и ω может быть принята в следующем виде. Пусть верно следующее: 1) вектор θ из ω является расширением β из ϕ, так что β в ϕ и в ω – один и тот же, βс – его текущее значение; 2) вектор γ состоит из параметров, дополняющих β до θ, γc задается из обычных соображений выбора начальной точки в итерационных процессах; 3) модель ω является расширением модели ϕ в смысле суперпозиции: -49-
ω(x, β, γ) = ψ(x, ϕ(x, β), γ) = ψ(x, ϕ, γ), φ = φ(x; β), где ψ – функция связи модели ϕ с параметрами γ. Подстановка данных xu в модель такой структуры определяет функ-
цию Ω: ℜ n + p → ℜ m , условно обозначаемую Ψ o Φ , с координатами: ωu(β; γ) = ω(xu; β, γ) = ψ(xu; ϕ(xu; β), γ) = ψu(φu(β), γ) = ψu(ϕu, γ), ϕu = ϕu(β), причем ∇γωu = ∇γψu, ∇βωu = (∂ψu/∂ϕu)∇ϕu. Линеаризация функций ωu(β; γ) такой структуры в окрестности (βс, γс) дает ωu (β; γ) ≈ ψ u (ϕu (βc ), γ c ) + ∂ψ (ϕ (β ), γ ) ∆β + u u c c ∇T ϕu (βc ) ∇T γ ψ u (ϕu (βc ), γ c ) . ∂ϕu ∆γ Этим определяется линеаризация ∆ β [ Ψ o Φ ](β, γ ) ≈ [ Ψ o Φ c ]c + [ D c (∇ T Φ c ) ∇ T γ [ Ψ o Φ c ]c ] , ∆γ
где использованы обозначения T [Ψ oΦc ]c = Ω(βc , γ c ), ∇T γ [Ψ o Φ c ]c = ∇ γ Ω(βc , γ c ), ∂ψ (ϕ (β ), γ ) D = diag u u c c . ∂ϕ u u =1 m
С учетом обозначений в формулах (2.50) и (2.51) ∇ βT Ω можно заменить на D ∇ βT Φ . Соотношения (2.51) принимают вид ∆γ€ = L c ( Y − [ Ψ o Φ c ] c ), ( ∆β€) ω = ( D c (∇ T Φ c )) + ( Y − [ Ψ o Φ c ]c ) −
(2.52а) (2.52б)
− ( D c (∇ T Φ c )) + ( ∇ Tγ [ Ψ o Φ c ]c ) ∆γ€,
где обозначение (∆β€) ω введено, чтобы отличить эту оценку от ∆β€ , а именно ∆β€ = (∆β€) , которая в некоторых случаях может войти в (2.52 б). ϕ
Так, если выполняются условия Dc = I, [Ψ o Φ c ]c = Фс (при этом, разумеется, не обязательно
∇ Tγ [Ψ o Φ c ] c
∆γ€ = Lc (Y − Φc ), -50-
(2.53) =
∇ Tγ Φ c ),
то (2.54а)
(∆β€)ω = (∆β€)ϕ − (∇T Φc )+ (∇T (2.54б) γ [Ψ o Φ c ]c )∆γ€ . ~ ~, Рассмотрим случай ω( x; β, γ ) = ϕ( x; β) + ϕ( x; γ ) , когда ψ = ϕ + ϕ ~ T~ так что Dc = I, но [Ψ o Φ c ]c = Фс+ Φ c , ∇T γ [Ψ o Φ c ]c = ∇ Φ c ; в этом случае (2.52) дает ~ ∆γ€ = L c (Y − Φ c − Φc ), (2.55а) ~ ~ T + T (∆β€)ω = (∆β€)ϕ − (∇ Φ c ) (Φc + ∇ Φc ∆γ€). (2.55б) Оба условия (2.53) выполняются, когда в предыдущем случае ~ ~ ~ линейны по параметрам; при этом Φ(β) = Φβ, Φ функции φ и ϕ ( γ ) = Φγ , ~ где Φ, Φ – матрицы значений базисных функций на данных X; кроме ~ ~ того, ∇T Φβ = Φ, ∇T Φγ = Φ , т.е. не зависят от своих аргументов: можно положить βс = 0, γс = 0; итерационный процесс сходится за один шаг и дает β€ = Φ + Y (см. формулу (2.4)), а (2.55) принимает вид ~ ∆γ€ = LY, (∆β€)ω = (∆β€)ϕ − Φ +Φγ€.
(2.56)
Разбиение в регрессионной модели вектора параметров на подвекторы может также мотивироваться соображениями вычислительного преимущества псевдообращения “меньшей” матрицы ∇ βT Ω c перед псевдообращением “большей” матрицы [ ∇ βT Ω c ∇ Tγ Ω c ]. Соотношения (2.56) для введения дополнительных членов в линейную регрессионную модель установлены в [4]. Аргументация введения дополнительных членов в уравнение регрессии, предложенная в [4], € состоит в том, что после вычисления (β) минимальное значение ϕ
f ((β€) ϕ ) из (2.3), показывающее степень расхождения между данными и модельными значениями отклика, может оказаться неприемлемо большим. Стандартный прием состоит в пополнении семейства базисных функций новыми функциями, этим автоматически вводятся новые параметры. Структурная связь расширенной модели с исходной определяется однозначно путем введения аддитивной добавки, линейной относительно новых параметров; процедура пошаговой регрессии позволяет определить оценку γ€ вектора дополнительных параметров, а затем, с использо€ , пересчитать последнюю в (β) € ; тем ванием γ€ и ранее найденной (β) ϕ
ω
-51-
самым сохраняется и используется результат первоначального расчета € (β) и, как уже отмечалось, экономятся вычислительные ресурсы на ϕ
псевдообращение. В нелинейной регрессии подобная ситуация может возникнуть на некотором шаге итерационного процесса: о том, что f ((β€) ) предвидитϕ
ся неприемлемо большой, можно судить еще до его окончания; однако теперь введение аддитивной добавки, как это сделано в (2.55), не является единственно возможным способом расширения модели, хотя и часто используется на практике; в этом случае последовательность расчета ∆γ€ € и пересчета (β) по ∆γ€ и (∆β€) близка к линейной регрессии (см. ω
ϕ
(2.55)). Представляют интерес другие случаи такого типа (в частности, удовлетворяющие (2.53), когда справедливо (2.54)), поскольку в общем случае (2.52) выделить в ( ∆β€) ω составляющую (∆β€) ϕ , вообще говоря, не удается, хотя последовательный расчет сначала ∆γ€ , а затем ( ∆β€) ω с экономией на псевдообращении имеет место. Рассмотренная схема суперпозиции является достаточно общей. В то же время она допускает дальнейшее развитие и детализацию. Так, в обобщение (2.55) можно рассмотреть суперпозицию вида ~( x ; γ )) (при этом установленные соотношения становятся ψ ( x; ϕ( x; β ); ϕ более “симметричными”), а также ψ( x; ϕ (1) ( x; β (1) );...; ϕ (l ) ( x; β ( l ) )). Необходимо подчеркнуть, однако, что подобные схемы суперпозиции являются частными случаями рассмотренной. 2.7. Рекуррентно-итерационные алгоритмы ньютоновского типа Как уже было отмечено, при решении задач о наименьших квадратах необходимость в рекуррентных процедурах возникает, например, при увеличении объема выборки в контексте задач регрессии. Ранее был рассмотрен общий случай, когда выборка дополняется блоками, адаптируемая модель может иметь нелинейную по параметрам структуру, и возникает необходимость сочетания блочных рекуррентных алгоритмов псевдообращения с итерационным методом Ньютона-Гаусса. Однако для решения НЗНК более эффективными считаются методы с параметром регуляризации Левенберга-Маркварта и ньютоновского типа, в которых используется информация о вторых производных функции невязки [40]. Поэтому целесообразно рассмотреть алгебраические аспекты разработки -52-
блочных рекуррентно-итерационных процедур применительно к методам ньютоновского типа и Левенберга-Маркварта [19]. Сформулируем (2.28) для регрессии с объемом выборки m: найти min
m 2 1 m m R (β) = ∑ ru 2 (β), β ∈ ℜ n , R (β) ∈ ℜ m . 2 u =1
(2.57)
1. Итерационный метод Ньютона в классическом варианте, позволяющий по текущей точке β c
найти следующую точку β +
m
применительно к задаче (2.57) имеет вид [95]: β +
m
= βc
m
+ ∆β
m
mT m (βc m )R (βc m ). J m T m m m + J (βc )J (βc ) m S (βc m ) +
m
=
,
,
−1
где ∆β m = −
Здесь S
m
m
∑ ru ⋅ ∇ 2 ru ∈ ℜ n × n
(2.58)
– матрица, обозначающая ин-
u =1
формацию о производных второго порядка. Пусть число компонент вектор-функции R так что r1 M m r m1 R m+q R = − − − = M rm + 1 R (q ) M r m +q S
m+ q
=
m +q
∑
u=1
m
увеличилось на q,
∇T r 1 M m T ∇ rm J m+q = −−− = M , , J T ( ) q ∇ rm +1 J M T ∇ rm + q
m
m +q
u =1
u= m +1
ru ⋅ ∇ 2 ru = ∑ ru ⋅ ∇ 2 ru +
∑
ru ⋅ ∇ 2 ru = S
m
+S
(q ) .
(2.59)
Теперь следующая точка β + m+ q определяется в виде m+q β + m + q = β c m + ∆β , −1
m+q (βc m ) + S (m+q)T m+q ∆β = − (βc m )R (m+q) (βc m ) J m + q T m + q m m + J (βc )J (βc )
С учетом структуры вектора R запишем
m+ q
и матриц J
m+ q
,S
m+q
-53-
m (q ) (β m )) + J m T (β m ) M J (q ) T (β m ) × (β c m ) + S c c c (S m+ q , Δβ = − J m (β c m ) −−− × J (q ) (β m ) c R m (β m ) c J m T (β m ) M J (q ) (β m ) −− = c c (q − R ) (β m ) c m mT m (β c m ) + J (β c m )J (β c m ) + S −1 q q T q m T ( ) ( ) ( ) (β c m ) + J (β c m )J (β c m ) ( J (β c m ) × . = − + S × R m (β c m ) + J (q ) T (β c m ) R (q ) (β c m )
Воспользуемся следующим, легко проверяемым и часто приме-
(
)−1
няемым, матричным тождеством: (A + B)−1 = A −1 − A −1 I + BA −1 BA −1 , понимая под A и B матрицы в фигурных скобках, опуская временно аргумент β c m и обозначая J Получим: ∆β
m+q
= −A −1 U T R
m
m
= U, J
− A −1V T R
+ A −1 (I + BA −1 ) −1 BA−1V T R
(q )
(q )
= ∆β
− A −1 (I + BA−1 ) −1 (I + BA −1 )V T R
(q )
(q )
(q )
= V.
+ A −1 (I + BA −1 ) −1 BA −1 U T R
m
− A −1 (I + BA −1 ) −1 B∆β
m
−
+ A −1 (I + BA−1 ) −1 BA−1V T R
(q )
m
+
=
− A −1 (I + BA−1 ) −1 (V T R + B∆β ). Окончательно блочная рекуррентно-итерационная процедура метода Ньютона решения НЗНК запишется в виде следующего выражения = ∆β
∆β
-54-
m
m+ q
через ∆β
m
:
m
∆β
m +q
= ∆β
m
mT m m − S (β c m ) + J (β c m )J (β c m )
(q ) (q ) T (β m )J (q ) (β m ) × (β c m ) + J I + S c c × −1 × S m (β m ) + J m T (β m )J m (β m ) c c c
−1
×
−1
×
(2.60)
J (q ) T (β m )R (q ) (β m ) + c c . × ( ) ( ) ( ) q q T q m + S (β c m ) + J (β c m )J (β c m ) ⋅ ∆β
2. Практической альтернативой методу Ньютона являются квазиньютоновские методы (методы секущих), которые используют апm m проксимацию S m (β c ) матрицей секущих A c =
m
m
∑ ru (β c
m
u =1
m
) ⋅ (H u
)c ,
m
где ( H u ) c аппроксимирует ∇ 2 ru (β c ) [40]. Итерационную процедуру для квазиньютоновских методов можно m записать как β + m = β c m + ∆β , где
∆β
m
m mT m = − A c + J (β c m ) J (β c m )
−1
J
mT
m (β c m ) R (β c m ).
При этом A
m+q
=
m +q
∑
u =1
m+q
ru ⋅ H u
=
m
∑ ru ⋅ H u
u =1
m
+
m+q
∑
(q)
ru ⋅ H u
=A
m
+A
(q)
.
u = m +1
Тогда, аналогично (2.60), блочная рекуррентно-итерационная процедура квазиньтоновских методов запишется в виде: ∆β
m +q
= ∆β
m
m mT m − A c + J (β c m )J (β c m )
−1
J (q ) T (β m )R (q ) (β m ) + c c × (q ) (q ) T (β m )J (q ) (β m ) ⋅ ∆β m . + A c +J c c
×
(2.61)
Следует отметить, что матрица Ac должна удовлетворять условию секущих [40]. На практике для расчета Ac обычно используют формулы DFP и BFGS, обеспечивающие это условие. -55-
3. Блочную рекуррентно-итерационную процедуру метода Ньютона-Гаусса получим – опуская матрицы, обозначающие информацию о производных второго порядка для случая, когда J
m
m (β c m ) ∈ ℜ n m×n , т.е. rgJ (β c m ) = n :
∆β
m+q
× I + J
= ∆β
(q ) T (β
m
c
− J
m (β c m )J (β c m )
mT
(q ) T (β
c
×
m )J (q ) (β m ) × c
mT m (β c m )J (β c m ) × J
×J
−1
(q ) (β c
m
) R
−1
m
(2.62)
−1
×
)+J
(q ) (β c
m
) ∆β
m
.
4. Итерационный метод Левенберга-Маркварта имеет вид [95]: mT m (q ) T (β m )J (q ) (β m ) = − µc I + J (βc m )J (βc m ) + J c c m T m ( q ) T ( q ) (βc m )R (βc m ) + J (βc m )R (βc m ) , × J ∆β
m
−1
×
где μс – некоторое неотрицательное число, параметр регуляризации. Воспользуемся матричным тождеством (в прежних упрощенных
(
обозначениях): A + V T V Получим ∆β
m+q
(
= ∆β
)−1 = A −1 − A −1V T (I + VA −1V T )−1 VA −1.
(
m
− A−1VT I + VA−1VT
)
(q )
× I + VA−1VT R
(
)
−1
V∆β
+ A−1VT I + VA−1VT
(
)
)
−1
m
(
− A−1VT I + VA−1VT
VA−1VTR
(q )
)
−1
×
=
(q ) m + V∆β . R Окончательно блочная рекуррентно-итерационная процедура метода Левенберга-Маркварта решения НЗНК запишется в виде следующе∆β
m
− A−1VT I + VA−1VT
го выражения ∆β
-56-
m+q
−1
через ∆β
m
:
∆β
m+q
= ∆β
m
I J m T( m ) βc × µ c + − m × J (β c m )
−1
J
(q ) T (β
−1 µ c I + ( q) m (β c ) × I + J m T m m m × (β c )J (β c ) + J ( ) q T m × J (β c )
c
m )×
−1
×
(2.63)
(q ) (β m ) ∆β m . (q ) (β c m ) + J × R c c
5. Блочную рекуррентно-итерационную процедуру метода Ньютона-Гаусса получим, опуская матрицу µc I , для случая, когда J
m m ∈ ℜ m ×n : βc n
∆β ×J × ⋅J
m+q
= ∆β
(q ) T (β
c
(q ) T (β
c
− J
m
mT
m (β c m ) J (β c m )
−1
×
m ) I + J (q ) (β m ) J m T (β m )J m (β m ) c c c
−1
×
(2.64)
m )
−1
⋅ R
(q ) (β c
m ) + J (q ) (β m )∆ β m . c
2.8. Метод оптимального моделирования технологических связей Моделирование зависимостей показателей потребительских свойств продукции от технологических факторов является важным этапом при разработке автоматизированных систем для решения задач управления качеством. Важность выбора аппарата моделирования обуславливается необходимостью получения адекватных формул прогноза изменения свойств продукции от изменения условий ее производства. При этом от точности модельного прогноза зависит и эффективность применяемого оптимизационного математического аппарата системы. Алгебраические основы методов, с помощью которых можно решить задачу идентификации моделей и адаптировать их к изменяющимся производственным условиям, представлены выше. Однако остается нераскрытым вопрос о структуре и составе модели для конкретной производственной схемы. -57-
При моделировании технологических связей сложных производств, как правило, вызывает затруднение отсутствие информации о точном законе совместного распределения большого числа случайных величин и говорить даже о полуэмпирических моделях в данной ситуации не приходится. На практике обычно аппроксимируют набор экспериментальных данных линейной по параметрам моделью y = ϕ T ( x )β (отклик). Флюктуация или погрешность моделей, возникающая при ее построении, обычно вводится в виде y = ϕ T (x )β + Ψ . Широкое применение такие модели получили благодаря своей простоте и надежному, теоретически обоснованному математическому обеспечению для их построения, имеющемуся в распоряжении любого исследователя [33, 106]. Следует отметить, что в контексте с положениями математической статистики вопросы влияния флюктуации Ψ на адекватность линейных регрессионных зависимостей реальным данным и ее учета до настоящего времени остаются открытыми. При практической реализации методов построения линейной регрессии погрешностью Ψ, как правило, пренебрегают, считая, что ее математическое ожидание равно нулю и значения Ψ и y независимы. Идеи таких методов, к которым относится и пошаговая регрессия, основаны на последовательном включении в модель факторов, имеющих наиболее тесную корреляционную связь с откликом до тех пор, пока статистические оценки адекватности модели, получаемые после каждого шага выполнения этой процедуры, не начнут ухудшаться. При этом полагают, что не включенные в модель факторы не влияют (или отрицательно влияют) на ее адекватность. Однако линейная по параметрам зависимость, построенная традиционными способами, не всегда удовлетворяет требованиям точности прогноза. Есть основание предполагать, что не включенные в эту зависимость факторы имеют с откликом нелинейную по параметрам связь, оценить которую методами корреляционно-регрессионного анализа затруднительно, и имеет смысл допустить, что такие связи ухудшают линейную модель за счет своего неявного присутствия в Ψ. Более того, факторы, вошедшие в линейную модель, могут иметь и неучтенные составляющие, допускающие только нелинейный по параметрам учет [22]. Рассматривая задачу с этих позиций, флюктуацию Ψ можно представить в виде двух составляющих Ψ = ϕ( x , β ) + ~e , где ϕ( x, β ) – аддитивная добавка к исходной модели, отражающая нелинейные по новым параметрам β связи; ~e – погрешность, вызванная неточностью измерений технологических величин, ошибками округления вычислительных -58-
расчетов, наличием иных неучтенных факторов и т.д., которой можно пренебречь. Таким образом, корректно подобрав функцию ϕ( x, β ) , можно существенно расширить возможности по улучшению регрессионной зависимости. При выявлении нелинейных связей трудность заключается в многофакторности и неопределенности структуры функции, аппроксимирующей набор реальных данных. Следует отметить, что при моделировании технологических связей целесообразно учитывать специфику производства продукции, например, многоэтапность обработки полуфабрикатов, выделение из общего числа факторов контролируемых и управляющих и т.д. Для аппроксимации нелинейных составляющих модели можно воспользоваться встречающимися во многих практических задачах технического и экономического характера структурами производственных функций (см., например [34, 57]), преобразованных к виду аддитивных добавок: k ϕ x, β = γ 0 exp ∑ β i x i ; i =1
( )
k
β
ϕ( x , β ) = γ 0 ∏ x i i ; i =1
k β ϕ( x, β ) = γ 0 ∑ β i x i k +1 i =1
βk + 2
; 1
k x β0 β0 ϕ( x, β ) = γ 0 ∑ i , i=1 β i где β = (γ, β) вектор параметров. Таким образом, окончательно модель с введенными в нее аддитивными добавками будет иметь структуру D y = ∑ [ϕ T ( x)βd + ϕd (x, β )] , (2.65) d d =1 где D – число этапов технологической траектории обработки продукта. Для корректного описания вычислительных процедур построения такой модели будем придерживаться следующих понятий, касающихся ее структуры: составляющие модели – структурные единицы одного типа, совокупность которых образует часть модели (например, линейная или нелинейная по параметрам часть); факторные включения – наборы факторов, присутствующих в составляющих модели. -59-
При идентификации (2.65) возникают задачи, связанные с выбором критериев структурных составляющих модели и факторов, в нее входящих. Для решения этих задач можно использовать алгоритм, вычислительные процедуры которого описываются следующей последовательностью. При расчете оценок параметров структурных составляющих и набора факторных включений модели можно использовать рекуррентные методы пошаговой или блочной идентификации, которые описаны в пп.2.2-2.7. При этом, если в какие-либо структурные составляющие вводится лишь один параметр – целесообразно воспользоваться для формирования этих составляющих формулами Гревиля, если число вводимых параметров больше 1 – формулами Клайна. Результатом вычислений алгоритма является модель с оценками параметров ( β€, β€ ), для линейно независимых базисных функций ϕ (i) ( x ) и нелинейных составляющих ϕ( x, β ) .
На каждом шаге алгоритма формируются d-составляющие и факторные включения этих составляющих. При этом расчет параметров на каждом шаге формирования очередной d-составляющей сводится к решению ЗНК, которую в общем виде можно сформулировать так: найти D
2
1 T min 2 ∑ [ϕ d ( x )β d + ϕd ( x, β )] − y . d =1 β∈ℜ p
(2.66)
Поскольку критерии адекватности линейных моделей не пригодны для оценки точности зависимостей нелинейной структуры, то для последних основной (и, по существу, единственной [1]) характеристикой их точности является оценка функции невязки ε/2, вычисляемая по формуле (2.66). Условием присутствия факторов в d-составляющей является выполнение известных критериев корелляционно-регрессионного анализа (например, увеличение коэффициентов корреляции, исключение линейно-зависимых факторов и т.д. [33, 106]), а максимальное число аддитивных добавок определяется предельным убыванием ε/2.
-60-
3. МАТЕМАТИЧЕСКИЕ ОСНОВЫ АДАПТИВНОЙ ОПТИМИЗАЦИИ 3.1. Адаптивная оптимизация структурных моделей В п. 2.1. описана методика структурного моделирования многоэтапных производств, которая в конечном итоге позволяет производственную схему представить в виде ориентированного графа. Рассмотрим ориентированный граф, в общем случае у которого нагружены вершины и дуги множеством некоторых ресурсов. Тогда можно сформулировать общую задачу поиска оптимального пути на таком графе следующим образом. Дан граф, i-я вершина которого нагружена величинами (ресурсами) R ik ( i ∈ [1, n ] , k ∈ [1, m] , где n – количество вершин графа; m – число ресурсов). В i-й вершине имеют место потери продукта ∆Ni , а j-я дуга нагружена соответственно величинами R ijk и ∆N ij , i, j ∈ [1, n ] , k ∈ [1, m] . Длина пути из вершины i в вершину j определяется выражениm ем C ij = ∑ (R ij + R ijk ) × K k , где K k - весовой коэффициент, опредеk =1 ляющий вес k-го ресурса определяется. Остаток продукта в j-ой вершине выражением определяется выражением N j = N i − ∆N j − ∆N ij . Если вершины i и j не соединены дугой, тогда Cij = (∞) .Требуется найти оптимальный путь из начальной вершины в конечную. Обозначим через x ij принадлежность дуги (i, j) пути из исходного пункта в конечный: xij = 1, если дуга (i, j) принадлежит графу; xij = 0, если дуга (i, j) не принадлежит графу. Тогда задача оптимизации на графе является многокритериальной и имеет следующий вид: n n
m
i =1 j=1
k =1
f ( x) = ∑ ∑ C ij x ij + ∑ R nk × K k → min ,
(3.1)
при ограничениях n
n
i =1
j=1
∑ x ik − ∑ x kj = 0 , где k ≠1 и k ≠n.
(3.2)
-61-
Стремление получить оптимальное решение в сетях с циклами, а также оценить альтернативные решения задачи (3.1), (3.2) обусловило необходимость разработки специального алгоритма, позволяющего преодолеть указанные недостатки [97]. Алгоритм включает следующие основные шаги: Шаг 1. Re s i = 0 , MinWayi = 0 , i ∈[1, n] , где tek = 1 , pred 0 = −1 , i = 0 , N −1 = N , где n – количество вершин графа, N – начальное количество продукта. Шаг 2. Определим: • потери продукции N tek = N predi − ∆N predi − ∆N predi ,tek , где N pred – количество продукта, поступившее с предыдущей вершиi ны заданного пути; ∆ N pred – потери продукта на вершине; i
∆N pred i , tek – потери продукта на дуге; N tek – количество продукта,
вышедшее из вершины; • расходы ресурсов R tek, j = R predi , j + ∆R predi , j + ∆R predi ,tek, j , j∈ [1, m] , где m – количество ресурсов; ∆R predi , j – расход j -го ресурса на вершине; ∆R pred i , tek , j – расход j -го ресурса на дуге; R tek, j – расход j -го ресурса на поступившее количество продукта; R predi , j – расход j -го ресурса на предыдущей вершине пути. Шаг 3. Если Restek > то Res tek =
M
M
∑ ((R tek, j + R predi , tek, j ) × K j )
j =1
∑ (( R tek, j + R pred i , tek, j ) × K j )
j =1
или Re s i = 0 ,
и MinWaytek = pred i , иначе
tek = predi , i = i − 1 . Шаг 4. Переход на первую нерассмотренную вершину на пути, в которую можно перейти из вершины tek : а) если таких вершин нет, то tek = predi , i = i − 1 и переход на Шаг 4; б) если predi = −1 , то переход на Шаг 6; в) в остальных случаях переход на Шаг 5. -62-
Шаг 5. i = i + 1 , predi = tek , tek = найденная вершина и переход на Шаг 2. Шаг 6. tek = последняя вершина . Шаг 7. Запомним текущую вершину в оптимальном пути и tek = MinWaytek . Шаг 8. Если tek ≠ последняя вершина переход на Шаг 7. Следует отметить, что критерии оптимизации маршрутов сети могут быть одновременно связаны с затратами временных, материальных, трудовых и прочих ресурсов (Rj, j = 1, …, m) и иметь различные приоритеты. Модель производственной сети представляет собой математическое описание взаимодействия между этапами обработки продукции, характеризующее интеграцию производственного процесса, и должна обладать свойством интерактивности. Поэтому поддерживаются механизмы моделирования процессов обработки единиц продукции (ЕП) при прохождении их по отдельным технологическим фазам. Тогда можно рассматривать производственный процесс как сеть, оптимизация которой, в общем случае, есть развитие задачи отыскания кратчайшего пути в направленной сети, т.е. маршрутов обработки полуфабриката с целью получения продукции с минимальными затратами ресурсов. Структурные модели производственных систем позволяют оценить все возможные маршруты и цепочки обработки ЕП. Однако отдельные цепочки могут содержать несколько технологических агрегатов, определяющих альтернативные маршруты следования продукции на обработку. Алгоритм оптимизации позволяет учитывать и ранжировать возможные варианты производственных схем, поэтому целесообразно определять технологические маршруты исходя из списка оптимизируемых ресурсов и величины их экономической значимости. 3.2. Адаптивные методы определения приоритетов в многокритериальных задачах Большинство практических производственных задач связаны с оптимизацией потребительских свойств выпускаемой продукции. В общем случае обычно решается многокритериальная задача оптимизации модели качества. Найти: (3.3) opt F(λ, s( y(x )) , x ∈Ω где λ ∈ ℜ M – вектор коэффициентов, учитывающий значимость (приоритеты) показателей качества продукции в общей совокупности потре-63-
бительских свойств; s(y(x)) = s(x) – функция нормирования частных критериев y( x ) ∈ ℜ M ; Ω – область допустимых значений факторов x. Однако такие задачи характеризуются значительной размерностью, изменением во времени параметров, структуры и приоритетов частных критериев. Поэтому, как правило, при их решении возникают вопросы, связанные с выбором методов оптимизации и определения весовых коэффициентов λ. Приоритеты частных критериев качества в (3.3) обычно задаются матрицей весов L = [λij] (i = 1, …, m; j = 1, …, M). Известно, что в основе определения λj лежат статистические методы обработки информации. Тогда является приемлемой допущение связи между λj и данными статистического контроля качества продукции, т.е. относительной частотой ее отбраковки по единичным показателям [96]: ωij λ ij = , i = 1, …, m; j = 1, …, M, (3.4) M ∑ ωij j=1
где ωij – количество отбракованной продукции по j-му критерию в i-й партии. Набрав статистику брака на некотором множестве партий продукции, можно использовать известные методы обработки данных для оценивания важности выходных характеристик (например, методы непосредственной оценки, ранжирования и др.). Однако без модификации эти методы не могут быть использованы в адаптивных системах. Рассмотрим интерпретацию методов непосредственной оценки и ранжирования при совместном использовании рекуррентных процедур со статистическим контролем качества. 1. В рекуррентном методе непосредственной оценки предполагается, что для m партий отбракованной продукции коэффициенты < m >(1)
λj
, j = 1, …, M являются усредненными весами относительных час-
тот вычисленных непосредственно по формуле (3.4): m
< m > (1)
λj
< m > (1)
∑ λ ij
= i =1
m
=
m ω< m > 1 ij , j = 1, …, M, ∑ m i =1 J m> < ∑ω j=1
где ω - количество отбракованной продукции в m партиях. -64-
(3.5)
Допустим, что с течением времени дополнительно появилась информация о некачественной продукции в q партиях. Тогда, очевидно, (3.5) преобразуется в рекуррентное соотношение для определения весовых коэффициентов с учетом m + q партий продукции: m
< m + q > (1)
λj
q
∑ λ(1) + ∑
= i =1
i = m +1
< q > (1)
λ ij
=
m+q
< q > m < > m ω m+q ω 1 ij ij ∑ + ∑ = M m + q i 1 J = i = m + 1 < q > ∑ ω ij< m > ∑ ω ij j=1 j=1
или m+q mλ< m > (1) + ∑ ( ω j ij i = m +1 λ<j m + q > (1) = m+q
M
j=1
, j = 1, …, M.
∑ ωij )
(3.6)
2. Для применения рекуррентного метода ранжирования исходную информацию, полученную в результате вычислений по формуле (3.4), необходимо привести к рангам ( €rij ) – числам, характеризующим порядковые номера важности частных критериев. Ранг 1 получает наиболее важный критерий, ранг J наименее важный. При наличии связан-
[
]
ных рангов, когда в строках матрицы Ρ€< m > = ρ€ , i = 1, …, m; j = 1, …, M, имеют место ранги с одинаковыми значениями, то элементы Ρ€< m> преобразуются следующим образом: ρ ij< m > =
l i< m >
∑
s=0
(s + k i< m > ) li< m > ; ρ~ij< m > = M + 1 − ρij< m > ,
(3.7)
i = 1, …, m; j = 1, …, M, где k – минимальное значение позиции связанных рангов для i-й > партии из объема m; l <m – количество элементов в связанных рангах i для i-й партии из объема m. Аналогично, для дополнительных q партий:
li s + k l ; ρ ij = i i s=0
∑
~ = J + 1 − ρ< q > , ρ ij ij
(3.8) -65-
i = m + 1, …, m + q; j = 1, …, M. Введем обозначения блочных матриц Ρ€<m > Ρ < m> ~ Ρ < m> <m+q> ~ < m +q > < + > m q € Ρ =−− −,Ρ = −−−,Ρ =−−−, ~ < > < > < > q q q Ρ€ Ρ Ρ
[
]
[
]
[
]
~ где Ρ€<m> = ρ€ , Ρ <m> = ρ , Ρ <m> = ρ~ij<m> , i = 1, …, m; j = 1, …, M, ~ ~ , i = m + 1, …, m + q; j = 1, …, M. Ρ€ = ρ€ij , Ρ = ρij , Ρ = ρ ij Вычислим суммы преобразованных рангов m
m+q
i=1
i= m+1
~ < m +q > = ρ ρ ∑ ~ij<m> + j
∑
~ , j = 1, …, M, которые будут пропорциоρ ij
нальны весовым коэффициентам M
λ<j m + q >( 2 ) = ~ ρ <j m +q > m+q
M
∑ ~ρ <j m > + ∑
j=1 = M M
∑ ∑ ~ρ <j m > + j=1 j=1
=
j=1
~ ρ ij
i = m +1 M m+q
∑ ∑
j=1i = m +1
(3.9) , j = 1,..., M.
~ ρ ij
m
Учитывая, что
< m +q >
∑ ρ~ j
~ < m> = ρ ρ ∑ ~ij<m> и j i=1
~<m> λ<j m >( 2 ) = ρ j
M
∑ ρ~ <j m> , j=1
j = 1, …, M из (3.9) получим рекуррентное соотношение M
λ<j m +q >( 2) =
~ < m> + λ<j m>( 2) ∑ ρ j M
∑
j=1
( λ<j m>( 2)
j=1 M
m +q
∑
i = m+1 M m+q
∑ ρ~ <j m> ) + ∑ j=1
~ ρ ij
∑
j=1 i = m +1
,
(3.10)
~ ρ ij
j = 1, …, M. Обычно, определив различными методами λ, используют усредP
ненные оценки, λ j = ∑ λ(jp) P , j = 1,..., M , где P – число методов. Тогда p =1
в результате получим -66-
m +q M mλ<m >(1) + ∑ ( ω ∑ ω ) j ij ij i =m +1 j=1 + m+q < m +q > 1 M m + q λj = , j = 1, …, M. (3.11) < m > ( 2 ) < q > < m > ~ ~ 2 λj ∑ ρ j + ∑ ρij j=1 i = m +1 + M M M m+q < m >( 2 ) < m> ~ ~ ∑ ρ j ) + ∑ ∑ ρij ∑ (λ j j=1 j=1i = m +1 j=1
При использовании для определения приоритетов производственной информации о свойствах продукции не исключена возможность появления брака из-за случайных нарушений технологии. Такие ситуации не являются закономерными, поэтому их следует “сглаживать” при расчете весовых коэффициентов. Известно, что мерой стабильной зависимости технологии и свойств может служить коэффициент конкордации Кендэла [55]: M m
∑ ( ∑ ρ ij − m (M + 1) / 2) 2
W=
j=1 i =1
m
,
(3.12)
(1 / 12) m (M − M ) − m ∑ Ti 2
3
i =1
где Ti =
Gi
1 ∑ ( t 3 − t ig ) , i = 1, …, m – поправочный коэффициент, учиты12 g =1 ig
вающий число связанных рангов tig в g-й группе неразличимых рангов в i-й ранжировке; Gi – число групп неразличимых рангов в i-й ранжировке. Ρ€ < m> < m + q > € Учитывая, что Ρ = − − − и специфику блочного оценива< q > € Ρ
ния производственной информации о свойствах продукции, (3.12) можно записать в виде рекуррентного соотношения для коэффициента конкордации: M
W<m+q> =
m
m+q
∑ { ∑ [ρ ij + ∑ ρ ij ] − [( m + q ) ( M + 1)] / 2}2
j =1 i = 1
i = m +1
(1 / 12 ) ( m + q ) 2 ( M 3 − M ) − ( m + q ) (
m
m+q
i =1
i = m +1
.
(3.13)
∑ Ti + ∑ Ti ) -67-
Тогда (3.13) можно использовать при оценке качественных показателей новой партии продукции на предмет корректировки весовых коэффициентов λ. Таким образом, для объективного оценивания приоритетов показателей свойств продукции целесообразно использовать данные статистического контроля качества, а применение рекуррентных процедур в методах их обработки способствует решению задачи адаптивной корректировки весовых коэффициентов. Такой подход, в отличие от экспертного оценивания, позволяет создавать автоматизированные системы управления качеством продукции с непрерывными информационными потоками. 3.3. Адаптивные алгоритмы решения многокритериальных задач При реализации математического обеспечения в автоматизированных системах предприятий возникает проблема поддержания актуальности как параметров моделей s(x) в задаче (3.3), так и ее решений с течением времени. Эта проблема разрешима, если использовать адаптивные алгоритмы. Далее в данном пункте рассматривается возможность применения адаптивных процедур для получения решений задачи (3.3) адаптации этих решений при изменении производственных условий с течением времени [15]. Часто в производственных задачах в качестве F(s(x), λ) используется взвешенный квадратичный функционал (см., например, [67, 71]) М F[λ, s(x)] = ∑ λ2 j [s *j − s j ( x )] 2 (3.14) j=1 ( s *j – задаваемое нормированное значение j-го свойства продукции), минимизация которого, по сути, представляет задачу о наименьших квадратах. Во многих случаях управление качеством продукции с использованием математических моделей можно свести к решению следующей системы уравнений: λj( s j ( x ) + x n + j − s*j ) = 0, j = 1, …, k ; (3.15) λj ( s j (x ) − x n + j − s*j ) = 0, j = k + 1, …, l ; (3.16) λj (sj (x) − s*j ) = 0, j = l + 1, …, M; (3.17) -68-
где x n + j ≥ 0 , j = 1, …, M – дополнительные переменные. Эта система может отражать как диапазонные характеристики качества, определенные уравнениями (3.15) и (3.16), так и точечные их значения (3.17). В случае (3.15), (3.16) s*j обуславливает граничные значения требуемого диапазона свойств. Как было отмечено выше, система (3.15)-(3.17) может включать нелинейные относительно параметров функции s j ( x ) . Тогда (3.67) следует свести к НЗНК: найти 1 2 1 R (x) = R (x)T R (x) , 2 2 * λ (s ( x ) + x n +1 − s1 ) 1 1 ............................... * λ k (s k ( x ) + x n + k − s k ) r1 ( x ) * λ k + 1 (s k + 1 ( x ) − x n + k + 1 − s k + 1 ) r (x) . = .............................. R(x) = 2 ...... *) λ (s ( x ) − x s − n+l l l l rМ ( x ) λ (s ( x ) − s* ) l +1 l +1 l +1 .............................. * λ M (s M ( x ) − s M )
min
где
(3.18)
Это дает возможность применить для решения задачи (3.18) нелинейные итерационные методы наименьших квадратов, которые в соответствующих обозначениях будут аналогичны методам для расчета и адаптации параметров моделей. Таким образом, все описанные ниже алгоритмы решения задачи (3.18) основаны на аппроксимации функции R(x) в текущей точки xc ее аффинной моделью Mc(x) = R(xc) + J(xc)(x – xc) = R(xc) + J(xc)∆x и соответствующей замене НЗНК на линейную задачу вида: найти 2 1 2 1 M c ( x ) = R (x c ) + J (x c )∆x = ε c / 2 . min 2 2 Опуская промежуточные преобразования формул, которые аналогичны формулам параметрической идентификации получим адаптивные алгоритмы получения спектра решений задачи (3.3).
-69-
1. Демпфированный блочный рекуррентно-итерационный алгоритм Ньютона-Гаусса использует итерационную формулу: x+ = xc + αс ∆x, (3.19) где x+ – следующая точка итерационного процесса, полученная по оценке xc; ε c = R (x c ) + J( x c )∆x 2 – невязка уравнения J( x c )∆x = −R ( x c ) ; αс – шаг линейного поиска минимума невязки ε c вдоль направления ∆x. Здесь J – матрица Якоби вектор-функции R = (r1, …, rM). Следует отметить, что как основные xi, i = 1, …, n переменные, так и дополнительные xi, i = n + 1, …, n + l могут иметь ограничения на допустимые интервалы значений или быть ограничены односторонне. В этом случае при итерационных вычислениях обычно предусматриваются специальные процедуры, обеспечивающие контроль и выполнение этих условий (например, циклическое уменьшение значений αс на некоторую величину до исключения нарушений установленных ограничений). Решая, таким образом, задачу (3.18) получим оценочные значения x* – технологических факторов, при которых с некоторой вероятностью обеспечивается s*. Предположим, что у q моделей из числа (3.15)-(3.17) изменились структура и/или их параметры или добавились новые модели, описывающие прежние или другие свойства продукции. Таким образом, число координат вектор-функции R увеличилось на q, так что
R < M+q >
T r1 ∇ r1 <M > R . . . . . . r T = M = − − − , J < M+q > = ∇ rM − − − − − − r T M + 1 R ∇ rM + 1 . . . . . . rM + q T ∇
rM + q
J < M > = − − − . J
Очевидно, что эти изменения требуют корректировки x*. Тогда, используя псевдообратную матрицу J+ к матрице J, получим соотношения, определяющие блочные рекуррентно-итерационные процедуры в (3.19), для адаптации решения x* к изменившимся условиям задачи (3.18): x <+M + q > = x + α c ∆x < M + q > ,
[
]
где ∆x < M+q > = ∆x <M> − L<M+q> R (x ) + J (x )∆x <M> , (3.20)
-70-
[
]
L< M +q > = C < M +q > + + I − C < M +q > + ⋅ J ( x ) J < M > + ( x ) ×
[
]
[
]
T × J ( x ) ⋅ J < M > + ( x ) ⋅ K < M+ q> ⋅ I − C < M + q> ⋅ C < M +q > + ,
C < M + q > = J < q > ( x c< M > ) ⋅ I − J < M > + ( x c< M > ) ⋅ J < M > ( x c< M > ) ,
K
<M+q>
[(
)
I + I − C < M +q > C < M + q > + J ( x < M > ) J < M > + ( x < M > ) c c = T < + > < + > + < > < > < > + < M q M q q M M M × I − C C J (x c )J c (x c >
[(
)
]
]× −1 ,
> – обозначение точки x , отвечающее M исходным моделям; здесь x <M c c
x <+M + q > – обозначение точки x+, отвечающее M исходным и q дополни-
тельным моделям. В основе соотношения (3.20) лежат транспонированные формулы Клайна для псевдообращения блочных матриц. Следует отметить, что в частном случае, когда q = 1 вместо формулы (3.20) для решения задачи (3.18) можно воспользоваться рекуррентной формулой Гревиля. Тогда x <+M +1> = x + α c ∆x < M +1> ,
(
)
∆x < M +1> = ∆x < M > − l < M + 1> rM +1 ( x c< M > ) + ∇ T rM + 1 ( x )∆x < M > , 2 < M +1>+ = c < M+1>T c <M +1> , если c < M> c < M +1> = ∇ T r ) I − J < M> + ( x )J < M> ( x ) ≠ 0; M +1 ( x c l < M +1> = в остальных случаях T J < M> + ( x ) J <M >+ (x c< M> ) ∇rM +1 (x c<M > ) k < M +1> , 2 где k <M +1> = 1 + ∇ T r ( x c<M > )J < M> + ( x ) . M + 1
(
)
2. Блочный рекуррентно-итерационный метод Ньютона использует итерационную прцедуру:
{
x + < M > = x c < M > + ∆x < M > ,
∆x < M > = − S < M > ( x c < M > ) + J < M >T ( x c < M > ) J < M > ( x c < M > ) × J < M >T ( x c < M > ) R < M > ( x c < M > ),
}−1 × -71-
где S<M> - матрица обозначает информацию о производных второго поM
рядка: S < M > =
∑ ru ⋅ ∇ 2 ru ∈ ℜ n×n .
u =1
При увеличении числа компонент вектор-функции R <M > на q следующая точка x <+M + q > определяется в виде x <+M +q > = x c < M > + ∆x < M + q > ,
{
}−1 ×
∆x <M+q> = − S<M+q> (x c <M> ) + J <M+q>T (x c<M> )J <M+q> (x c <M> ) × J <M+q>T (x c <M> )R <M+q> (x c <M> )
или M+q
∆x
= ∆x
M
M T M M (x c M ) + J ( x c M )J (x c M ) − S
(q ) T ( x M ) J (q ) ( x (q ) (x c M ) + J I + S c c × × S M ( x c M ) + J M T ( x c M ) J M ( x c M J × +
(q ) T ( x
M ) ×
) −1
−1
×
−1
×
(3.21)
M ) R (q ) ( x M ) + c
( ( q) T q) M . (q ) M M M (x c )+J (x c )J (x c ) ⋅ ∆x S
3.
c
Блочные
рекуррентно-итерационные
квазиньютоновские
методы (методы секущих) используют аппроксимацию S M
рицей секущих A c M
рует ∇ 2 ru ( x c
=
M
M M ∑ ru (x c ) ⋅ (H u ) c (где
u =1
M
(H u
M
M
(x c
) мат-
) c аппроксими-
) ) и итерационную формулу: x+
M
= xc
M
+ ∆x
M
−1
,
M MT M MT M = −A c + J ( x c M )J ( x c M ) J ( x c M )R ( x c M ). Тогда блочная рекуррентно-итерационная процедура квазиньютоновских методов запишется в виде:
∆x
M
-72-
∆x
M +q
= ∆x
M
M M T M − A c +J ( x c M )J (x c M )
(q) (q ) T ( x M ) J (q ) ( x M ) × I + A c +J c c × −1 M M T M +J ( x c M )J (x c M ) × A c J × +
(q ) T ( x
× J
(3.22)
×
M ) R (q ) ( x M ) + c
. (q) ( ( ) q) T q m +J ( x c M )J (x c M ) ⋅ ∆x A c c
x+ M
×
−1
4. Блочный рекуррентно-итерационный Маркварта использует итерационную формулу:
∆x
−1
= xc
M
M
+ ∆x
M
метод
Левенберга-
, −1
MT M (q) T M (q) = − µcI + J (xc M )J (xc M ) + J (xc )J (xc M ) ×
MT
(xc M )R
M
(xc M ) + J
(q) T(x
c
M )R (q) (x M ), c
где μс – параметр регуляризации. Тогда блочная рекуррентно-итерационная процедура метода Левенберга-Маркварта решения НЗНК запишется в виде следующего
выражения ∆x M +q через ∆x ∆x
M +q
= ∆x
M
M
:
µ I + J M T ( x M ) × c c − M × J (x c M )
−1
J
(q ) T ( x
−1 (q ) ( x M ) µ c I + I J + c M T M × ( x c M )J ( x c M ) + J × J (q ) T ( x M ) c ( (q ) ( x M ) ∆x M . q) M × R (x c )+J c c
×
c
M
)×
−1
×
(3.23)
Использование при решении задач оптимизации системы различных методов обусловлено разнообразием возможных структур, составляющих модели качества. Каждый рекуррентно-итерационный метод, несмотря на свою универсальность, предпочтителен для определенного -73-
круга задач. В [40] приводятся сравнительные характеристики и свойства локальной сходимости алгоритмов в классических вариантах (без рекуррентных процедур). Считается, что метод Ньютона обладает высокой локальной скоростью сходимости на почти всех задачах, тогда как демпфированный метод Ньютона-Гаусса и метод Левенберга-Маркварта могут медленно сходиться при сильно нелинейной функции R(x). Причина, по которой в НЗНК редко применяется метод Ньютона, состоит в том, что, как правило, отсутствует возможность за оправданную цену получить матрицу S( x c ) в выражении J T ( x c )J (x c ) + S(x c ) в аналитическом виде. В квазиньютоновских методах S( x c ) аппроксимируется матрицей секущих Ac, которая при выполнении итераций накапливает информацию о вторых производных целевой функции. В целом методы секущих несколько медленнее работают, чем метод Ньютона, а на задачах со средней и большой невязкой точнее методов Ньютона-Гаусса и Левенберга-Маркварта. Однако на начальном этапе решения НЗНК, когда в аппроксимирующей матрице Ac информация о вторых производных отсутствует, применение квазиньютоновских методов не эффективно. Поэтому адаптивное моделирование приводит к тому, что на начальных стадиях вычислений используются шаги метода Ньютона-Гаусса или Левенберга-Маркварта до тех пор, пока Ac не накопит достаточное количество полезной информации о вторых производных, а затем происходит переключение к более сложным алгоритмам. Взаимодействие рекуррентно-итерационных методов обеспечивается взаимозаменяемостью отдельных процедур на уровнях I-III модельной схемы (рис. 3.1). Поэтому актуальна задача компоновки эффективного алгоритма оптимизации из спектра процедур возможных стратегий модельной схемы для решения конкретной производственной проблемы [98]. 3.4. Статистические оценки точности оптимальных решений Задача оптимизации качества и управления технологией предполагает прогноз потребительских свойств на основе статистических моделей. В соответствии с принятой в данном разделе методикой необходимо определить критерии этого прогноза, с помощью которых можно с достаточной вероятностью оценить возможность получения продукции заданного качества на любом этапе ее производства. Важной особенностью задачи (3.14) является наличие случайной природы, которая характеризуется некоторым параметром ω . Тогда значения F[λ, s(x)] при каждом x зависят от реализации ω , и постановка задачи стохастической оптимизации формулируется в виде: найти минимум -74-
Определение начального состава моделей, М
Определение начального приближения
I Метод Ньютона
МетодDFP
Метод BFGS
Метод НьютонаГаусса
Метод Левенберга Маркварта
II Численное дифференцирование
Аналитическое вычисление производных
Определение дополнительного состава моделей, М+ q
III Рекурентноитерационный метод Ньютона
Рекурентноитерационный метод DFP
Рекурентноитерационный метод BFGS
Рекурентноитерационный метод Ньютона-Гаусса
Рекурентноитерационный метод Левенберга-Маркварта
Рис. 3.1. Схема взаимодействия оптимизационных методов
-75-
математического ожидания F[λ, s(x), ω]. По внешнему виду такая постановка, очевидно, напоминает обычную задачу математического программирования при F[λ, s(x)] = MF[λ, s(x), ω]. Но это лишь внешнее сходство: в основной задаче стохастического программирования, как правило, не выполняется основная предпосылка теории детерминированного математического программирования – при каждой технологической ситуации невозможно определить точные значения откликов по моделям Ms(x). Доступной является информация не о значениях Ms(x), а о значениях функций s(x, ω) для отдельных ω, поэтому основная трудность состоит в том, чтобы решить задачу (3.14), не зная Ms(x), а пользуясь s(x, ω). В тех случаях, когда удается найти Ms(x, ω), задача стохастического программирования ничем не отличается от задач детерминированного программирования, ее стохастическая природа проявляется только на этапе поиска функций Ms(x, ω). Если не удается найти Ms(x, ω), то можно рассматривать вместо Ms(x, ω) функции s(x, ω ), где ω – среднее значение ω: Ms(x, ω) ≈ s(x, ω ), ω = Mω. Это весьма распространенный прием, при помощи которого можно решать множество стохастических задач хорошо отработанными и программно реализованными алгоритмами писка экстремальной точки, а само решение следует дополнять оценками его точности. В данном случае необходимо получить интервальные значения характеристик свойств продукции y* при оптимальных (фиксированных) значениях факторов x* ∈ ℜ n [66, 65]. Методика определения доверительных интервалов решения задачи (3.14) базируется на учете структуры частных критериев модели качества и в соответствующих обозначениях может применяться для оценки точности прогноза откликов как по линейным, так и нелинейным по парамерам зависимостям. Пусть модель линейна относительно параметров β, т.е. ϕ(x;β) = ϕT(x)β , ϕ = ϕ(x ) . Величины ϕ1 , ..., ϕ n могут быть любыми, но
удовлетворяющими условию L ≠ 0 [59] (определение L дано далее), которое означает, что m точек ( ϕ1ν , ..., ϕ nν ), ν = 1, …, m не могут лежать в одной гиперплоскости k-мерного пространства переменных ϕ. Пусть задана выборка объема m, состоящая из независимо наблюдаемых точек ( y ν , ϕ1ν ,..., ϕ nν ), ν = 1, …, m. Рассматривая y как ϕ0, обозначим
-76-
m
1 ∑ ( y v − y)(ϕ jv − ϕ j ), j = 1,..., n m v =1
(2.24 a)
1 m ∑ (ϕ jv − ϕ j )(ϕiv − ϕi ), i, j = 1,..., n , m v =1
(2.24 b)
l0 j =
и, как обычно, lij =
– ковариации факторов и отклика.
l11 ... l1k Обозначим через L определитель из lij : L = ... ... ... . l k1 ... l kk Через Lij обозначим алгебраические дополнения элементов определителя L. Основным предположением (как уже отмечалось) является L ≠ 0. Пусть случайная величина y при любых фиксированных значениях ϕj имеет нормальное распределение со средним значением M ( y) = β 0 +
n
∑ β i (ϕ i − ϕ i ) = y€
(3.25)
i =1
и со среднеквадратическим (стандартным) отклонением σ. Известно, что в этом случае оценками коэффициентов регрессии будут n
1 (3.26) β€0 = y, β€i = ∑ l 0 jL ij , i = 1,..., n. L j =1 Всюду в дальнейшем p обозначает заданную величину доверитель-
ной вероятности q = (1 − p ) / 2 , ν = m − n – число степеней свободы, t q (ν ) – значение 100q%-ной точки распределения Стьюдента с ν степенями свободы (см., например, [59, табл. II.6]); σ€ 2 – оценка для дисперсии регрессионных остатков σ€ 2 =
m
1 ∑ [y u − y€u ]2 , σ€ = σ€2 (остаточная дисперсия). ν u =1
Теперь уже есть возможность представить расчет оценок при имеющейся модели: 1) доверительные интервалы для вектора β – параметров (коэффициентов) регрессии: β j = β€ j ± t q ( ν)σ€ (T T T) −jj1 ,
(3.27)
где T = [ ϕuj ] = [ ϕ j (x u ) ], j = 1, …, n, u = 1, …, m;
-77-
2) доверительные интервалы для средних значений отклика в оптимальной точке ϕ*: y* = y€*. ± t q (ν)σ€ v , (3.28) где v = ϕ T* (T T T ) −1 ϕ* ; 3) доверительные интервалы для собственно оптимальных значений отклика в точке ϕ*: y * = y€*. ± t q (ν)σ€ 1 + v
(3.29)
или n
β€0 + ∑ β€i (ϕ *i − ϕ i ) ± t q ( ν ) i =1
n L ji
σ€ m − n −1
× 1+ ∑
L j,i
(ϕ *j − ϕ j )(ϕ *i − ϕ i ) ;
4) математическое ожидание индивидуального значения y* в фиксированной точке ϕ* получается непосредственной подстановкой в уравнение n
y*. = β€0 + ∑ β€i (ϕ*i − ϕi ) .
(3.30)
i =1
( )
Почти во всех этих формулах фигурирует матрица T T T
−1
, назы-
ваемая, как известно, информационной. Ковариационная матрица вектора оценок параметров регрессии представляется в виде
()
( )
C β€ = σ€ 2 T T T
−1
= [l ji ] , а ее диагональные элементы определяют дис-
персии оценок параметров регрессии.
()
Для получения выражения матрицы C β€ в случае нелинейной регрессии, аналогично указанному выше в линейном случае, воспользуемся аффинной аппроксимацией избранной модели в окрестности β = β€ :
( ) ( )( )
y(x; β) ≈ y x; β€ + j T x; β€ β − β€ , где
( )
( )
( )
( )
∂y x; β€ ∂y x; β€ jT x; β€ = ∇ T y x; β€ = ... ∂β n ∂β1
( )
– значение градиента функции y(x; β) в точке x; β€ .
-78-
(3.31)
(3.32)
(
)
(
)
j T x 1 ; β€ ... Введем матрицу J β€ = размера m × n , составленную j T x ; β€ m
()
()
из градиентов (3.32). Именно значения матрицы J β€
() (
)
и вектора
j β€ = j x ; β€ играют существенную роль в оценке точности оптимального значения отклика. Пусть p, q, ν, t q (ν), σ€ определены так же, как выше. Тогда в слу*
*
чае нелинейной регрессии оценки рассчитываются следующим образом: 1) доверительные интервалы для вектора параметров регрессии β i = β€ i ± t q (ν )σ€
(J T (β€)J (β€))ii− 1 ;
(3.33)
2) доверительные интервалы для средних значений отклика в оптимальной точке
( )( ( ) ( ))
()
−1 * y * = y€*. ± t q (ν )σ€ j* T β€ J T β€ J β€ j β€ ;
(3.34)
3) доверительные интервалы для собственно оптимальных значений отклика в оптимальной точке x*
( )( ( ) ( ))
()
−1 * y * = y€*. ± t q (ν )σ€ 1 + j*T β€ J T β€ J β€ j β€ ;
(3.35) *
4) математическое ожидание индивидуального значения y в фиксированной точке x* получается непосредственной подстановкой в уравнение y€* = y x * ; β€ . (3.36) .
( )
Таким образом, доверительные интервалы в случае нелинейной регрессии получены из доверительных интервалов для случая линейной регрессии путем замены матрицы T на матрицу J β€ , а вектора ϕ* на вектор j* β€ .
()
()
Теперь задача статистического оценивания оптимальных значений технологических параметров решается следующим образом: тем или иным методом оптимизации находится экстремальная точка ( x1* , ..., x *n ), в которой функция цели достигает экстремума. Затем находятся статистические характеристики значения функции цели в этой точке. -79-
Следует отметить два главных отличия нелинейного случая от линейного с точки зрения статистической оценки точности [1]. Во-первых, используемые для построения доверительных интервалов статистические свойства состоятельных оценок β€ по методу наименьших квадратов (несмещенность, эффективность и др.) справедливы лишь в асимптотическом смысле (m → ∞ ) . Во-вторых, следует учитывать приближенный характер аффинной аппроксимации. Поэтому, хотя и возможны различные уточнения изложенного подхода, вряд ли они существенно улучшат использованные практические рекомендации: ведь даже предлагаемые в ряде работ полученные теоретически точные доверительные интервалы на практике обычно оказываются приближенными, зависят от соблюдения в реальных условиях предпосылок регрессионного анализа. Поэтому, утверждая, что интересующая нас погрешность не превзойдет определенной величины с заданной доверительной вероятностью, следует отдавать себе отчет в приближенном характере подобных заключений.
-80-
4. АДАПТАЦИЯ И ОПТИМИЗАЦИЯ МОДЕЛЕЙ МЕТАЛЛУРГИЧЕСКОГО ПРОИЗВОДСТВА 4.1. Объектно-структурное моделирование металлургического производства Представим металлургическое предприятие в виде иерархической модели производственной системы (рис. 4.1). Иерархия предприятия построена на основе объектно-ориентированной детализации, которая позволяет рассмотреть его логическую структуру с выделением классов и объектов (см. п. 2.1), отражающих абстрактную модель предприятия. Использование такого представления существенно упрощает объединение в единые структурные модели отдельно взятые агрегаты и механизмы, отделения агрегатов, группы отделений и цехов, разные производства, которые фактически располагаются на разных уровнях иерархии. Например, на рис. 4.2 показан фрагмент иерархической модели металлургического предприятия, на основе которой можно получить иерархическую структуру классов для описания объектной модели производства горячекатаного листового проката (рис. 4.3). Степень детализации рассматриваемых производств соответствует уровню, необходимому для отслеживания обрабатываемой продукции по технологическим этапам обработки. С использованием объектного подхода (см. п. 2.1), эта степень может быть увеличена для рассмотрения отдельных операций обработки. Например, на рис. 4.4 чистовая группа клетей стана горячей прокатки рассматривается с детализацией до уровня отдельной клети. Аналогично, для пятиклетьевого стана холодной прокатки листопрокатного производства (рис. 4.5) может быть получена такая же детализация (рис. 4.6). На рис. 4.7, 4.8 показаны графы соответствующих технологических процессов производств горячего и холодного проката (см. рис. 4.4, 4.5). Ориентированным графам технологических процессов (см. рис. 4.7, 4.8) соответствуют матрицы инцидентностей представленные в табл. 4.1, 4.2. Следует отметить, что в схемах производств горячего и холодного проката введены фиктивные агрегаты, определяющие локальные обратные связи производств (помеченные как «На переработку»). Кроме того, если рассмотреть подробную схему производства горячего проката (см. рис. 4.4), можно видеть, что глобальные обратные связи присутствуют практически на всех этапах прокатываемого изделия, которые соединяют объекты разных производств (горячего проката и копрового цеха). -81-
1. Машиностроительное предприятие
. . .
. . .
. . .
2.1. Доменное производство
. . .
. . .
. . .
. . .
2.k.3.1. Черновая группа клетей
. . .
. . .
. . .
2.k.3. Прокатное отделение
. . .
2.k.3.2.Промежуточный рольган
. . .
. . .
. . .
. . .
2.k.3.3. Летучие ножницы
. . .
. . .
Схема отделения
. . .
2.k.3.1.5. Клеть №5
Рис. 4.1. Иерархия представления производств
-82-
Схема производства
. . .
2.k.3.3. Группа моталок
. . .
Схема предприятия
. . .
2.k.4. Склад рулонов
. . .
. . .
Схема отраслей
2.m. Листопрокатное производство
. . .
. . .
. . .
2.k.3.1.1. Клеть №1
2.k. Производство горячего проката
2.k.2. Отделение методических печей
. . .
n. Химическое предприятие
. . .
. . .
. . .
2.k.1. Склад слябов
. . .
2. Металлургическое предприятие
Схема агрегата
Металлургическое предприятие
Схема предприятия
……… ………
Кислородноконвертерное производство
……… ………
Склад слябов
Производство горячего проката
Листопрокатное производство
Схема производства
Отделение методических печей
……… ………
Прокатное отделение
……… ………
……… ………
Склад рулонов
……… ………
Рис. 4.2. Дерево металлургического предприятия
С К Л А Д Ы
Таблица 4.1 Матрица инцидентностей графа производства горячего проката АГРЕГАТЫ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 -1 2 -1 -1 -1 -1 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 3 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 8 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 1 10 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 0 11 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 0 12 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 0 13 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 0 14 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 0 15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 0 0 16 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 1 17 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 0 18 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 19 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 0 1 -83-
С К Л А Д Ы
1 2 3 4 5 6 7 8
Таблица 4.2 Матрица инцидентностей графа листопрокатного производства АГРЕГАТЫ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 -1 -1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 -1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 ±1 0 0 0 -1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 -1 0 0 0 0 0 -1 -1 0 0 1 1 1 1 1 1 1 1 1 1 0 1 0 0 0 0 0 0 -1 -1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 -1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 -1 -1 0 0 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 0 1
На графе структурной модели методом оптимизации маршрутов производственной сети (см. п. 3.1) можно получить множество технологических траекторий. Рассмотрим в качестве примера процесс моделирования сети производства холоднокатаной листовой стали марки 08Ю, когда оптимизируемыми величинами являются временные и энергетические затраты (электроэнергии и газа) на производство металла. Исходя из норм расхода и стоимости рассматриваемых ресурсов на производство продукции, можно определить их весовые коэффициенты в (4.1), приведенные к денежным выражениям. Таким образом получены следующие величины: у.е. K1 = 0,003 – коэффициент определяющий вес ресурса вресек мени в функции цели (3.1); у.е. K2 = 0,02 – коэффициент определяющий вес электрокВт.час энергии в функции цели (3.1); у.е. K3 = 0,13 – коэффициент определяющий вес условного топкг лива в функции цели (3.1). Математическая модель сети производства холоднокатаной стали является частным случаем (3.1), (3.2), где R ijk = 0 и ∆N ij = 0 ( i, j ∈ [1, n ] , k ∈ [1, m ] ), т.е. в составляющих модели и алгоритма оптимизации циклических сетей будут отсутствовать затраты ресурсов и потери продукта вне агрегатов и складов. -84-
Рис. 4.3. Иерархия абстрактных классов производства горячего проката -85-
Выплавка и переплавка КОПРОВЫЙ ЦЕХ
ККЦ
МП-1
МП-2
S1
МП-3
S2
К Л 1
МП-4
К Л S3
2
К Л S4
3
К Л S5
4
К Л S6
5
Черновая группа клетей КЛ1 – КЛ5
ПР S7
ЛН S8
К Л
ОЛ S9
S10
7
К Л S11
8
К Л S12
9
К Л S13
К Л
К Л
10 S14 11 S15 12
ДУ S16
ОР S17
S18
М О Т А Л К И
S19
Чистовая группа клетей КЛ7 – КЛ12
МП-5
На переработку
Рис.4.4. Структурная модель производства горячего проката: МП1-МП5 – методические печи №№1-5; КЛ1-КЛ5 – последовательно идущие клети №№1-5 черновой группы; ПР – промежуточный рольганг; ЛН – летучие ножницы; ОЛ – окалиноломатель; КЛ7-КЛ12 – последовательно идущие клети №№ 7-12 чистовой группы; ДУ – душирующее устройство; ОР – отводящий рольганг; S1, S19 – склады продукции; S2-S18 – состояние продукции
-86-
Выплавка, горячая прокатка и переплавка КОПРОВЫЙ ЦЕХ
ККЦ
ЭСПЦ
ДР-1
АР-2
ОКП
ЛПЦ-1
S4
S6 АР-3
ЛПЦ-3
ДР-2
ЛПЦ-5
АР-6 На переработку
НТА-1 S1
S8 S2
5 КЛ СТАН
АР-4 S3 АР-5
НТА-2
АНО S5
АПП
S7
АР-7 АР-8
АГЦ
АР-9 АР-10
Рис. 4.5. Структурная модель листопрокатного производства -87-
Выплавка, горячая прокатка и переплавка КОПРОВЫЙ ЦЕХ
ККЦ
ЭСПЦ
ЛПЦ-1
ЛПЦ-3
ЛПЦ-5
НТА-1 S1
S2
НТА-2
Р А З М А Т Ы В А Т Е Л И
S3
К Л Е Т Ь
К Л Е Т Ь
К Л Е Т Ь
К Л Е Т Ь
К Л Е Т Ь
1
2
3
4
5
S4
S5
S6
S7
М О Т А Л К И S9 S8
Рис. 4.6. Структурная модель холодной прокатки на пятиклетьевом стане -88-
A24
A1
A2
S1
A3
A6
A7
A8
A9
A 10
S2 S3
S4
S5
S6
A 11 S7
A 12 S8
A 14
A 13 S9
S10
A 15 S11
A 16 S12
A 17 S13
A 19
A 18 S14
S15
A 20 S16
A 22
A 21 S17
S19
S18
A4
A5
A23
Рис. 4.7. Граф технологического процесса производства горячего проката: A1-A24 – агрегаты; S1-S19 – склады
-89-
A20 A7 A4
S4
A10 S6 A11
A8 A12 A19 S8
A1 S1
S2
A3
A13 S3 A14 A5
A2
S5
A9
S7
A15 A16
A6
A17 A18
Рис. 4.8. Граф технологического процесса листопрокатного производства: A1-A20 – агрегаты; S1-S8 – склады
-90-
Рассмотрим несколько альтернативных технологических маршрутов производства холоднокатаной стали В = 1222 мм, Н0 = 3,5 мм, НВЫХ = 1,1 мм, М = 25,7 т, результаты которых представлены в табл. 4.3-4.6, где конечной продукцией являются холоднокатаные листы. Результаты оптимизации маршрутов производства холоднокатаных полос представлены в приложении 1 (табл. П 1-П 4). Таблица 4.3 Оптимизация маршрутов производства холоднокатаных листов по времени без учета затрат на доставку к технологическим агрегатам. ПриДлительность Технологический маршрут оритет обработки (сек/т) Назначение на АНО 1 S1-А2-S2-А3-S3-A5-S5-А10-S8 116,8 2 S1-А2-S2-А3-S3-A5-S5-А12-S8 117,3 3 S1-А2-S2-А3-S3-A5-S5-А11-S8 117,4 4 S1-А1-S2-А3-S3-A5-S5-А10-S8 118,8 5 S1-А1-S2-А3-S3-A5-S5-А12-S8 119,3 6 S1-А1-S2-А3-S3-A5-S5-А11-S8 119,4 Назначение в отделение колпаковых печей 7 S1-А2-S2-А3-S3-А4-S4-А8-S6-А10-S8 667,5 8 S1-А2-S2-А3-S3-А4-S4-А8-S6-А12-S8 668 9 S1-А2-S2-А3-S3-А4-S4-А8-S6-А11-S8 668,1 10 S1-А2-S2-А3-S3-А4-S4-А7-S6-А10-S8 668,3 11 S1-А2-S2-А3-S3-А4-S4-А7-S6-А12-S8 668,4 12 S1-A2-S2-A3-S3-A4-S4-A7-S6-A11-S8 668,8 13 S1-A1-S2-A3-S3-A4-S4-A8-S6-A10-S8 669,5 14 S1-A1-S2-A3-S3-A4-S4-A8-S5-A12-S8 669,8 15 S1-A1-S2-A3-S3-A4-S4-A8-S5-A11-S8 670 16 S1-A1-S2-A3-S3-A4-S4-A7-S5-A10-S8 670,1 17 S1-A1-S2-A3-S3-A4-S4-A7-S5-A12-S8 670,3 18 S1-A1-S2-A3-S3-A4-S4-A7-S5-A11-S8 670,4 Таблица 4.4 Оптимизация маршрутов производства холоднокатаных листов по потреблению электроэнергии Затраты на Приэлектроэнергию, Технологический маршрут оритет (Квт/(час⋅т)) 1 2 3 Назначение в отделение колпаковых печей 1 S1-А1-S2-А3-S3-А4-S4-А7-S6-А10-S8 103,5 2 S1-А1-S2-А3-S3-А4-S4-А8-S6-А10-S8 103,5 -91-
1 2 3 S1-А2-S2-А3-S3-А4-S4-А7-S6-А10-S8 4 S1-А2-S2-А3-S3-А4-S4-А8-S6-А10-S8 5 S1-А1-S2-А3-S3-А4-S4-А7-S6-А11-S8 6 S1-А1-S2-А3-S3-А4-S4-А8-S6-А11-S8 7 S1-А2-S2-А3-S3-А4-S4-А7-S6-А11-S8 8 S1-А2-S2-А3-S3-А4-S4-А8-S6-А11-S8 9 S1-А1-S2-А3-S3-А4-S4-А7-S6-А12-S8 10 S1-А1-S2-А3-S3-А4-S4-А8-S6-А12-S8 11 S1-А2-S2-А3-S3-А4-S4-А7-S6-А12-S8 12 S1-А2-S2-А3-S3-А4-S4-А8-S6-А12-S8 Назначение на АНО 13 S1-А1-S2-А3-S3-А5-S5-А10-S8 14 S1-А2-S2-А3-S3-А5-S5-А10-S8 15 S1-А1-S2-А3-S3-А5-S5-А12-S8 16 S1-А2-S2-А3-S3-А5-S5-А12-S8
Окончание табл. 4.4 3 103,5 103,5 108,0 108,0 108,0 108,0 123,2 123,2 123,2 123,2 138,0 138,0 157,7 157,7
Таблица 4.5 Оптимизация маршрутов производства холоднокатаных листов по потреблению условного топлива ПриПотребление Технологический маршрут оритет газа, (кг/т) Назначение на АНО 1 S1-А1-S2-А3-S3-А5-S5-А10-S8 57 2 S1-А1-S2-А3-S3-А5-S5-А11-S8 57 3 S1-А1-S2-А3-S3-А5-S5-А12-S8 57 4 S1-А2-S2-А3-S3-А5-S5-А10-S8 57 5 S1-А2-S2-А3-S3-А5-S5-А11-S8 57 6 S1-А2-S2-А3-S3-А5-S5-А12-S8 57 Назначение в отделение колпаковых печей 7 S1-А1-S2-А3-S3-А4-S4-А7-S6-А10-S8 60 8 S1-А1-S2-А3-S3-А4-S4-А7-S6-А11-S8 60 9 S1-А1-S2-А3-S3-А4-S4-А7-S6-А12-S8 60 10 S1-А1-S2-А3-S3-А4-S4-А8-S6-А10-S8 60 11 S1-А1-S2-А3-S3-А4-S4-А8-S6-А11-S8 60 12 S1-А1-S2-А3-S3-А4-S4-А8-S6-А12-S8 60 13 S1-А2-S2-А3-S3-А4-S4-А7-S6-А10-S8 60 14 S1-А2-S2-А3-S3-А4-S4-А7-S6-А11-S8 60 15 S1-А2-S2-А3-S3-А4-S4-А7-S6-А12-S8 60 16 S1-А2-S2-А3-S3-А4-S4-А8-S6-А10-S8 60 17 S1-А2-S2-А3-S3-А4-S4-А8-S6-А11-S8 60 18 S1-А2-S2-А3-S3-А4-S4-А8-S6-А12-S8 60 -92-
Таблица 4.6 Оптимизация маршрутов производства холоднокатаных листов по комплексному критерию без учета затрат времени на доставку к технологическим агрегатам ПриЗатраты ресурТехнологический маршрут оритет сов (у.е./т) Назначение на АНО 1 S1-А2-S2-А3-S3-А5-S5-А11-S8 11,33 2 S1-А2-S2-А3-S3-А5-S5-А10-S8 11,34 3 S1-А2-S2-А3-S3-А5-S5-А12-S8 11,43 4 S1-А1-S2-А3-S3-А5-S5-А11-S8 11,44 5 S1-А1-S2-А3-S3-А5-S5-А10-S8 12,33 6 S1-А1-S2-А3-S3-А5-S5-А12-S8 12,34 Назначение в отделение колпаковых печей 7 S1-А2-S2-А3-S3-А4-S4-А8-S6-А11-S8 12,88 8 S1-А2-S2-А3-S3-А4-S4-А7-S6-А11-S8 12,89 9 S1-А2-S2-А3-S3-А4-S4-А8-S6-А10-S8 12,98 10 S1-А2-S2-А3-S3-А4-S4-А7-S6-А10-S8 12,99 11 S1-А2-S2-А3-S3-А4-S4-А8-S6-А12-S8 13,11 12 S1-А2-S2-А3-S3-А4-S4-А7-S6-А12-S8 13,12 13 S1-А1-S2-А3-S3-А4-S4-А8-S6-А11-S8 13,21 14 S1-А1-S2-А3-S3-А4-S4-А7-S6-А11-S8 13,22 15 S1-А1-S2-А3-S3-А4-S4-А8-S6-А10-S8 13,87 16 S1-А1-S2-А3-S3-А4-S4-А7-S6-А10-S8 13,88 17 S1-А1-S2-А3-S3-А4-S4-А8-S6-А12-S8 14,10 18 S1-А1-S2-А3-S3-А4-S4-А7-S6-А12-S8 14,11 Таким образом, показано, что целесообразно определять технологические маршруты исходя из списка оптимизируемых ресурсов и величины их экономической значимости, для которых далее решить задачу идентификации технологических связей. 4.2. Адаптивная идентификация технологических связей листопрокатного производства Приведем в качестве примера использование методов адаптивного моделирования для описания производства холоднокатаной листовой стали по производственной схеме включающей: получение слитков определенным химическим составом стали, горячую прокатку слитков, охлаждение горячекатаных полос, холодную прокатку листовой стали, рекристализационный отжиг холоднокатаных рулонов в колпаковых -93-
печах, дрессировку отожженных полос. Одними из основных показателей, определяющими качество стали являются механические характеристики (см. ГОСТ 9045-93). На основе множества исследований установлен ряд технологических факторов, от которых существенно зависят механические свойства малоуглеродистых сталей (см., например, [9, 71, 86 и др.]). Полученные на основе анализа производственных данных статистические характеристики технологических факторов, механических свойств (откликов) и обозначения, используемые в дальнейшем, представлены в табл. 4.7. Таблица 4.7 Факторы технологического маршрута производства стали марки 08Ю без покрытия поверхности Обозначение в модели 1
Факторы
Единицы измерения
2
3
x1 Толщина полосы, HS мм x2 Ширина полосы, B мм x3 Масса рулона, M т Химический состав стали: x4 Углерод, [C] % x5 Марганец, [Mn] % x6 Кремний, [Si] % x7 Фосфор, [P] % x8 Сера, [S] % x9 Хром, [Cr] % x10 Никель, [Ni] % x11 Медь, [Cu] % x12 Алюминий, [Al] % Горячая прокатка: x13 Скорость, Vгп м/мин x14 Температура конца прокатки, Tкп °С x15 Температура смотки, Tсм °С Холодная прокатка: x16 Суммарное обжатие, % εΣ x17 Скорость после 5-й клети, V5 м/мин
-94-
Диапазон измерения
СтанСреднее дартное значеотклоние нение
4
5
6
0,41 – 2,55 1255 – 1740 10,3 – 36,1
1,24 1380 27
0,475 124,2 5,91
0,03 – 0,07 0,16 – 0,48 0,009 – 0,030 0,005 – 0,015 0,010 – 0,025 0,01 – 0,04 0,01 – 0,06 0,02 – 0,11 0,029 – 0,075
0,05 0,22 0,023 0,008 0,015 0,02 0,02 0,04 0,057
0,011 0,036 0,0348 0,0021 0,0022 0,008 0,012 0,026 0,0103
432 – 933
717
91,3
823 – 910 577 – 729
860 644
13,3 23,3
50,8 – 76,6
67,7
1,99
766 – 1640
1399
184,4
Окончание табл. 4.7 1
2
3
4
Рекристализационный отжим в колпаковых печах: x18 Промежуточная температура, Тпр °С 550 – 620 x19 Максимальная температура, Tmax °С 680 – 710 x20 Температура распаковки, Тр °С 110 – 140 x21 Время нагрева до Тпр, tнп 3 –24 ч x22 Время выдержки при Тпр, tвп 10 – 39 ч x23 Время нагрева до Tmax, tнм 2 – 17 ч x24 Время выдержки при Tmax, tвм 14 – 29 ч x25 Время охлаждения до Тр, tох 12,8 – 120 ч Механические свойства: y1 МПа 147 – 230 Предел текучести, σт y2 МПа 284 – 382 Предел прочности, σв y3 – 30 – 46 Твердость, HRB y4 % 39 – 46 Относительное удлинение, δ y5 Глубина сферической лунки, мм 9,6 – 12,6 JE
5
6
562
24,8
692 117 10,5 23,9 7,7 20,6 75,3
10,9 9,41 3,42 8,26 3,61 3,68 20,93
185 324 36,1 42,8
20,3 23,1 3,86 2,95
11,7
0,64
Очевидно, что для корректного построения любых статистических зависимостей необходима первичная обработка массива информации, которая определяет состав данных и факторов – основу моделирования. Для этого в данной работе использована методика, представленная в [19]. В табл. 4.8 приведены результаты предварительной обработки данных, где приняты следующие обозначения: “+” – допустимость включения фактора в модель соответствующих откликов; “–” – исключение фактора на одном из шагов процедуры отсева. Таблица 4.8 Результаты выполнения процедуры определения факторов моделей Отклики Факторы HRB JE σT σв δ 1
2
3
4
5
6
[C] [Mn] [Si] [P] [S] [Cr] [Ni] [Cu] [Al]
– – + – + – – – –
– + – – + – – – +
– – – + – – – – –
+ – – + – – – – +
– – + – + – – – –
-95-
1 Vгп Tкп Tсм εΣ V5 Тпр Tmax Тр tнп tвп tнм tвм tох
2 – + – – – – – – + – – + +
3 – – + + – – + + – – – – –
4 – + – + – – – – – – – + +
Окончание табл. 4.8 5 6 – – – + + – – – – – – – – + – + – – + – + – – – + –
Таким образом, для задаваемых типоразмеров (x1, x2, x3), в функции качества входят соответствующие вектора факторов: y1 = f(x6, x8, x14, x21, x24, x25); (4.1) y2 = f(x5, x8, x12, x15, x16, x19, x20); (4.2) y3 = f(x7, x14, x16, x24, x25); (4.3) y4 = f(x4, x7, x12, x14, x19, x20); (4.4) y5 = f(x6, x8, x15, x22, x23, x25). (4.5) Рассмотрим пример совместного использования рекуррентных, рекуррентно-итерационных методов в составе алгоритма структурной идентификации технологии производства листового проката. Наборы факторов определяются металлургическими переделами и зависимость может быть структурно уточнена по мере реализации технологического маршрута, кроме того, информация о реализации технологии обработки партии продукции поступают в хранилище в виде порций данных, поэтому целесообразно воспользоваться рекуррентными или рекуррентноитерационными методами идентификации, представленными в главе 2. Базовой основой моделирования служит линейная по параметрам зависимость, которая затем может быть уточнена за счет включения нелинейных составляющих. Ниже показана динамика изменения адекватности моделей механических свойств по мере их последовательного расширения факторами технологических этапов (суперпозиции) и блоками данных (адаптивной параметрической идентификации). Из регламентации технологических инструкций производства холоднокатаной листовой стали, стандартов на ее сортамент (ГОСТ 1990490) и технических условий (ГОСТ 9045-93) следует, что с целью обеспечения стабильной адекватности модели качества при изменении производственных условий набор зависимостей модели качества определяется -96-
комбинацией значений характеристик типоразмеров продукции (табл. 4.9) и категорий качества. Таблица 4.9 Комбинации параметров типоразмеров № ограниТолщина листа, Ширина листа, Масса рулона, чений мм мм т 1. от 0,35 до 0,5 не более 1200 22 – 26 2. более 0,5 до 1,5 не более 1200 22 – 26 3. более 1,5 до 2,0 не более 1200 22 – 26 4. более 2 до 3,0 не более 1200 22 – 26 5. от 0,35 до 0,5 более 1200 29 – 34 6. более 0,5 до 1,5 более 1200 29 – 34 7. более 1,5 до 2,0 более 1200 29 – 34 8. более 2 до 3,0 более 1200 29 – 34 Таким образом, каждая механическая характеристика определенной категории качества листовой стали может описываться множеством зависимостей, включенных в модели технологических этапов. Рассмотрим процесс моделирования зависимостей (4.1), соответствующих производственным данным, значения которых попадают в рамки ограничений № 6 (см. табл. 4.9) для каждого этапа обработки продукции категории вытяжки ОСВ (ГОСТ 9045-93)1: Технологический этап 1 Выборка – 100 наблюдений. σ T : y1,1 = −980,736x 6 + 6287,53x 8 + 205,018 exp{7,222x 6 − 51,72x 8 }. Предел текучести, МПа
Проверка адекватности модели 220 210 200 190 180 170
0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 17,1371. 1
Зависимости (4.2)-(4.5) представлены в Приложении 2.
-97-
Технологический этап 2 Выборка: 150 наблюдений. ,788 −13,777 6, 970 σ T : y1,2 = 89,647x 6 + 50,702x 8 + 0,213x 14 − 75,505 x 57 x8 x14 . 6
)
(
Предел текучести, МПа
Проверка адекватности модели 220 210 200 190 180 170 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 11,1435. Технологический этап 3 Выборка: 200 наблюдений. σ T : y1,3 = x 6 + x 8 + 0,280x14 + 1,048x 21 + 0,691x 24 + 0,025x 25 − 1 / 1,755
x 1,755 + x 81,755 + ( x14 / 1,639)1,755 + ( x 21 / 0,972)1,755 + − 0,156 6 + ( x 24 / 1,089)1,755 + ( x 25 / 1,149)1,755
.
Предел текучести, МПа
Проверка адекватности модели 220 210 200 190 180 170
0
5
10
15
Наблюдения
Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 8,6197. -98-
Результаты суперпозиционного моделирования показывают структурную неоднородность зависимостей механических свойств и факторов. По мере реализации технологической траектории добавляются блоки данных и качественно изменяются прогнозирующие свойства моделей. Рассмотрим в качестве примера применение методологии адаптивной идентификации приоритетов показателей качества комплекса критериев, характеризующих механические свойства листового проката. За определенный период был проведен анализ уровня качества автолиста, который выявил статистику “провалов” по свойствам проката для категорий вытяжки ОСВ и ВОСВ. Фрагмент результатов отбраковки металла по механическим свойствам представлен в Приложении 3 (табл. П 5), для которых рассчитаны по формуле (3.4) соответствующие относительные частоты (табл. 4.10). Для иллюстрации динамики изменения приоритетов показателей качества и применения рекуррентных соотношений для расчета весовых коэффициентов рассмотрим поблочное поступление относительных частот отбраковки металла из табл. 4.10 на вход адаптивных алгоритмов. Тогда, используя (3.4)-(3.11) и данные табл. 4.10 получим оценки λj, отражающие приоритеты характеристик металла (табл. 4.11). Оценивая стабильность зависимости технологии от свойств по формуле (3.13), получим: W<3> = 0,647; W<6> = 0,661; W<9> = 0,754; W<11> = 0,721. Сравнивая эти значения с критическими Wα [55] при уровне значимости α = 0,05, можно сделать вывод о стабильности технологического процесса и закономерности получения продукции со свойствами ему отвечающими. 4.3. Адаптивная оптимизация моделей качества листового проката Рассмотрим пример оптимизации моделей, характеризующих механические свойства стали, с учетом их приоритета в обобщенной задаче (3.3), адаптации решений рекуррентно-итерационными методами и статистической оценки точности этих решений на этапах прогноза потребительских свойств металлопродукции. С целью сокращения большого объема вычислений при расчете возможных комбинаций оптимальных технологических траекторий производства листового проката далее будут рассмотрены варианты адаптивной оптимизации моделей, полученных в рамках ограничений № 6 (см. п. 4.2, табл. 4.9), с изменением их приоритетов на этапах обработки металла. Тогда на технологических этапах решаются следующие задачи2: 2
Обозначения факторов в моделях соответствуют табл. 4.7
-99-
Таблица 4.10 Результаты отбраковки металла по механическим характеристикам № г./к. партии
Относительная частота отбраковки металла по характеристикам, т/т:
1
σТ 0,160
σB 0,540
HRB 0
δ 0,300
JE 0
2
0,716
0
0
0,284
0
3
0,258
0
0
0,742
0
4
0,911
0
0
0,089
0
5
0,196
0
0
0,804
0
6
1
0
0
0
0
7
0,906
0
0
0,094
0
8
0,911
0
0
0,089
0
9
0,746
0
0
0,254
0
10
0
0
0
1
0
11
0,327
0
0
0,673
0
– предел текучести; линение;
-100-
– предел прочности;
– глубина сферической лунки
– твердость;
– относительное уд-
Диаграмма усредненных частот
Таблица 4.11 m 1
q 2
λ σT
3
Оценки приоритетов характеристик металла λσB λHRB λδ λJE 4
5
6
Непосредственная оценка,
7
Диаграмма оценок 8
λ(j1)
3
0
0,378
0,180
0
0,442
0
3
3
0,540
0,090
0
0,370
0
6
3
0,645
0,060
0
0,295
0
9
2
0,557
0,049
0
0,394
0
-101-
1
2
3
4
5
6
7
Ранжирование, λ(j2 )
-102-
3
0
0,267
0,200
0,122
0,289
0,122
3
3
0,289
0,172
0,133
0,273
0,133
6
3
0,304
0,159
0,133
0,271
0,133
9
2
0,288
0,158
0,136
0,282
0,136
Продолжение таблицы 4.11 8
1
2
3
4
5 6 Усредненные оценки, λj
7
3
0
0,322
0,190
0,062
0,364
0,062
3
3
0,415
0,131
0,066
0,321
0,067
6
3
0,474
0,110
0,066
0,283
0,067
9
2
0,423
0,104
0,068
0,337
0,068
Окончание таблицы 4.11 8
-103-
Технологический этап 1 3,22 (y1,1 + x26 – 196) = 0, 1,90 (y2,1 – x27 – 255) = 0, 1,90 (y2,1 + x28 – 323) = 0, 0,62 (y3,1 + x29 – 46) = 0, 3,65 (y4,1 – x30 – 36) = 0, 0,62 (y5,1 – x31 – 9,4) = 0 при x26 ÷ x31 ≥ 0;
Технологический этап 2 3,22 (y1,1 + x26 – 196) = 0, 4,15 (y1,2+ x32 – 196) = 0, 1,90 (y2,1 – x27 – 255) = 0, 1,31 (y2,2– x33 – 255) = 0, 1,90 (y2,1 + x28 – 323) = 0, 1,31 (y2,2+ x34 – 323) = 0, 0,62 (y3,1 + x29 – 46) = 0, 0,67 (y3,2+ x35 – 46) = 0, 3,65 (y4,1 – x30 – 36) = 0, 3,21 (y4,2– x36 – 36) = 0 0,62 (y5,1 – x31 – 9,4) = 0, 0,67 (y5,2– x37 – 9,4) = 0 при x26 ÷ x37 ≥ 0; Технологический этап 3 3,22 (y1,1 + x26 – 196) = 0, 1,90 (y2,1 – x27 – 255) = 0, 1,90 (y2,1 + x28 – 323) = 0, 0,62 (y3,1 + x29 – 46) = 0, 3,65 (y4,1 – x30 – 36) = 0, 0,62 (y5,1 – x31 – 9,4) = 0,
4,15 (y1,2 + x32 – 196) = 0, 4,74 (y1,3 + x38 – 196) = 0, 1,31 (y2,2 – x33 – 255) = 0, 1,10 (y2,3 – x39 – 255) = 0, 1,31 (y2,2 + x34 – 323) = 0, 1,10 (y2,3 + x40 – 323) = 0, 0,67 (y3,2 + x35 – 46) = 0, 0,67 (y3,3 + x41 – 46) = 0, 3,21 (y4,2 – x36 – 36) = 0 2,83 (y4,3 – x42 – 36) = 0, 0,67 (y5,2 – x37 – 9,4) = 0 0,67 (y5,3 – x43 – 9,4) = 0, при x26 ÷ x43 ≥ 0. Здесь пунктирной линией разделяются блоки рекуррентной оптимизации, при реализации которой размерность систем уравнений существенного влияния на эффективность работы алгоритма в целом не оказывает. Вычисления в основном используют текущую на данный момент времени информацию, учитывая при этом результаты предыдущих рекурсий. Аналогично в системы уравнений могут быть добавлены блоки практически любых зависимостей, которые, по мнению пользователя системы, следуют учитывать. Результаты решения задач представлены в таблицах 4.12, 4.13, в которых отражены доверительные вероятности получения металлопродукции при реализации технологических траекторий. Очевидно, что суперпозиционнное включение факторов в модель качества не только улучшают ее свойства в плане адекватности реальным условиям, но повышает доверительную вероятность решений оптимизационных задач. -104-
Таблица 4.12 Этап
Плоды прогноза соответствия оптимальных решений показателям качества
1
КРИТ ЕРИИ К АЧЕС ТВ А
Прогноз качества y1 y2 y3 y4 y5 2
3
4
5
6
Доверительный интервал в оптимальной точке y1 min y1 max y2 min y2 max y3 min y3 max y4 min y4 max y5 min y5 max 7
8
9
10
11
12
13
14
15
Диаграмма соответствия качеству
16
17 Y5 Y4 Y3
1 186
308 36 41 10,6 176
196 302
318
35
39
39
Y2
43 10,1
Y1
11,1 Доверительная область
Y5 Y4 Y3 Y2
2 189
280 40 42 10,6 185
193 274
286
38
42 40,3 43,7 10,2
0
Y1
11 Доверительная область
-105-
Окончание табл. 4.12 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 Y5 Y4 Y3
3 183
285
41
43 10,6 181 186 281 289 40
42 41,7 44,3 10,3 10,9
Y2 Y1
Доверительная область
Этап
1 2 3
-106-
x1
Таблица 4.13 Результаты решений задач оптимизации качества на технологических этапах Технологические факторы x2 x3 x4 x5 x6 x7 x8 x12 x14 x15 x16 x19 x20 x21 x22 x23 x24 x25
0,529>1200 0,05 1,5 34
0,29 0,030 0,006 0,018 0,066
-
-
-
-
-
-
0,529>1200 0,07 0,16 0,017 0,005 0,017 0,040 840 630 1,5 34 0,529>1200 0,06 0,189 0,029 0,009 0,017 0,067 860 600 75,70 690 110 23 1,5 34
-
-
-
-
-
-
-
-
9
6
16 53
ЗАКЛЮЧЕНИЕ На основе анализа состояния проблем, связанных с внедрением на промышленных предприятиях автоматизированных систем управления можно заключить, что повышение эффективности управления возможно только на основе развития современных технологий в области математического и программного обеспечения. Поэтому в работе были представлены следующие результаты. На основе структурного моделирования c объектно-ориентированной детализацией, формализовано представление производственной системы в виде циклических графов с нагруженными затратами ресурсов дугами и вершинами, обозначающими агрегаты и склады производств. Разработана единая алгоритмическая основа структурной и параметрической адаптивной идентификации линейных и нелинейных зависимостей, использующая рекуррентные и рекуррентно-итерационные процедуры, ориентированная на специфику блочного поступления набора идентифицируемых параметров и массива данных о технологии производства продукции. На основе представления производственной системы в виде ориентированного циклического графа с нагруженными ребрами и вершинами графа, разработан алгоритм оптимизации маршрутов производственной сети. Разработана методология адаптивной идентификации приоритетов показателей качества продукции для оптимизации стратегий управления качеством на основе рекуррентных алгоритмов уточнения весовых коэффициентов и их ранжировки по данным статистического контроля качества. Разработаны адаптивные алгоритмы оптимизации моделей, отличающиеся использованием блочных рекуррентно-итерационных процедур, интерпретированных к решению многокритериальных оптимизационных задач и блочных рекуррентных алгоритмов уточнения весовых коэффициентов по данным статистического контроля качества Разработаны методики статистической оценки точности оптимальных решений, полученных и использованием линейных и нелинейных моделей с представлением доверительных интервалов для параметров моделей, для средних значений отклика в оптимальной точке, для оптимальных значений отклика, а также оценкой математического ожидания индивидуальных значений отклика.
-107-
-108-
ПРИЛОЖЕНИЯ
-109-
ПРИЛОЖЕНИЕ 1 Таблица П 1 Оптимизация маршрутов производства холоднокатаных полос по времени без учета затрат на доставку к технологическим агрегатам Приоритет
Технологический маршрут
Назначение на АНО 1 S1-А2-S2-А3-S3-A5-S5-А16-S8 2 S1-А2-S2-А3-S3-A5-S5-А13-S8 3 S1-А2-S2-А3-S3-A5-S5-А17-S8 4 S1-А2-S2-А3-S3-A5-S5-А18-S8 5 S1-А2-S2-А3-S3-A5-S5-А15-S8 6 S1-А1-S2-А3-S3-A5-S5-А13-S8 7 S1-А1-S2-А3-S3-A5-S5-А17-S8 8 S1-А1-S2-А3-S3-A5-S5-А18-S8 9 S1-А2-S2-А3-S3-A5-S5-А14-S8 10 S1-А1-S2-А3-S3-A5-S5-А14-S8 11 S1-А1-S2-А3-S3-A5-S5-А16-S8 12 S1-А1-S2-А3-S3-A5-S5-А15-S8 Назначение в отделение колпаковых печей 13 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 14 S1-А2-S2-А3-S3-А4-S4-А8-S6-А16-S8 15 S1-А2-S2-А3-S3-А4-S4-А7-S6-А16-S8 16 S1-А2-S2-А3-S3-А4-S4-А8-S6-А17-S8 17 S1-А2-S2-А3-S3-А4-S4-А8-S6-А18-S8 18 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 19 S1-А2-S2-А3-S3-А4-S4-А7-S6-А17-S8 20 S1-А2-S2-А3-S3-А4-S4-А7-S6-А18-S8 21 S1-А2-S2-А3-S3-А4-S4-А8-S6-А14-S8 22 S1-А2-S2-А3-S3-А4-S4-А8-S6-А15-S8 23 S1-А2-S2-А3-S3-А4-S4-А7-S6-А14-S8 24 S1-А2-S2-А3-S3-А4-S4-А7-S6-А15-S8 25 S1-А1-S2-А3-S3-А4-S4-А8-S6-А16-S8 26 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 27 S1-А1-S2-А3-S3-А4-S4-А7-S6-А16-S8 38 S1-А1-S2-А3-S3-А4-S4-А8-S6-А17-S8 29 S1-А1-S2-А3-S3-А4-S4-А8-S6-А18-S8 30 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8 31 S1-А1-S2-А3-S3-А4-S4-А7-S6-А17-S8 32 S1-А1-S2-А3-S3-А4-S4-А7-S6-А18-S8 33 S1-А1-S2-А3-S3-А4-S4-А8-S6-А14-S8 34 S1-А1-S2-А3-S3-А4-S4-А8-S6-А15-S8 35 S1-А1-S2-А3-S3-А4-S4-А7-S6-А14-S8 36 S1-А1-S2-А3-S3-А4-S4-А7-S6-А15-S8
-110-
Длительность обработки (сек/т) 116,8 117,1 117,2 117,3 117,7 119,1 119,2 119,3 117,6 119,6 118,8 119,7 667,5 667,8 667,8 667,9 668,0 668,1 668,2 668,3 668,3 668,4 668,6 668,7 669,5 669,8 669,8 669,9 670,0 670,1 670,2 670,3 670,3 670,4 670,6 670,7
Таблица П 2 Оптимизация маршрутов производства холоднокатаных полос по потреблению электроэнергии ПриоТехнологический маршрут ритет Назначение в отделение колпаковых печей 1 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8 2 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 3 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 4 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 5 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8 6 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 7 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 8 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 9 S1-А1-S2-А3-S3-А4-S4-А7-S6-А17-S8 10 S1-А1-S2-А3-S3-А4-S4-А8-S6-А17-S8 11 S1-А2-S2-А3-S3-А4-S4-А7-S6-А17-S8 12 S1-А2-S2-А3-S3-А4-S4-А8-S6-А17-S8 13 S1-А1-S2-А3-S3-А4-S4-А7-S6-А16-S8 14 S1-А1-S2-А3-S3-А4-S4-А8-S6-А16-S8 15 S1-А2-S2-А3-S3-А4-S4-А7-S6-А16-S8 16 S1-А2-S2-А3-S3-А4-S4-А8-S6-А16-S8 17 S1-А1-S2-А3-S3-А4-S4-А7-S6-А15-S8 18 S1-А1-S2-А3-S3-А4-S4-А8-S6-А15-S8 19 S1-А2-S2-А3-S3-А4-S4-А7-S6-А15-S8 20 S1-А2-S2-А3-S3-А4-S4-А8-S6-А15-S8 21 S1-А1-S2-А3-S3-А4-S4-А7-S6-А18-S8 22 S1-А1-S2-А3-S3-А4-S4-А8-S6-А18-S8 23 S1-А2-S2-А3-S3-А4-S4-А7-S6-А18-S8 24 S1-А2-S2-А3-S3-А4-S4-А8-S6-А18-S8 Назначение на АНО 25 S1-А1-S2-А3-S3-А5-S5-А13-S8 26 S1-А2-S2-А3-S3-А5-S5-А13-S8 27 S1-А1-S2-А3-S3-А5-S5-А13-S8 28 S1-А2-S2-А3-S3-А5-S5-А13-S8 29 S1-А1-S2-А3-S3-А5-S5-А17-S8 30 S1-А2-S2-А3-S3-А5-S5-А17-S8 31 S1-А1-S2-А3-S3-А5-S5-А16-S8 32 S1-А2-S2-А3-S3-А5-S5-А16-S8 33 S1-А1-S2-А3-S3-А5-S5-А15-S8 34 S1-А2-S2-А3-S3-А5-S5-А15-S8 35 S1-А1-S2-А3-S3-А5-S5-А18-S8 36 S1-А2-S2-А3-S3-А5-S5-А18-S8
Затраты на электроэнергию, (Квт/(час⋅т)) 106,3 106,3 106,3 106,3 108,8 108,8 108,8 108,8 110,7 110,7 110,7 110,7 110,9 110,9 110,9 110,9 112,0 112,0 112,0 112,0 112,7 112,7 112,7 112,7 142,7 142,7 145,2 145,2 147,1 147,1 147,3 147,3 148,4 148,4 149,1 149,1
-111-
Таблица П 3 Оптимизация маршрутов производства холоднокатаных полос по потреблению условного топлива Прио-риТехнологический маршрут тет Назначение на АНО 1 S1-А1-S2-А3-S3-А5-S5-А13-S8 2 S1-А1-S2-А3-S3-А5-S5-А13-S8 3 S1-А1-S2-А3-S3-А5-S5-А16-S8 4 S1-А1-S2-А3-S3-А5-S5-А17-S8 5 S1-А1-S2-А3-S3-А5-S5-А15-S8 6 S1-А1-S2-А3-S3-А5-S5-А18-S8 7 S1-А2-S2-А3-S3-А5-S5-А13-S8 8 S1-А2-S2-А3-S3-А5-S5-А13-S8 9 S1-А2-S2-А3-S3-А5-S5-А16-S8 10 S1-А2-S2-А3-S3-А5-S5-А17-S8 11 S1-А2-S2-А3-S3-А5-S5-А15-S8 12 S1-А2-S2-А3-S3-А5-S5-А18-S8 Назначение в отделение колпаковых печей 13 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8 14 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8 15 S1-А1-S2-А3-S3-А4-S4-А7-S6-А16-S8 16 S1-А1-S2-А3-S3-А4-S4-А7-S6-А17-S8 17 S1-А1-S2-А3-S3-А4-S4-А7-S6-А15-S8 18 S1-А1-S2-А3-S3-А4-S4-А7-S6-А18-S8 19 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 20 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 21 S1-А1-S2-А3-S3-А4-S4-А8-S6-А16-S8 22 S1-А1-S2-А3-S3-А4-S4-А8-S6-А17-S8 23 S1-А1-S2-А3-S3-А4-S4-А8-S6-А15-S8 24 S1-А1-S2-А3-S3-А4-S4-А8-S6-А18-S8 25 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 26 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 27 S1-А2-S2-А3-S3-А4-S4-А7-S6-А16-S8 28 S1-А2-S2-А3-S3-А4-S4-А7-S6-А17-S8 29 S1-А2-S2-А3-S3-А4-S4-А7-S6-А15-S8 30 S1-А2-S2-А3-S3-А4-S4-А7-S6-А18-S8 31 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 32 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 33 S1-А2-S2-А3-S3-А4-S4-А8-S6-А16-S8 34 S1-А2-S2-А3-S3-А4-S4-А8-S6-А17-S8 35 S1-А2-S2-А3-S3-А4-S4-А8-S6-А15-S8 36 S1-А2-S2-А3-S3-А4-S4-А8-S6-А18-S8
-112-
Потребление газа, (кг/т) 57 57 57 57 57 57 57 57 57 57 57 57 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60
Таблица П 4 Оптимизация маршрутов производства холоднокатаных полос по комплексному критерию без учета затрат времени на доставку к технологическим агрегатам ПриоТехнологический маршрут ритет Назначение на АНО 1 S1-А2-S2-А3-S3-А5-S5-А13-S8 2 S1-А2-S2-А3-S3-А5-S5-А16-S8 3 S1-А2-S2-А3-S3-А5-S5-А18-S8 4 S1-А2-S2-А3-S3-А5-S5-А15-S8 10 S1-А1-S2-А3-S3-А5-S5-А17-S8 5 S1-А2-S2-А3-S3-А5-S5-А13-S8 6 S1-А1-S2-А3-S3-А5-S5-А13-S8 7 S1-А1-S2-А3-S3-А5-S5-А16-S8 8 S1-А1-S2-А3-S3-А5-S5-А18-S8 11 S1-А1-S2-А3-S3-А5-S5-А13-S8 9 S1-А1-S2-А3-S3-А5-S5-А15-S8 Назначение в отделение колпаковых печей 12 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 13 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 14 S1-А2-S2-А3-S3-А4-S4-А8-S6-А16-S8 16 S1-А2-S2-А3-S3-А4-S4-А7-S6-А16-S8 15 S1-А2-S2-А3-S3-А4-S4-А8-S6-А18-S8 17 S1-А2-S2-А3-S3-А4-S4-А7-S6-А18-S8 18 S1-А2-S2-А3-S3-А4-S4-А8-S6-А15-S8 20 S1-А2-S2-А3-S3-А4-S4-А8-S6-А13-S8 19 S1-А2-S2-А3-S3-А4-S4-А8-S6-А17-S8 21 S1-А2-S2-А3-S3-А4-S4-А7-S6-А15-S8 23 S1-А2-S2-А3-S3-А4-S4-А7-S6-А13-S8 22 S1-А2-S2-А3-S3-А4-S4-А7-S6-А17-S8 24 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 25 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8 26 S1-А1-S2-А3-S3-А4-S4-А8-S6-А16-S8 28 S1-А1-S2-А3-S3-А4-S4-А7-S6-А16-S8 27 S1-А1-S2-А3-S3-А4-S4-А8-S6-А18-S8 29 S1-А1-S2-А3-S3-А4-S4-А7-S6-А18-S8 32 S1-А1-S2-А3-S3-А4-S4-А8-S6-А13-S8 30 S1-А1-S2-А3-S3-А4-S4-А8-S6-А15-S8 31 S1-А1-S2-А3-S3-А4-S4-А8-S6-А17-S8 33 S1-А1-S2-А3-S3-А4-S4-А7-S6-А15-S8 35 S1-А1-S2-А3-S3-А4-S4-А7-S6-А13-S8
Затраты ресурсов (у.е./т) 11,12 11,13 11,17 11,18 11,18 11,22 11,22 11,23 11,23 11,25 11,26 11,27 12,67 12,68 12,72 12,73 12,76 12,77 12,77 12,78 12,79 12,80 12,81 12,82 12,90 12,91 12,95 12,96 13,00 13,00 13,01 13,01 13,02 13,03
-113-
ПРИЛОЖЕНИЕ 2 Технологический этап 1 Выборка – 100 наблюдений. σ B : y 2,1 = 1058,24x 5 + 5739,72x 8 + 3761,24x 12 −
− 18,885 exp{3,88361x 5 + 31,3066x 8 + 18,8845x12 }.
Предел прочности, МПа
Проверка адекватности модели 400 350 300 250 0
5
10
15
Наблюдения
Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 16,7715. HRB : y 3,1 = 0,6826x 7 + 44,0755 exp{x 7 / 21,2541} Проверка адекватности модели
Твердость HRB
50 45 40 35 30 25 0
5
10 Наблюдения
Реальные значения
Среднеквадратичное отклонение: 3,5549. -114-
Прогнозируемые значения
15
,2632 16,759 10,3715 δ : y 4,1 = 526,05x 4 + 354,289x 7 + 398,112x 12 − 3,1594x10 x7 x12 4
Относительное удлинение, %
Проверка адекватности модели 100 80 60 40 20 0 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 11,9071. JE : y 5,1 = − 7,4228x 6 − 2,5742x 8 + 12,3316(( x 6 / 0,9381) 2,5418 + + ( x 8 / 0,0159) 2,5418 )1 / 2,5418 .
Глубина сферической лунки, мм
Проверка адекватности модели 35 25 15 5 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 2,62573.
-115-
Технологический этап 2 Выборка: 150 наблюдений. σ B : y 2, 2 = 1,001x 5 + x 8 + x12 − 0,3792x15 + 1,7460(( x 5 / 1,001)1,016 + x 81,016 + + ( x 12 / 1,0005)1,016 + ( x15 / 1,9926)1,016 )1 / 1, 016 .
Предел прочности, МПа
Проверка адекватности модели 400 350 300 250 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 10,84034. HRB : y 3, 2 = x 7 + 1,3232x 14 − 5,15052(( x 7 / 0,67111) 2,17202 + + ( x14 / 4,02431)1 / 2,17202 . Проверка адекватности модели
Твердость HRB
50 45 40 35 30 25 0
5
10 Наблюдения
Реальные значения
Среднеквадратичное отклонение: 2,53826. -116-
Прогнозируемые значения
15
δ : y 4, 2 = 1,0137x 4 + 1,0006x 7 + 1,0026x12 + 0,0578x14 +
+ 1,0006 exp{0,0023x 4 + 0,0003x 7 + 0,0005x12 − 0,9730x14 } Проверка адекватности модели
Относительное удлинение, %
100 80 60 40 20 0 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 9,11988. JE : y 2,5 = − 15,8346x 6 + 277,607x 8 + 0,0143x15 + + 1193,99((x 6 / 1120,56) −1579,9 + (x 8 / 2336,17) −1579,9 + (x15 / 25,7819) −1579,9 )1579,9 .
Глубина сферической лунки, мм
Проверка адекватности модели 30 25 20 15 10 5 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 2,3547.
-117-
Технологический этап 3 Выборка: 200 наблюдений. σ B : y 2,3 = x 5 + x 8 + x 12 + 0,3x15 + x16 + x 19 + 0,8996x 20 +
{
}
+ exp − 0,8162 x15 − 0,6234 x19 − 0,1085x 20 .
Предел прочности, МПа
Проверка адекватности модели 400 350 300 250 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 7,01093. HRB : y 3,3 = x 7 + 0,0042x14 + 1,0061x 16 − 0,0277x 24 + + 0,0148x 25 + exp{− 1,08632x14 − 0,857765x 25 }.
Твердость HRB
Проверка адекватности модели 50 45 40 35 30 25 -1
1
3
5
7
9
11
13
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 1,65625. -118-
15
δ : y 4, 3 = 1,0111x 4 + x 7 + x12 + 0,1393x14 + 0,6637x 19 − 0,1369x 20 − 2,03 − 1,1226( x 24,03 + x 27, 03 + x12 + ( x 14 / 2,2517) 2,03 + ( x 19 / 2,8502) 2,03 +
+ ( x 20 / 1,3647) 2,03 )1 / 2,03 .
Относительное удлинение, %
Проверка адекватности модели 100 80 60 40 20 0 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 6,21906. JE : y 5,3 = 1,2970x 6 + 341,668x 8 − 0,0016x15 − 0,0803x 22 + 0,3962x 25 − ,679 100,398 39,7098 −118,687 85,3589 − 57,1895x 6−97,8855 x 363 x15 x 22 x 23 x 25 . 8
Глубина сферической лунки, мм
Проверка адекватности модели 30 25 20 15 10 5 0
5
10
15
Наблюдения Реальные значения
Прогнозируемые значения
Среднеквадратичное отклонение: 1,85187.
-119-
ПРИЛОЖЕНИЕ 3 Таблица П 5 Сопроводительная - протокол механических испытаний холоднокатаной продукции ЛПП № г./к. партии 1 10615 10615 10615 10615 10615 10615 10813 10813 10813 10813 10813 10813 10822 10822 10822 10822 10822 10822 10104 10104 10104 10104 10104 10104 10315 10315 10315 10315 10315 10315 10222 10222 10222 10222 10222 10222 10345
-120-
Количество отбракованного металла по показателям, т % от HRB JE σТ σB δ общего 2 3 4 5 6 7 брак 80 брак 20 – – отсутст40 отсутст10 – – вует 100 вует – 27 – 100 – 27 – 30 – – 8 30 – – 8 30 – – 7 60 – – 16 20 – – 5 40 – – 10 40 – – 10 80 19 – – 60 13 – – 30 8 – – 60 16 – – 60 16 – – 60 16 – – 100 – – 24 100 – – 24 100 – – 24 30 – – 8 30 – – 8 30 – – 8 30 7 – – 60 17 – – 60 15 – – 100 22 – – 100 24 – – 30 – – 8 40 – – 11 100 – – 30 100 – – 29 30 – – 7 40 – – 12 60 – – 18 60 – – 15 30 – – 9
Окончание табл. П 5 1 10345 10345 10345 10345 10345 10784 10784 10784 10784 10784 10784 10515 10515 10515 10515 10515 10515 10505 10505 10505 10505 10505 10505 10267 10267 10267 10267 10267 10267
2 15 14 22 – 17 10 19 25 21 17 – – 7 24 9 4 – – – – – – – – 9 9 – – –
3 – – – – – – – – – – – – – – – – – – – – – – – – – – – – –
4 брак отсутствует
5 – – – 8 – – – – – – 9 8 – – – – 7 25 25 16 14 8 16 12 – – 8 8 9
6 брак отсутствует
7 60 60 100 30 60 40 80 100 80 60 30 30 30 100 30 15 30 100 100 70 60 30 70 50 30 30 30 30 30
-121-
СПИСОК ЛИТЕРАТУРЫ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
17. 18. 19. 20.
Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей. – М.: Финансы и статистика, 1985. – 487 с. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и обработки данных. – М.: Финансы и статистика, 1983. – 471 с. Прикладная статистика. Классификация и снижение размерности / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин. – М.: Финансы и статистика, 1989. – 607 с. Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. – М.: Наука, 1977. – 224 с. Артемова Е. Комплексные решения на базе системы CA-PRMS. – http: // www. osp. ru/os/1998/02/36. htm. Бан Я. Интегрированные системы управления предприятием. Аналитическая записка. – http: // www. erp. boom. ru. Бард Й. Нелинейное оценивание параметров. – М.: Статистика, 1979. – 349 с. Бендат Дж.С., Пирсол А.Дж. Прикладной анализ случайных данных. – М.: Мир, 1989. – 540 с. Беняковский М.А., Мазур В.Л., Мелешко В.И. Производство автомобильного листа. – М.: Металлургия, 1979. – 256 с. Бешелев С.Д., Гурва Ф.Е. Математико-статистические методы экспертных оценок. – М.: Статистика, 1980. – 283 с. Блюмин С.Л., Погодаев А.К. Блочные рекуррентно-итерационные процедуры решения нелинейной задачи о наименьших квадратов // Вычисл. математика и матем. физика – 1992. – Т. 32. – № 8. – С. 1180-1186. Блюмин С.Л., Миловидов С.П. Взвешенное псевдообращение: Учеб. пособие. – Воронеж: ВорПИ-ЛипПИ, 1991. – 64 с. Блюмин С.Л., Миловидов С.П. Псевдообращение: Учебное пособие. – Воронеж: ВорПИ-ЛипПИ, 1990. – 72 с. Блюмин С.Л., Миловидов С.П., Погодаев А.К. Нелинейный метод наименьших квадратов и псевдообращение: Учебное пособие. – Липецк: ЛипПИ, 1992. – 80 с. Блюмин С.Л., Погодаев А.К. Адаптивные процедуры в решении задач оптимизации качества металлопродукции // Изв. вузов. Черная металлургия. – 2003. – № 3. – С. 60-62. Блюмин С.Л., Погодаев А.К. Алгоритмы блочной адаптации линейных и нелинейных моделей технологических зависимостей // Изв. вузов. Черная металлургия. – 1992. – № 9. – С. 67-68. Блюмин С.Л., Погодаев А.К. Пошаговая нелинейная регрессия по последовательно поступающим данным // Заводская лаборатория. – 1995. – № 10.– C. 51-57. Блюмин С.Л., Погодаев А.К. Суперпозиционная регрессия // Вычисл. математика и матем. физика. – 1995. – Т. 35. – № 10. – С. 1576-1581. Блюмин С.Л., Погодаев А.К., Барышев В.В. Оптимальное моделирование технологических связей: Учебное пособие. – Липецк: ЛипПИ, 1993. – 68 с. Обобщение теоремы Гэя / С.Л. Блюмин, А.К. Погодаев, А.Л. Куменков, В.И. Гостеев // Электромеханические устройства и системы: Межвуз. сб. науч. тр. – Воронеж: ВГТУ-АЭТН РФ, 1997. – С. 133-137.
-122-
21. Блюмин С.Л., Погодаев А.К., Куменков А.М. Формулировка и исследование сходимости класса методов решения систем нелинейных уравнений // Сб. науч. тр. – Липецк: ЛГТУ-ЛЭГИ, 1997. – С. 105-114. 22. Блюмин С.Л., Погодаев А.К., Тарасов А.А. Алгоритмы блочной пошаговой линейной и нелинейной регрессии в оптимальном моделировании технологических связей // Изв. вузов. Черная металлургия. – 1995. – № 9. – С. 37-41. 23. Алгебраические основы методов линеаризации решения систем нелинейных уравнений / С.Л. Блюмин, А.К. Погодаев, А.А. Тарасов, А.Л. Куменков // Математическое и информационное обеспечение автоматизированных систем: Сб. науч. тр. – Липецк: ЛГТУ, 1997. – С. 79-83. 24. Брахман Т.Р. Многокритериальность и выбор альтернативы в технике. – М.: Радио и связь, 1984. – 288 с. 25. Бусленко В.Н. Автоматизация имитационного моделирования сложных систем. – М.: Главная редакция физико-математической литературы изд-ва «Наука», 1977. 26. Бусленко Н.П. Моделирование сложных систем. – 2-е изд., перераб. – М.: Наука, 1978. – 399 с. 27. Бусленко Н.П., Калашников В.В., Коваленко И.Н. Лекции по теории сложных систем. – М.: Советское радио, 1973. – 440 с. 28. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на C++: Пер. с англ. – М.: «Издательство Бином»; СПб.: «Невский диалект», 1998. – 560 с. 29. Вагин П.П., Дубровская И.С., Сютрик И.С. Имитационная модель системы контроля качества функционирования дискретного технологического процесса // Исследования в области метрологии АСУ техническими процессами: Сб. науч. тр. – Львов: ВНИИМИУС, 1986. – С. 45-51. 30. Виленкин Н.Я. Специальные функции и теория представлений групп. – М.: Наука, 1965. – 588 с. 31. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. – М.: Мир, 1985. – 509 с. 32. Гординский А.А. Метод оценивания в линейной регрессии // Заводская лаборатория. – 1993. – № 5. – С. 48-52. 33. Демиденко Е.В. Линейная и нелинейная регрессии. – М.: Финансы и статистика, 1981. – 302 с. 34. Демиденко Е.В. Оптимизация и регрессия. – М.: Наука, 1989. – 296 с. 35. Демиденко Е.З. Вычислительные вопросы нелинейной регрессии // Заводская лаборатория. – 1986. – № 3. – С. 51-54. 36. Доброе Г.М., Ершов Ю.В., Левин Б.И. Экспертные оценки в научно-техни-ческом прогнозировании. – Киев: Наукова думка, 1974. – 160 с. 37. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. – М.: Финансы и статистика, 1986. 38. Дубровский С.А. Прикладной многомерный статистический анализ. – М.: Финансы и статистика, 1982. – 215 с. 39. Дьяченко В.Ф. Основные понятия вычислительной математики. – М.: Наука, 1972. – 120 с. 40. Дэннис Д., Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений. – М.: Мир, 1988. – 440 с. 41. Дюран Б., Одел П. Кластерный анализ. – М.: Статистика, 1977. – 182 с.
-123-
42. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации. – М.: Наука, 1982. – 311 с. 43. Жадан В.Т., Маневич В.А. Совершенствование технологии прокатки на основе комплексных критериев качества. – М.: Металлургия, 1989. – 96 с. 44. Жамбю М. Иерархический кластер-анализ и соответствия. – М.: Финансы и статистика, 1988. – 342 с. 45. Жиглявский А.А., Жилинскас А.Г. Методы поиска глобального экстремума. – М.: Наука, 1991. – 248 с. 46. Закс Л. Статистическое оценивание. – М.: Статистика, 1976. – 598 с. 47. Зангвилл У. Нелинейное программирование. Единый подход. – М.: Советское радио, 1973. – 312 с. 48. Ивахненко А.Г., Юрачковский Ю.П. Самоорганизация моделей по экспериментальным данным. – М.: Радио и связь, 1985. – 300 с. 49. Ивченко Г.И., Каштанов В.А., Коваленко И.Н. Теория массового обслуживания: Учеб. пособие для вузов. – М.: Высш. школа, 1982. – 256 с. 50. Илющенко В.И., Козма П. Решение задач МНК с применением стандартных и SVD программы. – Дубна: ОИЯИ, 1989. – 34 с. 51. Имитационное моделирование производственных систем / Под общ. ред. чл. кор. АНСССР А.А. Вавилова. – М.: Машиностроение; Берлин: Техник, 1983. – 416 с. 52. Исследование операций: В 2-х т.; Пер. с англ. / Под ред. Дж. Моудера, С. Элмаграби. – М.: Мир, 1981. 53. Кабаев С.В. Программный пакет InTouch восходит на вершину // Энергетика. – 1997. – № 12. – C. 32-40. 54. Карпачев И.И. Классификация компьютерных систем управления предприятием. – http: // www. akdi. ru/avt-upr/klass/korp. htm. 55. Кендэл М. Ранговые корреляции. – М.: Статистика, 1975. – 214 с. 56. Клейнен Дж. Статистические методы в имитационном моделировании: В 2-х вып. / Пер. с англ. Ю.П. Адлера и др.; Под ред. и с предисл. Ю.П. Адлера и В.Н. Варыгина. – М.: Статистика, 1978. 57. Клейнер Г.Б. Производственные функции: Теория методы, применение. – М.: Финансы и статистика, 1986. – 239 с. 58. Клир Дж. Системология. Автоматизация решения системных задач. – М.: Радио и связь, 1990. – 554 с. 59. Крамер Г. Математические методы статистики. – М.: Мир, 1975, – 648с. 60. Кривцов А.М., Шеховцов В.В. Сетевое планирование и управление. – 2-е изд., доп. и перераб. – М.: «Экономика», 1978. – 191 с. 61. Кузнецов Л.А. Введение в САПР производства проката. – М.: Металлургия, 1991. – 112 с. 62. Кузнецов Л.А. Применение УВМ для оптимизации тонколистовой прокатки. – М.: Металлургия, 1988. – 304 с. 63. Система автоматизированного проектирования сквозной технологии производства листового проката / Л.А. Кузнецов, А.Д. Белянский, А.М. Корнеев, А.К. Погодаев // Сталь. – 1994. – № 8. – С. 51-54. 64. Кузнецов Л.А., Блюмин С.Л., Погодаев А.К. Выбор рациональной технологии производства листового проката с использованием методов математического программирования // Изв. вузов. Черная металлургия. – 1991. – № 9. – С. 64-66.
-124-
65. Кузнецов Л.А., Блюмин С.Л., Погодаев А.К. Статистическая оценка точности оптимизации технологических параметров на основе нелинейной регрессии // Изв. вузов. Черная металлургия. – 1992. – № 7. – С. 69-71. 66. Кузнецов Л.А., Блюмин С.Л., Погодаев А.К. Статистическое оценивание оптимальных значений технологических параметров металлургических процессов // Изв. вузов. Черная металлургия. – 1990. – № 11. – С. 55-57. 67. Сочетание методов математического программирования для оптимизации качества листовой стали / Л.А. Кузнецов, С.Л. Блюмин, А.К. Погодаев, В.В. Ведищев // Изв. вузов. Черная металлургия. – 1992. – № 5. – С. 54-55. 68. Кузнецов Л.А., Гордеев В.В. Система построения имитационной модели и управления сложного производства // Изв. вузов. Черная металлургия. – 1994. – № 7. – С. 35-38. 69. Кузнецов Л.А., Погодаев А.К., Бурцев В.Д. Объектно-ориентированный подход к моделированию сложных производств // Изв. вузов. Черная металлургия. – 2001. – № 7. – С. 55-58. 70. Кузнецов Л.А., Погодаев А.К., Гостеев В.Г. Применение экспертных систем для управления качеством металлопродукции // Изв. вузов. Черная металлургия. – 2001. – № 9. – С. 52-56. 71. Кузнецов Л.А., Погодаев А.К., Корнеев А.М. Статистические модели в задачах оптимизации сквозной технологии производства автолистовой стали // Изв. вузов. Черная металлургия. – 1990 № 3. – С. 34-36. 72. Кузнецов Л.А., Погодаев А.К., Угаров А.А. Управление качеством продукции // Современные сложные системы управления СССУ/HTCS’2002: Сб. тр. междунар. науч.-техн. конф. – Старый Оскол: СТИ МИСиС, 2002. – С. 77-80. 73. Кузнецов Л.А., Толстова Т.А. Определение оптимального базиса аппроксимации экспериментальных данных // Заводская лаборатория. – 1995. – № 10. – С. 45-50. 74. Кучеряев Б.В., Блинков А.Е. Критериальный идентификатор стратегии управления оператора // Изв. вузов. Черная металлургия. – 1991. – № 9. – С. 70-72. 75. Лифшиц А.Л., Мальц Э.А. Статистическое моделирование систем массового обслуживания. – М.: Советское радио, 1978. – 248 с. 76. Логинов Э.А., Логинов В.Э. Сравнение некоторых методов выбора регрессии из полиномов с одним аргументом // Заводская лаборатория. – 1994. – № 5. – С. 38-43. 77. Лоран П.-Ж. Аппроксимация и оптимизация. – М.: Мир, 1975. – 496 с. 78. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов. – М.: Наука, 1986. – 232 с. 79. Льюнг Л. Идентификация систем. Теория для пользователя. – М.: Наука, 1991. – 432 с. 80. Лямбах Р.В., Климовицкий М.Д. Проблемы автоматизации прокатного производства: Аналитический обзор // Сталь. – 1999. – № 2. – С. 43-47. 81. Меденков А.А., Пятунин Г.А. Регулирование и контроль качества проката на основе статистических методов // Сталь. – 1987. – № 7. – С. 55-58. 82. Минимизация в инженерных расчетах на ЭВМ. Библиотека программ / Гуснин С.Ю., Омельянов Г.А., Резников Г.В. и др. – М.: Машиностроение, 1981. – 120 с. 83. Мину М. Математическое программирование. – М.: Наука, 1990. – 488 с. 84. Молчанов А.А. Моделирование и проектирование сложных систем. – К.: Выща шк. Головное изд-во, 1988. – 359 с.
-125-
85. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия: В 2-х вып. – М.: Финансы и статистика, 1982. 86. Влияние химического состава и режимов отжига на свойства и склонность к старению стали 08Ю / Ю.А. Мухин, А.Ф. Пименов, И.Г. Родионова, А.П. Шаповалов // Тонколистовая прокатка: Межвуз. сб. – Воронеж, 1986. – С. 43-46. 87. Налимов В.В. Теория эксперимента. – М.: Наука, 1971. – 207 с. 88. Неймарк Ю.И., Теклина Л.Г. Метод наименьших квадратов как управляемая динамическая система // Исследовано в России: Электронный журнал. – 2002. – http: // zhurnal. ape. relarn. ru/articles/ 2002/059. pdf. 89. Автоматизированная система управления качеством при производстве электронной техники / Ю.И. Нестеров, А.И. Власов, А.Г. Тимошкин, И.П. Иванов. – http: // iu4. bmstu. Ru /rus/nauka/ neurasu/neurasu. htm. 90. Огасавара Акинобу. Автоматизация процессов и информационные сети // Япония, Кэйсоку то сэйгё. – 1985. – Т. 24. – № 2. – С. 132-136. 91. Инструментальная система поддержки вычислительного эксперимента / А.Г. Олейник, А.В. Смагин, Ф.Я. Фридман, О.В. Фридман // Программные продукты и системы. – 1999. – № 2. – C. 7-13. 92. Оптимизация качества. Сложные продукты и процессы / Э.В. Калинина, А.Г. Лапига, В.В. Поляков и др. – М.: Химия, 1989. – 256 с. 93. Официальный сервер ISO9000. Современный менеджмент качества. – http: // www. ISO9000. ru. 94. Пашковский А.П. Комплекс Программных средств TRIM: Аналитическая записка. – http: // www. trim. ru. 95. Питер Д. Шайнин Инструменты качества. Ч. 3: Контрольные карты // Методы менеджмента качества. – 2000. – № 1. – С. 17-22. 96. Погодаев А.К. Адаптивные методы определения приоритетов показателей качества металлопродукции // Изв. вузов. Черная металлургия. – 2002. – № 7. – С. 51-53. 97. Погодаев А.К., Анненков А.В. Метод оптимизации графов с нагруженными вершинами // Вестник ЛГТУ-ЛЭГИ. – Липецк: ЛЭГИ, – № 1(7). – 2001. – С. 37-39. 98. Погодаев А.К., Гостеев В.Г. О выборе рациональных оптимизационных стратегий // Вестник ЛГТУ-ЛЭГИ. – Липецк: ЛЭГИ. – № 1. – 1998. – Т. 1. – С. 86-89. 99. Пойкер Т., Гейд Д., Мюллер Х. Обоснование новых решений в прокатном производстве моделированием технологических потоков // Сталь. – 1999. – № 10. – С. 47-50. 100. Полухин В.П. Математическое моделирование и расчет на ЭВМ листовых прокатных станов. – М.: Металлургия, 1972. – 512 с. 101. Пытьев Ю.П. Математические методы интерпретации эксперимента. – М.: Высшая школа, 1989. – 351 с. 102. Реклейтис Г., Рейвиндран А., Рэгсдел К. Оптимизация в технике: В 2-х кн. – М.: Мир, 1986. – 245 с., 227 с. 103. Рожков И.М., Власов С.А., Мулько Г.Н. Математические модели для выбора рациональной технологии и управления качеством стали. – М.: Металлургия, 1990. – 184 с. 104. Рубан А.И. Идентификация нелинейных динамических объектов на основе алгоритма чувствительности. – Томск: ТГУ, 1975. – 270 с.
-126-
105. Салыга В.И., Карабутов Н.Н. Идентификация и управление процессами в черной металлургии. – М.: Металлургия, 1986. – 192 с. 106. Себер Д. Линейный регрессионный анализ. – М.: Мир, 1980. – 456 с. 107. Современные методы идентификации систем / Под ред. Эйкхофа. – М.: Мир, 1983. – 397 с. 108. Судаков Р.С. Теория псевдополуобратных матриц и ее применение к задачам оценки надежности. – М.: Знание, 1981. – 106 с. 109. Сунчелей И.Р. Комплексное решение по созданию корпоративной информационной системы предприятий металлургической отрасли – АйТи – Вертикаль: Металлургия. – http: // www. intres. ru/konfter/ati. htm. 110. Таха Х. Введение в исследование операций: В 2-х кн. – М.: Мир, 1985. – Кн. 1. – 479 с. 111. Хардле В. Прикладная и непараметрическая регрессия. – М.: Мир, 1991. – 222 с. 112. Химмельблау Д. Прикладное нелинейное программирование. – М.: Мир, 1975. – 534 с. 113. Цвиркун А.Д. Основы синтеза структуры сложных систем. – М.: Наука, 1982. – 203 с. 114. Цвиркун А.Д. Структура сложных систем. – М.: Сов. радио, 1975. 115. Целиков А.И., Никитин Г.С., Рокотян С.Е. Теория продольной прокатки. – М.: Металлургия, 1980. – 320 с. 116. Цыпкин Я.З. Адаптация и обучение в автоматических системах. – М.: Наука, 1968. – 400 с. 117. Цыпкин Я.З. Основы теории обучающихся систем. – М.: Наука, 1970. – 252 с. 118. Шеметов Д.В., Осипов Ю.М. Нейросетевая имитационная модель наукоемкой машиностроительной продукции // Автоматизация и современные технологии. – 1999. – № 7. – С. 33-34. 119. Шеннон Р. Имитационное моделирование систем – искусство и наука: Пер. с англ. – М.: Мир, 1978. – 422 с. 120. Шумский В.М., Шумская Т.Н. О применении метода псевдообращения для решения плохо обусловленных задач МНК // Заводская лаборатория. – 1989. – № 1. – С. 81-86. 121. Эфрон В. Нетрадиционные методы многомерного статистического анализа. – М.: Финансы и статистика, 1988. – 263 с. 122. Blyumin S.L., Pogodayev A.K. Blockwise Recursive-Iterative Procedures for the Leastsquares Solution of Non-linear Problems // Comput. Maths Math. Phys. – Vol. 32. – № 8. – 1992. – PP. 1059-1064. 123. Blyumin S.L., Pogodayev A.K. Superpositional Regression // Comput. Maths Math. Phys. – Vol. 35. – № 10. – 1995. – PP. 1269-1273. 124. Feuiillete D., Amet J.P. Introduction du SPC (Statistical process control) sur le train a bandes de Sollac Florange // Rev. Met. – 1988, 85. – № 4. – P. 325-330. 125. The Automatic Engineering System of a Through Rolled-Stock Production Technology / L.A. Kuznetsov, A.D. Belyansky, A.M. Korneev, A.K. Pogodayev. – Proc. ICSE Coventry University. – Vol. 1. – 1994. – 6-8 September. – PP. 646-649.
-127-
ББК 22.18 УДК 681.3:62-52 П50
Погодаев А.К., Блюмин С.Л. АДАПТАЦИЯ И ОПТИМИЗАЦИЯ В СИСТЕМАХ АВТОМАТИЗАЦИИ И УПРАВЛЕНИЯ
ISBN 5-900037-35-5 В монографии приведено описание современного подхода для решения проблем при разработке математического и программного обеспечения автоматизированных систем управления производственными и технологическими процессами. В качестве примера представлены результаты реализации подхода для металлургического предприятия. Издание утверждено НТС и РИС ЛЭГИ и рекомендовано научным сотрудникам и специалистам, занимающимся вопросами проектирования автоматизированных систем управления. Компьютерная верстка и редактирование И.Ф. Ковешниковой Подписано в печать 27.03.2003 г. Бумага 55-60 г/м2. Формат 60х84/16. Гарнитура «Таймс». Усл. печ. л. 8,0. Тираж 250 экз. Заказ № 691. Цена свободная. Издательство ЛЭГИ. 398 600, Липецк, ул. Интернациональная, 5а. Ризография ЛЭГИ. 398 600, Липецк, ул. Интернациональная, 5а.
-128-