Г. ВАГНЕР
ОСНОВЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
Harvey M. Wagner Department of Administrative Science Yale University; Consult...
6 downloads
363 Views
10MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Г. ВАГНЕР
ОСНОВЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
Harvey M. Wagner Department of Administrative Science Yale University; Consultant to McKinsey and Company, Inc.
Principles of Operations Research With Applications to Managerial Decisions
Prentice-Hall, Inc., Englewood Cliffs, New Jersey 1969
Г. ВАГНЕР ОСНОВЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
Том 3
Перевод с английского Б. Т. Вавилова
Издательство «Мир» Москва 1973
УДК.35.073.5
В томе 3 отражены современные достижения в области стохастического моделирования и рассмотрены многочисленные проблемы оптимизации управляющих решений применительно к процессам, явлениям и состояниям, характеризуемым параметрами, подчиняющимися законам теории вероятностей. Как и в первых двух томах, приведен ряд поучительных примеров, иллюстрирующих возможности излагаемых методов (модели очередей, вероятностные модели управления запасами, модель управляемой экономики и др.). Автор знакомит читателя также с проблемой построения имитационных моделей систем управления и возможностями реализации такого рода моделей на ЭВМ. Заключительная глава данного тома посвящена вопросам организации работ на всех этапах операционного исследования и практического использования получаемых при этом результатов.
Редакция литературы
по вопросам новой техники
Перевод на русский язык, «Мир», 1973
3314-336 041(01)-73
ГЛАВА 16
Введение в теорию стохастических оптимизационных моделей 16.1. УПРАВЛЯЮЩИЕ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
В предшествующих томах рассматривались оптимизационные модели, для практической реализации которых необходимо полностью детерминированное представление всех исходных данных. Именно так обстоит дело с линейными моделями *), при построении которых постулировалось, что удельная прибыль, потребительский спрос, уровни запасов и т. д. являются величинами, определяемыми совершенно однозначно. При рассмотрении задач управления запасами, календарного планирования производства и замены оборудования 2) также предполагалось, что задание числовых значений параметров, фигурирующих в соответствующих моделях, не сопряжено с какой бы то ни было неопределенностью. Но, поскольку в реальных условиях по крайней мере некоторые из упомянутых выше показателей известны лишь приближенно, у многих может возникнуть сомнение относительно практической ценности методов оптимизации, рассмотренных в первых двух томах. Поспешим, однако, еще раз заверить читателя в том, что детерминистические модели находят широкое практическое применение. Вопрос заключается лишь в том, когда применимы такого рода модели для решения реальных задач организационного управления. Исключительно важно (и далеко не всегда просто) найти правильный ответ именно на этот вопрос. Ниже приводятся некоторые соображения, которые при анализе данной проблемы могут быть весьма полезными. Чтобы этот анализ был всесторонним, необходимо 1) в каждом конкретном случае добиться понимания внутренней природы имею, щейся неопределенности и увидеть ее истоки; 2) представить себекаким образом учитывается эта неопределенность выбранной математической моделью; 3) разобраться в существе метода, с помощью которого находится численное решение для данной модели при наличии надлежащих исходных данных. Таким образом, приступай к исследованию с целью решения той или иной практической задачя организационного управления, операционист должен прежде всего выяснить I) с какими видами неопределенности ему придется столкнуться и каким образом это может отразиться на выборе оптимального решения; II) можно ли в рамках принятой модели адекватным образом учесть недетерминистский характер исследуемой ситуации. 1 2
) См. т. 1 (в частности, гл. 2). ) См. гл. 8—11 в т. 2.
ГЛАВА 16
Выбор наиболее эффективного метода получения численного решения для той или иной оптимизационной модели — важный момент любого прикладного операционного исследования. Задача эта, однако, является сугубо математической (или, можно сказать, технической). В последующих главах читателю будут представлены широкие возможности познакомиться с различными формальными методами решения оптимизационных задач. Однако в процессе изучения материала не следует слишком углубляться в математические дебри, так как при этом можно упустить из поля зрения требования, изложенные в пп. I) и II), и, следовательно, не увидеть самого главного. Ниже ,рассмотрены две явно упрощенные постановки задачи, помогающие усвоить основные моменты анализа операционно-исследовательской ситуации и служащие ориентиром при поисках ответов на вопросы, содержащиеся в пп. I) и II). Пример 1. Фирма «Бонбон», занимающаяся производством продуктов питания, стоит перед дилеммой: увеличивать ли ей производственные мощности уже действующего завода или строить новое предприятие такого же профиля. По мнению президента фирмы, решение этой дилеммы существенно зависит от того, какая доля рынков сбыта будет принадлежать фирме в течение ближайших десяти лет. Допустим, что плановый отдел фирмы «Бонбон» располагает всеми прочими данными, которые следует принять во внимание при выработке окончательного решения, и считает, что организационно-технологическая структура производства и процессы сбыта готовой продукции могут быть математически представлены в виде линейной модели, аналогичной моделям, приведенным в гл. 2. Президенту фирмы необходимо убедиться, что экономический анализ проблемы в явной форме учитывает неопределенность той части общего объема сбыта рассматриваемых изделий, которая в перспективе будет приходиться на долю фирмы. Следует постоянно помнить, что главное в постановке задачи— это решение, где целесообразнее разместить дополнительные производственные мощности. Значения других управляемых переменных, учитываемых моделью (как, например, объемы сбыта каждого вида продукции, средний и пиковый уровни запасов или требуемые объемы сырьевых поставок), в соответствии с предположением представляют меньший интерес, хотя и используются при обосновании основного решения. Следовательно, экономический анализ задачи целесообразно проводить следующим образом. Вначале с помощью детерминированной линейной модели нужно найти наилучший вариант расширения производства для ряда предположительных и вероятных значений такого параметра, как часть общего объема сбыта рассматриваемых изделий, приходящаяся на долю фирмы. Если в результате выяснится, что оптимальное решение нечувствительно к этому параметру, то можно утверждать, что используемая линейная модель адекватно учитывает упомянутый выше элемент неопределенности. Если же обнаруживается, что реше-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
7
ние обладает сильной чувствительностью к вариациям указанного параметра, то необходим дополнительный анализ задачи. В частности, для каждого значения доли рынка, контролируемой фирмой, следует найти численное значение суммарной прибыли (получаемой, скажем, за год). При этом может быть установлено, что, несмотря на чувствительность основного решения к доле рынка, контролируемой фирмой, суммарная прибыль оказывается практически нечувствительной к этому параметру. Если прибыль также сильно зависит от доли рынка, контролируемой данной фирмой, то для содержательного анализа задачи необходимо каким-то образом получить оценку правдоподобия каждого выбранного значения доли рынка, контролируемой фирмой. Фирма может пойти на дополнительное исследование рынка с тем, чтобы получить информацию, позволяющую уменьшить диапазон неопределенности и подготовить более веские основания для принятия окончательного решения относительно расширения производства. Таким образом, в ходе анализа проблемы расширения производства фирмы «Бонбон» исследуется природа неопределенности рыночной конъюнктуры и влияние этой неопределенности на формирование управляющего решения. За основу при этом принимается некоторая линейная оптимизационная модель, а влияние неопределенности устанавливается с помощью анализа на чувствительность (гл. 5). Если такого рода анализ показывает, что прибыль существенно зависит от доли рынка, контролируемой фирмой, то президент фирмы «Бонбон» может определить «риск» для каждого варианта решения путем оценки правдоподобия различных значений рассматриваемого параметра. Более того, фирма может оценить экономический эффект, достигаемый за счет получения дополнительной информации о рынках сбыта на этапе выработки окончательного решения. Что же касается численных значений ряда фигурирующих в этой сложной задаче управляемых переменных (объемов поставок, уровней запасов и др.), то для их определения планирующий орган фирмы, безусловно, должен прибегнуть к помощи стандартных процедур линейного программирования и воспользоваться вычислительными возможностями большой современной ЭВМ. Пример 2. Обратимся теперь к другому примеру, который на первый взгляд обнаруживает сходство с только что рассмотренным. Представим себе, что у фирмы «Цветметалл», являющейся одним из крупнейших поставщиков слитков цветных металлов, имеется несколько десятков заводов, расположенных в различных географических районах США. Центральные службы фирмы располагают четырьмя относительно небольшими ЭВМ, 70% машинного времени которых используется для подготовки стандартных сводных бухгалтерских отчетов, а остальное время отводится для выполнения вычислительных работ, связанных со специальными исследованиями, проводимыми научно-поисковыми группами и отделом исследования операций. Несмотря на то что средняя доля машинного времени,
8
ГЛАВА 16
расходуемого на эти специальные исследования в течение года, приблизительно известна, потребности научно-поисковых групп в «услугах» ЭВМ в сильной степени варьируются во времени, и нередко заказы на проведение специальных вычислительных работ с помощью ЭВМ поступают «целыми пачками». У фирмы имеется также несколько малых ЭВМ, которые находятся непосредственно при заводах; 50% машинного времени этих ЭВМ расходуется на составление бухгалтерских отчетов предприятий, а остальное время уходит на удовлетворение потребностей местных «технических» групп, таких, как отдел главного конструктора или отдел главного технолога. Начальником производственного отдела, отвечающим за эксплуатацию электронно-вычислительного комплекса фирмы, установлено, что в течение 4—5 (а иногда и 10) дней как ЭВМ центральных служб, так и ЭВМ на предприятиях оказываются перегруженными. Будучи уверенным в том, что нехватка машинного времени в эти периоды приводит к дорогостоящим и вызывающим естественное раздражение задержкам в производстве, он планирует установить в центральных службах фирмы либо одну ЭВМ средней мощности взамен имеющихся там четырех ЭВМ, либо одну большую ЭВМ, заменив ею парк ЭВМ центральных служб и некоторые из малых ЭВМ, размещенных на предприятиях. Начальник производственного отдела четко представляет себе, что при принятии организационного решения необходимо учесть ряд трудноформализуемых факторов, в частности относительные преимущества децентрализованного использования ЭВМ. Однако ему хотелось бы сопоставить эти соображения с возможностями более мощной и экономически более эффективной ЭВМ. Кроме того, с помощью нового вычислительного комплекса он намерен устранить или по крайней мере существенно снизить наблюдающиеся перегрузки ЭВМ и обусловленные ими задержки и перерывы в производстве. То, что в какой-то момент возникнет необходимость реконструировать электронно-вычислительный комплекс фирмы, начальник производственного отдела понял уже несколько лет назад. Именно тогда им были начаты работы по сбору и систематизации данных, • относящихся ко всем режимам функционирования принадлежащих фирме ЭВМ. Поэтому начальнику производственного отдела фирмы было известно, например, количество часов, расходуемое каждой ЭВМ на составление платежных ведомостей, на учет складских запасов, на проверку правильности оформления счетов и т. д. Фирмы,, занимающиеся производством ЭВМ, снабдили его временными показателями выполнения тех же самых видов работ с помощью больших ЭВМ и ЭВМ среднего размера. Начальник производственного отдела фирмы обратился в отдел исследования операций с просьбой помочь ему проанализировать возникшую проблему. Фактически начальник производственного отдела уже располагал (в первом приближении) данными для построения линейной модели. По его мнению, управляемыми переменными
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
9
Xjj должны явиться частоты поступления заказов на выполнение работы i-ro вида на ЭВМ /-го типа 1); коэффициент при управляемой переменной хц должен выражать скорость выполнения машиной /-го типа работы i-ro вида; ограничения должны отражать то обстоятельство, что суммарное число «заказов» на выполнение каждого, вида работ, а также машинное время каждой ЭВМ лимитированы; целевая функция должна выражаться через величины Cjj, представляющие собой стоимость выполнения работы i-ro вида на ЭВМ ;-го типа. Можно ли задачу фирмы «Цветметалл» анализировать таким же образом, как и задачу фирмы «Бонбон»? Одинакова ли в этих задачах роль неопределенности? Что думает по этому поводу читатель? Как на первый, так и на второй вопрос следует дать отрицательный ответ. Попытаемся это аргументировать. В примере с фирмой «Бонбон» получаемая прибыль однозначно выражается через среднегодовые показатели, так как доля рынка, контролируемого этой фирмой, является той основой, которая определяет производственную деятельность фирмы в течение года. В случае фирмы «Цветметалл» метод усреднения (на некотором большом интервале времени, например равном одному году) исказил бы саму суть проблемы «перегрузок», так как последние обусловлены неравномерностью (во времени) поступления заявок на различные виды вычислительных работ или, другими словами, неравномерным временным распределением потребностей в машинном времени. Совершенно очевидно, что и при существующей структуре электронно-вычислительного комплекса все виды работ в конечном итоге оказываются выполненными — дополнительные вычислительные мощности требуются для того, чтобы сократить задержки в выполнении «заказов», обусловленные неравномерностью их поступления. Таким образом, математическая модель будет в данной ситуации полезной лишь в том случае, если в ней будет отражено влияние случайных событий в самом процессе функционирования исследуемой системы. Другими словами, метод анализа рассматриваемой проблемы должен учитывать текущие события с тем, чтобы обеспечить оценку среднего числа заказов, выполняемых в течение года с существенными задержками. Читателю, видимо, интересно было бы знать, можно ли для задачи фирмы «Цветметалл» построить такую модель, в которой использовались бы усредненные (за год) данные и одновременно учитывалось бы влияние «текущей» неопределенности. Не исключено, что это возможно. Однако модель такого типа, по-видимому, была бы неудобной для практического использования. Перегрузки ЭВМ можно было бы учесть с помощью «специального» приема путем введения фиктивного дополнительного времени на выполнение работы й ) То есть величины, показывающие, сколько раз за единицу времени; (например, в течение года) работу г-го типа выполняли на ЭВМ /-го типа.— Прим. перев.
10
ГЛАВА 16
i-ro вида на ЭВМ ;'-го типа. Такой прием в сочетании с анализом модели на чувствительность мог бы быть достаточно эффективным, если бы в задаче фигурировало лишь весьма небольшое число видов работ и типов ЭВМ. Однако, знакомясь с последующими главами, , читатель убедится, что существуют другого класса модели, именуемые стохастическими (или вероятностными), которые в значительно большей степени приспособлены для анализа задач, связанных с оптимизацией так называемой пропускной способности. В этих моделях используются данные предыдущих наблюдений (или измерений), позволяющие описать вероятностный характер поступления «заявок» на обслуживание и, следовательно, заострить внимание на элементах неопределенности, свойственных задачам такого типа. Что касается методов нахождения (численных) решений для стохастических моделей, то их детальное обсуждение было бы пока преждевременным и практически невозможным. Они составят предмет особого рассмотрения в последующих разделах книги. Пока же достаточно отметить, что в зависимости от математической структуры модели для получения численных решений задач стохастического характера могут использоваться алгоритмы линейного или нелинейного программирования, методы динамического программирования, а в тех случаях, когда ни один из перечисленных способов не приводит к успеху, возможно применение так называемого имитационного моделирования (гл. 21). Таким образом, по мере ознакомления с материалом, содержащимся в данном томе, читатель сможет убедиться в том, что вычислительные методы, развитые в предыдущих томах, оказываются также эффективными и при решении многих стохастических задач. Кроме того, ниже будет изложен ряд специальных методов и приемов решения задач, содержащих элементы неопределенности. Предварительные замечания относительно вероятностных моделей. В рассмотренных выше примерах обсуждались два различных способа учета неопределенности при решении задач организационного управления: 1) с помощью анализа на чувствительность решения, полученного для детерминированной модели, и 2) путем построения модели, содержащей фактор неопределенности в явном виде. Основным предметом обсуждения в данном томе является методология учета и анализа вероятностных характеристик в оптимизационных моделях. При этом любая неопределенность будет рассматриваться нами как совокупность неполных предсказаний, характеризуемая некоторым распределением вероятностей различных возможных событий (или исходов). Во многих случаях построенные таким образом модели будут представлять собой лишь в определенной степени усложненные варианты детерминистических моделей, решения для которых могут быть найдены уже известными нам методами. Однако это имеет место далеко не всегда. В ряде случаев для получения решения достаточно лишь подставить математическое ожидание той или иной величины в детерминистическую модель; однако гораздо
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
Ц
чаще для получения численных решений нам придется (если это не будет сопряжено со слишком большими трудностями) искать соответствующую оптимальную стратегию. Если же нахождение оптимальной стратегии окажется слишком затруднительным, мы будем вынуждены использовать в процессе вычислений произвольные (принятые на основании здравого смысла) предположения относительно характера и «поведения» неопределенности. В любом случае по сравнению с детерминистическими моделями использовать вероятностные модели значительно сложнее. Во-первых, возникают трудности концептуального характера (например, связанные с интерпретацией самого понятия «вероятность» и с определением критерия оптимальности; см. разд. 16.2). Во-вторых, появляются дополнительные трудности технического порядка, обусловленные особенностями математического аппарата, используемого при решении стохастических задач оптимизации. Так, например, даже в том случае, когда стохастическая модель является простым обобщением ее детерминистического аналога, объем вычислительных процедур возрастает, поскольку приходится рассматривать каждое возможное событие вместо одной-единственной оценки. Кроме того, в стохастических моделях критериальные функции г), как правило, являются нелинейными, и, следовательно, задача оптимизации носит более сложный характер. В-третьих, для нахождения распределения вероятностей требуется большое число исходных данных. Например, руководитель фирмы может заметить флуктуации цен на продукцию конкурирующей фирмы, однако далеко не всегда ему удается сформулировать соответствующий закон распределения вероятностей. Таким образом, абстрагируясь от мотивов чисто познавательного плана, можно утверждать, что интерес к стохастическим явлениям был бы весьма ограниченным, если бы его не стимулировала практическая необходимость решения конкретных задач организационного управления. Еще раз об искусстве выбора модели. Мы снова возвращаемся к вопросу: каким образом при решении конкретной практической задачи организационного управления производится выбор подходящей для этого случая математической модели? К сожалению, нет такого учебника, который содержал бы непогрешимые рецепты, позволяющие сделать этот выбор совершенно безошибочным. Операционист вынужден полагаться на опыт, здравый смысл и непрерывный анализ реальных ситуаций. Выполняя конкретное исследование, операционист (так же как и руководитель) обычно имеет возможность получить квалифицированную консультацию или мудрый совет со стороны. В этом можно видеть некоторое утешение. Однако если принимать управляющее решение предстоит вам, то и ответственность за это решение (каковы бы ни были его последствия) придется нести именно вам, а не вашим To есть критерии эффективности, или целевые функции.— Прим. перев.
12
ГЛАВА 16
советчикам. Следовательно, работая над освоением излагаемых здесь методов эффективного использования математического аппарата при решении задач организационного управления, читатель не должен забывать о том, что это не избавляет его от необходимости развивать в себе творческие способности и профессиональную интуицию. Чтобы помочь читателю справиться с этой задачей, мы подобрали для данного тома значительное число примеров, представляющих собой стохастические аналоги моделей, рассмотренных в предыдущих томах. Необходимо развить в себе умение видеть влияние неопределенности на постановку организационно-управленческой задачи через призму модели. Тогда, столкнувшись с практической задачей принятия управляющего решения в условиях неопределенности,, читатель сможет более уверенно определить те существенные моменты, которые необходимо отразить в математической модели, и, следовательно, найти ключ к решению проблемы. Некоторые методические указания. В оставшейся части этой главы, а также в двух последующих главах показано, каким образом можно обобщить многие из задач, рассмотренные в предыдущих томах, с тем чтобы учесть в них элементы случайности. Одновременно сформулирован ряд общих положений (теорем) об оптимальных решениях для стохастических моделей. Наконец, продемонстрирована применимость уже известных читателю методов (в частности, линейного и динамического программирования) для нахождения в случае такого рода моделей соответствующих численных решений. Таким образом, три первых главы этого тома свяжут весь последующий материал с содержанием двух предыдущих томов. Важно вместе с тем иметь в виду, что многие из моделей, рассмотренные в первых трех главах настоящего тома, носят слишком общий характер. В них явно недостаточно представлена «тонкая» структура и нечетко определена форма представления оптимального решения. Поэтому глубинное содержание понятия «оптимальное решение» здесь раскрывается далеко не в полной мере, а модели трудно поддаются количественному анализу. Однако в последующих главах читатель найдет хорошо структурированные модели, позволяющие разобраться в подробностях метода стохастического программирования. Один исключительно важный класс вероятностных моделей связан с задачей управления запасами в условиях, когда спрос на продукцию заранее не известен. Несколько моделей этого класса, а также ряд наиболее эффективных методов их анализа рассмотрены в гл. 19 и приложении II. Другой, имеющий широкое применение класс стохастических моделей ориентирован на решение так называемых задач массового обслуживания. Именно к такой категории можно отнести рассмотренную выше задачу обновления электронно-вычислительного комплекса фирмы «Цветметалл». Если условия образования и обслуживания очереди не слишком сложны, рабочие характеристики системы (такие, как средняя длина очереди, среднее
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
13
время ожидания и вероятность наступления событий, когда очередь полностью отсутствует) могут быть найдены с помощью аналитических методов, изложение которых содержится в гл. 20 и приложении III. Результаты, обсуждению которых посвящены указанные разделы тома, позволяют, кроме того, оценить в целом возможности стохастического программирования при решении задач минимизации задержек, связанных с ожиданием обслуживания. Процессы образования очередей в условиях вероятностного характера потока заявок бывают иногда настолько сложными, что их анализ стандартными математическими методами оказывается затруднительным; для исследования такого рода процессов нередко приходится применять имитационное моделирование с помощью ЭВМ. Основы имитационного моделирования на ЭВМ, а также ряд конкретных приемов построения имитационных моделей излагаются в гл. 21. При изучении каждой из приведенных ниже стохастических моделей полезно заострить внимание на следующих вопросах: 1. Какова оптимальная стратегия детерминистического аналога рассматриваемой модели? 2. Какой объем информации о распределении вероятностей необходим для определения оптимального решения? Рассмотрение первого вопроса позволяет лучше понять роль неопределенности в каждом конкретном случае. В некоторых примерах детерминистические варианты моделей имеют тривиальные решения и, следовательно, читателю удастся прочувствовать, в какой степени наличие элемента неопределенности усложняет задачу принятия управляющих решений. Нахождение оптимального решения детерминистического варианта задачи проще по сравнению со случаем ее стохастического аналога, а также тогда, когда детерминированная модель нетривиальна, и, таким образом, читатель сможет оценить ту дополнительную сложность, которая возникает при учете фактора неопределенности. Важность второго вопроса станет совершенно очевидной, когда читатель приступит к изучению так называемого метода вероятностных ограничений (см., например, разд. 16.5), в котором для нахождения оптимальной стратегии требуются лишь квантили распределений вероятностей. Добросовестно пытаясь ответить на поставленные выше вопросы при рассмотрении каждой из сформулированных ниже задач, читатель сможет более детально разобраться в основах стохастического моделирования. 16.2.
НА ПУТИ К ОПТИМАЛЬНОМУ РЕШЕНИЮ
Прежде чем приступать к подробному обсуждению конкретных моделей и примеров, следует сказать несколько слов о характере той дополнительной сложности, которая возникает всякий раз, когда пытаются найти оптимальное решение в условиях неопределенности. Мы будем исходить из предположения, что читатель полностью овладел приемами построения детерминистических моделей,
14
ГЛАВА 16
а также соответствующими методами оптимизации. В частности, читателю должно быть ясно, что в случае задач линейного и динамического программирования, рассмотрению которых посвящены два предыдущих тома, как само решение, так и последствия принятия этого решения определяются совершенно однозначно. Так, например, в детерминистической задаче планирования производства заведомоизвестно, какое добавочное количество продукции будет получено, если переработать 10 дополнительных единиц сырья. Аналогично детерминистическая модель управления запасами содержит очевидное предположение, согласно которому, зная объемы закупок в течение нескольких ближайших отрезков времени, можно точно вычислить уровни запасов на протяжении всего планового периода. Но представим себе другую ситуацию: пусть при переработке 10 дополнительных единиц сырья можно получить различные объемы разнотипной продукции или предположим, что в задаче управления запасами объемы складируемой продукции зависят от фактического уровня сбыта. Другими словами, рассмотрим ситуацию, когда приходится принимать решение или определять стратегию, не имея полного представления о том, к каким результатам могут привести запланированные действия. Всякий раз, когда выбор осуществляется в условиях неопределенности, прежде всего следует уяснить, какой смысл вкладывается в понятие оптимальное решение. В настоящем разделе этот вопрос обсуждается во всех подробностях. В то же время, если требуется принять немедленно лишь некоторые из всей совокупности решений, а другие решения можно отложить до того "момента, когда неопределенность частично исчезнет, возникает необходимость проанализировать возможность построения условного плана, или стратегии. Обращаясь вновь к задаче управления запасами, можно конкретизировать эту мысль следующим образом: вначале определяется объем закупок на текущий (первый) период, а для последующих периодов разрабатывается своего рода инструкция, позволяющая определить объемы заказов в зависимости от уровней спроса, наблюдаемых в течение предыдущих периодов. Таким образом, трудно, а порой даже невозможно утверждать, какими должны быть объемы закупок после первого периода, но существуют четкие альтернативы, определяемые в момент принятия будущих решений данными ретроспективного анализа. Понятие «стратегия принятия управляющих решений» подробнее будет обсуждаться в следующем разделе. Математическое ожидание случайных величин. Если бы читателю приходилось применять на практике методы моделирования, рассматриваемые в предыдущих томах, он согласился бы с утверждением, что использование единственной целевой функции, подлежащей оптимизации, продиктовано лишь удобством выбора в этом случае какого-то одного управляющего решения из огромного числа допустимых вариантов. Руководители, имеющие опыт практического
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
15
применения методов исследования операций, хорошо знают, что получаемое с помощью математической модели решение редко является оптимальным «абсолютно со всех точек зрения». Фактически почти всегда получаемое решение корректируют «вручную», с тем чтобы окончательно согласовать его с действительностью. В ряде же случаев производят изменения в структуре модели и ищут новое «оптимальное» решение. При решении задач оптимизации управляющих решений в условиях неопределенности мы будем поступать аналогичным образом, строя модели, содержащие единственную (подлежащую оптимизации) целевую функцию. Однако с самого начала следует предупредить читателя о том, что при решении практических задач ему необходимо будет исследовать различные рабочие характеристики решения, получаемого на основе единственного критерия оптимизации. Это решение, если необходимо, корректируется на основе дополнительных соображений, или же модифицируется сама модель, с тем чтобы получаемый с ее помощью результат приобрел практическую ценность и был успешно внедрен заинтересованной организацией. В большинстве моделей, к рассмотрению которых мы переходим, фактор неопределенности сказывается на значениях выбранного (или заданного) экономического критерия эффективности. Поэтому именно математическое ожидание (которое называется также средним или ожидаемым значением) экономического критерия будет постоянно использоваться нами в качестве оптимизируемой целевой функции. В последнее время специалистами по теории принятия решений разработано несколько методов обоснования того, что при поиске оптимального варианта действий следует исходить именно из среднего значения упомянутого критерия. Доказательства этого положения можно найти в современных монографиях, посвященных вопросам статистического анализа. Но как бы ни были эти доказательства увлекательными, мы не останавливаемся на них в данной книге, поскольку независимо от того, нашел бы их читатель убедительными или нет, при решении задач оптимизации управляющих решений мы все равно будем использовать математическое ожидание экономического критерия в качестве целевой функции стохастической модели. (Вместе с тем мы частично компенсируем отсутствие последовательного теоретического анализа этого вопроса путем детального рассмотрения конкретных операционных ситуаций.) За редким исключением, нами используются лишь элементарные понятия теории вероятностей, такие, как математическое ожидание и функция распределения. Нередко мы пользуемся дискретными распределениями вероятностей, так что читателю в процессе вычислений не понадобится обращаться к дифференциальному и интегральному исчислению. В ряде случаев приводятся лишь окончательные результаты вычислений, основанные на применении дифференциального и интегрального исчислений; несмотря на то что формулы иногда выглядят весьма сложными, при задании численных
16
ГЛАВА 16
значений фигурирующих в модели параметров у читателя в процессе вычислений не должно возникать никаких трудностей. Следует вместе с тем заметить, что даже те читатели, которые прослушали (или изучили самостоятельно) полный курс теории вероятностей, могут с некоторыми из математических соотношений встретиться впервые и поэтому найдут их несколько необычными. Это объясняется тем, что в большинстве учебников по теории вероятностей вопросы оптимизации управляющих решений не рассматриваются. По этой причине средние значения и дисперсия некоторых случайных величин могут показаться читателю весьма сложными для восприятия. Нахождение встречающихся в данном томе математических ожиданий различного рода величин, вообще говоря, ненамного сложнее вычисления средних для заданных распределений. Для подтверждения этого замечания дадим краткий обзор основных понятий, которые будут использоваться нами при анализе приводимых ниже примеров. Пусть X есть случайная величина, которая может принимать одно из значений п = О, 1, 2, . . ., N. Обозначим через Р [X = п] вероятность того, что X принимает значение п. Тогда математическое ожидание случайной величины X определяется следующей формулой: N
Е[Х] = 2 п-Р[Х = п] п=0
(ожидаемое значение X).
(1)
Если переменная X может с некоторой положительной вероятностью принимать любое неотрицательное целочисленное значение, в выражении (1) вместо N должен фигурировать символ сю; при этом (как и в других случаях, когда производится суммирование бесконечной последовательности значений) постулируется, что математическое ожидание всегда представляет собой конечное число. Предположим теперь, что нам требуется вычислить математическое ожидание X2. В этом случае 2
Е[Х \^
N
S п*-Р(Х-=п}
п=0
2
(ожидаемое значение X ).
(2)
Рассмотрим наиболее общий случай. Пусть требуется вычислить математическое ожидание некоторой функции случайной переменной (обозначим эту функцию через / (X)). Тогда ft E [ f ( X ) ] = S f ( n ) - P [ X = n] (ожидаемое значение /(X)). (3) n=0
Приведем пример, когда выражение (3) применяется для анализа задачи, критериальная (целевая) функция которой имеет экономическое содержание. Рассмотрим простой, но весьма типичный экономический критерий — ожидаемые затраты, связанные с хранением складских запасов в течение планового периода единичной протя-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
17
ценности. Обозначим через D случайную величину, представляющую собой объем потребительского спроса за единичный период. Пусть D может принимать значения d = О, 1, 2, . . ., N; соответствующие вероятности обозначим через Р [D = d]. Предположим, что приобретается у единиц продукции, которая складируется с целью обеспечения резерва, служащего для удовлетворения потребительского спроса. Пусть стоимость единицы продукции равняется с долл. Если часть запасов окажется в конце рассматриваемого периода нереализованной, то это вызовет издержки, связанные с хранением; затраты на хранение единицы продукции в течение одного периода обозначим через h. (Допустим, что нереализованная в конце планового периода продукция полностью обесценивается.) В случае же, когда спрос D превышает объем заказа у, то за каждую недостающую единицу продукции взимается штраф в размере р. Таким образом, суммарные затраты в течение одного периода зависят не только от объема заказа, но и от фактического уровня спроса. Поскольку объем заказа у должен определяться в условиях, когда спрос точно не известен, «потенциальный результат» управляющего решения вполне правомерно выразить через математическое ожидание суммарных затрат. Обозначим через / (d у) суммарные затраты в случае, когда D = d, а объем заказа равен у. Тогда
f(d\y) =
cy-\-h-(y — d),
если d^y
cy^-p-(d — у),
если d>y
(объем заказа превышает уровень спроса),
(уровень спроса превышает объем заказа). (4) Следовательно, ожидаемые затраты при условии, если объем заказа у ограничен некоторым значением N (у ^ N), определяются следующими выражениями: N
E[f(D\y)]=^f(d\y).P[D d=0
E[f(D\y)]
=
(5)
= d],
f ( d \ y ) . P [ D = d}+ 2
d=y+l
f ( d \ y ) . P [ D = d] (если y
(6)
E[1(D\y)\ = N
d=y+l
(7)
Выражение (5) есть не что иное, как определение математического ожидания; выражение (6) получается путем разделения исходной суммы в (5) на две части (суммирование от 0 до у и затем суммирование от у -\- 1 до N, где у — объем заказа, a d — уровень спроса);
18
ГЛАВА 16
выражение (7) получается из выражения (6) путем подстановки в последнюю / (d \ у), определяемую выражением (4). Выполним некоторые дополнительные алгебраические преобразования. Заметим, что в (7) произведение су фигурирует как под знаком первой, так и под знаком второй суммы. Следовательно, величина су умножается на вероятность того, что D принимает по крайней мере одно из множества возможных значений; поскольку сумма вероятностей Р [D = d] по всем значениям d равна единице, мы получаем E [ f ( D \ y ) ] = cy+j^h-(y-d).P[D d=0
= d] + 2
d=y+l
p-(d-y)-P[D = d]
(ожидаемые затраты при заданном у). (8) Выражение (8) имеет следующую непосредственную интерпретацию: если складской запас составляет у единиц продукции, то математическое ожидание суммарных затрат складывается из покупной стоимости указанного объема продукции, математического ожидания затрат на ее хранение и математического ожидания потерь из-за неудовлетворения спроса. Выражение (8) было получено нами подстановкой / (d \ у) в (3). При построении оптимизационных моделей, аналогичных только что рассмотренной, значительно удобнее сразу же начинать с записи выражения, аналогичного (8). Поэтому в последующих разделах мы будем практиковать построение целевой функции в виде суммы ожидаемых затрат (или доходов), опуская промежуточные выкладки. В тех случаях, когда у читателя возникает желание проверить правильность записи целевой функции, он может провести анализ, аналогичный представленному выше. При этом прежде всего следует построить экономический критерий в виде функции случайных величин при заданных значениях управляемых переменных. Затем нужно взять математическое ожидание этой функции с учетом всех возможных значений случайных переменных и провести необходимые упрощения. Рассмотрим теперь конкретный пример оптимизации управляющего решения в условиях неопределенности, выбирая в качестве целевой функции математическое ожидание экономического критерия эффективности. Оптимальные решения. Обратимся снова к задаче расширения производства фирмы «Бонбон» (разд. 16.1). Напомним, что речь шла о дилемме: увеличить производственные мощности существующего предприятия или построить новый завод. Прибыль, получаемая фирмой в результате принятия того или иного решения, зависит от того, какая доля рынков сбыта будет контролироваться фирмой в последующие периоды. Предположим, что президент фирмы оценивает вероятность того, что фирма сможет сохранить контроль за приходящимися на ее долю 35% рынка сбыта, в V 2 , а вероятность того, что эта доля будет равняться 30 и 40%,— в г / 8 и 3/8 соответ-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
19
ственно. Годовой доход фирмы в каждом из этих случаев указан в таблице на рис. 16.1. Каким образом разрешил бы читатель дилемму фирмы «Бонбон», если бы он оказался на месте ее президента? Насколько пагубными оказались бы последствия, если бы было принято решение построить Доля рынка сбыта, контролируемая фирмой, %
30 35 40
Оценка вероятности
Годовой доход, млн. долл. увеличение производстстроительство венных мощностей нового предприядействующего предтия приятия
90 100 130
Vs 1/2 3
/8
50 100 150
Р и с . 16.1. Задачи фирмы «Бонбон».
новый завод, а удельный вес фирмы в общем объеме сбыта рассматриваемых изделий снизился бы до 30% и, таким образом, годовой доход фирмы составил бы лишь 50 млн. долл. вместо 90 млн. долл. в настоящее время? В какой степени пострадала бы фирма, если упомянутая выше дилемма была бы решена в пользу увеличения производственных мощностей уже действующего предприятия, а доля фирмы в общем объеме сбыта возросла бы до 40% и, таким образом, годовой доход фирмы увеличился бы до 130 млн. долл., тогда как при другом варианте решения годовой доход мог достичь 150 млн. долл.? В ситуациях, аналогичных только что описанной, когда число альтернатив невелико, можно найти распределение вероятностей возможных значений целевой функции и таким путем оценить относительные достоинства каждого варианта действий. Однако в большинстве рассматриваемых здесь случаев мы, по крайней мере на первых порах, будем стремиться помочь читателю отыскать тот вариант действия, который оптимизирует ожидаемое значение экономического критерия. В случае дилеммы фирмы «Бонбон» с помощью таблицы, приведенной на рис. 16.1, легко показать, что г Ожидаемая годовая прибыльв случае увеличения произI Бедственных мощностей дей- = 90-4-+ЮО 4+130-|= иствующего предприятия
(9) Ожидаемая годовая прибыль в случае строительства нового [_предприятия
'
^ =50«-g-- T -100-y
150- - =
20
ГЛАВА 16
Сравнивая полученные значения ожидаемой годовой прибыли, мы видим, что вариант, предусматривающий строительство нового завода, несколько выгоднее. Некоторые из читателей, возможно, будут придерживаться той точки зрения, что столь незначительная разница между ожидаемыми значениями годовой прибыли [см. (9)] в действительности не скажется на фактических экономических последствиях выбора варианта решения. Если читатель действительно так думает, то пусть рассмотренный пример послужит ему просто иллюстрацией метода. Вместе с тем следует подчеркнуть, что всякий раз, когда в зависимости от варианта решения наблюдается хотя бы небольшое различие между ожидаемыми значениями целевой функции, для окончательной оценки целесообразности того или иного выбора необходимо учесть также другие характеристики решения. Неопределенность в выборе вариантов действий. Динамические детерминированные модели, рассмотренные в гл. 8—12, позволяют совершенно однозначно предсказать последовательность решений, вытекающих из той или иной заданной стратегии. Так, например, в модели календарного планирования производства, когда потребительский спрос известен для всей протяженности планового периода, определение уровней производства для каждого отрезка времени внутри этого периода не представляет особой трудности. Однако если уровни потребительского спроса можно описать лишь с помощью распределения вероятностей, то, как правило, однозначное предсказание будущих уровней производства оказывается невозможным. Предположим теперь, что в связи с решением задачи календарного планирования производства нам удалось разработать динамическую стратегию, позволяющую определить, каким должен быть объем выпускаемой продукции при произвольном значении уровня запасов в начале любого отрезка планового периода. Такая стратегия фактически привела бы к вероятностному распределению для планируемых на будущее объемов выпуска продукции. Чтобы проиллюстрировать это важное положение, рассмотрим следующую упрощенную модель. Пусть в начале каждого отрезка планового периода уровень запасов может принимать одно из значений i = О, 1, 2, 3. Допустим, что полный (суммарный) период планирования имеет неограниченную протяженность, а динамическая стратегия стационарна. Обозначим через х^ (i) решение относительно текущего уровня производства при заданном i, причем
«ос (0) = Хес (1) = хх (2) = 3, хх (3) = 0,
(10)
т. е. в течение каждого отрезка планового периода производится 3 единицы продукции, за исключением случаев, когда в начале отрезка объем запасов составляет 3 единицы. Предположим, что на любом отрезке уровень спроса характеризуется следующим рас-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ
МОДЕЛЕЙ
21
пределением: Dt = 2 с вероятностью V 2 ,
Dt = 3 с вероятностью V 2 .
(11)
Когда объем запасов в начале того или иного отрезка планового периода равен 2 единицам, то в течение этого отрезка производится 3 единицы продукции, а в течение последующего отрезка планового периода либо продукция не производится (если спрос на предыдущем отрезке равняется 2 единицам), либо производится 3 единицы продукции (если спрос на предыдущем отрезке планового периода равнялся 3 единицам 1)). Продолжая анализ по аналогии с только что проведенным, убеждаемся, что в течение следующего по порядку отрезка производится либо 0 единиц продукции с вероятностью V 4 (если спрос на первом и на втором из рассмотренных отрезков планового периода составляет соответственно 3 и 2 единицы), либо 3 единицы продукции с вероятностью 3 / 4 (1 — V 4 = 3 /4)Такой метод рассмотрения приводит к важному выводу: даже в том случае, когда «составляющие» решения, предусмотренные стационарной стратегией (10), являются детерминированными, оптимальные значения управляемых параметров распределяются во времени случайным образом в силу неопределенности, вводимой в саму структуру модели, описываемой с помощью (11). В результате соответствующие затраты за суммарный плановый период определяются сложным, так называемым совместным, распределением. Для большинства динамических задач, содержащих элементы вероятностного характера, требуется планировать будущие решения с учетом будущей неопределенности. Учитывая это обстоятельство, следует в каждом конкретном случае тщательно изучить структуру стохастической модели на предмет уточнения информации о предыдущих значениях случайных величин, которая имеется в наличии в момент принятия каждого управляющего решения. При построении математической модели легко допустить ошибку, если не провести четкого различия между хаотической временной последовательностью случайных событий и хронологически упорядоченной последовательностью управляющих решений, частично базирующихся на фактически зарегистрированных исходах, относящихся к прошлому. Приводимые ниже примеры, а также модели, рассмотренные в гл. 17, помогут читателю разобраться в принципах анализа (и решения) такого рода многошаговых задач. При рассмотрении индуцированной «стохастики» в развертывающейся последовательности решений возникает еще одно важное понятие — стационарное (установившееся) поведение. Поясним это понятие, снова обратившись к модели, заданной соотношениями (10) и (11). Обозначим через pt ту долю отрезков (по отношению к общему 1
1
) Согласно (11), вероятность каждого варианта равняется / 2 .— Лпим пер ев. ^
22
ГЛАВА 16
числу отрезков при неограниченном плановом периоде), в начале которых объем запасов равен г. Из характера стратегии (10) с учетом (11) получаем
1 Po = -g-,
1 р4 = -д
1 1 р2 =Т , Рз =¥ .
,.
(12)оч
Пусть далее qx означает долю отрезков (по отношению к общему числу отрезков при неограниченном плановом периоде), в течение которых производится х единиц продукции. Легко убедиться, что из (10) и (12) следует
Иногда оптимальное решение для стохастической модели требует от руководителя сознательного применения стратегии «случайного блуждания». Можно, конечно, критиковать отдельные структурные элементы моделей, приводящих к решениям такого вида, однако вряд ли имеет смысл отрицать сам факт существования рандомизированных стратегий х), поскольку, как мы уже видели, существует беспорядочность в выборе вариантов действий, индуцированная фактором неопределенности. Ниже приводится гипотетический пример, с помощью которого мы убедимся, что рандомизированная стратегия может быть оптимальной. Представим себе, что управляющий пекарней «Пышка» обнаружил, что ежедневный спрос на один вид его фирменных тортов характеризуется следующим распределением вероятностей: Р [нет спроса] = V 6 , Р [покупается 1 торт] = V e , 2 Р [покупаются 2 торта] = /3. Допустим, что спрос в любой из дней не зависит от спроса в предыдущие дни. Себестоимость одного торта равна с; торт, не проданный в течение дня, выбрасывают. Управляющий не стремится выпекать слишком много тортов, так как их себестоимость достаточно велика, но вместе с тем ему хочется удовлетворить приемлемый уровень спроса. В этой связи он формулирует задачу выбора управляющего решения следующим образом: минимизировать расходы на выпечку тортов при ограничении, заключающемся в том, что вероятность удовлетворения полного ежедневного спроса на торты этого вида х должна равняться по крайней мере /зМожет показаться, что оптимальное решение должно состоять в том, чтобы ограничиться выпечкой одного торта (при затратах, равных 1 с), так как в этом случае полный спрос удовлетворяется с вероятностью V 3 (V e + V 6 = V 3 ). Допустим, однако, что управх ) То есть, иными словами, стратегий случайного выбора, или действий наугад.— Прим. перее.
ТЕОРИЯ СТОХАСТИЧЕСКИХ ^ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
23
ляюший будет придерживаться следующего рандомизированного правила принятия решения: не выпекать ни одного торта в четырех случаях из пяти (вероятность 4/5) и выпекать два торта в одном случае из пяти (вероятность 1/5). При этом полный спрос будет по-прежнему удовлетворен с вероятностью V 3 ( V s - V e + 14/5 - l = 1 /з)> а что касается ожидаемых затрат, то они составят 0,4 с ( / 5 -0 с + V 5 -2 с •— = 0,4 с), т. е. будут меньше затрат (равных 1 с) в случае нерандомизированной (детерминированной) стратегии. Приведенное выше рандомизированное правило является оптимальным. Предположим теперь, что вместо ограничения на вероятность полного удовлетворения спроса в той же самой задаче минимизации формулируется другое требование: удовлетворить в среднем по крайней мере 1/3 ожидаемого ежедневного спроса. С помощью (1) легко показать, что ожидаемый ежедневный спрос равен 3 / 2 , и, следовательно, согласно введенному ограничению, ежедневно должно быть продано в среднем не менее V 2 торта. Если в данном случае воспользоваться детерминистической стратегией и выпекать по одному торту в день, то в среднем ежедневно будет продаваться по 5 / 6 торта (V 6 -0 -f- V 6 -l +2 / 3 -1 = 5/6), что превышает предельное значение (V 2 ), содержащееся в ограничении. Оптимальной же является рандомизированная стратегия, заключающаяся в том, чтобы не выпекать ни одного торта в двух случаях из пяти (вероятность 2/5) и выпекать один торт в трех случаях из пяти (вероятность 3 / 5 ). В этом случае будет продаваться в среднем V 2 торта ( 2 / 5 -0 + 3 / 5 - 5 / 6 = 1 / 2 ), а ожидаемые затраты составят 0,6 с (2/&-0 с -f- %•! с = 0,6 с), т. е. они будут меньше, чем в варианте с детерминистической стратегией. Вообще справедливо следующее утверждение: всякий раз, когда оптимизационная модель содержит ограничения на вероятности наступления тех или иных событий или на математические ожидания случайных величин, оптимальное решение может быть получено путем рандомизации. Мультивременная целевая функция. В стохастических динамических моделях, предназначенных для оптимизации некоторой последовательности значений дохода (эффекта) целевая функция представляет собой ожидаемое значение ее детерминистского аналога. Проиллюстрируем эту мысль на следующем примере. Пусть Rt — доход, получаемый, согласно динамической модели, на отрезке t. Как уже отмечалось выше, при наличии элементов неопределенности стратегия формирования управляющих решений на протяжении полного планового периода порождает совместное распределение вероятностей для элементов последовательности (R\, /?2, RZ- • • •)• Примем в качестве постулата, что целевой функцией является математическое ожидание суммарного приведенного потока доходов Е [Приведенный суммарный доход] = = E[Rt + aR2 + а 2 Д 3 + . . . ] ,
(14)
24
ГЛАВА 16
где а — одноотрезочный коэффициент дисконтирования, удовлетворяющий условию 0 ^ а. < 1. Будем предполагать, что суммарный приведенный доход имеет конечное математическое ожидание. Математическое ожидание (14) задается совместным распределением вероятностей (R\, R-i, Из • • •)• Соотношение (14) можно упростить, применив фундаментальную теорему о случайных переменных: математическое ожидание суммы равняется сумме математических ожиданий слагаемых. Таким образом, учитывая, что а есть константа, имеем Е [Приведенный суммарный доход] = = Е [Ri] + аЕ Ш 2 1 + а?Е [ R 3 ] -f- . . . .
(15)
В (15) каждое из математических ожиданий определяется с помощью безусловного распределения вероятностей для соответствующей случайной переменной. Рассмотрим еще один пример. Обратимся вновь к задаче динамического планирования производства, представленной моделью (10) — (11). Предположим, что в этой задаче целевая функция представляет собой усредненные за большой интервал времени затраты, приходящиеся на один отрезок. Соотношения (12) показывают, какая доля отрезков в случае неограниченного планового периода характеризуется начальным уровнем запасов i. Аналогично соотношениями (13) определена доля отрезков, в течение которых объем производимой продукции равен х. Обозначим через С (х) и h (i) соответственно стационарные значения затрат на производство и хранение в течение одного отрезка. Тогда значение целевой функции при стационарной стратегии (10) определяется формулой Ожидаемые затраты за один отрезок при неограниченном плановом периоде
-НМ2)]-!•+[* (3)14}Проверка формулы (16) предоставляется читателю. Построение распределений вероятностей. Рассматриваемое нами стохастическое моделирование предполагает, что руководитель располагает возможностью выбора распределения вероятностей, которое позволило бы описать характер неопределенности, содержащейся в модели. Грубо говоря, руководитель должен приписать неотрицательные количественные веса каждому возможному событию, соблю-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
25
дая при этом следующие условия: (1) если событие является достоверным, то соответствующий ему вес равен единице; (2) если события А и В являются взаимно исключающими, то вес события «либо А, либо 5» равен сумме весов этих событий. Методы построения распределений вероятностей по указанному выше принципу можно найти почти в любом, даже самом элементарном учебном пособии по теории вероятностей. Поэтому мы на их рассмотрении подробно здесь не останавливаемся. Более того, для наших целей оказывается достаточным знать лишь сформулированные выше общие принципы, поскольку обсуждаемые ниже модели строятся именно на основе информации о «весах» случайных событий, а типовые вычислительные процедуры выполняются с помощью формул, приведенных выше. Однако имеет смысл сказать несколько слов по поводу интерпретации упомянутых выше «весов», а также пояснить, каким образом руководителю удается определить их числовые значения, с тем чтобы читатель достиг большего понимания! практической ценности стохастических моделей. В ходе развития теории вероятностей математиками было предложено несколько способов интерпретации весов случайных событий. Наиболее распространенной является интерпретация, основанная на использовании понятия относительная частота наступления! случайного события. Применительно к оптимизационным моделям, однако, лучше воспринимается такое толкование весов, которое в большей степени согласуется с характером мышления административного работника. Попытаемся пояснить эту мысль, вновь обратившись к задаче фирмы «Бонбон», вероятностные показатели которой приведены в таблице на рис. 16.1. Эти показатели, имеющие смысл весовых коэффициентов, фактически являются количественным выражением прогноза относительно будущего и помогают президенту фирмы принять «немедленное» решение: строить новый завод или увеличивать производственные мощности действующего предприятия. Вспомните теперь о начальнике производственного отдела фирмы «Цветметалл», которому нужно обосновать целесообразность приобретения новой ЭВМ большой мощности. Данные о задержках в обслуживании, собранные начальником производственного отдела за определенный период прошлой деятельности фирмы, являются основанием для принятия решения только в том случае, если существует уверенность, что эти данные характеризуют ситуации, которые могут возникнуть в будущем. В последние годы появилось большое количество работ, посвященных методам определения весов случайных параметров, правильно отражающих «личные» прогнозы руководителя. Это направление исследований обычно относят к так называемой статистической теории принятия решений; иногда такого рода исследования именуют байесовским анализом. Несмотря на то что вопросы выбора
26
ГЛАВА 16
весов случайных событий исключительно важны и имеют прямое отношение к исследованию операций, попытка более подробного их освещения в этой книге только отвлекла бы от главного — от анализа оптимизационных моделей. Можно лишь отметить, что при решении практических задач в основном используются следующие четыре метода построения распределений вероятностей: 1. Интроспекция (самоанализ), 2. Использование ретроспективных данных, 3. Аппроксимация, 4. Аксиоматический подход. Чаще же всего применяются различные комбинации перечисленных методов. Проиллюстрируем это на примере. Представим себе, что фирма «Пилюля», занимающаяся оптовой торговлей фармацевтическими препаратами, собирается внедрить научно обоснованную систему управления запасами (около 1500 видов) с использованием ЭВМ. В частности, предполагается, что один раз в неделю ЭВМ должна выдавать информацию о состоянии запасов каждого из препаратов и что в тех случаях, когда уровень запаса того или иного препарата окажется слишком низким, от ЭВМ должен поступать сигнал о необходимости оформления нового заказа, который следует направить фирме, выпускающей лекарственный препарат. Поскольку еженедельный потребительский спрос на каждый препарат сильно варьируется, научно обоснованные «правила» пополнения запасов должны базироваться на использовании стохастических моделей управления запасами, наподобие тех, которые рассматриваются в гл. 19. Эти модели требуют знания распределений вероятностей объема спроса за неделю для каждого препарата. Допустим вначале, что фирма «Пилюля» располагает незначительным количеством данных относительно уровней спроса в прошлом или вообще не имеет таких данных. Такого рода ситуации иногда возникают из-за неудовлетворительного ведения учета, а чаще по той причине, что приходится иметь дело с новым препаратом, ретроспективные данные о котором отсутствуют. Управляющий отделом снабжения фирмы «Пилюля» не располагает другими средствами анализа, кроме метода 1, и вынужден довольствоваться при количественном прогнозе уровней спроса лишь своим личным опытом. Спустя некоторое время, когда в процессе функционирования системы управления запасами накопится некоторый объем информации о потребительском спросе на новый препарат, для определения вероятностных характеристик сбыта управляющий сможет воспользоваться количественными расчетами на основе байесовского метода анализа. Предположим теперь, что имеет место совершенно иная ситуация: фирма располагает информацией о потребительском спросе за прошедший период продолжительностью от 6 до 18 месяцев (в зависимости от оборота) и соответствующие количественные показатели
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
27
занесены вручную на временные регистрационные карты. В этом случае фирма «Пилюля» может комбинировать методы 1 и 2, анализируя вариации недельного спроса по каждому препарату за прошлый период и внося коррективы с учетом прогностических оценок будущего спроса. Следует, однако, иметь в виду, что в большинстве реальных ситуаций эмпирическое построение распределения вероятностей на базе ретроспективных данных оказывается невозможным: как правило, этих данных бывает явно недостаточно, а в тех случаях, когда они есть, слишком большая стоимость вычислительных работ, связанных с построением распределений для многочисленных индивидуальных уровней спроса оказывается непреодолимым препятствием для их выполнения. Поэтому в качестве модификации методов 1 и 2 используют метод 3. Так, например, управляющий отделом снабжения может вычислить «эмпирическое» среднее, а возможно, и дисперсию для недельного спроса по каждому из препаратов, внося каждый раз необходимые, с его точки зрения, коррективы. Затем в процессе использования стохастической модели управления запасами он может взять (в качестве приближения) нормальное распределение, приводящее к тем же самым значениям для среднего и для дисперсии. По мере накопления новых эмпирических данных относительно объемов спроса эти значения будут последовательно уточняться с помощью ЭВМ. Метод 4 представляет собой «утонченный» аналог метода 3. В случае когда применяется именно этот метод, управляющий отделом снабжения прежде всего строит модель, описывающую сам процесс формирования спроса. Такого рода модель может, например, содержать следующую информацию: суммарное число клиентов фирмы «Пилюля», вероятность возникновения в течение недели у каждого из клиентов потребности в том или ином препарате, типичные объемы заказов клиентов и т. д. Совершенно очевидно, что этот метод сложнее метода 3, однако он вполне может оправдать себя в тех случаях, когда в результате его применения удается записать .распределение вероятностей для уровней спроса в явном виде (например, показать, что распределение является пуассоновским или биномиальным). В этом случае ретроспективные данные и их коррекция на основе экспертных оценок используются для получения численных значений ряда параметров, необходимых для параметризации установленного закона распределения. (В примере с фирмой «Пилюля», по-видимому, целесообразнее применить метод 3, а не метод 4.) В заключение отметим, что фактор неопределенности сказывается на структуре стохастических моделей двояко: во-первых, наблюдается прямое проявление вероятностного характера задачи, выражающееся в учете случайных исходов в явном виде; во-вторых, имеет место опосредствованное проявление элемента неопределенности, вытекающее из самого процесса определения весов случайных величин, описывающих рассматриваемое явление. Весь последующий
28
ГЛАВА 16
материал ориентирован главным образом на изучение непосредственного эффекта, порождаемого фактором неопределенности. В области вероятностного моделирования ведутся обширные исследования, связанные с анализом чувствительности стохастических решений к вариациям распределения вероятностей. Особый интерес представляют следующие вопросы: поиск наилучшего способа оценки параметров распределений, используемых в оптимизационных моделях; эффективные методы аппроксимации; способы учета в оптимизационной модели неопределенности, связанной с распределением вероятностей; методы построения «надежных» моделей на основе ограниченного объема ретроспективных данных. О ближайших перспективах. Изложив основные принципы подхода к анализу вероятностных моделей принятия решений, мы можем перейти к более серьезному изучению методов стохастического программирования, а также к вопросам их практического применения. В следующем разделе на примере сложного динамического процесса принятия решений будет показано, каким образом можно пойти по ложному пути и допустить ошибку, если игнорировать вероятностный характер задачи и вместо того, чтобы оперировать самими случайными переменными, пытаться использовать их средние значения. (Назовем такого рода ошибку «заблуждением относительно средних».) Другими словами, как правило, оказывается недопустимым подставлять вместо случайным образом изменяющихся коэффициентов, фигурирующих в оптимизационной модели (например, в модели линейного программирования), их ожидаемые значения. Весь последующий материал данной главы посвящен методике анализа линейных моделей, в которых по крайней мере часть показателей носит вероятностный характер. В разд. 16.4 обсуждается один из возможных методов анализа довольно простой, так называемой двухшаговой, модели линейного программирования. На примере этой модели иллюстрируются некоторые из трудностей, которые приходится преодолевать в процессе поиска оптимального решения в условиях неопределенности. (Обобщение данного метода на случай многошаговых задач рассмотрено в разд. 16.7.) В разд. 16.5 рассмотрен другой возможный метод решения задачи, сформулированной в разд. 16.4. Этот метод, называемый программированием с вероятностными ограничениями, представляет собой одну из альтернатив двухшаговой модели. На рассмотренном примере проводится сравнение упомянутых методов. Двухшаговая модель и модель с вероятностными ограничениями обсуждаются на более высоком уровне в разд. 16.6. Рассматриваемая при этом задача представляет самостоятельный интерес. Это — типичная транспортная задача наподобие той, которая анализировалась в гл. 6. Отличие ее от задачи из гл. 6 заключается лишь в том,
ТЕОРИЯ СТОХАСТИЧЕСКИХ
ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
29
что уровни спроса в ней представляют собой случайные величины. В заключительной части главы обсуждается модель, в которой вместо случайных переменных допустима подстановка их средних значений. Любителям детективных историй мы советуем приступить немедленно к изучению следующего раздела: преступник не замедлит выдать себя. Если же читатель предпочитает заранее знать, что его ждет впереди, то мы должны подготовить его к возможному разочарованию. При решении практических задач лишь в очень редких случаях удается учесть вероятностный характер фигурирующих в задаче параметров путем незначительных преобразований соответствующей детерминистической модели. Нет оснований отрицать, что методы, рассматриваемые в настоящей главе, формально пригодны к решению стохастических оптимизационных задач. Однако в реальных ситуациях эти методы, как правило, оказываются неприменимыми. Практические задачи организационного управления весьма редко являются лишь двухшаговыми, так что, как правило, для их полноценного анализа требуются многошаговые оптимизационные модели с варьируемым числом периодов. Однако пока не следует предаваться скептицизму — некоторые из практических задач принятия решений с помощью предлагаемых здесь методов все же могут быть решены. Эти задачи будут рассмотрены в последующих главах после того, как читатель освоит способы преодоления различного рода трудностей стохастического моделирования. 16.3. ЗАБЛУЖДЕНИЕ ОТНОСИТЕЛЬНО СРЕДНИХ
Рассмотрим упрощенный вариант встречающейся на практике задачи принятия решений в условиях неопределенности. При анализе этой задачи будет показано, каким образом возникает опасность неправомерного использования средних значений показателей, фигурирующих в модели, вполне пригодной для анализа детерминированной ситуации. Пусть фирма «Швец и Жнец», занятая производством сельскохозяйственной техники, планирует строительство нового завода, на котором предполагается выпускать комбайны одной из новейших конструкций. Прежде чем новое предприятие начнет функционировать на полную мощность, фир-ме надлежит решить следующие основные задачи: A. Построить заводские корпуса. B. Завершить разработку проекта новой модели комбайна. C. Довести численность рабочих, а также инженерно-технического и административно-управленческого персонала до уровня, соответствующего полной загрузке проектируемых производственных мощностей нового предприятия. D. Произвести монтаж необходимого оборудования.
30
ГЛАВА 16
Е. Устранить дефекты проекта и произвести окончательную отладку модели. Обозначим число отрезков времени, требуемых для выполнения работ А (В, С, D, Е), через tA (tB, tc, tD, tE). Пусть каждый отрезок равен трем месяцам. Предположим, что перечисленные выше работы должны выполняться в последовательности, указанной на рис. 16.2, В частности, выполнение работ А и В может быть начато немедленно и производиться одновременно. К работам С и D можно приступать лишь после выполнения работы А. Работу Е можно начать только после завершения работ В и D. Завод начнет работать на полную мощность лишь после того, как будут выполнены работы С и Е.
Завершение проекта модели. Р и с . 16.2. Сетевой график фирмы «Швец и Жнец».
(Данный сетевой график идентичен сетевому графику на рис. 6.16Т иллюстрирующему метод критического пути. Несмотря на то что приведенных здесь пояснений для постановки задачи вполне достаточно, читатель может найти целесообразным еще раз просмотреть разд. 6.6.) Если бы значения tA, tB, . . ., tE были известны абсолютно точно, продолжительность периода от начала работ до пуска нового завода на полную мощность можно было бы определить путем вычисления длины наибольшего пути от узла 0 до узла 3, указанных на рис. 16.2. Однако значения некоторых показателей tA, tB, . . . . . ., tE оказываются неопределенными. Полагаясь частично на имеющийся опыт строительства заводов, президент фирмы «Швец и Жнец» оценил вероятность возможных значений tA, tв, . . ., tE; эти оценки приведены в таблице на рис. 16.3. Из таблицы следует, что t B с одинаковой вероятностью может равняться 2, 3 или 4 отрезкам (т. е. соответственно 6, 9 или 12 месяцам); аналогичные заключения сделаны относительно tc и tK. Значения tA и tD известны точно. Президент, кроме того, считает, что указанные в таблице случайные события полностью независимы. Легко убедиться, что в том случае, когда каждая случайная величина принимает наименьшее из приведенных значений, от начала работ до пуска завода на полную мощность требуется 4 отрезка;
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
31
если же случайные величины принимают наибольшие из предполагаемых значений, от начала работ до пуска нового завода на полную За- Оценки для числа дача отрезков времени
Оценка вероятности
А
2
Однозначная
В
2, 3, 4
Каждое значение с стью 1 / 3
С
2, 3, 4
D
1
Однозначная
Е
1, 2, 3
Каждое значение с стью 1 / 3
вероятно-
То же
вероятно-
Р и с . 16.3. Задача фирмы «Швец и Жнец». Возможные варианты временных затрат (один отрезок времени равен 3 месяцам).
мощность потребуется 7 отрезков. Таким образом, продолжительность времени, необходимого фирме для достижения поставленной цели, составляет от 12 до 21 месяца. Читатель без труда может также убедиться в том, что в Полное время Дополнительслучае, когда каждая из случай(от начала работ ная прибыль, ных величин принимает соответдо пуска завода), тыс. долл. число отрезков ствующее среднее значение (t в= 3, tc = 3, tE = 2), продолжительность времени с момента начала 120 3 работ до пуска нового предприяНО 4 тия на полную мощность будет 100 5 равняться 5 отрезкам, т. е. 15 ме6 50 сяцам. 0 7 Президент фирмы «Швец и Жнец» убежден в том, что чем быстрее начнет функционировать новый Р и с . 16.4. Дополнительная прибыль «Швец и Жнец», получаемая завод, тем больше преимуществ фирмы за счет строительства нового завода. получит фирма по сравнению со своими конкурентами и тем выше окажется уровень получаемой ею дополнительной прибыли. Прогнозируемая зависимость величины дополнительной прибыли, получаемой за счет сокращения сроков запуска нового завода (по отношению к сроку, определяемому протяженностью 7 отрезков), показана с помощью таблицы, приведенной на рис. 16.4. Будучи обеспокоенным падением уровня прибыли в случае, если пуск нового завода
32
ГЛАВА 16
затянется и состоится лишь 6—7 отрезков спустя после начала планируемых работ, президент фирмы намерен воспользоваться услугами опытного администратора, который выполнял бы функции специального его помощника по строительству нового завода. Президент фирмы считает, что дополнительное внимание проблеме строительства нового предприятия со стороны такого администратора позволит сократить время выполнения всех планируемых работ по крайней мере на 1 отрезок. Другими словами, предполагается, что если при отсутствии специального помощника пуск нового завода состоится через 4 отрезка после начала работ, то при наличии помощника весь объем работ займет лишь 3 отрезка и т. д. Общая стоимость услуг специального помощника по строительству нового завода составляет 20 000 долл. Если бы президент знал наверняка, что строительство нового завода продлится не более 4 или 5 отрезков, он был бы против найма ассистента, так как в этом случае выигрыш в 10 000 долл. не покрыл бы дополнительных затрат в количестве 20000 долл. Если бы президент наверняка знал, что выполнение всех планируемых работ займет не менее 6 или 7 отрезков, он принял бы решение воспользоваться услугами специального помощника. Какое решение по вопросу найма помощника принял бы в этом случае читатель, если бы он оказался на месте президента фирмы «Швец и Жнец» и располагал приведенными выше данными? Анализ. Если бы при анализе данной задачи мы исходили из того, что продолжительность выполнения всех запланированных работ должна составить 5 отрезков (именно к такому результату мы пришли бы, используя в процессе вычислений средние значения tA, t в, . . ., tE), то наем специального помощника по строительству нового завода оказался бы нецелесообразным. Действительно, сокращение сроков строительства на 1 отрезок (4 отрезка вместо 5) привело бы к приращению прибыли на 10000 долл. (110000 долл.— 100 000 долл.), тогда как стоимость услуг специального помощника фирмы составила бы 20 000 долл. Покажем, что такого рода анализ полностью ошибочен. Рассуждая по приведенной выше схеме, мы допускаем две существенные ошибки: во-первых, мы исходим из неверного предположения, что продолжительность выполнения всех необходимых работ, вычисленная с помощью средних значений для продолжительностей выполнения отдельных работ, является хорошим приближением к ожидаемой продолжительности реализации плана в целом; во-вторых, мы упускаем из виду то обстоятельство, что истинным критерием является ожидаемая дополнительная прибыль, а не приращение прибыли по отношению к той, которая соответствует математическому ожиданию продолжительности реализации плана. Принимая во внимание все возможные исходы и учитывая вероятности их обнаружения, можно показать, что
Р[Г = 4] = ^, Р[Г = 5]=4, P[T = G ] = ¥ , P[T = l] = j-r (1)
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
33
где Т — продолжительность выполнения всех работ, предусмотренных планом фирмы. Отсюда следует, что г Дополнительная прибыль"] Е J B случае отказа от найма > = 110-2/27+100-8/27+ [специального помощникам +50-14/27 + 0-3/27 = 64,
''
/•Дополнительная прибыль4) Е$в случае найма специальЛ= 120-2/27+110-8/27+ 1ного помощника J +100-14/27+50-3/27 = 99.
^'
(Во избежание слишком громоздких вычислений каждое слагаемое мы округляли до целого значения.) Таким образом, выигрыш (в смысле ожидаемой дополнительной прибыли) за счет услуг специального помощника президента фирмы составляет 35 000 долл. (99 000 долл.— 64 000 долл.), что превышает стоимость этих услуг (20 000 долл.). Заметим, что ошибка, допущенная при первоначальном анализе, возникла из-за переоценки ожидаемой дополнительной прибыли в случае, когда президент фирмы принимает решение обойтись без услуг опытного консультанта. Обобщив характер ошибок, допущенных при первоначальном анализе проблемы, мы можем сделать следующее заключение: для любой нелинейной функции / (zj, . . ., хп) случайных переменных #1, . . ., хп предположение о том, что Е If fo, . . ., «„)] = / (Е [ x j , . . ., Е [хп]), как правило, является ошибочным. Несмотря на то что в некоторых частных случаях математические ожидания нелинейных функций достаточно хорошо аппроксимируются соответствующими нелинейными функциями средних значений независимых переменных, никогда не следует предполагать правомерность такого рода аппроксимаций априорно (т. е. не проведя предварительного исследования свойств рассматриваемой нелинейной функции). Неопределенность и информация. Каковы экономические последствия, порождаемые неопределенностью, имевшей место в предыдущей задаче? Чтобы ответить на этот вопрос, используя количественные оценки, необходимо вычислить приращение ожидаемой прибыли, которое имело бы место в том случае, если бы президент фирмы «Швец и Жнец» оказался в состоянии дать точный прогноз значений случайных величин. Другими словами, экономический вес неопределенности измеряется максимальной суммой денег, которую президент фирмы был бы готов выплатить, если после уплаты этой суммы 3—0870
34
ГЛАВА 16
он смог бы узнать точные значения случайных величин и, следовательно, безошибочно решить вопрос о целесообразности найма специального помощника по строительству. Вычисление упомянутой суммы не представляет особого труда. Напомним, что решение нанять помощника по строительству нового завода оправдано лишь в том случае, если Т = 6 или Т = 7; чистая дополнительная прибыль составляет при этом 80 000 долл. (100000 долл.—20000 долл.) и 30000 долл. (50000 долл.— 20 000 долл.) соответственно. Таким образом, математическое ожидание чистой дополнительной прибыли в случае, когда значения случайных величин в момент принятия решения известны, равняется /•Чистая дополнительная"! Е) прибыль при наличии 1 = 100-2/27 + 100 -8/27 + [точной информации J+80-14/27 +30-3/27 = 82.
^'
В силу (3) ожидаемая чистая дополнительная прибыль, получаемая при отсутствии точной информации, равняется 79 000 долл. (99000 долл.—20 000 долл.). Следовательно, выигрыш за счет получения точной информации составляет 3 000 долл. (82 000 долл.— 79 000 долл.); при этом учтены также затраты, связанные с наймом специального помощника президента. Вычисленная сумма (3000 долл.) может интерпретироваться как «цена» существующей неопределенности, поскольку президент фирмы «Швец и Жнец» не стал бы платить более 3000 долл. за возможность получения абсолютно точного прогноза. 16.4. ДВУХШАГОВАЯ ЛИНЕЙНАЯ МОДЕЛЬ
В данном разделе мы приступаем к изложению методов учета вероятностной природы показателей в линейных оптимизационных моделях. Как уже неоднократно отмечалось, линейное программирование имеет многочисленные приложения. После ознакомления с гл. 2 читатель, по-видимому, убедился, что линейные модели пригодны «на все случаи жизни». Уже один только этот факт позволяет считать попытку обобщения задач линейного программирования на случай появления в них вероятностных элементов вполне заслуживающей внимания. Основная цель, которую мы преследуем в нескольких последующих разделах, заключается в том, чтобы разработать методы построения так называемых стохастических моделей линейного программирования, которые в результате надлежащих преобразований трансформируются в обычные линейные оптимизационные модели. В силу большого разнообразия приложений линейного программирования успешное решение поставленной задачи при отсутствии ряда специальных постулатов относительно самой структуры процедур принятия решений оказывается почти невозможным. В частно-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
35
сти, требуется дать формализованное описание цепочки взаимосвязанных решений, указывая при этом «решения, которые должны приниматься при наличии информации относительно предыдущих решений и ретроспективных данных о случайных переменных». Наиболее общее рассмотрение этого вопроса изложено в разд. 16.7. Методика, изложенная в этом разделе, позволяет строить оптимизационные модели, содержащие разнесенные во времени и сложным образом взаимосвязанные решения, а также учитывающие текущий и ретроспективные потоки информации. Однако многие из основополагающих идей становятся ясными после рассмотрения «усеченного» варианта модели, согласно которой число шагов в процедуре принятия решений равняется двум. Именно такого рода модель и обсуждается в настоящем разделе. Анализ двухшаговой модели представляется полезным по крайней мере в двух отношениях. Во-первых, при этом излагается метод построения простой стохастической оптимизационной модели, легко трансформируемой в обычную модель линейного программирования, Во-вторых, с помощью рассматриваемой модели удается показать, что учет стохастических элементов задачи приводит к увеличению размерности соответствующей модели. При ознакомлении с разд. 16.7 читатель будет вынужден прийти к заключению, что моделируемая в этом разделе более общая ситуация, с точки зрения руководителя, стремящегося к практическому использованию линейного программирования, скорее всего окажется за пределами «реальной полезности». В разд. 16.5 рассматривается модель с вероятностными ограничениями. Излагаемый здесь метод позволяет обойти некоторые трудности, характерные для задач упомянутого типа. Однако это приводит к некоторым дополнительным ограничениям возможностей самого метода оптимизации. Простейший случай. Прежде чем приступать к рассмотрению конкретного примера двухшаговой модели, познакомим читателя с одним исключительно важным частным случаем простого одношагового моделирования. Для простоты изложения допустим, что детерминистический аналог задачи можно записать в следующем каноническом виде: п
Максимизировать 2 cixj
(1)
;'=!
при ограничениях п
z = l, 2, ...,
т,
(2)
г,>0, / = 1, 2, ...,
п.
(3)
bi, 3=1
Предположим теперь, что коэффициенты в выражении для целевой функции являются случайными величинами, причем значения
36
ГЛАВА 16
всех управляемых переменных х} (/ = 1, 2, . . ., п) требуется определить в условиях отсутствия информации о том, какие значения будут в действительности принимать GJ (/ = 1, 2, . . ., п). Такая ситуация может возникнуть, например, при решении задачи планирования, когда будущие рыночные цены на производимые товары и «будущая» стоимость рабочей силы в момент разработки плана точно не известны. Поскольку все коэффициенты a t j , а также константы bi определены однозначно, выбор допустимых значений Xj не представляет никаких трудностей. Будем исходить из предположения, что оптимальное решение должно обеспечивать максимум ожидаемого значения целевой функции (1). Тогда имеет место следующая теорема; Т е о р е м а о б э к в и в а л е н т н о с т и ф о р м . Допустим, что ац (i — 1, 2, . . ., т; / = 1, 2, . . ., п) и bt (i = 1, 2, . . ., т) в соотношениях (2) определены однозначно, а с/ (/ = 1, 2, . . ., га) представляют собой случайные величины, не зависящие от переменных х} () = 1 , 2 , . . . , п). Если значения х} (; — 1, 2, . . ., п) подлежат определению при отсутствии точной информации относительно значений С], то решение задачи Максимизировать Е [ ^ CjXj\ j=i
(4)
при ограничениях (2) и (3) задается значениями переменных Xj, удовлетворяющих условию п
Максимивировать 2 Е [GJ] Xj
(5)
J:= 1
при ограничениях (2) и (3). Итак, если случайными величинами являются лишь коэффициенты в выражении для целевой функции, причем эти коэффициенты не зависят от выбора значений управляемых переменных, то оптимальное решение может быть найдено путем решения эквивалентной детерминистической задачи линейного программирования, в которой в качестве коэффициентов в выражении для целевой функции выбраны ожидаемые значения соответствующих коэффициентов исходной задачи. Скоро мы убедимся в том, что задачу стохастического линейного программирования таким простым способом не удается решить в случаях, когда модель содержит другие случайные элементы, а также когда хотя бы некоторые из xj могут быть определены лишь после получения информации, позволяющей точно установить, какие значения принимают фигурирующие в модели случайные величины. Пример. Обратимся теперь к простому примеру, позволяющему продемонстрировать, каким образом в связи с решением задачи организационного управления возникает двухшаговая оптимизационная модель. Ознакомление с конкретной задачей поможет читателю разо-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
37
браться в рассуждениях общего характера, приведенных в конце данного раздела. Пусть фирма, занимающаяся обработкой древесины (назовем ее «Супердранка»), ежемесячно перерабатывает определенное количество имеющегося в наличии леса (Т тонн), производя пиломатериалы и фанеру. Для простоты предположим, что данная фирма выпускает только первосортную продукцию. В начале месяца фирме надлежит определить значения следующих управляемых переменных: Xi — количество леса в тоннах, предназначенного для получения пиломатериалов; xz — количество леса в тоннах, предназначенного для изготовления фанеры; х3 — количество леса в тоннах, не подлежащего переработке. Допустим, что к концу месяца из xl тонн леса будет произведено a^Xi кубометров пиломатериалов, а из £2 тонн леса получится а2;г2 тысяч листов фанеры. Обозначим через DI максимальное количество пиломатериалов, а через Z)2 максимальное количество фанеры, которые фирма может продать к концу месяца. Пусть рыночная цена 1 м3 пиломатериалов (продукта 1) равняется г £ , а рыночная цена тысячи листов фанеры (продукта 2) равняется г2; тогда величина г/ (ujXj) представляет собой полную выручку, полученную фирмой при реализации продукта / (/ = 1, 2). Допустим далее, что стоимость переработки 1 т леса в продукт / равняется е,-; таким образом, ер, есть суммарные затраты, связанные с производством продукта /. Следовательно, если положить с7- = TJUJ — ej, то величина CjXj будет представлять собой суммарную прибыль, получаемую за счет продукта / (/ = 1, 2). Кроме того, фирма получает прибыль в размере C x z 3i реализовав неиспользованный лес на рынке; при этом рыночная цена 1 т леса предполагается не зависимой от х3 (она остается на прежнем уровне даже в том случае, когда х3 = Т). Если значения а3 (j = 1, 2), Cj (j = 1, 2, 3) и D, известны, задача принятия управляющего решения сводится к следующей задаче линейного программирования: Максимизировать c^i + с2£2 + с3х3 (6) при ограничениях #1 + х% + х3 = Т (имеющийся в наличии лес), (7) alxi + Si = DI (спрос на пиломатериалы), (8) azxz + s2 = Dz (спрос на фанеру), (9) Xj
> О,
S; > 0,
(10)
где Si — неудовлетворенный спрос на продукт i. Читателю предлагается проанализировать несложную структуру задачи (6) — (10) и объяснить причину тривиальности ее решения при заданных значениях О/, Cj И DJ.
38
ГЛАВА 16
На практике, однако, чаще сталкиваются с ситуациями, когда рыночные цены на каждый из выпускаемых видов продукции колеблются во времени (например, меняются через каждую неделю) в зависимости от уровней запасов (или поставок) сырья и уровней спроса. Следовательно, фирма «Супердранка» будет располагать точными данными о ценах rt и г2 (а значит, и о с± и с2) лишь несколько недель спустя после принятия решения относительно значений xt, £2 и х3. Кроме того, подвержены случайным колебаниям значения ai и а2, а также потенциальные уровни коммерческого спроса DI и DZ- Поэтому $i и sz будут практически определены лишь после того, как станут известными uj и Z);. И наконец, если afCj превысит максимальный уровень спроса, часть продукции фирмы останется нереализованной. Таким образом, совершенно очевидно, что в случае, когда величины а, и DI являются случайными, структура ограничений модели (7) — (10) оказывается недоопределенной. Для полноты представления оптимизационной модели предположим, что фирма должна избавиться от избытка продукции, реализуя ее по сниженным ценам. Чтобы отразить это обстоятельство, добавим (—t t ) к левой части соотношения (8), (—Z2) к левой части соотношения (9) и ( — f r f i — / 2 £ 2 ) к выражению для целевой функции (6), интерпретируя tt ^ 0 как избыток продукта г, а (—/ г £ г ) как потерю прибыли в случае сбыта £, единиц продукции по сниженным ценам. Коэффициенты удельных потерь /г также являются случайными величинами, и их значения в момент выбора уровней для Xj неизвестны. Фактические значения £ г , как и значения st, подлежат определению после того, как станут известными значения всех фигурирующих в модели случайных величин. Подводя итоги проведенного выше анализа, укажем основные этапы решения задачи: 1. Первый шаг. Фирма подбирает значения a;t, £2 и х3, располагая точными данными лишь относительно значений eit e2 и с 3 2. Получение данных о случайных исходах. Становятся известными фактические значения случайных величин ct, с2, / 4 , / 2 , ait
] = 1, 2.
(11)
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
39
Чтобы свести задачу к стандартной задаче линейного программирования, примем еще один постулат относительно характера неопределенности: будем предполагать, что возможно лишь конечное число Q состояний, характеризуемых совокупностью показателей (/i> /2> a i> аъ-> DI-* DZ). Положим для примера Q = 3, т. е. допустим, что возможны лишь следующие комбинации для элемента (/и /2' a i> а 2> -Dn DZ): (/н> /12> a ii' a i2' DU, DIZ) с вероятностью Pi, (/21' /22' а21' Й 22' Dzi, ^22) а
а
(/аи /32' зи 32> -О si' -О 32)
c
ВбрОЯТНОСТЬЮ J>2'
c
вероятностью рз,
причем pi + р а + рз = 1. С помощью (12) легко вычислить 3
3=0
а зная £ [г7-] и 6j, определить из (11) Е [с,-]. Следовательно, исчерпывающая формулировка рассматриваемой двухшаговой модели выглядит следующим образом: Максимизировать Е [cj Xi + Е [с2] ж 2 + С3х3 — Р! [/ц^ц + /12£12] — — ^2 t/21^21 +
при ограничениях х = \ + ^2+^3 Т == — *и -Оц 2— *i2=-0i2 a 2i ;r i +S2i — *2i=-^2i ~bssi — *з1=-Оз!
/22^22^ ~ Р 3 [/31*31 + /32*321
(13)
(имеющийся в наличии лес), (14) (спрос на пиломатериалы при =!), (15) (спрос на фанеру при д=1), (16) (спрос на пиломатериалы при q =2), (17) (спрос на фанеру при д=2), (18) (спрос на пиломатериалы при д=3), (19)
а32;с2+5з2— *з2=-0з2 (спрос на фанеру при =3), xj^sO, ] = 1, 2, 3, s,«>0, g = 1, 2, 3; i = 1, 2, tqi^0, q = 1,2,3; i = 1, 2.
(20) (21)
Необходимо внимательно проанализировать соотношения (13) — (21), с тем чтобы разобраться во всех деталях построения двухшаговой модели процедуры принятия управляющих решений. В частности, отметим следующее: 1. Детерминированное ограничение на объем имеющегося в наличии леса, учитываемое на первом шаге, представлено соотношением (14).
40
ГЛАВА 16
2. Имеются три группы (Q = 3) ограничений, каждая из которых определяет возможный набор значений случайных величин, а именно [(15), (16)], [(17), (18)] и [(19), (20)]. 3. Управляемые переменные первого шага фигурируют в каждой из групп ограничений, указанных в п. 2. Коэффициентами при этих переменных являются числа, определяемые допустимыми значениями соответствующих случайных величин при q = 1, 2, 3. 4. Имеется набор управляемых переменных второго шага (s
ТЕОРИЯ СТОХАСТИЧЕСКИХ
ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
41
первом шаге до того, как станут известными фактические значения, принимаемые случайными величинами. 3. Ограничения i = 1, 2, . . ., g содержат только переменные первого шага, причем 'оответствующие значения ац и bt являются известными. 4. Всегда существуют допустимые значения остальных переменных (выбираемые на втором шаге) xj (/ = k -f- 1, . . ., п). Значения этих переменных подлежат определению после того, как становятся известными фактические значения всех случайных величин. 5. Существует конечное число Q возможных комбинаций значений с} (J = k + 1, . . ., п), ац (i = g + 1, . . ., m; / = k + 1, . . . . . ., n) и bi (i = g + 1, . . ., m); определяемые ими состояния принято обозначать через (cqi, aqu, bqi), а вероятности их появления — через pq (q = 1, 2, . . ., Q). При такой постановке задачи оптимальные правила принятия решения могут быть получены в результате решения следующей задачи линейного программирования: ft
Q
п
Максимизировать 2 Е [cj] Xj + ^j Pq I 2 cqixqi\ ;=1 3=1 j=ft+l
(22)
при ограничениях ^dijXj — bi, /(
i = i, 2, ...,
g
(первый шаг),
(23)
П
У! a tjXj+ 5! a i;Xq) = bqj (правило для принятия решения /=i q j=.h+1 q на втором шаге),
(24)
i — g + 1, . . ., т; q = 1, 2, . . . , < ? ,
жу >0,
/ = 1, 2, . . ., п,
хд] > О, у = 1, 2, .... п; ? = 1, 2, . . ., Q.
(25)
Если какие-либо из коэффициентов с/, bt (i = g -\- {,..., т), bqi (i = g + 1> . . ., m; g = 1, 2, . . . , < ? ) или a^ (i = g + 1, . . . . . ., т) оказываются известными, то их следует сразу же подставить в соотношения (22) — (24). Заметим, что система (24) содержит (т — g) Q уравнений. При решении практических задач, для которых разность (т — g) достигает величины порядка нескольких Десятков, рассмотренный метод в случае больших Q оказывается малоэффективным. Желающие разобраться в том, как с помощью рассуждений, аналогичных только что изложенным, любую многошаговую стохастическую модель линейного программирования можно преобразо-
42
ГЛАВА 16
вать в обычную линейную модель (значительно большей размерности), должны обратиться к разд. 16.7. В заключительной части настоящего раздела обсуждается вопрос о приближенных методах оценки оптимальных значений целевой функции при различных предположениях относительно структуры стохастической модели. В следующем разделе рассматривается другая формулировка двухшаговой стохастической задачи линейного лрограммирования, допускающая переход к стандартной модели линейного программирования с сохранением размерности. Сравнение приближенных методов решения. Для нахождения численного решения практических задач, имеющих структуру, представленную соотношениями (22) — (24), можно воспользоваться рассмотренным в разд. 15.11 методом декомпозиции (разбиения) для двойственной задачи. Ограничения двойственной задачи, связанные с переменными Xj (j = 1, 2, . . ., k), определяют основную «программу», а двойственные ограничения, связанные с переменными xq] (j = k -\- 1, . . ., п), формируют для каждого значения q свою «подпрограмму». Чтобы лучше разобраться, как это происходит, читатель может обратиться к задаче (13) — (21) и после перехода к соответствующей двойственной задаче выделить основную программу и подпрограммы, В модели (22) — (25) предполагается, что к моменту выбора значений управляемых переменных на втором шаге фактические значения всех случайных величин должны быть известными. Обобщение модели на тот случай, когда некоторые из коэффициентов при переменных второго шага в выражении для целевой функции становятся известными лишь после определения численных значений этих переменных, не сопряжено с серьезными усложнениями модели. В частности, в выражении (22) для / = h -f- 1, . . ., п (k ^ h ^ га) достаточно заменить cqj на Е [GJ \ q ] , где Е[с, \ q] представляет собой условно-вероятностное математическое ожидание с,, т. е. ожидаемое значение с/ при условии, что случайный исход, связанный с индексом q, известен. В разд. 16.1 неоднократно подчеркивалось, что исключительно важным является содержательный анализ характера неопределенности в каждом конкретном случае. Излагаемый ниже материал позволит (на примере одношаговой модели) глубже разобраться в тех последствиях, к которым приводит фактор неопределенности при принятии управляющих решений. Приводимые при этом формулы являются также эффективными при оценке девиаций получаемых приближенных решений от оптимальных решений. Модель, представленную соотношениями (22) — (25), иногда называют моделью упреждающих действий, так как значения некоторых из управляемых переменных должны выбираться сразу, еще до получения фактических данных относительно случайных исходов. Весьма удобным является следующее альтернативное представление
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
43
задачи (22) — (25): k
Максимизировать ЕА, в, с [ 2 cixl~\~ ?'=1
п max
S CjZj] =
*(ж ..... xn i=h+l
= E [При упреждении],
(I)
где значения xt ^0 для / = 1, 2, . . ., k выбираются на первом шаге и должны удовлетворять условию ь 2 a,ijXj = bi, i = i, 2, . . . , g (первый шаг), (II) 3=1
а затем определяются значения переменных = A: -j- 1, . . ., я, удовлетворяющих условию n
Xj ^ 0
для / =
ft
2 aijXj = bi — "% ацХ],
j=h+l
i = g + i, ..., т (второй шаг), (III)
3=1
причем выбор переменных второго шага производится после того, как станут известными все коэффициенты в соотношениях (III). В представлении (I) — (III), так же как и в остальных представлениях, рассматриваемых в данном разделе, предположение о том, что существует лишь Q возможных комбинаций случайных исходов (состояний), можно опустить. Однако при этом предполагается, что система уравнений (III) всегда имеет допустимое решение. Модель другого типа, именуемая иногда моделью ожидания, возникает в том случае, когда к моменту выбора значений xj (] = = 1, 2, . . ., п) оказываются известными значения всех случайных величин. Запишем такого рода модель в виде ЕА.В,С [ XI,
max . ..,
^C]Xj]=E
[При ожидании],
(IV)
Xn j=l
где значения всех переменных х, ^з 0 определяются одновременно, причем таким образом, чтобы удовлетворялись как условия (II), так и условия (III). Если число возможных случайных исходов равно Q, то Е[При ожидании] вычисляется путем нахождения оптимального решения для каждой из Q соответствующих задач линейного программирования, после чего определяется средневзвешенное значение целевой функции с учетом вероятности каждого исхода pq. В этом случае для каждого значения q мы получаем линейную модель той же самой структуры и той же самой размерности, как и в детерминистском варианте (1) — (3). Возможность «ожидания» позволяет руководителю получить ценную информацию; при этом значение Е[При ожидании] является верхним предельным значением Е[При упреждении}. Рассмотрим далее оптимальное решение детерминистского аналога модели, в которой каждая случайная величина заменена на
44
ГЛАВА 16
соответствующее математическое ожидание; такую модель назовем моделью глобального усреднения. Пусть х, (/ = 1, 2, . . ., п) есть решение задачи п
Максимизировать 2 Е lcj] Zj^E J
==
[При
глобальном усреднении]
l
(V)
при ограничениях (II) и ,...,m.
(VI)
Заметим, что системой соотношений (V), (II) и (VI) представлена обычная задача линейного программирования, структура и размерность которой совпадают со структурой и размерностью детерминистского аналога модели (1) — (3). Если, согласно принятому предположению, существует решение системы уравнений (III), то, как будет показано ниже, всегда существует допустимое решение системы уравнений (II) и (VI). Нами будет также показано, что Е [При глобальном усреднении] является верхним предельным значением Е [При ожидании}. Предположим, наконец, что в двухшаговой модели производится подстановка Xj ->- xj (j = 1, 2, . . ., k), где Xj найдены в результате решения задачи, представленной моделью (V), (II) и (VI); эта операция вполне допустима, поскольку полученные значения х} удовлетворяют уравнениям (II). Значение остальных переменных Xj(j — /е+1, . . ., тг), как и в предыдущем случае, определим из (III). Назовем предлагаемый подход к решению стохастической задачи оптимизации усреднением на первом шаге. Оптимальное значение целевой функции при такой стратегии находится по формуле h
п
max = Е [При усреднении на первом шаге} . (VII), Если имеется Q возможных случайных исходов (т. е. Q различных, возможных комбинаций значений случайных величин), то вместо (VII) берется средневзвешенное значение целевой функции на множестве ее возможных значений, получаемых в результате решения Q задач линейного программирования и характеризующихся вероятностями исходов pq (q = 1, 2, . . ., 0. В ряде случаев решение упомянутых выше подзадач оказывается тривиальным. Можно доказать, что значения целевой функции, получаемые рассмотренными выше методами, удовлетворяют следующим неравенствам: Е\При усреднении на первом шаге]^.Е [При упреждении], Е [При усреднении на первом шаге]^.Е [При ожидании], Е [При усреднении на первом шаге] ^ Е [При глобальном усреднении] . (VIII)
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ
МОДЕЛЕЙ
45
Справедливость первого неравенства вытекает из того факта, что решение, полученное методом усреднения на первом шаге, представляет собой одно из многочисленных допустимых решений рассматриваемой задачи методом упреждения; следовательно, оно не может быть лучшим по сравнению с оптимальным решением в случае упреждения. Второе неравенство отражает то обстоятельство, что ожидаемое значение целевой функции может быть улучшено, если значения всех случайных величин становятся известными до момента выбора значений х,. Разность Д = Е[При ожидании] — Е[При упреждении] можно назвать ценой неопределенности. Эта величина представляет собой максимальную сумму, которую можно заплатить за точное предсказание случайных исходов до момента выбора значений всех переменных X]. Последним неравенством определяется легко вычислимая верхняя граница для трех других ожидаемых значений целевой функции. Данное неравенство может быть получено следующим образом. Вычислим ожидаемые значения я/ для j = 1, 2, . . ., п в соответствии с оптимальной стратегией, вытекающей из модели упреждения. Эти значения являются также допустимыми и для модели глобального усреднения. Учитывая затем (I), убеждаемся, что те же самые значения xj обеспечивают оптимальное значение Е При упреждении], поскольку имеет место (V) и, следовательно, оптимальное значение Е {При глобальном усреднении] не может быть меньше Е [При упреждении]. В тех случаях, когда легко вычислить Е [При усреднении на первом шаге] и когда получаемое при этом значение не слишком сильно отличается от Е [При глобальном усреднении] , стратегия, предусматривающая подстановку Х)-*-х3 для / = 1, 2, . . ., k (т. е. для переменных первого шага), приводит к решению, близкому к оптимальному решению для модели упреждения. В некоторых случаях для модели упреждения удается найти приближенное решение другого типа. Допустим, что значения Cj(i = k + 1, . . ., п) и bi (i = g + 1, . . ., т) очень малы (обозначим их через с| и if), а значения atj (i = g -f- 1, . . ., т; j = = 1, 2, . . ., п) весьма велики (обозначим их через a*j). Наконец, предположим, что существует решение xj > 0 (/ = 1, 2, . . ., ге) задачи в так называемой наиболее жесткой постановке, а именно задачи ft
п
Максимизировать 2 cix] + S cjxj = ;'=!
J=h+l
= С [При наиболее жесткой постановке задачи] при ограничениях (II) и при условии, что 3=1
, ...,
т.
(IX)
(X)
46
ГЛАВА 16
Заметим, что только что сформулированная задача представляет собой задачу линейного программирования, структура и размерность которой совпадают со структурой и размерностью соответствующего детерминистского аналога модели. Далее, легко убедиться, что значения х* для у = 1, 2, . . ., k являются допустимыми решениями задачи с упреждением. Следует, однако, отметить, что С [При наиболее жесткой постановке задачи] меньше ожидаемогозначения целевой функции в случае, когда x*j (j = 1, 2, . . ., /с) используются в рамках модели упреждения, поскольку в (IX) не учтена процедура оптимального выбора х} (j = k + 1, • • •> п) после того, как станут известными значения фигурирующих в модели случайных величин. Таким образом, можно доказать, что С [При наиболее жесткой постановке задачи] ^ ^ Е [При упреждении], (XI) и, следовательно, если С [При наиболее жесткой постановке задачи] почти совпадает с Е [При глобальном усреднении], то значения х* (] = 1, 2, . . ., k) близки к оптимальным значениям xj (j = — 1, 2, . . ., k), получаемым в результате решения задачи с упреждением. 16.5. МОДЕЛЬ С ВЕРОЯТНОСТНЫМИ ОГРАНИЧЕНИЯМИ
Подводя итоги рассмотрения изложенного в предыдущем разделе метода решения двухшаговой стохастической задачи линейного программирования, мы приходим к заключению, что основной недостаток этого метода состоит в том, что получающаяся в результате его применения стандартная линейная модель (эквивалентная исходной стохастической модели) имеет слишком большую размерность. Увеличение размерности обусловлено тем, что для построения исчерпывающих правил принятия решения на втором шаге необходимо учитывать все возможности значения фигурирующих в задаче случайных показателей. Если, однако, сделать ряд дополнительных упрощающих предположений, то можно построить другой, более простой метод решения, позволяющий свести двухшаговую линейную стохастическую модель к обычной линейной оптимизационной модели той же размерности. Этот метод называют программированием с вероятностными ограничениями 1). Поясним его сущность на примере, уже рассмотренном в предыдущем разделе. Пример. Обратимся вновь к задаче фирмы «Супердранка». Попытаемся упростить эту задачу в еще большей степени, предположив, что коэффициенты а 4 и а 2 являются известными, а вместо строгого требования полной реализации избыточной продукции будем предполагать, что возможны альтернативные варианты действий, эконох ) Такое название было предложено А. Чарнсом и У. Купером, заложившими основы данного метода.
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
47
мические последствия которых не определены. Тогда случайными величинами будут являться лишь рыночные цены г;- и предельные значения для уровней спроса Dt. При этом для ожидаемого значения удельной прибыли будем иметь Е [GJ] = Е [г,-] -а;- — е^ где / = 1,2 означает номер выпускаемой фирмой продукции. Подлежащая максимизации целевая функция имеет вид Максимизировать Е [cj х\ + Е [с2] £2 + €3X3. (1) Заметим, что выражение для целевой функции содержит лишь переменные первого шага, так как нами не конкретизированы варианты решений (или действий) в случае, когда объем выпускаемой продукции превышает объем спроса. Учтем теперь уже известные ограничения на объем имеющегося в наличии леса, а также условия неотрицательности Xj\ Xi -\- xz + хз = Т (имеющийся в наличии лес), (2) х} > 0, / = 1, 2, 3. (3) Наконец, необходимо наложить ограничения на объем производимой продукции, поскольку в противном случае модель, ориентированная на максимизацию ожидаемой прибыли, очевидно, приведет к яначениям Xi и ж а , превышающим уровни спроса. Допустим далее, что президент фирмы «Супердранка» ставит условием, чтобы все выпускаемые фирмой продукты i в объеме а^х^ (i = 1, 2) были полностью реализованы с вероятностью, не меньшей |3г (i = 1, 2). Математически это условие записывается следующим образом: Р [aixi ^ DJ ^ Pi (спрос на пиломатериалы), (4) Р [а2х2 ^D2] ^ (52 (спрос на фанеру). (5) Ограничения (4) и (5) называются вероятностными, поскольку они выражены через вероятности возможных исходов. Условия (4) и (5) эквивалентны следующим обычным линейным неравенствам: ajZi ^ BI а2;г2 ^ J92
[детерминистский эквивалент соотношения (4)], (6) [детерминистский эквивалент соотношения (5)]. (7)
Другими словами, линейная модель, состоящая из целевой функции (1) и ограничений (2), (3) и детерминистских эквивалентов ограничений (4), (5), позволяет получить оптимальное решение сформулированной выше задачи с вероятностными ограничениями. Чтобы показать, каким образом, зная безусловное распределение случайных величин, можно определить Bt (i = 1, 2), обратимся к следующему примеру. Пусть безусловное распределение для DI задано, а именно допустим, что р [£, = 1] = 0,2, Р Wi = 3] = 0,4, Р (Di = 8] = 0,3, Р [Di = 10] = 0,1.
(8)
48
ГЛАВА 18
(График Р [Di ^ BI\ приведен на рис. 16.5.) Нетрудно убедиться, что Bi = 1 при условии, что 0,8 < р ^ 1,0; В\ = 3 при условии, что 0,4 < р ^ 0,8, и т. д. Отметим, что решение для линейной модели (1) — (3), (6) — (7) находится так же просто, как и решение задачи (6) — (10), рассмот-; ренной в предыдущем разделе. Метод решения. Отталкиваясь от примера с фирмой «Супердранка», дадим общее описание метода решения для двухшаговой модели с вероятностными ограничениями. Пусть х^ (/=1, 2, . . ., К) являются переменными, значения которых выбираются на первом шаге. (Переменные второго шага о ]0 в явном виде мы не указываем.) В, Допустим, что все коэффициенты и Р и с. 16.5. Задача фирмы «Супер» 3аДаНЫ' На„конеЧ' предполодранка». жим, что случайные события не зависят от того, какие значения принимают переменные первого шага. Решение модели с вероятностными ограничениями сводится к нахождению значений Xj в следующей задаче: Максимизировать 2 Е \.ci] x)
(9)
3=1
при ограничениях h
^uijXj = bi,
1 = 1, 2, ..., g
(первый шаг),
(10)
m (вероятностные
ограниче-
3=1 h
Р [ S o,ijXj ^bi]^-PJ,
i = g-f-l, ...,
(11) (12)
ния), Xj ^ 0 для всех значений }.
Соотношение (11) интерпретируется следующим образом: безусловh
ная вероятность того, что выполняется неравенство bt ^э 2 аах]-> не может быть меньше Р; (где Р; удовлетворяет условию 0 ^ р г ^ 1). В предположении, что существуют такие значения Xj, которые одновременно удовлетворяют всем условиям (10) — (12), решение сформулированной нами задачи может быть получено в результате решения обычной задачи линейного программирования, целевая функция которой имеет вид (9), а в систему ограничений наряду с соотношениями (10) и (12) входит детерминистский эквивалент
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
49
вероятностных ограничений (11), а именно условие h
i = g + i,...,m,
(13)
где В i — предельное значение &,, удовлетворяющее условию Plbi^BJ^Vi, (14) или (что то же самое) Р [bi < Бг] < 1 — р г
[Bt: (1 - Р,) - квантиль].
(15)
Обсуждение результатов. Сравним теперь метод вероятностных ограничений с изложенным ранее методом, основанным на использовании двухшаговой модели. Модель с вероятностными ограничениями обладает двумя положительными качествами. Во-первых, она сводится к эквивалентной задаче линейного программирования, имеющей ту же размерность и такую же структуру, что и детерминистский аналог исходной модели. Следовательно, после надлежащего определения всех констант, стоящих в правых частях соотношений (10), вычислительные процедуры, связанные с нахождением оптимального решения для стохастической модели, оказываются не более громоздкими, чем процедуры поиска оптимального решения для ее детерминистского аналога. Во-вторых, относительно случайных величин bt требуется знать лишь значения констант PJ, определяющих соответствующие безусловные распределения вероятностей. В силу указанных свойств модели с вероятностными ограничениями выгодно отличаются от моделей, рассмотренных в предыдущем разделе, когда при отображении стохастической задачи на обычную задачу линейного программирования размерность модели сильно возрастает и, кроме того, приходится предполагать, что число возможных состояний Q ограничено. Основной недостаток моделей с вероятностными ограничениями заключается в том, что экономическое последствие «нарушения» того или иного ограничения может быть оценено лишь косвенным путем. Так, например, в задаче фирмы «Супердранка» метод вероятностных ограничений не позволяет проанализировать зависимость убытков, которые может понести фирма, от избыточного объема выпускаемой ею продукции. Выражаясь иными словами, в большинстве случаев определение численных значений р г , правильно описывающих анализируемую ситуацию, должно быть составной частью оптимизационного процесса. [Дополнительная концептуальная ограниченность данного метода состоит в том, что он заведомо исключает рандомизированные стратегии, которые (как было показано в разд. 16.2) иногда оказываются более выгодными. Необходимо также отметить, что оптимальное решение, полученное методом вероятностных ограничений, может отличаться от оптимального решения, найденного с помощью Двухшаговой модели (разд. 16.6). Таким образом, у нас нет никакой
50
ГЛАВА 16
уверенности в том, что существуют такие значения р г , для которых методом вероятностных ограничений было бы получено решение, являющееся оптимальным для двухшаговой модели, проиллюстрированной в предыдущем разделе.] Поэтому, столкнувшись с проблемой выбора между двумя подходами к моделированию двухшаговой процедуры принятия управляющих решений, операционист должен взвесить положительные и отрицательные качества как первого, так и второго методов: двухшаговая модель, рассмотренная в предыдущем разделе, приводит к необходимости оперировать слишком большими системами линейных соотношений, тогда как в модели с вероятностными ограничениями сам термин «оптимальное решение» имеет весьма ограниченный смысл. При ознакомлении с многошаговой моделью читатель заметит, что концептуальные трудности метода вероятностных ограничений при этом катастрофически возрастают. Вопрос о применимости этого метода к решению задач многошагового характера пока еще находится в стадии исследования как в теоретическом, так и в эмпирическом плане. В оставшейся части этой главы приводится анализ одного специального примера двухшаговой модели, а также рассматриваются способы построения линейных стохастических моделей, отличные от предложенных выше. Этот материал представляет для читателя определенный интерес в том случае, если он хочет глубже разобраться в методах отображения стохастических оптимизационных моделей на эквивалентные модели с детерминированной структурой. В то же время наше введение в методы построения оптимальных стратегий в условиях неопределенности вполне достаточно для того, чтобы подготовить читателя к анализу рассматриваемых в гл. 17 моделей динамического программирования, содержащих элементы вероятностного характера. В некоторых приложениях вместо индивидуальных ограничений типа (11) могут возникнуть совместно-вероятностные ограничения. Такого рода модели обычно оказываются эквивалентными нелинейным оптимизационным моделям, решение для которых может быть получено методами, изложенными в гл. 15. Чтобы пояснить, что мы имеем здесь в виду, рассмотрим следующую ситуацию. Пусть вместо (11) имеет место единственное вероятностное ограничение вида h
k
Р \^jag+i,jXj^.bg+l, 3=1
..., 2
ЯгоЛ'<Ьт]>Р,
(I)
3=1
(совместно-вероятностное ограничение).
где 0< р < 1. Заметим, что в этом случае подлежит конкретизации только одна константа р, и, следовательно, анализ чувствительности получаемого решения будет относительно простым. Обозначим функции безусловного распределения через FI (Ъ) SE P [bi
ТЕОРИЯ СТОХАСТИЧЕСКИХ
ОПТИМИЗАЦИОННЫХ
МОДЕЛЕЙ
51
что все они непрерывны. Допустим, кроме того, что функция совме7П
стного распределения для bt имеет вид
[] Ft, где П означает
i=g+l
операцию взятия произведения (умножения). Следовательно, bg+i, . . ., bm статистически независимы. Наконец, пусть Gt = = 1 — Ft. Тогда эквивалентная стохастической детерминистическая модель представляется с помощью (9), (10), (12) и соотношений ft —У» + 2 uijXj = 0, i = g-\-l, ..., т (определение квантиля), (И)
т
П
£<(#«) ^-Р
(детерминистский эквивалент совместного распределения),
(III)
где г/, не ограничен по знаку. Отметим, что ограничение (III) имеет нелинейный вид. Лишь в отдельных случаях GI таковы, что (III) определяет вогнутую функцию, т. е. удовлетворяет требованиям большинства алгоритмов решения нелинейных оптимизационных задач. Однако логарифмическое представление (III), имеющее вид m
2 I n G j (г/г)>-1п (3 i=s+i
(эквивалентное логарифмическое представление),
(IV)
чаще всего оказывается вогнутым (например, в том случае, когда Ь{ задается нормальным распределением, гамма-распределением или равномерным распределением). Для решения задачи, представленной соотношениями (9), (10), (12), (II), (IV), можно воспользоваться математическим методом, изложенным в гл. 15. Рассмотрим случай, когда значения bt известны, а величины а^ являются случайными. Например, предположим, что (11) заменено следующим соотношением: ъ^ >pi, i = g-\-i, ..., т (в качестве коэффициентов фигурируют случайные величины). (V) Если допустимо предположение, что для каждого значения i случайные величины аи (у = 1, 2, . . ., k) имеют нормальное совместное распределение со средними значениями а,ц (;' = 1, 2, . . ., k) и смешанными моментами (ковариациями) aiih (j = 1, 2, . . ., k; h = 1, 2, . . ., k), то нелинейный детерминистский эквивалент (V) имеет следующий вид: Ъ
Й
з=1
'
J
3
h
1/9
j=l ft=l
(детерминистский эквивалент), (VI)
52
ГЛАВА 16
где BI есть квантиль (1 — р г ) нормального распределения нормированной случайной величины. Если р, ^1 / 2 , так что Bt ^ 0, то представление (VI) является вогнутым, и для модели (9), (10), (12), (VI) решение может быть найдено с помощью математических приемов, рассмотренных в гл. 15. 16.6. СЛУЧАЙ ТРАНСПОРТНОЙ СЕТИ
Как уже отмечалось в гл. 6, транспортная задача (или задача размещения) является одной из наиболее важных задач оптимизации на сетях. Математически она формулируется следующим образом: m
n
Минимизировать 2 S Сцхц. i=l 3=1
(1)
при ограничениях n
2^i,- = 5'j, ;=i
i = l, 2, ...,
т (предложение),
(2)
т
2 xi} = D), 7 = 1, 2, ..., п (спрос), t=i хц ^ 0 для всех значений i и у,
(3) (4)
где Si можно интерпретировать как имеющийся в наличии объем продукции, ожидающий погрузки в i-м пункте отправления, a DJ — как объем продукции, требуемый в /-м пункте назначения (/-му потребителю), причем модель построена в предположении, что суммарное предложение равняется суммарному спросу (25; = 2-D^). В гл. 6 постулировалось, что значения St и DJ являются точно известными. В гл. 7 было показано, каким образом находится численное решение этой задачи, основанное на применении симплексного метода. Рассмотрим теперь случай, когда уровень спроса DJ оказывается неопределенным. Покажем, что соответствующая такому предположению двухшаговая модель выглядит лишь в незначительной степени сложнее своего детерминистского аналога (1) — (4). Будем считать, что основными этапами оптимизационного процесса являются следующие: 1. Первый шаг. При наличии точных данных относительно значений Si, c t j и, возможно, некоторых из DJ требуется выбрать значения всех управляемых переменных Xtj. 2. Получение информации относительно частных исходов. Становятся известными фактические значения случайных величин DJ. Значения DJ оказываются независимыми от выбора значений переменных Xij. 3. Второй шаг. Определяется «фактический» объем неудовлетворенного спроса или избыточной продукции.
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
53
Заметим, что в силу п. 3 на втором шаге в модели (1) — (4) появляются п переменных m
Uj^Dj—^j
i=l
xtj,
/ = 1, 2, ..., п,
(5)
не ограниченных по знаку. Чтобы сделать задачу первого шага нетривиальной, необходимо к выражению для целевой функции прибавить член, содержащий и/, поскольку в противном случае оптимальное решение будет заключаться в том, чтобы из каждого i-го пункта отправления транспортировать всю имеющуюся в наличии продукцию объемом St в тот пункт назначения /, которому соответствует минимальное значение ctj. Пусть с/ (uj) представляют собой потери (например, в виде штрафа), связанные с результирующими значениями и/. Необходимо иметь в виду, что функции Cj (uj) не обязательно являются линейными; можно, например, предположить, что функция потерь (или штрафная функция) имеет квадратичную форму. Допустим теперь, что целевая функция представляет собой сумму транспортных затрат и ожидаемого значения возможных потерь (при Uj *£ 0), т. е. пусть требуется m
n
Минимизировать 2 2
n
m
с
i=l j=l
г#й"т- S Е [С] (Dj—2 j=l
t=l
х
ч}\
(6)
при ограничениях (2) и (4). Фигурирующие в (6) средние значения случайных величин определены с учетом безусловного распределения вероятностей для DJ. Отметим важную особенность приведенной выше двухшаговой модели: на втором шаге проблемы оптимизации не существует. Значения переменных второго шага и} с помощью (5) однозначно определяются значениями переменных, выбранными на первом шаге, и значениями, принимаемыми случайными величинами DJ. Эта особенность модели полностью используется при решении задачи, и, таким образом, в отличие от случая, рассмотренного в разд. 16.4, отпадает необходимость оперировать детерминистским аналогом исходной стохастической модели. Примем еще два постулата, позволяющие свести двухшаговую стохастическую модель (2), (4)-(6) к математически эквивалентной ей обычной транспортной задаче. Во-первых, предположим, что возможны лишь целочисленные значения DJ (для всех значений /'). Определим для каждого значения j т
Xj s= 2 xtj f=i
(суммарный объем поставок в /-и пункт назначения)
(7) и введем величину Cj (х}) = Е [с} (D} — х}}]
(ожидаемые потери, связанные с /-м пунктом назначения).
(8)
ГЛАВА 16
54
(Способ вычисления Cj (xj) проиллюстрируем на примере, который рассматривается ниже.) Во-вторых, допустим, что Cj (x^ есть выпуклая функция: (для всех целочисленных значений xj). (9)
Cj(Xj-{-i)—Cj(Xj)^Cj(xj)—Cj(xj—1)
Чтобы функция Cj(xj) была выпуклой, достаточно выпуклости самой функции потерь Cj (u}). С помощью приведенного ниже примера мы покажем, что предположений о целочисленности и о том, что функция потерь является выпуклой, достаточно, чтобы свести рассматриваемую нами задачу к обычной расширенной транспортной задаче. \ Столбец 1
Jl '1 .*!
Спрос
Предложение
Л. \
f °\ *\ 7
НА *\
i i
,5_\
1
1\
В
'\
i
fj 2
10
7
Р и с . 16.6. Транспортная задача (оптимальное решение для детерминистической модели). Минимальные общие затраты = 100.
Чтобы не ввести читателя в заблуждение, необходимо предупредить его о том, что существуют значительно более эффективные методы численного решения рассматриваемой нами задачи, чем ее решения в полностью развернутой постановке. (Чаще всего используются вычислительные процедуры, основанные на применении обобщенного алгоритма, приведенного в разд. 15.10.) Поэтому при анализе сформулированной ниже задачи читатель должен стремиться главным образом понять, почему введение в рассмотрение факторов неопределенности приводит лишь к незначительным концептуальным усложнениям данной специфической двухшаговой модели. Разработку более совершенных алгоритмов мы оставим специалистам в области прикладной математики. Пример. Рассмотрим детерминированную задачу, представленную таблицей на рис. 16.6 (эта таблица уже приводилась нами на рис. 7.2, т. I); здесь же указано единственное оптимальное решение. Предположим теперь, что значения D3 и Z)4 оказываются неопреде-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
55
ленными; в частности, допустим, что соответствующие распределения вероятностей задаются следующими соотношениями: так что E[D3]=3,
РШз=1]=РШз=3]=Р[03=5]=±,
4
(10)
= = - , так что (И)
Таким образом, ожидаемые уровни спроса совпадают с детерминированными уровнями спроса в модели, рассмотренной в гл. 7; однако, несмотря на то что Е Ю 4 ] = 2 , фактический исход Z)4 = 2 исключен. Предположим, что для j = 3, 4 за избыточные поставки (и, ^ 0) J-TSL потребитель штраф не взимает, а за недопоставку каждой требуемой единицы продукции назначается штраф в размере /,-, т. е.
0
fjl(D._X])
при
.
при D)> x
(ФУНКЦИЯ потерь).
(12)
Легко убедиться, что функция с/ (и,) (где и, = Dj — Xj) является выпуклой. Следовательно, ожидаемые потери определяются формулой C](xj)~
2 1i(P — Xj)P[Dj = D] (среднее значение функции (13) >xi потерь).
D
Так, например, для х3 = 1 0=3, 5
(14)
а для х 4 = о
С 4 (3)=2 /4ф-3)Р[/) 4 = £)] = / 4 (4-3)1 = 1/4.
(15)
0=4
Значения Cj (x}) (j = 3, 4) приведены в таблице на рис. 16.7. Чтобы убедиться в умении пользоваться формулой (13), читатель может попытаться самостоятельно вычислить значения С 3 (3) и С 4 (0) и сравнить полученные результаты с соответствующими данными, приведенными в таблице на рис. 16.7. Требуется также объяснить, почему Cj (0) = fjE [Dj], а функция Cj (xj) асимптотически стремится к нулю при стремлении Xj к максимально возможному значению DJ. Читателю рекомендуется также проверить, что функция Cj (xj) является выпуклой в смысле определения (3); при этом можно воспользоваться таблицей на рис. 16.7, в которой приведены значения Cj (х}) — Cj (xj + 1), j = 3, 4.
56
ГЛАВА 16
Чтобы преобразовать стохастическую модель в расширенную транспортную сеть, мысленно свяжем с каждой единицей возможного1 спроса D3 и £> 4 самостоятельный пункт назначения. В рассматриваемой задаче для D3 имеется пять пунктов назначения, т. е. наибольшее из возможных значенийD s равняется 5; аналогично число пунктов назначения для Z>4 равняется четырем. Каждый из этих пунктов назначения характеризуется единичным уровнем спроса (т. е. каждому пункту назначения требуется продукция в количестве одной условной единицы). Такая схема рассуждений приводит нас к тому, что суммарная потребность в продукции на всех пунктах назначения (т. е. у всех потребителей) равняется 21 единице (7 + 5 + 5-\- 4). Поскольку суммарное предложение (суммарное количество продукции, имеющейся в наличии на пунктах отправления, т. е. у всех фигурирующих в задаче поставщиков) равняется, согласно таблице на рис. 16.6, 17 единицам (6+ 1+ 10), необходимо ввести в рассмотрение четвертый (фиктивный) пункт отправления, для которого 54 = 4 единицам (21—17). Таким образом, каждая единица продукции, поставляемая из четвертого пункта отправления (т. е. за счет iS4), фактически соответствует единице неудовлетворенного спроса. Предположим, что потребности DI и D 2 должны быть удовлетворены при любых обстоятельствах и, следовательно, четвертый поставщик (т. е. четвертый пункт отправления) в соответствующие пункты назначения продукцию не отправляет. Тогда мы приходим к табличному представлению транспортной задачи, приведенному на рис. 16.8. В таблице на рис. 16.8 значения с^ для i = 1, 2, 3 совпадают с соответствующими значениями сц, фигурирующими в таблице на рис. 16.6, и одинаковы для столбцов, отвечающих значениям с одним и тем же DJ. Содержание четвертой строки требует некоторых пояснений. В этой строке фигурируют значения, принимаемые приращениями Cj (xj~) — Cj (xj-\- 1) (см. таблицу на рис. 16.7). Xj
0 1 2 3 4 5 (и>5)
t/з ,£3)
З/з 2/з 4
C3(xa)-C3(x3+l)
l/з 2
/з/з
/з/з 2 /з/з
V 3 /3
V3/3
l/3/з
0
С 4 (х 4 ) C4(*4)-C 4 (*4+1)
2
/3/3
0
6
3
2/4
3
/4/4
/4/4
2
/4/4
/4/4 V4/4 0 0
2
/4/4 Х /4/4
0 0
Р и с. 16.7. Ожидаемые экономические потери при неполном удовлетворении спроса.
Заметим, что сумма приращений С3 (#з) — ^з (#з + 1) по всем возможным значениям х3 равняется С3 (0) [аналогично сумма прираще-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ Столбец 1
2
3
10
4
,5
7
S
D2
1
1
Предложение
s=sr
<
fcj О,
11
Jj
JLJ
Спрос
57
1
i 1
1
1
Oj
1
1
1
Л^
Р и с . 16.8. Матрица для расширенной транспортной задачи.
ний GI (х±) — С 4 (я4 + 1) по всем возможным значениям а;4 равняется С 4 (0)]. Поскольку функция С/ (х) является убывающей и выпуклой, значения коэффициентов при /7- в столбцах, содержащих С] (xj), убывают с ростом значения /. [Заметим, что в тех случаях, когда элементы четвертой строки, относящиеся к смежным столбцам (рис. 16.8), совпадают, элемент, стоящий слева, помечен знаком плюс и его численное значение можно считать «несколько большим» значения элемента данной пары, стоящего справа.} Отсюда следует, что для каждого DJ оптимальное решение заключается в том, чтобы распределить 54 по столбцам, начиная с самого правого и переходя последовательно к столбцам, расположенным левее. Таким образом, в случае оптимального решения суммарные потери, связанные с размещением /54 (S4 представляет собой неудовлетворенный спрос) в столбцах, соответствующих DJ (]' = 1, 2, 3, 4), равняются Cj (xj). Предположим, например, что три единицы из «S4 распределены по столбцам 5, 6 и 7, отвечающим D3- Тогда х3 = 2 (в чем нетрудноубедиться), и с помощью таблицы на рис. 16.7 получаем
=/,+-•/,+••/„—•/а.
(16)
(Поскольку St = 4, х3 ^ 1, и, следовательно, первый вклад в Z>3, представленный матричным элементом 1/з на пересечении третьего столбца и четвертой строки, можно исключить из рассмотрения. Еще одно упрощение может быть достигнуто путем подбора такой комбинации столбцов, для которой совокупный спрос равен 2.) Если бы функция С) (xj) не была выпуклой, мы не могли бы гарантировать, что оптимальное решение свелось бы к распределению 54 по потребителям, спрос которых оказался неудовлетворенным, начиная с наиболее высокого из возможных значений уровня
ГЛАВА 16
58
спроса и последовательно переходя к более низким уровням. В заключение можно сказать, что оптимальное решение для модели, изображенной на рис. 16.8, которое минимизирует при заданных значениях /з и / 4 суммарные транспортные затраты, определяемые целевой функцией (6), находится с помощью алгоритма решения транспортной задачи, который приведен в разд. 7.3. Анализ чувствитеьности. Построив расширенную транспортную модель, которая математически эквивалентна двухшаговой стохастической модели, мы можем оценить эффект, порождаемый фактором неопределенности. В частности, мы можем исследовать чувствительность решения по отношению к вариациям значений / 3 и /4. Поскольку суммарный объем имеющейся в наличии продукции равен 17 единицам (Si-]- ^2+ ^з); а спрос (Di -)- Z)2) в объеме 12 единиц должен быть удовлетворен (в обязательном порядке), то остается 5 единиц (17—12) продукции, которые требуется полностью распределить по потребителям 3 и 4, характеризующимся уровнями спроса DS и £)4 соответственно. Это означает, что возможны лишь следующие решения: #3 — 1, л» • • ч 5»
и
2^4 — " — 2-3-
(17)
Для каждой пары значений xz и ж 4 оптимальные значения всех управляемых переменных xt]- приведены в таблице на рис. 16.9 (оптимальные значения Хц можно найти путем решения соответствующей детерминистической задачи, аналогичной той, которая представлена таблицей на рис. 16.6). Ответ на вопрос, какой из вариантов размещения действительно является оптимальным, т. е. приводит к наименьшему ожидаемому значению целевой функции (6), разумеется, зависит от фактических числовых значений / 3 и /,.. Оптимальное размещение * 'ИЗ
Х
2*
-^33
^
Ожидаемые суммарные затраты 83 + 2f3
3
2
О
При этом
х/г=$,ха-/,^=7.
Р и с . 16.9. Оптимальное размещение при заданных значениях (хз, xj и (/3, ft).
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
59
Можно также считать, что оптимальный вариант размещения зависит от значения отношения / 3 // 4 и абсолютного значения /3. Для трех значений / 3 // 4 в таблице на рис. 16.9 указаны также значения /3, для которых приводятся возможные оптимальные решения. Заметим, что (I) если отношение /3//4 велико (например, равняется 3), то при возрастании / 3 увеличивается число единиц продукции, предназначаемое для третьего потребителя; (II) если отношение / 3 // 4 мало (например, равняется 1/3), то в третий пункт назначения отправляется минимальное количество продукции независимо от того, какое значение принимает /3; (III) всегда можно подобрать такие значения /з и / 4 , для которых каждый из возможных вариантов размещения является оптимальным Экономический эффект, обусловленный наличием неопределенности, можно измерить путем сравнения минимальных ожидаемых затрат, вычисленных с учетом (6), с минимальными затратами, которые имели бы место, если бы значения D3 и /?4 были известны до момента принятия решения относительно выбора варианта распределения объемов транспортных перевозок по пунктам назначения. Для того чтобы произвести такого рода оценки, допустим, что значение /з достаточно велико, чтобы считать вариант полного удовлетворения потребностей предпочтительным в любом случае, а также предположим, что все 5 единиц продукции, оставшейся после удовлетворения спроса DI и спроса Dz, отправляются в третий и четвертый пункты назначения даже в том случае, если (-D3+ D 4 ) < 5. Тогда можно показать, что для достаточно больших значений / 3 -Суммарные транспортныеI О оЬ /4 расходы плюс потери при Е наличии точной информа(I) 195 + 8/э при £ = 1 и 1 Щии и, следовательно, ГОжидаемая
цена]
11-п- + оо/з 1+|/g
[-6 + 11/3
при т^ = 3, npH£=lf П
(П)
р И /?= .1_.
Формулой (II) представлена оценка максимума того, что был бы готов выплатить руководитель, если бы он получил взамен абсолютно точный прогноз относительно случайных исходов. Цена неопределенности есть линейная функция /3; при достаточно больших значениях /з эта цена оказывается наибольшей при / 3 // 4 = 1/3, так как в этом случае третьему потребителю отправляется наименьшее количество продукции.
60
ГЛАВА 16
Метод вероятностных ограничений. Весьма поучительным может оказаться сравнение только что рассмотренной двухшаговои модели с вариантом этой модели, построенным методом вероятностных ограничений, в котором наряду с детерминированной целевой функцией (1) и ограничениями на предложение (2) и спрос (3) для / = 1,2, а также условиями неотрицательности управляемых переменных (4) принимаются следующие ограничения: Р [D3 ^ х3] ^ Рз и Р LD4 ^XJ s2s Р 4 (вероятностные ограничения), (18) где суммарный объем поставок X] в ;-й пункт назначения определяется по формуле (7). Таким образом, согласно (18), необходимо, чтобы вероятность удовлетворения уровней спроса DJ (/ = 3,4) была не меньше Р^, причем р^ могут принимать любые значения в интервале (О, 1). Заметим, что соотношения (18) ориентированы на предотвращение случаев неудовлетворения спроса, тогда как соотношения (4) и (5) из разд. IG.5 обеспечивают устранение ситуаций, при которых объем поставок превышает существующие уровни спроса. При заданных значениях Р З и р 4 задача с вероятностными ограничениями эквивалентна задаче, в которой вместо (18) рассматривается ограничение m
У> x ^Bj, i=i i}
1 = 3, 4
(детерминистский эквивалент),
(19)
где Bj указывают на нижнюю границу для уровней спроса и удовлетворяют условию Р ID} < Bj\ > ру. (20) Остальные компоненты модели, т. е. целевая функция (1) и ограничения (2) и (3) для / = 1, 2, остаются без изменений. Отметим еще раз, что единственно возможными вариантами распределения оставшихся пяти единиц продукции между третьим и четвертым потребителями являются варианты, определяемые формулой (17); соответствующие значения Р [D, ^ xj] приведены в таблице на рис. 16.10. Из этой таблицы вытекают два важных вывода. Во-первых, не существует допустимого решения в том случае, если Р! и Р 2 принимают одновременно слишком большие значения. Так, например, если Р З = 2/3, то не существует ни одного допустимого решения для Р 4 > 1/2. Во-вторых, варианты размещения (xs = 2, £ 4 = 3) и (х3 = 4, £4 = 1) являются неоптималъными при любых значениях р 3 и Р 4 . Вариант размещения (xs — 1, х 4 = 4) всегда предпочтительнее варианта (xz = 2, #4 = 3), поскольку вероятности удовлетворения спроса Ds и спроса D^ для х3 = 1, х 4 = 4 не могут быть меньше соответствующих вероятностей для варианта (х3 = 2, £4 = 3), и, следовательно, для первого варианта транспортные расходы не могут превышать транспортных расходов для второго
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
з
х±
Суммарные транспортные расходы
1
4 3 2 1 0
89 94 100 106 112
х
2 3 4 5
Р [D3 ^ хз]
V. V»
Р [£*4 'С £4]
1 3
2
/3
/4 V,
2
/з
1/2
1
61
V4
Р и с . 16.10. Вероятности удовлетворения спроса при заданных значениях ars и ;г4.
варианта. Аналогично объясняется неоптимальность варианта (х3 = 4, ж 4 = 1). Расхождения в выводах, полученных вначале с помощью двухшаговой модели, а затем методом вероятностных ограничений, указывают на принципиальное различие рассмотренных типов моделей, заключающееся в том, что возможные оптимальные решения в одном случае могут не совпадать с возможными оптимальными решениями в другом случае. Уверен ли читатель, что упомянутые выше варианты размещений (х3 = 2, xk = 3) и (х3 = 4, я4 = 1) действительно следует исключить из рассмотрения? Ответ должен быть надлежащим образом аргументирован. 16.7. МНОГОШАГОВАЯ ЛИНЕЙНАЯ МОДЕЛЬ
Логика рассуждений, позволившая преобразовать двухшаговую стохастическую модель линейного программирования в математически эквивалентную ей обычную линейную оптимизационную модель, может быть успешно применена и в случае многошаговых задач. Как и ранее, необходимо исходить из предположения, что возможно лишь конечное число Q наборов значений для фигурирующих в модели случайных величин (или, другими словами, конечное число состояний). В реальной многошаговой задаче значение Q может быть настолько большим, что решение результирующей задачи линейного программирования окажется практически невозможным; поэтому излагаемый ниже метод анализа представляется полезным главным образом в связи с попыткой глубже разобраться в особенностях организационного управления в условиях неопределенности. Однако в некоторых (хотя и редких) случаях многошаговая модель оказывается практически применимой при решении реальных задач. Пусть детерминистский прототип задачи выглядит следующим образом: Максимизировать 2 cixi
(1)
62
ГЛАВА 16
при ограничениях п
^aijX) = bi,
г = 1, 2, . . . , т о ,
(2)
Zj>0, / = 1 , 2, ..., /г. (3) Предположим, что в стохастическом варианте модели С], ао- и bi являются случайными величинами. В частности, допустим, что число возможных состояний равняется Q. Обозначим эти состояния через (с91, aqij, bqi). Ниже рассматривается трехшаговая процедура, используемая при формулировке соответствующей задачи линейного программирования. Предлагаемая процедура представлена в самом общем виде и поэтому пригодна для любых многошаговых моделей. Однако при рассмотрении конкретных задач эту процедуру нередко удается редуцировать. Идея заключается в том, чтобы начать с формулировки задачи, в которой предполагается, что еще до момента принятия того или иного управляющего решения известно, какой из возможных Q исходов фактически имел место. Если бы такое предположение соответствовало реальному положению вещей, то в результате мы получили бы Q альтернативных вариантов действий или правил, которые в совокупности исчерпывающим образом определили бы стратегию поведения. Следующий шаг заключается в учете того обстоятельства, что в момент принятия решения относительно выбора значений некоторых (по условию задач — вполне конкретных) переменных не все случайные величины на самом деле оказываются определенными. Поэтому первоначальная формулировка задачи должна быть видоизменена путем наложения дополнительных ограничений, из которых должно вытекать, что в соответствующих правилах упомянутые управляемые переменные не должны различаться по индексу д. Так, например, во всех Q правилах принятия решений значения всех управляемых переменных первого шага должны совпадать. На заключительном шаге шлифуется форма представления модели» полученной на втором шаге. Приведем более подробное описание данного метода. Шаг 1. Рассматривается формулировка задачи, которая была бы правильной, если бы имелась возможность получать информацию относительно значений всех фигурирующих в модели случайных величин до того, как выбираются значения управляемых переменных Xj, а именно рассматривается следующая задача: Q
п
Максимизировать 2 Рд S cqixni при ограничениях
g=l
i=l
(4)
п
^aqijxqj = bqi, i = l, 2, . . . , иг; д = 1, 2, . . . , < ? , j=i xqj>0, i = 1, 2, . . ., m; q = 1, 2, . . ., Q,
(5) (6)
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
63
где Xqj (] = 1, 2, . . ., п) — значения жу, соответствующие исходу c
( qji
0-qiji
bqi).
Шаг 2. Учитывается фактический порядок поступления информации; при этом всякий раз, когда в момент принятия решения фактические исходы для случайных величин неизвестны, соответствующие Xqj не различаются по индексу q. Так, например, если значение х^ подлежит определению до того, как станут известными значения фигурирующих в задаче случайных величин, то к ограничениям (5) и (6) добавляется условие ж 4 1 = ж 2 1 = . . . = х^. Шаг 3. С учетом ограничений, принятых на втором шаге, производится упрощение тех или иных соотношений модели. Например, в случае, если имеет место дополнительное условие, приведенноевыше (см. шаг 2), то xql (q = 2, 3, . . ., Q) всюду заменяются на Хц~ затем приводятся подобные члены и исключаются избыточные уравнения. Важно четко уяснить, что оптимальные значения xqj для модели (4) — (6) — это такие значения xqj, которые определяют управляющие решения, принимаемые в условиях, когда случайные исходы (cqj, aqij, bqt) оказываются уже реализованными. Следовательно, излагаемый нами метод анализа должен в результате привести к формулировке исчерпывающего предписания относительно вариантов действий для каждого возможного исхода. Вместо того чтобы пытаться развить данный метод во всех его деталях (связанных, например, с устранением различного рода неоднозначностей), мы обратимся к примеру, который позволит одновременно получить представление о методе в целом. Пример календарного планирования производства. Рассмотрим фирму, составляющую календарный план выпуска продукции, в котором должен быть определен объем производства xt для каждого отрезка t, где t = 1, 2, 3. Обозначим уровень спроса на отрезке t через Dt и предположим, что неудовлетворенная на отрезке t часть Dt полностью пропадает. Пусть it есть уровень запасов в конце периода t; допустим, что в начале отрезка 1 запасы отсутствуют, а запасы в конце отрезка 3 обесцениваются. Обозначим через ct прибыль, получаемую от каждой единицы продукции, выпущенной на отрезке t и коммерчески реализованной до конца планового периода. Положим ct = г — et, где г — рыночная цена единицы продукции, a et — затраты, связанные с производством единицы продукции на отрезке t. Пусть хранение каждой единицы продукции, остающейся заскладированной до конца отрезка t, обходится ht. Тогда в детерминистском варианте задача формулируется следующим образом: Максимизировать 5j c&t — S fait — (^з -<- г) г'3
(7)
64
ГЛАВА 16
при ограничениях ^i — ij
+ Si = DI
(товарный баланс в конце отрезка 1), (8)
+ $2 = DZ
(товарный баланс в конце отрезка 2), (9)
iz + ^s — *з + S3 = D3
(товарный баланс в конце отрезка 3), (10)
h + xz — h
*| >0, it >0, «4 >0, « = 1,2,3, (11) где s( — объем неудовлетворенного спроса на отрезке t. Приведенная выше модель во многих отношениях напоминает модель, рассмотренную в разд. 8.3 (рис. 8.6), однако она обладает двумя характерными особенностями, на которых следует остановиться отдельно. Во-первых, путем введения переменных st учитывается неудовлетворенный спрос. [Читатель без труда сможет модифицировать соотношения (8) и (9) в случае, если неудовлетворенный спрос не аннулируется (т. е. поступившие заказы не теряются), а прибавляется к спросу в последующие периоды.] Во-вторых, задача заключается в «максимизации прибыли». Поскольку ct (коэффициент при переменной, обозначающей объем производства) линейно зависит от рыночной цены г, коэффициентом при i3 также является г, причем ri 3 есть величина, определяющая нереализованную часть дохода, которая соответствует части продукции, оставшейся на складе на конец отрезка 3. При известных значениях Dt решение для модели (8) — (11) является тривиальным: предположив, что ct > О (t = 1, 2, 3), спрос в период t следует удовлетворить за счет продукции, выпускаемой на отрезке k (k ^ t), так, чтобы разность c h — h-ъ. была максимальной. Для того чтобы прийти к такого рода тривиальному заключению, вряд ли требуется обращаться к помощи модели. Но предположим теперь, что задача содержит элементы неопределенности. В частности, допустим, что Dt есть случайная величина. Каковы в этом случае оптимальные значения z ( ? Чтобы ответить на этот вопрос, необходимо располагать дополнительными данными о вероятностном законе, определяющем поведение Dt, a также знать, в какой последовательности устанавливаются индивидуальные уровни xt и каков порядок поступления информации относительно спроса. Допустим, что значения Dt не зависят от выбора значений xt. Кроме того, предположим, что -Dt может принимать только два различных значения. При фиксированном значении DI число возможных значений Dz примем равным 2; другими словами, существует четыре возможных значения Z)2- Аналогично допустим, что для каждого возможного значения Di и D3 существует два возможных значения Пз, т. е. суммарное число возможных значений D3 равняется 8. Короче говоря, уровни спроса Dt являются зависимыми случайными величинами, причем существует Q = 8 возможных состояний
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
01
02
0з
Pq
013
Pi
023
Pz
033
Рз
043
Рь
053
Р5
063
Рв
073
P^
083
Ps
65
п П Л Г) ii — U2i — ^31 — ^41
u
D
n 52 — ^62
Р и с. 16.11. Возможные значения Dt (t = 1, 2, 3).
( D i , Dz, Ds), которые мы обозначим через (Dqi, D
3
2
Максимизировать 2 Pq I 3 ct%qt— при ограничениях
+ Л/i —
x
qi — 1< I,qi
qt
0,
91'
~т~ "^q% _|_ г "Р ^q3
L
^3]
4=1
,• ^Q3
I
\
о — П °q3 -^03'
>0, g = 1, 2, . . . . 8.
(12) (13) (14) (15) (16)
66
ГЛАВА 16
Данная модель содержит 72 переменные при 24 ограничениях, каждое из которых имеет форму равенства. (Совершенно очевидно, что для получения численного решения этой задачи систему уравнений (12) — (16) можно разложить на 8 (Q = 8) автономных линейных «программ». Получаемые в результате программы имеют тривиальные решения, поскольку они обладают структурой, совпадающей со структурой детерминистической модели (7) — (И). Оптимальное значение целевой функx Дии (12) определяется как «сред'<ji. «42 qz> невзвешенное» на множестве решений автономных систем уравнений 2 = '22 при условии, если соответствующие = «22 вероятности pq заданы.) '11 = *2l = '31 '-=41 Случай, когда вначале уточня332 = Я42 ется спрос, а затем принимается «11 = «21 = «31 = «41 '32 — *42 решение. Предположим, что к мо«32= «42 менту принятия решения относительно объема производства на отрезке t известно точное значение Dt, а также предыдущие уровни спроса. Тогда, в соответствии с '51 = 'в! = '71 = '81 рассмотренным выше шагом 2, 51 = 61 =«71 = 81 необходимо ввести дополнительные ограничения, указанные в таблице на рис. 16.12. Так, например, если DI = DU = . . . = Z) 4 i, то объемы Р и с . 16.12. Дополнительные ограничения в случае, когда вначале производства на отрезке 1, запасы уточняется спрос, а затем прини- на конец этого отрезка и объемы мается решение. нереализованной продукции будут одинаковыми для q = 1, 2, 3, 4. Аналогично, если D%=D32= . . . = Diz, то объемы производства, запасы и объемы неудовлетворенного спроса для g = 3, 4 совпадают. Для реализации шага 3 оказывается удобным все тождественные величины обозначать одним и тем же символом; например, вместо £ 2 i, #3i и ж41 следует всюду подставить ги (аналогичная подстановка осуществляется для iql, sql и Dqi). При этом сразу же обнаруживается, что ограничения (13) для q = 1, 2, 3, 4 полностью идентичны, и, следовательно, достаточно рассмотреть лишь одно из них. Таким образом, в упрощенном виде задача содержит переменные S
S
S
Xqt, iqt, Sqt
при
«7=1, 5, q=l, 3, 5, 7, q=l, 2, . . ., 8
если f = если t =
(17)
если t =
и включает ограничения (13) для q = 1. 5, ограничения (14) для q = 1, 3, 5, 7, ограничения (15) для q = 1, 2, . . ., 8 и ограничения (16). В общей сложности в редуцированной задаче фигурируют 42 пере-
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
67
менные и 14 уравнений, задающих ограничения. Читатель может самостоятельно записать упрощенное выражение для целевой функции и, в частности, показать, что коэффициенты при х^ и хм имеют соответственно вид (PI + . . . + р4) ci и (р5+• • • + Ps) с\Уточнение спроса после принятия решения. Предположим, что к моменту принятия решения относительно объема производства xql
(iqi,
«,i, *92)
('72, «g2> xqa)
«12 = «22 '11= • • • ='41 5^ — . . . — S^ '32 = '42 «32 — «42
'52 = '62 «52 = «62
'51 =• • • = '81 «51 — . . . — «д!
*2 = *Ю
Р и с . 16.13. Дополнительные ограничения в случае, когда вначале принимается решение, а затем уточняется спрос.
на отрезке t известны лишь предыдущие уровни спроса. Дополнительные ограничения в этом случае (в соответствии с шагом 2) представлены таблицей на рис. 16.13. Заметим, что при этом переменные x qi (ч = 1' 2, . . ., 8) не различаются по индексу д, поскольку уровень производства на отрезке 1 устанавливается до получения каких-либо точных сведений относительно спроса. Отметим также, что ограничения на iqi, sgi и xqz накладываются при одних и тех же значениях д, так как уровни этих переменных выбираются на основе одной и той же информации, а именно с учетом точно известного значения DI. После упрощений, предусмотренных шагом 3, задача содержит переменные 11^
Oil
"01'
02
iqv s g2 , xqz f'gsi Sq3
Д«*
:/ 2
'
'
для для
q = 1, 3, 5, 7, q = 1, 2, . . ., 8
(18)
и включает в себя ограничения (13) при q = 1, 5, ограничения (14) при < 7 = 1 , 3 , 5, 7, ограничения (15) при q = 1, 2, . . ., 8 и ограни-
68
ГЛАВА 16
чения (16). В общей сложности в редуцированном варианте модели фигурируют 35 переменных при 14 ограничениях, записанных в виде равенств. Читатель может самостоятельно записать соответствующее выражение для целевой функции и убедиться, что коэффициентом при z14 является с 4 . Случай принятия решения при полном отсутствии данных о спросе. Предположим, наконец, что объемы производства для всего планового периода должны быть определены до того, как станут известными значения Dt (хотя бы для одного значения t — 1, 2, 3). Легко показать, что после надлежащих упрощений в соответствующей модели будут фигурировать переменные ж и , ж 12 , ж 13 ;
i
iqi, sqi
Для g = l , 3 , 5, 7;
для q = 1, 5;
i 93 , s g3 Для q = 1, 2, . . ., 8
\ ^ *•*)
и те же самые ограничения, что и в случае, когда вначале принимается решение, а затем уточняется спрос. В каждом последующем из четырех рассмотренных случаев объем информации, имеющейся в наличии до момента принятия решения, уменьшается по сравнению с предыдущим вариантом. Поэтому соответствующая последовательность оптимальных значений целевой функции, как правило, является убывающей (и никогда не может быть возрастающей). (Математический довод в пользу этого утверждения сводится к следующему: в каждой последующей модели появляются дополнительные ограничения (уравнения), и, следовательно, область возможных значений управляемых переменных сужается.) В случае, когда имеется полная информация, достигается максимум того, чего можно добиться при наличии безошибочных предсказаний случайных исходов. В других рассмотренных нами случаях разность между оптимальным значением целевой функции при неполной осведомленности и оптимальным значением при наличии полной информации представляет собой меру экономического ущерба за счет неопределенности. О других методах. При анализе некоторых задач, аналогичных только что рассмотренной задаче календарного планирования, можно воспользоваться другими методами построения многошаговой модели. Один из таких методов (который мы уже применяли в разделах 16.5 и 16.6) заключается в использовании вероятностных ограничений. В случае когда имеется конечное число Q возможных состояний (т. е. наборов значений, принимаемых случайными величинами), метод вероятностных ограничений позволяет избежать многократного увеличения размерности соответствующей задачи линейного программирования, которое наблюдается при только что изложенном подходе к постановке такой задачи. Если же иметь в виду трудности, связанные с необходимостью различать управляемые переменные и данные о случайных исходах, то они «внутренне присущи» стохастическим моделям, и не существует такого, во всех
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
69
отношениях последовательного метода, который мог бы эти трудности обойти. Когда случайные переменные, относящиеся к одному временному отрезку, совершенно не зависят от случайных переменных, отвечающих другим периодам, задача нередко может решаться методом динамического программирования. Справедливость данного утверждения будет подтверждена нами в следующей главе. 16.8. К В А Д Р А Т И Ч Н А Я КРИТЕРИАЛЬНАЯ ФУНКЦИЯ (ЛИНЕЙНЫЙ ВИД ОПТИМАЛЬНОГО РЕШЕНИЯ)
Рассматриваемая в этом разделе многошаговая стохастическая модель описывает ситуацию, когда оптимальные решения можно построить только на основе данных относительно ожидаемых значений случайных величин. Варианты временной последовательности принятий решений и порядок поступления информации относительно значений, принимаемых случайными величинами, могут при этом выглядеть так же сложно, как и в задаче, рассмотренной в предыдущем разделе. Предположим, однако, что ограничения имеют вид
xi+
п
S dijXj = bi, i = l, 2, .. ., т,
j=m+l
(1)
где переменные Xj (/ = 1, 2, . . ., п) не ограничены по знаку, все коэффициенты atj заданы, a bt представляют собой случайные величины, для которых известны соответствующие математические ожидания. Как будет показано ниже, возможны случаи, когда в результате решения оптимизационной задачи приходят к стратегии, для которой Xj ^ 0 (/ = 1, 2, . . ., п); существуют также ситуации, когда Xj представляют собой отклонения от заданных (целевых) значений, так что имеют смысл и отрицательные значения xs. Предположим далее, что решается задача минимизации и целевая функция может быть записана в виде математического ожидания квадратичной формы П
П
71
S X Cj XjX + 2 Cj*j, (2) j=i h=i h h j=i причем выражение (2) является положительно определенным и отличным от нуля при любых значениях Xj (j = 1, 2, . . ., п), кроме случая, когда все Xj = 0. Допустим, что cih (/ = 1, 2, . . . . п; k = 1, 2, . . ., ft) являются известными, а величины С] (/ = 1 , 2 , . . . . . ., п) могут быть случайными. Как и в предыдущих случаях, будем считать, что на первом шаге решение заключается в выборе значений тех переменных, которые подлежат определению до того, как становится точно известным значение хотя бы одной случайной величины. Можно доказать, что оптимальные значения переменных первого шага определяются так же, как и в случае детерминистической модели, а именно в соответствии со следующей схемой:
70
ГЛАВА 16
1. Заменим в (1) и (2) Cj и £>; математическими ожиданиями этих величин, вычисленными с помощью соответствующих безусловных распределений вероятностей. 2. Подставим xl (i = 1, 2, . . ., т), найденные с помощью (1), в выражение (2). 3. Соберем члены с одинаковыми переменными Xj (j = те + 1, . . . . . .. re). 4. Приравняем нулю частные производные квадратичной формы по Xj для / = т + 1, . . ., тг. 5. Разрешим уравнения, полученные в результате выполнения п. 4, относительно Xj, где / = т + 1, . . ., п. 6. Определим с помощью (1) xi для i = 1, 2, . . ., т. В результате выполнения этих операций мы обнаруживаем одну важную особенность рассматриваемой модели, состоящую в том, что оптимальные значения переменных первого шага линейно зависят от Е [cj] и Е [ b i \ . Поэтому эту модель иногда называют моделью линейных решений. После того как значения переменных первого шага установлены в соответствии с изложенной выше схемой, наступает период выжидания, которое продолжается до того момента, когда станут известными фактические значения других случайных величин; затем данная процедура повторяется. При этом происходит «переименование» переменных второго шага, которые теперь логично называть переменными «первого шага», и т. д. Кроме того, может возникнуть необходимость в уточнениях (или в вычислении заново) математических ожиданий с,- и bit если полученная дополнительная информация указывает на такого рода необходимость. Проиллюстрируем данный метод на следующем гипотетическом примере. Задача регулирования численности обслуживающего персонала. Директору ресторана «Сальная ложка» необходимо определить число официанток, требуемое для обслуживания посетителей в часы пик каждый i-й день в течение периода продолжительностью Т дней (т. е. £ = 1 , 2 , . . ., Т). Ежедневное изменение числа официанток обходится ресторану дорого по целому ряду причин (в частности, здесь действует психологический фактор и то обстоятельство, что опытные официантки являются весьма дефицитными). Не выгодно также иметь слишком много или слишком мало официанток, поскольку в первом случае возрастают затраты, связанные с выплатой официанткам заработной платы, а во втором случае возникают потери за счет ухода части посетителей, не желающих дожидаться обслуживания слишком долго. Вместе с тем точно определить число требуемых официанток невозможно, так как ежедневно флуктуирует как число посетителей, так и объем трудозатрат на их обслуживание. Обозначим через Dt объем трудозатрат (в человеко-часах) на обслуживание будущих посетителей столовой в часы пик t-то дня. Пусть yt означает объем трудозатрат (в человеко-часах) на обслуживание в t-ж день, на который ориентируется директор ресторана
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
71
при составлении календарного плана. Обозначим через ft разницу между трудозатратами в t-й день и трудозатратами в (t — 1)-й день (т. е. флуктуацию объема трудозатрат), а через et — ошибку, допущенную при планировании трудозатрат для £-го дня; упомянутые выше величины удовлетворяют соотношениям ft = 2/t-i — yt,
t = 1,2, . . ., Т
(флуктуация трудозатрат),
(3)
£t — Vt — DI,
t = 1,2, . . ., Т
(ошибка, допущенная при планировании), (4)
где уо — объем трудозатрат накануне 1-го дня. В рассматриваемом примере переменные ft и et играют ту же роль, что и переменные xt (i = 1, 2, . . ., т), а переменные yt — ту же, что и переменные Xj (j = т + 1, . . ., п), фигурирующие в (1). Пусть задача заключается в том, чтобы минимизировать ожидаемое значение квадратичной формы
S (/? + <**)
t=i
(5)
при ограничениях (3) и (4), где с ^ 0 — заданное число. Заметим, что если с = 0, то оптимальным является решение yt = y0 для всех значений t. Если с является произвольно большим, то оптимальное решение имеет вид yt = Е [ D t ] . На первом шаге определению подлежит значение у^. Выполняя пп. 1 и 2 указанной выше последовательности, заменим в (4) Dt на Е [Dt] и подставим в выражение (5) ft и et, определяемые соотношениями (3) и (4). В результате будем иметь т C = ^{(yt-i-y
t = 1, 2, . . ., Т - 1, (8)
(9)
При заданных значениях с, Е [Dt] и г/0 система уравнений (7) — (9) решается однозначно. Получаемое в результате значение yt является оптимальным для первого шага принятия управляющих решений и линейно зависит от Е [ D t ] . Допустим, что плановый период практически не ограничен, причем значение переменной у\ выбирается таким, чтобы оно было оптимальным при сколь угодно большой протяженности Т. Тогда можно показать, что, разрешив систему (7) — (9) относительно i/i
72
ГЛАВА 16
при Т —>• оо , получим оо
= а(Уо + ^[А]) + Ца'^[А] (неограниченный период ^2 планирования), (10) где предполагается, что сумма, стоящая в правой части, имеет конечное значение. В выражении (10) У1
(И)
и, следовательно, 0 < а ^ 1 при О =SC с < оо, a z/4 ^ 0. Еще раз обратим внимание на то, что z/4 есть линейная функция Е [ D t ] , что непосредственно видно из (10). После получения сведений о фактическом значении Dt директор ресторана может пересмотреть свои прогнозы относительно последующих значений Dt, так что на следующий день вычисления по формуле (10), возможно, придется выполнить заново, заменив Е LDj] на математическое ожидание потребностей в трудозатратах для второго дня (найденное с учетом полной информации о D^ и т. д.). Однако в том случае, когда Е [Dt] = D* для всех t независимо от того, какими были фактические значения Dt в предыдущие дни (т. е. если распределение вероятностей ожидаемых трудозатрат окажется стационарным), то значения yt для всех последующих дней определяются формулой acD* _a —
yt = ayt-i i t--,
=a
, acD* I I — a1'1 \
J/0 + -T3;— ( —iT2 — I
1
,
-
(стационарные потребности в обслуживании)
,,„,
(12)
для О ^С с •< °°, и г/г ->-£>* при t -> оо. КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ
1. Объясните содержание каждой из перечисленных ниже задач организационного управления и сформулируйте вашу точку зрения относительно причин появления в них неопределенности и ее роли в процессе принятия решений. Попытайтесь также выяснить, можно ли раскрыть характер неопределенности и уточнить порождаемые ею следствия с помощью анализа чувствительности детерминистских аналогов соответствующих стохастических моделей. Рассмотрите следующие задачи организационного управления: а) выбор мест строительства новых товарных складов, обслуживающих розничную торговую сеть; б) прекращение производства определенного вида продукции; в) начало выпуска нового вида продукции; г) определение числа лифтов для проектируемого административного помещения фирмы; д) определение маршрутов доставки корреспонденции для почтальонов;
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
73
е) определение числа резервных операционных, которое необходимо иметь в клинике; ж) определение периодичности пополнения запасов бензина на бензозаправочных станциях; з) оптимизация банковского баланса фирмы; и) определение числа бригад, занимающихся ремонтом телефонных аппаратов; к) выбор емкости водохранилища при строительстве плотины; л) определение количества пассажирских мест в сверхзвуковом лайнере. 2. В каждом из приведенных ниже случаев требуется вычислить математическое ожидание случайной величины D, математическое ожидание D 2 , математическое
ожидание
/ (D) = (— 1)д
и Е [/ (D \ у)] по формуле (8), приведенной в разд. 16.2, положив с = 1, h = 2, р = 5 и у = О, 1, . . ., 6:
а) P[D = d]=4-
для d = 0, 1, . . . , 6;
б) P[D = d]=~
для d = l, 2, . . . , 6 ;
в) P(D = d] = ±-
для d = 0, 1, . . - , 5;
г) P[D = d}=
для d = 0, 2, 4, 6;
ц) P[D = d} = ~-
д л я й = 1 , 3, 5;
е) ^[£> = d] = d- 1 .0,5 d - 1 .0,5 3 -* fl для d = l, 2, 3, 4. ж)Р[£> = й] = СГ2.0,5'г-2.0,53-<г+2 для d = 2, 3, 4, 5; з) P[D = 2/] = CJ.O,5 8 -; 3
и) ^[0 = 2/] = ^ . к) P[£ = 2/] = C
3 3
для d = 0, I, 2, 3;
.
для d = 0, 1, 2, 3;
. . -
для d = 0, 1, 2, 3.
3. Для каждого указанного ниже вида / (D \ у) требуется вывести формулу, аналогичную формуле (8) из разд. 16.2: а)
I су ~г~ it (у — cL) , cyz -4- р (d—г/)2,
f(D\y) =
если если d^>y;
с(у)-{-Н — v (у — d),
если d^.y,
с(у)-}-Р,
если d>y,
где
с (у) —
О
при у = О, при г/>0;
74
ГЛАВА 16
в) / (D \ у) = с (у) -| h (у — d)-+-p(y, d), О при у = 0, ? + су при г/>0, А! (г/ — d), если 0<г/ — d^I, h(y — d)={ H^-h2(y — d), если y — d>l, О во всех остальных
случаях;
если р, 0
если d-y>S, во всех остальных случаях.
4. Задача фирмы «Бонбон» (разд. 16.2). а) Предположим, что годовая прибыль за счет увеличения производственных мощностей действующего предприятия в случае, когда фирма контролирует 30% рынка сбыта, равняется (90 + е), где е >• 0. Каково наибольшее значение е, при котором решение строить новый завод все еще является оптимальным? Аналогичным образом проанализируйте модель на чувствительность в тех случаях, когда фирма будет контролировать 35 и 40% рынка сбыта. б) Предположим, что годовая прибыль за счет строительства нового завода в случае, когда фирма контролирует 30% рынка сбыта, равняется (50 — е), где е > 0. Каково наибольшее значение е, при котором решение строить новый завод все еще является оптимальным? Аналогичным образом проанализируйте модель на чувствительность в тех случаях, когда фирма будет контролировать 35 и 40% рынка сбыта. в) Обозначьте через pi и pz вероятности того, что фирма «Бонбон» будет контролировать соответственно 30 и 35% рынка сбыта, причем Pi ~г Pz ~ 5 /s- Каково наибольшее значение р^, при котором решение строить новый завод все еще остается оптимальным? г) Обозначьте через pi, pz и р3 соответственно вероятности того, что фирма «Бонбон» будет контролировать 30, 35 и 40% рынка сбыта. Учтите, что £>з = 1 — Pi — Pz- Постройте график, позволяющий определить все значения PJ и р2, для которых решение строить новый завод является оптимальным. (Указание: Запишите неравенство между ожидаемыми прибылями, которые соответствуют первому и второму вариантам решений и отражают то условие, что оптимальным является решение строить новый завод; после этого производите необходимые упрощения. Постройте (в пространстве решений) график для Pi и pz.) д) Пусть предположения относительно вероятностей исходов являются вполне реалистичными, однако допустим, что за некоторую плату К (тыс. долл.) президент может получить точную информацию о том, какую долю рынка сбыта будет фактически контролировать его фирма. Другими словами, президент фирмы «Бонбон»
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
75
может за соответствующую плату получить точный прогноз до момента принятия решения. Каково наибольшее значение К, при котором все еще стоит воспользоваться возможностью получения такого прогноза? 5. Сформулированные ниже упражнения связаны с календарным планированием производства. Выполняя эти упражнения, читатель должен иметь в виду соотношения (10) и (11), приведенные в разд. 16.2. а) Пусть на начало текущего отрезка объем продукции, хранящейся на складе, равнялся 2 единицам. Объясните, почему на последующем отрезке объем выпускаемой продукции будет нулевым с вероятностью V 2 , а на следующем по порядку отрезке — нулевым с вероятностью V 4 . Чему равняется вероятность нулевого уровня производства на третьем по отношению к текущему отрезке? б) Предположите, что вместо (11) мы имеем Dt = 2 с вероятностью */4 и Dt = 3 с вероятностью 3 / 4 . Определите, чему в этом случае будут равняться вероятности нулевого уровня производства на каждом из трех следующих за текущим отрезков. в) Пусть вместо (11) стратегия имеет следующий вид: ( 5 — i для j = 0, 1, 2, х °° (^ 0 = \[ 0 л для -i =о3, 3 причем Dt = 2 с вероятностью / 4 , a Dt — 3 с вероятностью V 4 . Найдите вероятности нулевого уровня производства для каждого из трех (следующих за текущим) отрезков, если объем продукции, хранящейся на складе на начало текущего отрезка, равняется 2 единицам. г) Предположите, что всякий раз, когда уровень производства отличен от нуля, имеют место накладные расходы К = 4 и что стоимость производства единицы продукции равняется с = 1. Кроме того, считайте, что за каждую единицу продукции, отправляемую на хранение на склад в конце того или иного отрезка, взимается плата в размере h = 2. Найдите ожидаемые расходы для одного отрезка при неограниченном плановом периоде, воспользовавшись данными, приведенными в соотношениях (12) и (13) из разд. 16.2. д) Пусть вместо (10) стратегия имеет вид Zoo
(-2)
=
Z o o (-1)
=
Z o o (0) = 3,
Zoo (1) = О,
т. е. в некоторых случаях спрос превышает объем наличных складских запасов; считайте, что неудовлетворенный спрос не аннулируется, а присовокупляется к спросу на последующих отрезках. Таким образом, если запасы составляют 1 единицу, продукция не производится; неудовлетворенный спрос при Dt = 2 составляет 1 единицу, а при Dt = 3 равняется 2 единицам (это отражено отрицательными уровнями запасов —1 и —2 соответственно). Требуется определить, какие значения примут в этом случае стационарные вероятности (вместо значений, заданных соотношениями (12) и (13) из разд. 16.2), и пояснить полученные результаты.
76
ГЛАВА 16
6. Рассмотрим задачу пекарни «Пышка» (разд. 16.2). а) Каким будет оптимальное решение, если управляющий захочет, чтобы вероятность полного удовлетворения суточного спроса была не менее V^? не менее x / 2 ? б) Каким будет оптимальное решение, если управляющий захочет, чтобы ежедневно продавалось в среднем не менее */з торта? не менее 1 торта? 7. Рассмотрим последовательность .(-ffj, R2, R3) и предположим, что RI при любом значении t равняется либо 0, либо 1. Пусть вероятность исхода (1, 0, 0) равна нулю, исхода (0, 1,0) — V 4 , исхода (О, 1,1) — 3/16, исхода (1, 1, 0) — 1 / 16 , а любого другого исхода—V 8 . Предположим, что а = 1 / 2 . а) Для данного совместного распределения вероятностей найдите математическое ожидание суммарной прибыли [т. е. вычислите значение RI -f- а/?2 + а2-й з Для каждого возможного исхода (Rt, R%, R3), умножьте каждое из полученных значений на вероятность соответствующего исхода и просуммируйте по всем возможным исходам]. б) Вычислите Е [Rf] для t = 1, 2, 3 и сравните полученный результат с оценкой Е [ R t ] из разд. 16.2. 8. Рассмотрите примеры, приведенные в упражнении 1, и в каждом случае предложите метод построения распределения вероятностей; укажите, к какому (или к каким) из методов, перечисленных в разд. 16.2, относится каждый из предложенных вами способов построения распределения вероятностей. 9. Задача фирмы «Швец и Жнец» (разд. 16.3). Рассмотрите данные, приведенные на рис. 16.2 и в таблице на рис. 16.3. а) Проверьте, правильно ли вычислены вероятности, указанные в(1). б) Проверьте, что если каждая случайная величина принимает свое среднее значение, то продолжительность времени с момента начала работ до пуска нового предприятия равняется 5 отрезкам времени. Покажите, чему равняется средняя продолжительность выполнения всего комплекса работ, исходя из условий задачи, приведенных в разд. 16.3. в) Целесообразен ли наем специального помощника по строительству нового завода, если его участие приводит к сокращению продолжительности выполнения планируемого комплекса работ на 3 1 отрезок лишь с вероятностью / 4 ? Подкрепите ваш ответ соответствующими количественными оценками. г) Предположите, что услуги специального помощника с вероятностью 1 / 2 приводят к сокращению продолжительности выполнения комплекса запланированных работ на 2 отрезка и с такой же вероятностью могут не привести ни к какому сокращению вообще. Пусть дополнительная прибыль фирмы за счет сокращения сроков строительства на 2 отрезка равняется 130. Целесообразен ли наем упомянутого выше специального помощника?
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
77
д) Считайте, что президент фирмы решает обойтись без услуг специального помощника, но намеревается за сумму F получить гарантию того, что выполнение работы В займет в точности 3 отрезка. Каково наибольшее значение F, при котором использование такой возможности остается целесообразным? е) Выполните упражнение д), предположив, что за сумму F можно будет гарантировать то, что работа С будет выполнена в течение 3 отрезков времени. ж) Выполните упражнение д), предположив, что за сумму F можно будет гарантировать, что работа Е будет выполнена за 2 отрезка. з) Выполните упражнение д), предположив, что за сумму F можно будет гарантировать выполнение работ В и С за 3 отрезка. и) Каковы наибольшие значения F в пп. д) — з), если президент принимает решение воспользоваться услугами специального помощника по строительству нового завода? к) Предположите, что строительство заводских корпусов может продлиться с одинаковой вероятностью либо 1, либо 2 отрезка времени и аналогично разработка проекта новой модели комбайна может продлиться 3 или 4 отрезка, комплектование штатов — 3 или 4 отрезка, а окончательная отладка модели — 2 или 3 отрезка. Пусть на монтажные работы по-прежнему требуется 1 'отрезок времени. Проведите анализ с целью определения степени целесообразности найма специального помощника президента по строительству. При известном оптимальном решении вычислите выигрыш за счет получения точного прогноза для сроков выполнения планируемых работ. 10. Предложите метод доказательства теоремы об эквивалентности форм, формулировка которой приведена в разд. 16.4. (Проиллюстрируйте предложенное вами доказательство на примере максимизации функции CjXj + czxz при ограничении 2ж 4 + 3_r2 ^ 6, предположив, кроме того, что с одинаковой вероятностью и независимым образом каждый из коэффициентов c t и с2 может принимать значения 0 или 1.) 11. Задача фирмы «Супердранка» (разд. 16.4). а) Объясните, почему структура модели (6) — (10) настолько проста, что ее численное решение при заданных а^ Cj и Dt является тривиальным. (Проиллюстрируйте тривиальность решения системы уравнений (6) — (Ю), положив c t = 10, с 2 = 15, с3 = 3, Т = 10, а, = 3, а 2 = 5, Dl = 10, D2 = 50.) б) Покажите, как изменится система соотношений (13) — (21), если Q = 4. Приведите формулу, показывающую зависимость числа уравнений модели и числа фигурирующих в ней переменных от Q. в) Покажите, как изменится система соотношений (13) — (21), если на х3 наложить ограничение х3 ^ К, где К — заданное число. Как изменится результат, если предположить, что К — случайная величина? Примите также допущение, что если х3 превысит К, то штраф составит / 3 (К — х3).
78
ГЛАВА 16
г) Покажите, как упростится система соотношений (13) — (21), если величины а^, az и D2 являются детерминированными (кроме того, предположите, что избыток продукта 2 недопустим). д) Объясните, как видоизменится структура (12) — (21), если величины г,- и uj будут взаимно коррелированными. (Дополнительно предположите, что Q — число возможных комбинаций значений для фигурирующих в модели случайных величин — равно 3.) е) Покажите, как изменится структура (12) — (21), если стоимость производства единицы продукции в] (/ = 1, 2) является случайной величиной. Предположите, что значения е}- могут стать известными лишь после принятия решения на первом шаге. (Дополнительно предположите, что Q — число возможных комбинаций значений для фигурирующих в модели случайных величин — равно 3.) ж) Предположите, что фактические значения / t и / 2 становятся известными лишь после того, как будут выбраны значения управляемых переменных второго шага. Обозначьте через Е [/г | q] ожидаемое значение / г при фиксированном значении д (q = 1, 2, . . ., Q). Покажите, как изменится при этом выражение для целевой функции (13). 12. Задача фирмы «Супердранка» (разд. 16.4). Предположим, что президент фирмы, уплатив сумму F,- может узнать заранее, какая из Q возможных комбинаций значений случайных величин будет фактически иметь место. а) Предложите метод определения наибольшего значения F, при котором все еще имеет смысл покупать такого рода точную прогностическую информацию. б) Предположите, что за сумму F приобретается точная прогностическая информация лишь относительно a t , и допустите, что а^ статистически не зависит от других фигурирующих в задаче случайных величин (т. е. эта информация бесполезна при прогнозировании исходов для других случайных величин). Объясните, как изменится метод, предложенный вами, при выполнении упражнения, сформулированного в п. а). 13. Задача фирмы «Супердранка» (разд. 16.4). В силу специфики данной задачи возможен другой метод построения соответствующей модели, приводящий лишь к одному ограничению (для имеющегося в наличии леса) при нелинейной целевой функции. Из соотношений (15) — (20) следует, что на втором шаге оптимизирующие решения фактически отсутствуют; при заданных aqiXi и Dqi из условия допустимости вытекает, что либо sg,, либо tqi являются положительно определенными. Обозначим через ut (xt \ at, /;, Dt) потерю прибыли, обусловленную выбором xt при фиксированных значениях а г , /j и Dt. а) Требуется вывести формулу для и( (xt\ а{, f i : DI) (i = 1, 2) (Указание: значение целевой функции зависит от того, какое из соотношений имеет место: atXi ^ Z), или a^j >Z) ; .)
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
79
б) Обозначим через Ut (xi) математическое ожидание t (xi Iaii fii Df)- Требуется вывести формулу, позволяющую вычислять Ui (xt) при заданном числе Q возможных состояний. в) Требуется полностью записать нелинейную оптимизационную модель для рассматриваемой задачи. 14. Рассмотрим двухшаговую линейную модель общего вида (разд. 16.4). В каждом из приведенных ниже пунктов требуется п пленить, каким образом учитываются принимаемые нами допущения в структуре модели, представленной соотношениями (22) — (25). а) Пусть значение каждой случайной величины не зависит от выбора значений Xj. б) Пусть значение Xj (/ = 1, 2, . . ., k) подлежит определению на первом шаге до того, как будет точно известно значение хотя бы одной из фигурирующих в модели случайных величин. в) Пусть значения управляемых переменных второго шага выбираются после того, как станут известными значения всех случайных величин. Является ли допущение о том, что всегда существуют допустимые значения переменных второго шага, эквивалентным предположению о существовании допустимого решения системы соотношений (23) — (25)? (Ответ требует обоснования.) г) Допустим, что существует конечное число Q комбинаций частных исходов. Вытекает ли из структуры соответствующей модели, что случайные величины взаимно независимы? (Ответ требует обоснования.) Если нет, то можно ли упростить модель, приняв такое допущение. (Ответ требует обоснования.) д) Объясните, почему в модели (22) — (25) допустимо использовать точно установленные значения с,-, bt и а,ц. Какие упрощения модели будут иметь место, если окажутся известными bt или а,;для i = g + 1, . . . , m? (Рассмотрите частные случаи.) 15. а) Сформулируйте для задачи (13) — (21) из разд. 16.4 соответствующую двойственную задачу. б) Сформулируйте двойственную задачу для рассмотренной в разделе 16.4 задачи (22) — (25). 16. Рассмотрим следующую двухшаговую задачу: u
Максимизировать ба^ + &с2 — 12ж 3 — За;4 при ограничениях " ^з — •^•'4 "=~
>
где Xj ^ 0, величины at, az и D являются случайными, а х3 и xt — переменные, значения которых конкретизируются на втором шаге. Предположим, что возможны лишь следующие комбинации частных 2 исходов: (1, 2, 4) с вероятностью V 3 и (2, 1, 10) с вероятностью / 3 . а) Преобразуйте данную двухшаговую модель в эквивалентную ей обычную модель линейного программирования и найдите оптимальное правило для принятия решения. Дайте экономическое истолкование полученного результата.
80
ГЛАВА 16
б) Предложите альтернативную структуру модели, основанную на максимизации нелинейной целевой функции при наличии лишь следующих записанных в явном виде ограничений: х^ ^ 0, х2 ^ 0. (Указание: воспользуйтесь тем обстоятельством, что если заданы значения х\ и х2, a также известны значения а 4 , а 2 и D, то из условия допустимости вытекает, что либо х3 ^ 0, либо х 4 ^ 0.) Необходимо вывести формулу, позволяющую определить приращение математического ожидания целевой функции в результате выполнения второго шага, когда переменными первого шага являются xi и х2. в) Воспользовавшись соображениями, изложенными в конце разд. 16.4, вычислите Е [При ожидании], Е [При глобальном усреднении], Е [При усреднении на первом шаге], Е [При наиболее жесткой постановке задачи] и «цену» неопределенности. 17. Задача фирмы «Супердранка» (разд. 16.5). Рассмотрите модель с вероятностными ограничениями (1) — (5). Пусть Е [q] = 10, Е [с2] = 15, с 3 = 3, Т = 10,
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
81
в) Найдите оптимальное решение при / 3 = 15 и / 4 = 5; проверьте полученный ответ, воспользовавшись данными, приведенными в таблице на рис. 16.9. 21. Пусть вместо (11) мы имеем Р [D4 = d] — 1/5 для d = = О, 1, 2, 3, 4. Найдите новые значения С 4 (xt) (см. таблицу на рис. 16.7), составьте новую матрицу для расширенной транспортной задачи (рис. 16.8) и вычислите оптимальное решение при/ 3 = 15 и / 4 = 5. 22. а) Проверьте, что решение ха = 2 и а;4 = 3 является оптимальным для соответствующих значений / 3 и /4, фигурирующих в таблице на рис. 16.9. б) Проделайте то же самое для х3 = 3 и ж 4 = 2. 23. а) Проверьте формулы (I) и (II). б) Получите формулы, аналогичные (I) и (II), для случая больших значений / 4 . 24. Рассмотрите вариант модели, построенный методом вероятностных ограничений (разд. 16.6). а) Убедитесь, что суммарные транспортные расходы, указанные в таблице на рис. 16.10 для (х3 = 2, ж 4 = 3), а также для (х3 = 3, а:4 = 2), вычислены правильно. б) Объясните, почему вариант размещения (х3 = 4, ж 4 — 1) в случае, когда применяется метод вероятностных ограничений, не может быть оптимальным. в) Уясните, в чем состоит принципиальное различие между методом вероятностных ограничений и методом, основанным на использовании двухшаговой модели, применительно к транспортной задаче. Не считаете ли вы, что имеются основания исключить варианты размещения (х3 = 2, ж 4 = 3) и (х3 = 4, ж 4 = 1) из рассмотрения? Дайте обоснованный ответ. 25. Рассмотрите пример календарного планирования производства, приведенный в разд. 16.7. а) Объясните, почему модель (12) — (16) описывает ситуацию, когда имеет место «полная информация». Дайте обоснование утверждению о том, что в модели фигурируют 72 переменные при 24 ограничениях (каждое из которых имеет форму равенства). Объясните, почему модель (12) — (16) можно разложить на Q автономных задач линейного программирования. б) Убедитесь, что в случае, когда вначале уточняется спрос, а затем принимается решение, модель после упрощения содержит лишь переменные, указанные в (17); подтвердите, что число управляемых переменных модели равняется 42, а число ограничений, имеющих форму равенств, равняется 14. Запишите в явном виде упрощенное выражение для целевой функции. в) Убедитесь, что в случае, когда вначале принимается решение, а затем уточняется спрос, модель после упрощения содержит только те переменные, которые указаны в (18); подтвердите, что число управляемых переменных модели равняется 42, а число ограничений
82
ГЛАВА 16
(каждое из которых имеет форму равенства) — 14. Запишите в явном виде соответствующее выражение для целевой функции. г) Убедитесь, что в случае, когда решение принимается при полном отсутствии данных о спросе, после упрощения модель содержит лишь те переменные, которые указаны в (19); подтвердите, что число управляемых переменных модели равняется 31, а число ограничений (в виде уравнений) — 14. д) Предположите, что плановый период увеличивается на один отрезок, т. е. t = 1, 2, 3, 4. Допустим, что Z)4 формируется аналогично Dt (t = 1, 2, 3), так что суммарное число возможных состояний Q = 16. Определите число управляемых переменных и число уравнений для каждого из упомянутых выше четырех случаев. 26. Рассмотрите пример календарного планирования производства, приведенный в разд. 16.7. а) Покажите, как видоизменится (или объясните, почему не видоизменится) каждый из упомянутых выше вариантов модели, если предположить, что величины Dt взаимно независимы. (Обязательно проконтролируйте, уменьшится ли число управляемых переменных и число ограничений модели в каждом из четырех упомянутых случаев.) б) Проанализируйте во всех подробностях модель линейного программирования, эквивалентную исходной стохастической при следующих допущениях: на отрезке t к моменту принятия решения относительно уровня производства xt известны как Dt, так и Dt+i. (При этом требуется определить число управляемых переменных и число уравнений модели, а также построить целевую функцию.) 27. Рассмотрим пример календарного планирования производства, приведенный в разд. 16.7. а) Предположим, что в (7) коэффициент удельной прибыли ct представляет собой случайную величину и что значение ct становится известным в то же самое время, когда становится известным Dt. Допустим также, что число возможных состояний (Di, Dz, D3; c C ii 2> c3) равняется Q = 8, а спрос Dt формируется в соответствии с данными таблицы на рис. 16.11. Объясните, как изменится структура модели в каждом из упомянутых выше четырех случаев. б) Предположим, что неудовлетворенный спрос отрезка 1 присовокупляется к спросу на отрезке 2, а неудовлетворенный спрос отрезка 2 присовокупляется к спросу на отрезке 3. Пусть удельный штраф (т. е. потери в расчете на единицу продукции) в случае, когда в конце отрезка t часть спроса оказывается неудовлетворенной, равняется dt. Любая часть спроса, оставшаяся неудовлетворенной на конец отрезка 3, аннулируется. Все прочие условия задачи сохраняются. Объясните, какие изменения претерпит структура модели в каждом из упомянутых четырех случаев. (Обязательным является определение числа управляемых переменных и числа уравнений модели, а также построение соответствующей целевой функции.)
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
83
28. Рассмотрим задачу регулирования численности обслуживающего персонала из разд. 16.8. а) Докажите, что принятие условия dCldyt = 0, t = 1, 2, . . ., Т, для (6) приводит к уравнениям (7) — (9). б) Докажите, что при 0 ^ с ^ ею имеет место 0 ^ а ^ 1, где а определяется уравнением (11). в) Докажите, что в (12) yt —>~D* при устремлении t к бесконечности. 29. Рассмотрим задачу регулирования численности обслуживающего персонала (разд. 16.8). Пусть у0 = 0, а с — 1/2. Определите оптимальное значение г/ 4 , предположив, что а) Т = 4, Е [Dt] = 16 при любом значении t. б) Т = 4, Е [Dt] = ^t при t = 1, 2, 3, 4. в) Т = 4, Е [Dt] = 20 - 4г при * = 1, 2, 3, 4. г) Г = 4, £ [Я,] = £ [D3] = 4, а £ [£2] = £ Ш 4 ] = 16. д) Т = 4, Е [Dt] = £ [D3] = 16, а Е [D2] = Е Ш J = 4. е) Плановый период не ограничен, а Е [Dt] = £>* = 16 при любом значении t. Определите также yt для t = 2, 3, 4. 30. Выполните упражнение 29, предположив, что а) с = 1/2. б) с = 9/4. 31. Объясните, как вы понимаете следующие термины: математическое ожидание (ожидаемое значение, среднее значение); рандомизированная стратегия; двухшаговая линейная модель; теорема об эквивалентности форм; модель упреждения; модель выжидания; модель глобального усреднения; модель усреднения на первом шаге; модель с вероятностными ограничениями; эквивалентное детерминированное ограничение; многошаговая линейная модель; квадратичная целевая функция. У П Р А Ж Н Е Н И Я НА ПОСТРОЕНИЕ МОДЕЛЕЙ И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ
32. Задача фирмы «Швец и Жнец» (разд. 16.3). Пусть на рис. 16.2 дуга между узлами 1 и 2 имеет противоположное направление. Проведите анализ сформулированной в разд. 16.3 задачи поиска оптимального решения, предположив, что дополнительная прибыль равняется нулю, если продолжительность выполнения планируемого комплекса работ превышает 6 отрезков. (Обязательно укажите оптимальное решение и вычислите по формуле, приведенной в конце разд. 16.3, выигрыш за счет обладания точным прогнозом.)
84
ГЛАВА 16
33. Календарное планирование методом критического пути. Рассмотрите пример, приведенный в разд. 6.6 [модель (1) — (6)]. Считайте, что продолжительности выполнения некоторых операций являются неопределенными (рис. 16.3). Пусть требуется определить сроки начала операций yCD, yE и ур так, чтобы каждое из неравенств (2) — (6) выполнялось по крайней мере с вероятностью 1/2 (например, требуется, чтобы Р [yF ^ tc + yCD] ^ 0,5). Сроки начала операций должны быть определены до того, как станут точно известными продолжительности выполнения операций, являющихся случайными. Раскройте содержание вероятностных ограничений. а) Постройте детерминированную модель линейного программирования, эквивалентную только что описанной стохастической модели. б) Найдите для данной модели (как в исходной, так и в двойственной формулировке) оптимальное решение. Покажите, как изменяется решение, если потребовать, чтобы каждое из условий (2) — (6) удовлетворялось с вероятностью 0,25; с вероятностью 0,75. 34. Задача «двух картошек» (разд. 1.6). Как правило, количество продукции, получаемое из единицы веса (например, из 1 т) сельскохозяйственного сырья, подвержено случайным колебаниям. Предположите, что из 1 т картофеля поставщика 1 можно с одинаковой вероятностью получить продукты 1, 2 и 3 в следующих количествах (также выраженных в тоннах): либо (0,2; 0,2; 0,3). т. е. в количестве, указанном в таблице на рис. 1.1, либо (0,25; 0,25; 0,35), либо (0,18; 0,15; 0,29). Предположите также, что соответствующие показатели для картофеля поставщика 2 оказываются следующими: либо (0,3; 0,1; 0,3), т. е. в количестве, указанном в таблице на рис. 1.1, либо (0,35; 0,1; 0,25), причем первая возможность реализуется с вероятностью 2 / 3 , а вторая — с вероятностью V 3 . Пусть продукт 1, оказавшийся в избытке по отношению к уровню спроса, можно продать оптовому покупателю и получить при этом удельную относительную прибыль F; аналогично, удельная относительная прибыль в случае реализации по оптовым ценам продукта 2 составляет Н, а продукта 3 —L. а) Постройте двухшаговую линейную модель, позволяющую выбрать объемы закупок картофеля у поставщиков 1 и 2 таким образом, чтобы ожидаелгая прибыль была максимальной. б) Дайте математическую формулировку соответствующей двойственной задачи. 35. Задачи фирмы «Мультиконвейер» (разд. 2.2). а) Предположим, что удельная прибыль для каждого из вариантов выбираемого технологического процесса равняется выручке от продажи единицы продукции за вычетом себестоимости единицы продукции. Пусть себестоимость является случайной величиной. Предположим, что удельные значения выручки для процессов 1 и 2 равняются 15, а для процессов 3 и 4 равняются 20. Пусть значения себестоимостей определяются следующим образом: > • :
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
85
для технологического процесса 1
себестоимость единицы продукции равняется 8 + с\ для технологического процесса 2 себестоимость единицы продукции равняется 8 + 2с, где Р[с = 01=1/3, Яс= 11=2/3; для технологического процесса 3 себестоимость единицы продукции равняется 6 + d; для технологического процесса 4 себестоимость единицы продукции равняется б + 3d. где p[d = Q] = 1/6, P[d = i] = = 1/2, Р [d = 2] = 1/3. Постройте модель, позволяющую определить объемы производства так, чтобы ожидаемая прибыль была максимальной. б) Предположим, что имеющаяся в наличии рабочая сила представляет собой случайную величину W, причем Р [W = 10] = 1/8, Р [W = 12] = 1/2, Р [W = 15] = 3/8. Допустим, что если, согласно календарному графику производства, требуемые трудозатраты (в человеко-неделях) превышают имеющиеся возможности, то в графике предусматриваются сверхурочные работы, оплачиваемые по ставке с за человеко-неделю. (Объемы производства устанавливаются в начале недели, а сверхурочные часы добавляются в конце недели.) Построим модель, позволяющую определить объемы производства так, чтобы ожидаемая прибыль была максимальной. в) Пусть сохраняются условия упражнения в п. б), однако предположим, что фирмой разрабатывается календарный план, который должен быть выполнен с вероятностью не менее 0,8 при имеющейся в наличии рабочей силе. (Стоимость трудозатрат в сверхурочное время в явном виде не учитывается.) Постройте соответствующую линейную оптимизационную модель. Покажите, как изменится структура модели, если потребовать выполнение разрабатываемого календарного плана с вероятностью 0,9. 36. Задача свинофермы «Суперрацион» (разд. 2.3). Прочитав научно-исследовательский отчет, только что опубликованный Министерством сельского хозяйства, управляющий пришел к выводу, что минимальная суммарная потребность г в компоненте В равняется либо 225 с вероятностью V 5 , либо 250 с вероятностью 3 / 1 0 - либо 300 с вероятностью 1 / 2 . Постройте соответствующую линейную оптимизационную модель, которая гарантировала бы обеспечение по крайней мере минимальных потребностей свинофермы в компоненте В с вероятностью не менее 0,25 (не менее 0,5; не менее 0,75). 37. Задача фирмы «Электрон» (разд. 6.4). Предположим, что фирма «Электрон» не уверена, что компоненты ее субподрядчиков смогут удовлетворять ее техническим требованиям. Обозначим через ри полученную фирмой оценку вероятности того, что каждый i-й электронный компонент, изготовленный /-м подрядчиком, будет
86
ГЛАВА 16
удовлетворять ее техусловиям, а через К; — убытки, которые потерпит фирма за счет каждой единицы i-ro компонента, не отвечающей этим условиям. Требуется построить модель, минимизирующую суммарные затраты на выполнение заказа. Является ли построенная вами модель стандартной (обычной) моделью для задачи о назначении? 38. Модель выбора кратчайшего пути (разд. 6.5). Рассмотрим пример, представленный на рис. 6.8. Предположим, что стоимости переезда от одного узла к другому являются случайными величинами, а переезд вдоль каждой дуги занимает один период. Пусть в течение каждого из трех первых периодов стоимость переезда из узла i в узел j равняется либо c t j с вероятностью p t j , либо dtj с вероятностью 1 — PIJ. После третьего периода стоимость переезда из узла i в узел ; равняется либо etj с вероятностью q^, либо /^ с вероятностью 1 — qi]. Допустим, что стоимость переезда вдоль той или иной дуги в каждый из периодов не зависит от стоимости переезда вдоль этой дуги в другие периоды. (Так, например, одна из возможных последовательностей для стоимости переезда из узла 3 в узел 4 за семь периодов выглядит следующим образом: с 34 > ^34, С з4> /34' /34' «341 /34-) Полный маршрут подлежит определению до того, как станут известными фактические значения c,-j, причем задача заключается в минимизации ожидаемых затрат, связанных с переездом из узла 8 (источник) в узел 1 (сток). Покажите, каким образом можно отобразить данную стохастическую модель на эквивалентную ей детерминированную модель для задачи выбора кратчайшего пути. (Нарисуйте сеть и проставьте стоимости переезда вдоль дуг.) 39. Рассмотрим модель линейного программирования, содержащую ограничение
где «и — случайная величина, имеющая распределение вероятностей Р [а,ц = а] =0,1 для а = 1, 2, . . ., 10. а) Покажите, каким образом можно перейти от данного вероятностного ограничения к обычному линейному неравенству. б) Выполните упражнение, сформулированное в п. а), положив '0,75 для а = 1, 2, . . ., 10, 0,8 для а = 1, 2, . . ., 10, = а\ -< а = 6, 7, . . ., 15, ,1 для а = — 4, — 3, . . ., 5. 40. Задача фирмы «Гигант» (разд. 2.6). Пусть Т = 3, а также предположим, что St (t = 1, 2, 3) есть случайная величина, причем P[St = iQ]=±, />[£, = 15] = -|.
Р[5 2 = 20]=у, П32 = 25]=4-,
P[Sa = lQ] = ^, P[5,= 18]=-g-.
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
87
а случайные исходы St являются полностью независимыми. Предположим, что часть неудовлетворенного на отрезке t спроса аннулируется и фирма терпит убыток в размере rt (в расчете на единицу продукции). а) Предположите, что имеет место случай, когда в начале планового периода фирма располагает полной прогностической информацией (разд. 16.7). Постройте соответствующую линейную модель и укажите суммарное число фигурирующих в ней управляемых переменных и уравнений. б) Проанализируйте, как изменится структура только что построенной вами модели, если точные значения St и предыдущие уровни спроса к моменту определения объемов производства на отрезке t оказываются известными (см. в разд. 16.7 случай, когда вначале уточняется спрос, а затем принимается решение). в) Проанализируйте, как изменится структура модели, удовлетворяющая условиям п. а), если к моменту определения объемов производства на отрезке t становятся известными лишь значения предыдущих уровней спроса (см. в разд. 16.7 случай, когда вначале принимается решение, а затем уточняется спрос). г) Проанализируйте, как изменится структура модели, удовлетворяющая условиям п. а), если решение принимается при полном отсутствии точной информации относительно уровней спроса (см. аналогичный случай в разд. 16.7). ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ
41. Лемма Неймана — Пирсона. Рассмотрим случайную величину V, которая может принимать значения 1, 2, . . ., п. Пусть с помощью единственного выборочного наблюдения требуется определить, какое из двух возможных распределений вероятностей отвечает V. Обозначим одно из возможных распределений (включающее вероятности р3 > 0) через Р, а другое (включающее вероятности ; > 0) через Q. Объясните, почему всегда можно заиндексировать наблюдаемые значения 1, 2, . . ., п таким образом, чтобы Pi ^ Pz <--
^- Рп
31 "" 92 ~~~ " ' ^ Чп
(т. е. чтобы при у = 1 отношение Pj/qj имело наименьшее значение, а при у = п — наибольшее). Пусть выборка приводит к наблюдению V с индексом ;'. Обозначим через X] вероятность того, что распределение вероятностей отождествляется с Р (тогда 1 — Xj есть вероятность того, что распределение вероятностей отождествляется с Q). а) Постройте модель линейного программирования, позволяющую максимизировать вероятность отождествления распределения вероятностей с Р, когда действительно имеет место Р, при ограничении, отражающем требование, чтобы вероятность отождествления рас-
ГЛАВА 16
пределения с Р, когда на самом деле имеет место Q, не превышала р* (О < р <С 1). Постройте также модель для соответствующей двойственной задачи. б) Покажите, что оптимальное решение данной задачи имеет следующий вид: Xj = 0 для / ^ / и Xj = 1 для / > /, где / — некоторое критическое значение /. 42. Рассмотрим пример транспортной сети, приведенный в разд. 16.6. Предположим, что St также являются случайными величинами и их значения до момента выбора значений xi} точно не известны. Пусть Р [Si = 5] — вероятность того, что S, принимает значение S. (Значения, устанавливаемые для x t j , следует рассматривать как обязательства осуществить доставку соответствующих объемов продукции из i-ro пункта отправления в ;'-й пункт назначения.) Если хц + х',2 -f-. . . -\-Xim превышает фактическое значение Si, то продукция в объеме, равном разности указанных величин, подлежит доставке с помощью других средств по стоимости С\ за единицу продукции. Подробно обсудите вопрос о внесении изменений в структуру модели, рассмотренной в разд. 16.6. и отображении видоизмененной задачи на эквивалентную ей детерминированную транспортную задачу «расширенного» типа. 43. Календарное планирование трудовых ресурсов. Рассмотрим задачу фирмы «Дик О'Браз», приведенную в разд. 6.7. Предположим, что количество бригад R^, требуемое в период k, есть случайная величина. В частности, допустим, что Р [Rh = R] = ph (R), где R = 1, 2, . . ., 10, причем величины Rh взаимно независимы. Требуется построить линейную оптимизационную модель, эквивалентную стохастической модели, для каждого из указанных в пп. а) и б) предположений относительно порядка поступления информации о Rh. (Требуется дать точное определение каждого из используемых понятий и соответствующих символических обозначений, а также указать число управляемых переменных и число уравнений, входящих в структуру модели.) а) Рассмотрите случай, когда R^ становится известным в начале отрезка k до того, как принимается решение относительно значений x
h. h+li • • •' xhn-
б) Рассмотрите случай, когда Rh становится известным в начале отрезка k — 1 до принятия решения относительно xh_llh, . . ., xh_it n в (т. е. в начале отрезка 1 известны RI и Д 2 - начале отрезка 2 известны RZ и Rs и т. д.). 44. а) Рассмотрим нелинейную оптимизационную задачу, решение которой может быть получено с помощью алгоритма, аналогичного алгоритму, описанному в гл. 14 и 15. Предположим, что по самому существу постановки задачи возникает необходимость построения двухшаговой модели (разд. 16.4). Можно ли метод, изложенный в разд. 16.4, обобщить на случай нелинейных моделей? Можно ли построить расширенную нелинейную модель, эквивалентную исходной стохастической, решение для которой удалось бы найти
ТЕОРИЯ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
§9
с помощью алгоритма решения детерминированных нелинейных задач оптимизации (гл. 14 и 15)? б) Ответьте на вопросы, сформулированные в п. а), рассмотрев случай многошаговой стохастической модели (разд. 16.7). в) Ответьте на вопросы, сформулированные в п. а), рассмотрев случаи двухшаговой (а также многошаговой) стохастической модели целочисленного программирования и учтя материал, изложенный в соответствующих разделах гл. 13 и 16.
ГЛАВА 17
Вероятностные модели динамического программирования
17.1. ВВЕДЕНИЕ
В предыдущей главе мы проанализировали влияние неопределенности на процесс формирования оптимального управляющего решения, или выработки оптимальной стратегии поведения. Особое внимание при этом уделялось вопросам структуризации модели, содержащей случайные величины, в частности разбору различных последовательностей из актов принятия управляющих решений при различных предположениях относительно порядка поступления сведений, характеризующих фактические или прогнозируемые исходы. Наш анализ относился главным образом к задачам линейного программирования. Было показано, что линейные модели стохастического характера можно свести к детерминированным линейным моделям большей размерности; при этом увеличение размерности в реальных задачах настолько значительно, что нахождение оптимального решения подчас оказывается практически невозможным. В данной главе мы попытаемся, хотя частично, преодолеть эту трудность. Каждая из приведенных ниже моделей представляет собой типичную модель вероятностного динамического программирования. С помощью рассматриваемых здесь примеров мы убедимся, что метод решения стохастических задач динамического программирования оказывается лишь в незначительной степени сложнее метода нахождения решений для соответствующих динамических оптимизационных моделей детерминированного характера. Мы рассматриваем здесь лишь модели с ограниченным плановым периодом или с конечным числом оптимизирующих шагов (исключение составляет лишь разд. 17.7). Задачи оптимизации при неограниченном плановом периоде анализируются в гл. 18. В данной главе главное внимание сосредоточено на методе учета вероятностных элементов в структуре многошаговой модели. Мы предполагаем, что читатель уже знаком с приемами построения детерминированных моделей динамического программирования, и рекомендуем ему уделить хотя бы несколько минут гл. 8 и 10, с тем чтобы освежить в памяти основные понятия, используемые в теории динамического программирования. (Необходимо, в частности, вспомнить, что понимается под переменными состояния и переменными /-го шага, и убедиться в правильности понимания возникающих в динамических моделях рекуррентных соотношений и вычислительных процедур, связанных с поиском численных решений рекуррентных уравнений.) При изложении принципов вероятностного динамического программирования мы используем подход, уже применявшийся нами
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
91
в гл. 8 и 10, т. е. объясняем эти принципы с помощью ряда наиболее характерных примеров. Начиная с относительно простых, мы постепенно переходим к более сложным моделям, причем некоторые из них представляют собой стохастические обобщения детерминистических моделей, уже рассматривавшихся в гл. 8 и 10. В этой главе мы не останавливаемся подробно на способах получения численных решений для приведенных ниже моделей, так как при решении практических задач вычислительные процедуры оказываются настолько трудоемкими, что для их реализации приходится прибегать к помощи ЭВМ и использовать машинные программы, разрабатываемые специалистами по программированию ЭВМ. Не углубляясь в вычислительный аспект проблемы, мы пытаемся сосредоточить внимание на процедурах построения моделей и на методах анализа, учитывающих стохастический характер величин, фигурирующих в этих моделях. Для того чтобы анализ роли неопределенности в задачах динамического программирования был более целенаправленным, при изучении излагаемого ниже материала читатель должен постараться дать исчерпывающий ответ на следующие вопросы: 1. Какова оптимальная стратегия, вытекающая из детерминистского варианта каждой из рассматриваемых моделей? 2. Какой объем информации относительно распределения вероятностей фигурирующих в той или иной модели случайных величин требуется для построения оптимального решения? 3. В какой степени алгоритм решения стохастической задачи динамического программирования отличается от алгоритма решения для соответствующего детерминистического аналога рассматриваемой задачи? 17.2.
ЗАДАЧА РАСПРЕДЕЛЕНИЯ УСИЛИЙ
Рассмотрим вначале пример, в котором влияние вероятностных элементов на процедуры вывода и применения рекуррентных соотношений динамического программирования оказывается почти тривиальным. Приведенная ниже задача представляет собой стохастический аналог так называемой задачи распределения усилий, сформулированной в гл. 10. Чтобы избавить читателя от необходимости обращаться к разд. 10.2, в котором эта задача обсуждается в детерминистском варианте, мы сформулируем ее здесь повторно. Владелец фирмы «Свежие продукты» должен распределить имеющийся у него недельный запас яиц в количестве N штук по s магазинам, принадлежащих данной фирме. Из опыта известно, что если направить у, яиц в магазин j, то будет обеспечена прибыль в размере RJ (У]). Владелец фирмы стремится найти такой вариант распределения имеющихся в наличии яиц по магазинам, для которого суммарная прибыль была бы максимальной.
92
ГЛАВА 17
Математически задача формулируется следующим образом: s Максимизировать ^Rj(yj) (1) j=i
при ограничениях s
2 yj = N (наличный запас яиц), j=i У] = О, 1, . . .
(2)
при любом значении j (поставляется лишь целое число яиц). (3)
В разд. 10.2 мы ввели следующее обозначение: gj (n) —прибыль при оптимальном распределении п яиц по магазинам 1, 2, . . . , / . (4) Мы видим, что задача, определяемая соотношениями (1) — (3), преобразуется в многошаговую задачу, решение которой может быть получено с помощью рекуррентного соотношения динамического программирования: g j ( n ) = m a x [ R j ( y j ) + g j _ i ( n — z/;-)], для jf = l, 2, ...,s, y i go(n) = Q для / = 0,
(5) (6)
где п = О, 1, . . ., N, а максимизация выполняется над множеством неотрицательных целочисленных значений у}, удовлетворяющих s
условию
j/j ^ п. Оптимальное значение
2 Rj (yj) j=i
определяется
величиной gs (N). Приведенная выше формулировка задачи основывалась на предположении, что прибыль, которую можно получить за счет поставки г/j яиц магазину ;', известна заранее и определяется однозначно. Предположим, однако, что прибыль зависит не только от t/7-, но и от фактического спроса на яйца в /-м магазине, причем допустим, что объем спроса в /-м магазине представляет собой случайную величину, которая не зависит от i/7- (/ = 1, 2, . . ., s) и значение которой становится точно известным лишь после того, как выбраны значения всех управляемых переменных z/j. Введем следующие обозначения: r
i № I У) — прибыль, получаемая магазином / в случае, когда фактический уровень спроса равняется и, а объем поставок в этот магазин составляет у яиц; (7) PJ (d) — вероятность того, что уровень спроса для магазина / равняется d, (8)
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
93
Функцию TJ (d | у) можно записать, например, в следующем виде: jd
при d<j/
jy
, при а>г/
(объем поставок достаточен, чтобы удовлетворить спрос), , * (спрос превышает объем поставок).
(9)
В данном случае г,- представляет собой прибыль, получаемую J-M магазином за счет каждого проданного яйца. Когда объем поставок у достаточен для того, чтобы полностью удовлетворить спрос d, суммарная прибыль равняется Tjd. Однако в случае, когда фактический спрос превышает объем поставок, то оказываются проданными только у яиц, и, таким образом, суммарная прибыль равняется r^i/. Математическое ожидание прибыли за счет поставок в у'-й магазин у, яиц определяется формулой
R}(Vi) = ^ r ] ( d \ y , ) p ) ( d ) , d
(Ю)
где суммирование производится по всем возможным значениям уровня спроса (именно поэтому d стоит под знаком суммы). Если исходить из такого определения RJ (г/j), то решение для модели (1) — (3), в которой максимизируется математическое ожидание суммарной прибыли, будет соответствовать оптимальному варианту распределения, причем оптимальное решение по-прежнему находится с помощью соотношений (4) — (6). Таким образом, как только математические ожидания TJ (d \ у) оказываются вычисленными, процедура решения стохастической задачи ничем не отличается от процедуры определения оптимального варианта распределения для соответствующей детерминированной модели. 17.3. ПРОБЛЕМА У Л У Ч Ш Е Н И Я КАЧЕСТВА ПРОДУКЦИИ И ДЕРЕВО РЕШЕНИЙ
После прочтения предыдущего раздела читатель, по-видимому, вновь обрел уверенность в своем умении обращаться с рекуррентными соотношениями динамического программирования и готов перейти к рассмотрению более сложной задачи организационного управления. В гл. 16 было сформулировано следующее фундаментальное положение относительно нахождения оптимальных решений динамической задачи организационного управления при наличии в ней стохастических элементов: оптимизации подлежат вначале лишь значения управляемых переменных, выбираемые на первом шаге, а для последующих интервалов времени устанавливаются оптимальные правила принятия управляющих решений. Эти правила позволяют определить оптимальный вариант действий при наличии информации о фактически реализованных исходах в прошлом, т. е. до момента принятия решения.
94
ГЛАВА 17
Пусть фирма «Комфорт» занимается коренным усовершенствованием выпускаемых ею установок для кондиционирования воздуха в бытовых помещениях. Проект продвинут настолько, что изменения в существующие конструкции можно было бы внести немедленно. Однако фирма предпочитает подождать завершения ряда дополнительных исследований и окончания испытаний, поскольку еще не преодолены некоторые трудности, осложняющие организацию соответствующего технологического процесса. С другой стороны, президент фирмы «Комфорт» понимает, что если задержка будет слишком большой, то некоторые из конкурентов непременно объявят об аналогичном усовершенствовании своих изделий, и фирма потеряет часть своего рынка. Таким образом, возникает проблема принятия компромиссного решения, учитывающего, с одной стороны, потенциальную прибыль в случае, если до начала выпуска усовершенствованного изделия будут устранены все технические дефекты проекта, и с другой — возможную потерю рынка сбыта в случае, если: конкурирующие фирмы опередят фирму «Комфорт» с выпуском усовершенствованных установок для кондиционирования воздуха. Попытаемся описать эту ситуацию математически. Предположим,, что президент фирмы стремится к тому, чтобы оптимальным образом: решить, в каком месяце объявить о выпуске модернизированных изделий. Пусть президент фирмы считает, что это объявление необходимо сделать не позднее месяца Т и что он внесет изменения в конструкции выпускаемых фирмой установок сразу же, как только» это сделает хотя бы одна из конкурирующих фирм. Введем следующие обозначения: rt — прибыль, получаемая фирмой «Комфорт» в случае, если об усовершенствованных установках будет объявлено в 2-й месяц, причем раньше чем это сделают конкурирующие фирмы; gt — прибыль, получаемая фирмой «Комфорт» в случае, если она (в t-ж месяц) внесет изменения в конструкцию своей: установки, причем сделает это одновременно с конкурирующими фирмами; ht — прибыль, получаемая фирмой «Комфорт» в случае, если она объявит об усовершенствованной установке в <-й месяц, причем после того, как конкурирующие фирмы уже предприняли аналогичные шаги. Вероятнее всего (хотя это и не так существенно) можно постулировать, что rt > gt > ht и что rt, gt и ht являются возрастающими функциями времени. Предположим, что если до t-то месяца не делалось никаких объявлений о выпуске моделей, то фирма «Комфорт», так же как и конкурирующие с ней фирмы, принимают в i-й месяц решения совершенно независимым образом, не располагая никакой информацией о текущих решениях своих конкурентов. В соответствии с такой ситуацией допустим, что президент фирмы полагает вероятность
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
95
того, что в 2-й месяц конкурирующие фирмы объявят о выпуске усовершенствованных установок, равной pt при условии, что до этого времени пи один из конкурентов не предпринял подобных шагов; при этом президент фирмы считает, что рт = 1. Затем, согласно предположению, постулируется, что условные вероятности р не зависят от того, какой конкретной стратегии будет придерживаться фирма «Комфорт». Однако президент фирмы абсолютно убежден, что если его фирма внедрит усовершенствование в t-м месяце, опередив при этом своих конкурентов, то последние непременно внесут аналогичные изменения в модели выпускаемых ими установок для кондиционирования воздуха в последующий период. Поэтому он производит численную оценку rt с учетом прогнозируемой реакции конкурирующих фирм. Структура процесса принятия управляющего решения может быть описана деревом решений, представленным на рис. 17.1 (для случая Т = 3). С помощью букв Ф is. К, проставленных в узловых точках, показано, кем предпринимается действие (фирмой «Комфорт» или ее конкурентами). Процесс выработки решения завершается в 2-й месяц при условии, что либо фирма «Комфорт», либо ее конкуренты отказываются от выжидательной тактики (если же все фирмы придерживаются «политики отсрочки», то дерево решений продолжает ветвиться). Читатель должен внимательно изучить представленное на рис. 17.1 дерево решений, чтобы разобраться в графическом изображении многошагового процесса формирования решения. Нижние ветви дерева соответствуют первому шагу (или решению, которое президент фирмы «Комфорт» должен принять немедленно). Если он выражает намерение ввести усовершенствование своего изделия незамедлительно, процесс формирования решения прекращается. Если же принимается решение «выждать», то при этом в зависимости от исхода случайного события, характеризующего поведение конкурирующих фирм, либо сохраняется, либо теряется возможность выжидать на отрезке 2. Пусть президент хочет выработать стратегию, которая максимизировала бы ожидаемое значение прибыли. Как и для любой другой задачи динамического программирования, не представляет особого труда найти оптимальное решение в случае, когда процесс формирования решения продолжается вплоть до последнего периода, т. е. до отрезка Т. К этому моменту необходимо лишь сравнить ожидаемую прибыль при внедрении проектируемых усовершенствований с ожидаемой прибылью в случае дальнейшей отсрочки начала выпуска усовершенствованных изделий. Читатель должен объяснить, почему сравниваемые значения прибыли равняются соответственно РТ£Т и Рт^-т- Поскольку предполагается, что рт = 1 и gT > hT, в случае, если процесс принятия решения продолжается вплоть До последнего периода, более правильным является решение внедрить усовершенствованные модели в производство. Приведенные выше
Обозначения: Ф-решение президента фирмы „Комфорт" К-решения конкурентов Р и с . 17.1. Дерево решений фирмы «Комфорт» (задача улучшения качества продукции).
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
97
расчеты можно представить в следующем виде: [ Ртёт (при внедрении) /r = m a x < , . . = grj (1) I Рт^т (если не внедрять) где / т есть математическое ожидание прибыли при оптимальном решении на отрезке Т. Посмотрим теперь, что происходит на отрезке £, предшествующем отрезку Т. Если президент фирмы идет в этот период на внедрение усовершенствованного изделия в производство, то ожидаемая прибыль будет равняться произведению gt на вероятность pt того, что его конкуренты также объявят о введении аналогичного новшества плюс произведение rt на вероятность (1 — pt) того, что фирма «Комфорт» застанет своих конкурентов врасплох. Если же президент примет решение не вносить изменений в существующую конструкцию установки для кондиционирования воздуха, то ожидаемая прибыль будет складываться из htpt и стоимости ожидания, или отсрочки, умноженной на вероятность (1 — pt) того, что конкурирующие фирмы также предпочтут выжидать. Какова стоимость отсрочки? Она просто равняется ожидаемому значению прибыли в случае оптимальной стратегии при условии, если процесс формирования решения продолжается до отрезка t + 1 включительно; обозначим стоимость отсрочки через ft+i- Тогда /( превосходит математическое ожидание прибыли в каждом из двух возможных вариантов решений на отрезке t. Все эти утверждения легко обобщаются с помощью выкладок, выполняемых рекуррентным способом для t = Т — 1, . . . . . ., 1, и в результате получаем f Ptgt + (l — pt)rt (при внедрении), ( ~ \ ptht + (i — pt)fM (если не внедрять). Для получения оптимального правила принятия решений на последующих отрезках и определения оптимального поведения на отрезке 1 следует выполнить вначале необходимые вычисления с помощью (1), а затем продолжить вычисления, используя формулу (2). Решение, приводящее к / 4 , является оптимальным для месяца 1. Если оно состоит в том, чтобы «не внедрять», и конкуренты фирмы «Комфорт» не пошли на объявление новых моделей, то решение, приводящее к / 2 , является оптимальным для отрезка 2. Аналогично находятся решения в последующие месяцы, причем всякий раз выбор варианта действий зависит от фактического поведения конкурирующих фирм. Читателю предлагается подумать о связи между так называемой процедурой обратной индукции, определяемой соотношениями (1) и (2), и деревом решений, изображенном на рис. 17.1. (В каком отношении эта процедура напоминает способ определения оптимального пути в ациклической сети?) В рассмотренной выше модели наиболее «рискованным» является предположение о том, что значения pt не зависят от собственной
ГЛАВА 17
стратегии фирмы «Комфорт». Поясним это с помощью анализа следующей ситуации. Предположим, что у фирмы «Комфорт» имеется единственный конкурент, у которого показатели прибыли совпадают с соответствующими показателями рассматриваемой фирмы. Тогда, если бы конкурирующая фирма могла заранее знать, что президент фирмы «Комфорт» планирует ввести усовершенствование в свои изделия на отрезке s, то она объявила бы об аналогичном усовершенствовании на отрезке s — 1 (если rs_i ;> gs). Однако, если бы президент фирмы «Комфорт» заподозрил в такого рода намерениях своего конкурента, он добился бы того, чтобы выполнялось условие Ps-i = 1, и соответствующим образом изменил бы свое первоначальное решение. Читатель сразу же поймет, что такой способ рассуждений может привести к некоторой последовательности пересмотров решений как со стороны фирмы «Комфорт», так и со стороны ее конкурента. Возникает вопрос: существуют ли стратегии поведения рассматриваемой фирмы и ее конкурента, которые находились бы во взаимном равновесии, т. е. такие стратегии, которые не подлежали бы пересмотру и изменению в тех случаях, когда одной из упомянутых фирм стало бы известно о решении своего конкурента? Более того, если бы такие стратегии действительно существовали, то можно ли было бы их считать в том или ином смысле оптимальными? Ответ на такого рода вопросы может дать теория игр, изложение которой читатель найдет в соответствующих учебниках и монографиях. 17.4. ЭЛЕМЕНТАРНАЯ МОДЕЛЬ УПРАВЛЕНИЯ ЗАПАСАМИ
Задача фирмы «Комфорт» является весьма простой, так как состояние системы на любом отрезке t зависит практически только от того, продолжается ли процесс формирования решения вплоть до t-ro отрезка, или, другими словами, от того, рекламировались ли усовершенствованные установки для кондиционирования воздуха фирмой «Комфорт» или ее конкурентом на предшествующих отрезках. Переменная состояния в приведенном ниже примере соответствует тому, что уже рассматривалось нами в ранее представленных детерминистических задачах. Этот пример представляет собой вероятностный аналог задачи планирования производства и управления запасами фирмы «Надежный поставщик» (разд. 8.4). Более широкое обсуждение моделей управления запасами при стохастическом характере спроса будет проведено в гл. 19 и приложении П. Основное внимание при этом будет уделено получению формы оптимальной стратегии и нахождению с помощью предлагаемого метода численных решений для упомянутого класса моделей. В детерминистическом варианте задачи фирмы «Надежный поставщик» были приняты следующие предположения относительно фигу-
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
99
рирующих в модели данных: Спрос D = 3; объем производства х ^ 5; Уровень запасов /' на конец отрезка (являющегося частью планового периода) удовлетворяет условию / ^ 4. (1) Сумма затрат, связанных с производством и хранением, равняется С (х, /) =С (х) + hj, (2) где х и j — неотрицательные целые числа, а С (0) = 0 , С (1) = 15, С (2) = 17, ( С (3) = 19, С (4) = 21, С (5) = 23, ' /i = l, для всех отрезков (внутри планового периода). Таким образом, параметры модели стационарны во времени. Переменной состояния системы является уровень запасов на начало отрезка планового периода; уровень запасов был обозначен через i (i = О, 1, . . ., 4). Рекуррентное соотношение динамического программирования в этом случае имеет следующий вид: / n (i) = min[C(a:)-|-(i + *-3) + / B -i(» + a:-3)] для п = 2, 3, ..., (4) X
при
/ 4 (О = С (3 - О для i = О, 1, 2, 3, (5) причем в (4) i = О, 1, . . ., 4, а минимизация осуществляется над множеством только таких целочисленных значений переменной г, которые лежат в интервале 3 — i =£С х ^ min (5,7 — i). Предположим теперь, что уровень спроса принимает одно из двух независимых и равновероятных значений:
Р[Я = 2]=|,
Р[Д = 4] = |,
(6)
так что Е [D] = 3 для всех отрезков планового периода. Чтобы сделать анализ данной стохастической модели сравнимым с анализом соответствующей детерминированной задачи, необходимо принять ряд дополнительных допущений. Во-первых, предположим, что в конце планового периода складские запасы не принимаются во внимание и не приводят к затратам на хранение (в детерминистском случае уровень запасов в конце планового периода мы полагали равным нулю). Во-вторых, допустим, что объем производства Достаточен для того, чтобы запасы никогда не истощались (не принимали отрицательных значений), что приводит к следующему ограничению: Объем запасов на начало отрезка + + Объем произведенной продукции ^ 4. (7) Поскольку наименьшее значение для уровня спроса равняется 2, а уровень запасов в конце отрезка не может превышать 4 единицы,
100
ГЛАВА 17
то должно удовлетворяться также следующее условие: Объем запасов на начало отрезка + + Объем произведенной продукции ^ 6.
(8)
Наиболее важным является то обстоятельство, что переменная, характеризующая состояние в данной стохастической модели, попрежнему представляет собой уровень запасов на начало отрезка. Чем это объясняется? Поскольку случайные величины, характеризующие уровень спроса, полностью независимы, единственным связанным с прошлым показателем для момента времени, в котором до конца планового периода остается п отрезков, является имеющийся в наличии объем запасов. Предполагая, что задача заключается в минимизации значения целевой функции, представляющей собой математическое ожидание суммарных (за плановый период) затрат, мы можем интерпретировать /л (г) как ожидаемые затраты на реализацию оптимальной стратегии при заданном значении i для уровня запасов на начало отрезка, когда до конца планового периода остается п отрезков. В случае когда п = 1, простые вычисления приводят к следующей формуле: Л (О = С (4 - i), i = О, 1, . . ., 4. (9) Читатель должен объяснить, почему из принятых нами предположений вытекает, что оптимальный объем производства х при п ~ 1 равняется 4 —- i. Для больших значений п при заданном уровне запасов i ожидаемые затраты при реализации оптимальной стратегии могут быть определены с помощью следующей схемы рассуждений. Во-первых, нужно учесть затраты С (х), связанные с производством х единиц продукции. Во-вторых, необходимо включить в /n (i) ожидаемые затраты на хранение продукции (по состоянию на конец рассматриваемого отрезка, т. е. в объеме i + х — D). Наконец, следует принять в расчет затраты, которые будут иметь место в последующие отрезки планового периода. Эти затраты представляют собой не что иное, как Е [/ п _ 4 (I + х — D)], где D характеризуется распределением вероятностей, определяемым соотношениями (6). (Читатель должен дать последнему утверждению надлежащее обоснование.) Таким образом, при п = 2, 3, . . . рекуррентное соотношение динамического программирования для рассматриваемой стохастической модели имеет следующий вид:
. 1t
,, , _ _2) + -
1 ,^ /n-i(» + s—4)]},
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Уровень запасов на начало отрезка i
п— 1
re — 2
МО
re = 5
re— 4
re — 3
Ю1
Heorpaниченныи плановый период
«4(0
/4(0
*s(0
57,5
5
75,25
5
93
5
5
52,25
5
70,00
5
87,43
5
32,5
4
50,25
4
68,00
4
85,43
4
3
30,5
3
48,25
3
66,00
3
83,43
3
0
20
0
37,75
0
54,87
0
72,62
0
*i(0
/i(0
X2(i)
0
4
21
4
41
5
1
3
19
5
34,5
2
2
17
4
3
1
15
4
0
0
/2(0
* 3 (0
/5(0
*=o (0
Р и с . 17.2. Задача фирмы «Надежный поставщик» (стохастический вариант модели управления запасами).
где i = О, 1, . . ., 4, а минимизация производится над множеством только таких неотрицательных целочисленных значений х, которые лежат в интервале 4 — i ^ х ^ min (5, 6 — i). Заметим, что главное отличие рекуррентного соотношения (4), имеющего место в случае детерминистической модели, от рекуррентного соотношения (10) для стохастической задачи заключается в том, что в последнем случае необходимо произвести дополнительные вычисления, связанные с количественным определением В таблице на рис. 17.2 наряду с /n (i) приведены оптимальные значения для объемов производства хп (i) для п = 1, 2, . . ., 5. Можно доказать, что стратегия, оптимальная для п = 3, является оптимальной также и для всех п ^ 3. Сравнивая результаты, приведенные в таблице на рис. 17.2, с результатами, полученными в случае детерминированной ситуации (рис. 8.12), мы приходим к следующим выводам: 1. При любом начальном значении объема запасов i и произвольной протяженности оставшейся части планового периода п ожидаемые затраты при оптимальной стратегии в случае стохастического поведения уровня спроса бу дут выше оптимальных затрат при детерминированном спросе.
102
ГЛАВА 17
2. При заданном i оптимальное значение хп (i) при стохастическом спросе никогда не убывает с ростом п. 3. Оптимальная стратегия для планового периода большой протяженности была нами получена в случае стохастического спроса при п = 3, тогда как в детерминированной ситуации — при п = 18. Эти выводы, правда, сделаны на основе количественного анализа модели частного вида, однако рассмотренный пример позволяет сделать следующее общее заключение: характеристики решения для детерминистического и стохастического вариантов модели могут коренным образом отличаться. 17.5. ЗАДАЧА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО РАЗМЕРА ПАРТИИ
Фирма «Вольтекс», выпускающая магнитофоны промышленного назначения, покупает у другой фирмы ряд дорогостоящих деталей, изготовляемых по специальному заказу. Фирма «Вольтекс» не держит запасов таких деталей, так как она производит магнитофоны по заказам потребителей, а технические условия заказчиков не повторяются. Поскольку требования к качеству всех блоков и устройств, идущих на изготовление магнитофонов, являются исключительно высокими, детали упомянутого выше типа нередко выходят из строя от короткого замыкания в процессе предварительных технических испытаний. В таких случаях фирма «Вольтекс» может вернуть отказавшие детали своему поставщику при полном возмещении последним их стоимости. Чтобы не допустить экономических потерь и неудобств, связанных с задержками в производстве при ожидании замены в случае обнаружения брака, фирма «Вольтекс» заказывает, как правило, большую партию по сравнению с фактически требуемым количеством деталей. Если же, однако, заказанная партия окажется слишком большой и, таким образом, возникнут излишки деталей, фирма «Вольтекс» потерпит убытки. (Это может произойти потому, что поставщик, согласившись принять неиспользованные детали, сможет в ряде случаев продать их лишь по более низким ценам. Возможны также случаи, когда поставщик не захочет принять излишки деталей, так как они являются слишком специализированными и не имеют других потребителей.) Задача принятия решения фирмой «Вольтекс» заключается в определении оптимального размера заказываемой партии деталей. Если бы управляющий фирмой знал точно, сколько деталей окажется непригодными для использования при любом размере партии, задача принятия решения была бы весьма простой. Управляющий этого не знает, и поэтому анализ задачи становится нетривиальным. Введем следующие обозначения: с — цена одной детали, приобретаемой у данного поставщика; v — цена одной детали, оказавшейся в избытке (при этом О < v < с);
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
ЮЗ
К — затраты, связанные с оформлением дополнительного заказа при возникновении такой необходимости; Рх 0) — вероятность того, что из партии в х деталей / деталей окажутся непригодными для использования в процессе технической проверки (при этом рх (х) < 1). Рассуждая о том, как будет развиваться во времени соответствующий процесс принятия решения, мы сможем определить способ построения (для рассматриваемой задачи) соответствующей многошаговой оптимизационной модели. Предположим, что требуемое число исправных (пригодных для использования) деталей равняется N, а заказ оформляется на х деталей (х ^ N). Если неисправными окажутся / деталей, причем / ^ х — N, то потребности фирмы будут удовлетворены, но N — х + ;' деталей останутся неиспользованными. Если же j > х — N, то неудовлетворенные потребности фирмы составят N — х + / деталей. (Так, например, если из 15 заказанных деталей 6 окажутся неисправными, а фирме требуется 10 исправных деталей, то дополнительно понадобится 1 (= 10 —15 + 6) исправная деталь.) Таким образом, при / > х — N потребуется повторный заказ. Возникающая при этом задача принятия решения носит такой же характер, что и в предыдущем варианте. Разница заключается лишь в том, что теперь требуется меньшее число деталей (исключение составляет ситуация, когда все заказанные ранее детали оказываются неисправными). В любом случае для принятия решения необходима лишь та информация относительно предыдущей партии деталей, которая позволяет определить, какое количество исправных деталей требуется фирме дополнительно. Таким образом, соответствующей переменной, характеризующей состояние системы, является дополнительное число исправных деталей, в которых фирма испытывает потребность. Пусть оптимальной является такая стратегия, при которой минимизируются ожидаемые суммарные затраты на полное удовлетворение потребностей фирмы в упомянутых выше деталях. Обозначим через п требуемое число деталей и посмотрим, чему будут равняться ожидаемые затраты, если заказать х деталей. Прежде всего из полной стоимости х деталей нужно вычесть математическое ожидание стоимости неисправных деталей, так как они возвращаются фирмепоставщику на условиях компенсации. Если же число неисправных деталей окажется настолько незначительным, что потребности фирмы будут полностью удовлетворены и даже останутся излишки исправных деталей, следует учесть сокращение ожидаемых суммарных затрат на величину стоимости неизрасходованных деталей. Если же число неисправных деталей окажется слишком большим и поэтому придется делать дополнительный заказ, в выражение для суммарных ожидаемых затрат необходимо добавить величину затрат при повторном заказе К, умноженную на вероятность возникновения потребности в повторном заказе; аналогично учитываются ожи-
104
ГЛАВА 17
даемые затраты при повторном возникновении потребностей в исправных деталях. Таким образом, обозначив через / (п) минимальные ожидаемые затраты в случае, когда требуется п исправных деталей, будем иметь *) Ж—П
X
/(га) = тш{с[л: — ^ jpx(})}~ v 2 (x — n—i)px(j) + «Jsn x
+
2
j=0
j=0
при ra = l, 2, 3, .... (1)
[K + f(n-x + j ) ] p x ( j ) }
j=3C-Tl+l
Определяющее / (п) значение х (п) есть оптимальный размер партии. Последовательность х (п) для п = 1, 2, 3, . . . представляет собой оптимальное правило для принятия управляющего решения. (Читатель должен объяснить, как это предписание используется на практике.) Если требуется N деталей, то последовательно вычисляются / (п) для п = 1, 2, . . ., N. Заметим, однако, что соотношение (1) необходимо слегка преобразовать, поскольку / (п) (при / = х) появляется также и в правой части упомянутого соотношения. [Читатель должен объяснить, почему вероятностный характер задачи приводит к тому, что / (п) фигурирует в обеих частях соотношения (1).] После некоторых упрощений соотношение (1) приводится к виду, удобному для получения численного решения. С помощью ряда несложных алгебраических преобразований получаем следующее выражение: X
1
— рх(х)Г
\с[х—^\ j p x ( i ) ] — }—0
* j—O
j=x— n+1
г=зс— n-fl
в котором исключен член, соответствующий п = 1 . Пример с конкретными числовыми показателями. Покажем, как используется соотношение (2), положив с = Ю, v = О (3) и приняв для описания рх (/) биномиальный закон распределения
Р'О'Н-щЙТ)!^-^1"'' / = 0 , 1 , . . . , * ,
(4)
где р есть вероятность обнаружения одной неисправной детали. Тогда оптимальные размеры партии х (п) в случае, когда требуется п деталей, р = 1/4, р = 1/2, р = 3/4, а К = 50 и К — 1000 задаются таблицей на рис. 17.3. При увеличении значений п, р я К значение х (п), естественно, возрастает. Дополнительная информация отноЧитателю предлагается проверить правильность соотношения (1).
К
50
1000
п
*(я)
P = V4
P = Vs
/ И f ( n ) — cn х(п)
/(») i ( n ) — cn х(п)
/(») f ( n ) — cn
3
24,3
14,3
8
27,8
17,8
9,3
Р = 3/4
1
2
19,3
2
3
33,5
13,5
6
38,3
18,3
13
42,7
22,7
3
5
44,9
14,9
8
51,3
21,3
17
56,1
26,1
5
8
68,3
18,3
12
75,7
25,7
26
80,9
30,9
10
15
123,8
23,8
23
132,4
32,4
46
138,8
38,8
1
4
34,0
24,0
7
43,1
33,1
17
50,4
40,4
2
6
49,8
29,8
11
61,1
41,1
24
69,5
49,5
3
8
64,4
34,4
13
76,7
46,7
30
86,2
56,2
И
90,3
40,3
19
105,1
55,1
41
116,5
66,5
51,7
31
170,5
70,5
67
184,5
84,5
^
10
19
151,7
О б о з н а ч е н и я : К — затраты, связанные с оформлением дополнительного заказа; с —цена одной детали, приобретаемой у поставщика; у —цена одной детали, оказавшейся в избытке; р—вероятность обнаружения одной неисправной детали; п — требуемое количество деталей. Р и с . 17.3. Задача фирмы «Вольтекс» (определение оптимального размера партии).
106
ГЛАВА 17
с = 10,
1>=0,
р = 1/2
сительно поведения х (п) в зависимости от значений п та К при р = 1/2 К приведена в таблице на рис. 17.4. Если размер заказанной партии п 50 500 5000 50000 равняется х, то ожидаемое количество деталей, пригодных для использова9 1 3 6 13 ния, равняется (1 — р) х. Следователь9 13 17 2 6 но, при х — п/(1 — р) ожидаемое коли16 20 3 8 12 чество исправных деталей совпадает с 17 5 12 22 27 требуемым количеством п. В рассмат30 36 41 10 23 риваемом примере значение х (п) всегда превосходит х. Значения разности (Обозначения см. на рис. 17.3.) х (п) — х, т.е. своего рода гарантийной доли партии, приведены в таблиР и с . 17.4. Оптимальный размер партии х (п) (задача фир- це на рис. 17.5. Заметим, что разность мы «Вольтекс»). х (п) — х с увеличением п возрастает; однако отношение этой разности к х с ростом п убывает. (Читатель должен объяснить, почему такое поведение х(п) — х и (х (п)— х)1х выглядит вполне правдоподобным.)
с = ю,
v=Q
l
p =U К
50
1000
P = V2
Р = 3 /4
п
х
1
1,33
0,66
2
1
4
4
5
6,66
1,33
10
2
20
6
10
13,33
1,66
20
3
40
6
1
1,33
2,66
2
5
4
13
5
6,66
4,33
10
9
20
21
10
13,33
5,66
20
11
40
27
х(п)-х
х
х(п) —х
X
х (п) — х
Обозначения: остальные обозначения см. на рис. 17.3. Р и с . 17.5. Гарантийная часть партии при оптимальном заказе (задача фирмы «Вольтекс»).
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Ю7
Один из способов оценить экономические последствия неопределенности основываются на сравнении значений / (п) и сп (минимальные затраты фирмы «Вольтекс» в случае приобретения п исправных деталей). Разность / (п) — сп можно интерпретировать как максимум того, что готова была бы заплатить фирма «Вольтекс» за гарантию поставщика поставлять только исправные детали. Значения I/ (п) — сп] для рассматриваемой задачи приведены в таблице на рис. 17.3. Заметим, что указанная разность увеличивается с ростом п, К и р, но нетрудно убедиться, что отношение [/ (п) — сп]/п с ростом п убывает. (Читатель должен объяснить, почему указанное выше поведение / (п) — сп и [/ (п) — сп]/п можно считать вполне пр авдоподо бным.) 17.6.
З А Д А Ч А СОСТАВЛЕНИЯ КОММЕРЧЕСКОГО ПРОГНОЗА
До сих пор рассматривались примеры, в которых фигурировала одномерная переменная, характеризующая состояние, а случайные величины были полностью независимыми. С помощью примера, приведенного ниже, мы проиллюстрируем метод введения в модель взаимно коррелированных случайных величин за счет увеличения размерности переменной, описывающей состояние системы. Рассмотрим следующую упрощенную модель реальной ситуации. В течение первых N недель сезона фирма «Паутинка», специализирующаяся на производстве женских свитеров, имеет возможность в определенной степени регулировать объем каждого вида выпускаемой ею продукции. Фирма, изготовляющая модную одежду для определенного сезона, как и многие другие фирмы, занятые производством продукции, спрос на которую нерегулярен, не может с полной уверенностью прогнозировать суммарный объем заказов, которые она получит на тот или иной вид изделия. Пока персонал фирмы, занятый розничной торговлей упомянутыми выше товарами, подводит итоги за прошедшие N недель, от покупателей непрерывно поступают новые заявки. Производственные затраты включают в себя не только стоимость рабочей силы и стоимость используемых материалов, но и расходы на регулирование уровня производства на предприятиях. Последние возникают из-за остановок при переналадке, связанной с существенным изменением мощностей поточных линий; особенно дорого обходится увеличение объема выпускаемой продукции в самом разгаре сезона. Если фирма «Паутинка» установит слишком высокий суммарный объем для того или иного вида изделия, то часть соответствующей продукции останется не реализованной до конца сезона и фирма будет вынуждена распродать излишки по сниженным ценам и, таким образом, потерпит убытки. Если же фирма «Паутинка» запланирует слишком незначительные объемы производства, она может упустить потенциальную возможность увеличить свой доход. В то же время фирма будет нести убытки, если она будет корректи-
108
ГЛАВА 17
ровать календарный план выпуска продукции слишком поспешно, полагаясь на уточненную информацию относительно суммарного количества заказов, поступающих в течение каждой недели. Кроме того, варьировать уровень производства можно лишь в определенных границах, зависящих от уровня производства в предшествующий период, а также и от того, сколько еще недель осталось до конца данного сезона. Фирма производит свою сезонную продукцию с опережением на несколько месяцев до начала этого сезона. Так, например, фирма «Паутинка» выпускает осенние модели в начале года. Скорее всего фирма завершает выпуск продукции до того, как начинается розничная продажа этой продукции, и коммерческий доход определяется лишь тем суммарным количеством заказов, которое фирма может удовлетворить к моменту прекращения выпуска данной продукции. Следовательно, задача календарного планирования производства фирмой «Паутинка» содержит элемент существенной неопределенности. Если бы руководство фирмы могло точно знать суммарное количество заказов, фирма производила бы продукцию в одном и том же темпе в течение всего планового периода. Задачу составления календарного плана на каждое изделие можно описать с помощью оптимизационной модели. Пусть Dt есть общее число поступивших заказов на определенное изделие к началу t-& недели. Поскольку наряду с новыми заказами часть заказов аннулируется, не исключено, что Dt+l окажется меньшим по сравнению с Dt. Допустим, что Dt+i зависит только от Dt и не зависит ни от количества заказов в предыдущие периоды, ни от объемов производства. Введем следующие обозначения: pt (D | d) — условная вероятность того, что общее число поступивших заказов Di+i = Z), если Dt = d для £ = 1 , 2 , . . . . . . ) •
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
109
Здесь предполагается, что г и s определены с учетом стоимости использованной рабочей силы, а также стоимости израсходованных материалов, причем постулируется, что s < 0. Обозначим через Lt (х) и Ut (х) соответственно нижний и верхний пределы переменной X, описывающей множество допустимых значений для уровня выпуска продукции в t-ю неделю при условии, если уровень выпуска, запланированный на (t — 1)-к> неделю, равняется х. Правило принятия решения в данном случае формирует стратегию, позволяющую определить текущий уровень выпуска X при заданных значениях х и Dt. Пусть оптимальной является стратегия, максимизирующая математическое ожидание дохода. Такая стратегия может быть определена путем решения рекуррентного уравнения it (x, d) = maximum
(x)
[ — ct (X \ х) -\-
(X, D)Pl(D\Q},
D
t = N-i,...,l (1)
при N
fN(z,d)=
maximum
)
{ 2 [rD + s(X — D)] 'pN (D\ d) + D=0
(D\d)-cN(X\x)},
PN
(2)
где неравенство D > X под знаком суммы в (2) означает, что суммирование производится по всем возможным значениям переменной, определяющей общее число заказов, поступающих к концу сезона, a D под знаком суммы в (1) означает, что суммирование проводится по всем возможным значениям Dt+i. Величина /4 (X*, D*) представляет собой максимальный ожидаемый доход в предположении, что до рассматриваемого планового периода уровень производства равнялся X*, а к началу первой недели планового периода поступило D* заказов. Заметим, что в (2) переменная состояния двумерна: один из ее компонентов характеризует предыдущее управляющее решение, тогда как другой компонент показывает, каким оказалось фактическое значение случайной величины. Чтобы убедиться в правильности понимания соотношений (1) и (2), дайте определение fN (x, d) и / г (х, d). Объясните, почему в правой части (2) фигурирует сумма ожидаемых значений дохода при различных соотношениях между объемами выпускаемой продукции и заказов (с учетом затрат, связанных с изменением уровня выпуска.) Убедитесь, что в данной модели действительно используется коммерческий прогноз. Покажите, как изменились бы соотношения (1) и (2), если бы Dt+i зависело не только от Dt, но и от Dt_t.
НО
ГЛАВА 17
17.7. СТОХАСТИЧЕСКАЯ МОДЕЛЬ! ВОССТАНОВЛЕНИЯ (ЗАДАЧА ЗАМЕНЫ ОБОРУДОВАНИЯ)
В заключение приведем пример, с помощью которого попытаемся проанализировать задачу оптимизации управляющих решений как при ограниченном, так и при неограниченном плановом периоде. Прежде чем приступить к изучению излагаемого ниже материала, читатель должен внимательно просмотреть разд. 11.4, поскольку мы опираемся на результаты выполненного ранее анализа, не повторяя использованной схемы рассуждений. В разд. 11.4 рассматривалась следующая детерминистическая задача: всякий раз, когда наступает момент принятия решения относительно восстановления, руководитель должен выбрать один из N возможных вариантов, каждый из которых снабжен индексом k (k = 1, 2, . . ., N). Если на временном отрезке t выбор падает на вариант k, то очередное восстановление производится на отрезке t + k. Пусть RK — затраты при варианте k, оценка которых в начале периода восстановления.
произведена (1)
Тогда в задаче с ограниченным плановым периодом положим /п — приведенное значение затрат при оптимальной стратегии восстановления, в которой один из альтернативных вариантов должен быть выбран за п отрезков до конца планового периода. (2) При этом должно удовлетворяться следующее рекуррентное соотношение:
/„=
min
k=l, 2,. . ., N
[ahfn-h + Rk],
/о=0, 0<а<1,
(3)
где п ^ N. (При п <. N минимизация осуществляется над множеством значений k = 1, 2, . . ., п.) В задаче с неограниченным плановым периодом соответствующее предельное соотношение имеет вид
/=
r
min
h=l, 2,. ... N
[ a / + -Rft]>
0
(4)
откуда получаем / = minimum Г
k
^
(приведенное значение).
_
(5)
Если ввести в рассмотрение эквивалентный усредненный показатель 8=
a
. a ^
'
(6)
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Щ
то из (5) получим g = minimum —~h=i,2,...,NL J
для а — 1 (усредненный доход расчете на один отрезок планового периода)
в
(?)
Замена оборудования. Важным частным случаем модели восстановления является модель замены оборудования. В детерминистическом варианте этой задачи с индексом k связана продолжительность времени, в течение которого то или иное устройство (деталь, прибор и т. д.) функционирует нормально, т. е. остается пригодным для эксплуатации. В стохастическом варианте задачи восстановления допускается, что устройство может выйти из строя (например, в результате поломки) еще до запланированного момента замены, т. е. до наступления отрезка t -\- k. Другими словами, если на отрезке t планируется замена устройств, прослуживших срок k, а устройство выходит из строя на отрезке t + / (/ < k), то этим предполагается, что замена оборудования должна состояться на отрезке t + / + 1. Введем следующие обозначения: k — отрезок времени, на котором планируется произвести замену оборудования; Pi — вероятность того, что первая поломка оборудования произойдет в течение /-го отрезка использования; Г; — стоимость эксплуатации оборудования в течение /-го отрезка, если это устройство останется исправным; (rj + si) — стоимость эксплуатации оборудования, если поломка произойдет в течение /-го отрезка (/ < /с, Sj > 0). При этом 2 PJ = 1, a TI включает первоначальную стоимость устройства (для простоты предположим, что вышедшее из строя оборудование полностью обесценивается). Величину s7- можно рассматривать как ущерб, обусловленный преждевременной поломкой оборудования. Предположим, что оптимальной является стратегия, минимизирующая математическое ожидание дисконтированных затрат. Если наступил отрезок восстановления и решение, связанное с планированием замены оборудования, состоит в выборе k-то варианта, то в состав ожидаемых дисконтированных затрат входят все перечисленные ниже компоненты. Во-первых, необходимо учесть средние дисконтированные затраты в очередной и во все последующие моменты восстановления в случае, если оборудование выйдет из строя раньше запланированного отрезка времени. Во-вторых, следует учесть средние дисконтированные затраты в очередной и во все последующие моменты восстановления в случае, если оборудование не выйдет из строя до запланированного периода восстановления. Наконец, нужно добавить ожидаемые эксплуатационные затраты в период между текущим и очередным моментами восстановления. Следовательно, в случае ограниченного планового периода в ре-
112
ГЛАВА 17
зультате надлежащего обобщения соотношения (3) для п ^ N и 0 ^ а =£С 1 получаем fc-i _ ь-1 /„= minimum [Д! ocj'/n-jp;- + a ft /n-ft (1— S Р;) + ^й1, /o = 0, (8) причем теперь
ft-i fe-i ... + a -1Гй (l — 2j Pj) + S &3~1Sjpj.
(9)
Здесь, как и в последующих формулах, для k = 1 знак суммирования, естественно, опускается. (Как и ранее, при п < N минимизация в (8) осуществляется над множеством значений k = 1, 2, . . . . . ., п.) Читатель должен убедиться, что при р, = 0 (/ = 1, 2, . . . . . ., TV) формула (8) принимает вид (3). Заметим также, что в (9) Rk зависит от а, что при используемых нами обозначениях не получило соответствующего отражения из-за упрощенной записи. Неограниченный плановый период. В случае планового периода бесконечной протяженности в соотношении (8) все индексы при / следует опустить. При этом стохастический аналог формулы (4) запишется в следующем виде: / = minimum (E [aj I k] f + Rk) при 0<а<1, (10) где
h=l, 2
h-l
.
N
fe-1
E[a,i\k]= 2 ^Pj-^v*
( l — 2 Pi) (среднее значение коэффи- (11) :i=1 ^=1 циента дисконтирования), a Rh определяется с помощью (9). По аналогии с (5) соотношение (10) можно переписать в виде /= minimum ( _ „ ka.. ) fe=i,2,...,N ~~ l I J /
при 0-<а<;1 (математическое (12) ожидание дисконтированного значения) Здесь / представляет собой математическое ожидание дисконтированных затрат при неограниченном плановом периоде в случае, когда реализуется оптимальная стратегия. В соотношениях (10) и (12) априорно допускается, что оптимальной является стационарная стратегия (каждый раз, когда производится закупка нового оборудования, в качестве планируемого отрезка замены всегда выбирается А-й). Правомерность такого предположения может быть доказана строго (фактически это вытекает из теоремы о стационарной стратегии, приводимой в разд. 18.3). Таким образом, после того как оказываются вычисленными [по формуле (11)] математические ожидания коэффициентов дисконтирования, поиск оптимального решения с помощью (12) становится не сложнее оптимизационного процесса, основанного на использовании (5).
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
ИЗ
В случае когда а = 1, в формуле (12) необходимо перейти к эквивалентному усредненному показателю g = (1 — а) /, после чего упомянутое соотношение принимает вид g = minimum
(13)
h=l, 2 ..... N
откуда, как легко убедиться, следует g— minimum ( „ .h. h=i,2,...,N иI
)
(ожидаемые затраты за один отрезок планового периода),
где Rh вычисляется с помощью (9) при а = 1, а ь-1 fe-i — S P}) (среднее значение сроков E\i k] — 2 '=1 замены оборудования).
(14)
(15)
Заметим, что (15) определяет ожидаемое число отрезков использования каждого устройства (компонента оборудования) при заданном планируемом сроке замены k. Следовательно, в формуле (14) k
Ph
a
1
i /4
100
2 3 4 5
0 i/ 4 0 Oa)
2
6 /3
20 20 56
*
*
20 Oa) 180 a O ) a O )
100 110 125 180 208
E [j | A]
1 3
1 /4 21/2
3 Si/2
Лй
E [j \ k]
100 62^/7
50 60 593/7
a ) Вариант k = 3 остается оптимальным даже в том случае, когда указанные показатели принимают положительные значения.
Р и с . 17.6. Пример стохастической оборудования.
модели замены
величину g можно интерпретировать как минимальное значение отношения ожидаемых затрат в течение интервала времени между двумя последовательными моментами замены к математическому ожиданию длины этого интервала. Грубо говоря, g представляет собой минимальные ожидаемые затраты за один отрезок при неограниченном плановом периоде. При этом также можно доказать, что выбор стационарной стратегии в связи с поиском оптимального варианта является вполне обоснованным. Случай, когда а = 1, иллюстрируется таблицей, представленной на рис. 17.6. Из таблицы видно, насколько дорого обходятся опшбки при неправильном учете фактора неопределенности. Так, например, можно показать, что если бы использовался ошибочный критерий
114
ГЛАВА 17
Rklk, то решение заключалось бы в выборе k = 5, а если бы в каh
честве критерия мы взяли 2 (Г//&), то пришли бы к решению k = 4. 3=1
В этих случаях ожидаемые затраты за один период превышали бы оптимальное значение почти на 20%. Корректность математических выкладок, с помощью которых соотношения (14) и (15) получаются из (13) при а-»-1, удается доказать весьма простым способом. Например, можно в (13) подставить е = 1 — а, произвести разложение знаменателя по формуле бинома и затем устремить е к нулю. Еще проще воспользоваться правилом Лопиталя. [Читателю предлагается применить упомянутые методы для проверки соотношений (14) и (15).] Однако строгое доказательство того, что g можно интерпретировать как ожидаемые затраты в расчете на один отрезок неограниченного планового периода при стратегии, определяемой соотношением (14), является нетривиальным. Причина возникающих при этом трудностей заключается в том, что существует несколько способов определения самого понятия «ожидаемые затраты за один отрезок при неограниченном плановом периоде». Можно, например, определить эту величину как предел отношения ожидаемых затрат за п отрезков к п при п —>• оо. Другой способ заключается в том, чтобы положить определяемую величину равной пределу отношения ожидаемых затрат в течение Т отрезков восстановления к полному числу отрезков рассматриваемого планового периода при Т —>- оо. При этом возникают следующие вопросы: существуют ли упомянутые выше пределы и если эти пределы существуют, то совпадают ли они? Можно доказать, что ответ как на первый, так и на второй вопрос положителен (при условии если соответствующие Rh являются конечными). •? 17.8. ВОПРОСЫ ПРИМЕНИМОСТИ И ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ МЕТОДОВ ВЕРОЯТНОСТНОГО ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Читатель найдет полезным еще раз просмотреть приведенные в разд. 10.9 и 10.10 краткие выводы относительно динамического программирования, поскольку эти выводы остаются в такой же степени справедливыми и в случае, когда модель содержит элементы стохастического характера. Кратко отметим, что наиболее важные приложения моделей упомянутого класса относятся к задачам специфического характера, связанных, например, с поиском оптимальной стратегии пополнения запасов, с минимизацией эксплуатационных затрат и стоимости замены оборудования, с определением наиболее рациональной дисциплины очереди в пунктах массового обслуживания и т. д. (В главах, следующих за гл. 18, основное внимание будет уделяться более глубокому анализу такого рода задач, а также
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Ц5
по возможности вопросам построения специальных методов их решения, основанных на использовании структурных особенностей рассматриваемых явлений.) В то время как для задач, решаемых с помощью линейного программирования, созданы широко распространенные универсальные машинные программы, для решения задач динамического программирования, вообще говоря, таких программ не существует. Это, однако, не является серьезным препятствием при использовании конкретного метода решения, так как вычислительные формулы, используемые в каждой конкретной модели, после некоторой модификации достаточно легко отображаются машинными программами, позволяющими решать задачу с помощью ЭВМ. С помощью более совершенных аналитических методов удается решать стохастические задачи динамического программирования при менее жестких предположениях по сравнению с теми, которые принимались нами в данной главе. Так, например, в ряде случаев появляется возможность анализировать задачи организационного управления, в которых время рассматривается как непрерывный параметр, а состояние системы и управляющие решения могут быть как дискретными, так и непрерывными. Следует отметить, что многие из такого рода моделей можно получить путем непосредственного обобщения моделей, рассмотренных в настоящей главе. Однако эта цель здесь нами не преследуется. В гл. 18 анализируются модели, в которых временной период не ограничен. Мы не стремимся здесь охватить весь широкий круг разнообразных специфических моделей и ведем изложение применительно к задачам сетевой структуры. Поэтому рассматриваемые нами методы анализа во многих отношениях напоминают методы, изложенные в гл. 12. Чаще всего лам придется ссылаться на теоремы об оптимальности стационарных стратегий, которые играют исключительно важную роль при решении задач, рассматриваемых в гл. 18. При анализе любой модели частного вида, содержащей предположения, идентичные тем, которые обсуждаются в этой главе, можно без ущерба для оптимальности ограничить поиск классом стационарных стратегий. В гл. 18 изложен также метод получения численных решений для сетевых моделей стохастического характера. Однако, как уже отмечалось ранее, метод в его обобщенной формулировке всегда можно усовершенствовать с учетом структурных особенностей каждой конкретной модели. Вопросам разработки специальных приемов решения оптимизационных задач посвящена гл. 19, а также ряд следующих за ней глав. КОНТРОЛЬНЫЕ У П Р А Ж Н Е Н И Я
1. Рассмотрим модель распределения усилий (разд. 17.2). Предположим, что уровень спроса в /-м магазине характеризуется следующим распределением вероятностей: р} (d) = 1/5 для d = О, 1, . . .
ГЛАВА 17
, . ., 4. В каждом из приведенных ниже случаев требуется вычислить математическое ожидание прибыли R}- (ys — О, 1, . . ., 5), заданной формулой (10), с учетом конкретного вида функции прибыли г,- (d | у) [см. определение (7) в разд. 17.2]:
a) б) в)
10d
при
iOd
при
10d
при d<.y, при
г)
при Ш-4 Сформулируйте условия задачи, при которых функция прибыли будет иметь вид, указанный в пп. б) и г ) . (Указание: рассмотрите такую ситуацию, когда покупатель предпочитает яйца другого сорта, а также случай, когда магазином принимаются меры по ускорению дополнительных поставок яиц с целью полного удовлетворения спроса.) 2. Выполните сформулированные выше упражнения, предположив, что распределение для уровня спроса имеет вид d
= °- !. ••"4;
а)
М<*)=^Г.
б)
P i ( d } = ~,
г)
Р;(0) = Р;(4) = ~,
d = 0, I, . . . , 4 ;
РП1) = Р;(3)=~,
рИ2)=п-
3. Задача фирмы «Свежие продукты» (разд. 17.2). Предположим, что уровни спроса в s магазинах взаимно коррелировали. В частности, допустим, что могут иметь место Q различных комбинаций (/?!, D2, • • •. ^ s )> характеризующих уровни спроса в магазинах 1, 2, . . ., s, а через pq обозначим вероятность того, что реализуется д-я комбинация. Покажите, как можно определить экономический jeec (цену) неопределенности. (Другими словами, сформулируйте
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
117
способ вычисления максимальной денежной суммы, которую было' бы целесообразно заплатить за точный прогноз уровней спроса до того, как выбраны объемы поставок яиц в каждый из s магазинов.) 4. Задача фирмы «Комфорт» (разд. 17.3). Предположим, что дерево решений на рис. 17.1 снабжено следующими показателями: hi = 40, gi = 50, п = 60, pi = 1/5, hz = 60,
gz = 70, r 2 = 100,
h3 = 70, ga = 80,
P2
= 1/2,
Рз
= 1.
а) Вычислите / 3 , / 2 , /i и укажите оптимальную стратегию. б) Постройте распределение вероятностей для процесса принятия решений, завершающегося на отрезке t (t = 1, 2, 3). в) Объясните, почему математическое ожидание прибыли по состоянию на начало отрезка 1 отличается от соответствующего показателя по состоянию на начало отрезка 2 при условии, что процесс формирования решения не ограничивается первым отрезком. г) Каково наибольшее значение г4, при котором решение, принятое на отрезке 1, все еще является оптимальным? Аналогично требуется произвести оценки наименьших значений /г4 и г2, при которых решение, принятое на отрезке 1, продолжает оставаться оптимальным. д) Пусть процесс формирования решения не ограничивается первым периодом. Каково наименьшее значение г а , при котором решение,, принятое на отрезке 2, продолжает оставаться оптимальным? Аналогично требуется произвести оценки наибольших значений /г 2 и g3r при которых решение, принятое на отрезке 2, все еще является оптимальным. е) Каково наибольшее значение р 4 , при котором решение, принятое на отрезке 1, все еще остается оптимальным? Аналогичную оценку требуется произвести для р 2 ж) Пусть процесс формирования решения не ограничивается первым отрезком, Каково наименьшее значение р а , при котором решение, принятое на отрезке 2, продолжает оставаться оптимальным? з) Предположите, что pt представляют собой точные значения вероятностей поведения конкурирующих фирм, но президент фирмы «Комфорт» имеет возможность до момента принятия решения приобрести за соответствующую плату точную информацию относительно намерений конкурентов объявить о выпуске новой установки для кондиционирования воздуха. Если процесс формирования решения не ограничивается первым отрезком, президент фирмы «Комфорт» может аналогичным образом приобрести информацию о намерениях своих конкурентов, касающихся отрезка 2, и т. д. Насколько ценна такого рода информация? (Сколько стоит за нее платить?) 5. Задача фирмы «Комфорт» (разд. 17.3). Покажите, что численное значение фигурирующей в (2) величины / 4 можно найти методом линейного программирования. (Запишите все ограничения для t — = 1, 2, . . ., Т та сформулируйте все решения; выпишите в явном
118
ГЛАВА 17
виде целевую функцию.) Дайте детальное представление модели для случая Т = 3. Сформулируйте двойственную задачу и дайте истолкование фигурирующих в ней переменных и ограничений. (Указание: в качестве переменных двойственной задачи можно рассматривать вероятности случайных величин.) Упражнения 6—12 связаны непосредственно с разд. 17.4, в котором дается описание стохастической модели управления запасами. 6. а) Дайте подробное обоснование ограничений (7) и (8). б) Объясните, почему оптимальный уровень производства х при п = 1 равняется 4 — i. в) Дайте подробное обоснование адекватности каждого члена в выражении (10), следующего за первым знаком равенства. г) Предположите, что функция затрат, связанных с хранением запасов, имеет вид h (i -4- х — D)2 при i + х > D и тождественно равна нулю во всех остальных случаях. Как при этом изменится формула (10)? д) Проверьте, правильно ли вычислены показатели в таблице на рис. 17.2 для п = 2 и п = 3. е) Предположите, что до конца планового периода остается три отрезка, а уровень запасов на начало отрезка равняется 1. Каково распределение вероятностей для оптимального уровня производства на последующем отрезке? в конце планового периода? 7. Пусть распределение вероятностей для уровня спроса имеет следующий вид: P[D = '[] =1/3 и Р [.0 = 4] = 2 / 3 . а) Запишите для этого случая рекуррентное соотношение, аналогичное (10). б) Вычислите fn (О и хп (i) (т. е. показатели, аналогичные приведенным в таблице на рис. 17.2) при ге = 1, гс = 2 и я = 3. 8. Пусть уровень спроса задан распределением P[D = d] = 1/3 при d = 2, 3, 4. а) Запишите для этого случая рекуррентное соотношение, аналогичное (10). б) Вычислите in (0 и хп (i) (т. е. показатели, аналогичные тем, которые приведены в таблице на рис. 17.2) для ге = 1,га = 2 и г е = 3. 9. Объясните, почему оптимальная стратегия формируется значительно быстрее в рамках стохастической модели (при п — 3), чем в рамках детерминистической модели (при п = 18). 10. Отбросим предположение о недопустимости истощения запасов, т. е. снимем ограничение (7). Всякий раз, когда уровень спроса превышает сумму уровней запасов на начало отрезка и производства, избыточный спрос аннулируется. Вместе с тем допустим, что за счет каждой единицы удовлетворенного спроса фирма получает доход в размере г. Обозначим через р (q) вероятность того, что уровень спроса окажется равным д, где q — 0, 1, 2, . . . . Покажите, как при этом изменится рекуррентное соотношение (10). (Указание: задача заключается в максимизации ожидаемой прибыли.)
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Ц9
И. а) Предположим, что минимизируемый критерий представляет собой математическое ожидание дисконтированных затрат, причем коэффициент приведения в расчете на один отрезок равняется а (О ^ ос •< 1). Покажите, как изменится при этом рекуррентное соотношение (10). б) Предположим, что существует вероятность q (0 ^ q ^ 1) того, что на любом из рассматриваемых отрезков обнаруживается отсутствие спроса на всех последующих отрезках. Другими словами, q представляет собой вероятность ограничения планового периода текущим отрезком времени. Если, однако, на следующем по порядку отрезке спрос отличен от нуля, то q есть вероятность того, что плановый период «оборвется» на данном отрезке, и т. д. Покажите, как изменится при этом рекуррентное соотношение (10). 12. Предположим, что фирма имеет возможность получить точный прогноз спроса для каждого из отрезков планового периода. Другими словами, допустим, что фирме удается узнать фактический уровень спроса до того, как принимается решение относительно объема производства х. Это значение, разумеется, меняется при переходе от одного отрезка к последующему в соответствии с распределением вероятностей (6). а) Постройте рекуррентное соотношение динамического программирования, с помощью которого находится оптимальная стратегия. (Указание: в качестве переменной, характеризующей состояние системы, можно взять разность между уровнем запасов в начале отрезка и текущим уровнем спроса.) б) Найдите оптимальную стратегию для п = 1, 2, 3, 4. в) Какова максимальная сумма, которую целесообразно заплатить за точный прогноз относительно спроса, если плановый период включает п отрезков (п — 1, 2, 3)? Предполагается, что уровень запасов на начало планового периода равен нулю. 13. Задача фирмы «Вольтекс» (разд. 17.5). а) Дайте определение каждого члена рекуррентного соотношения (1). б) Дайте развернутое математическое обоснование корректности преобразования (1) в (2). в) Рассмотрите данные, приведенные в таблице на рис. 17.3. Предположите, что фирме требуется три детали, причем К = 50, а р = 1/4. Дайте подробное описание оптимальной стратегии. Чему равно максимальное количество деталей, которое можно заказать? Возможен ли неоднократный заказ в объеме, который равняется трем деталям? г) Чему равняется средний объем заказа при условиях, сформулированных в п. в)? д) Как изменится характер ответов на вопросы, сформулированные в п. в), если р = 1/2? 14. Задача фирмы «Вольтекс» (разд. 17.5). Рассмотрите стратегии, представленные таблицей на рис. 17.3. Требуется проверить, пра-
120
ГЛАВА 17
вильно ли вычислены значения х (п) и / (п) для следующих значений К, п и р: а) К = 50, я = 1, 2, 3, р = 1/4; б) # = 50, п = 1, р = 1/2; в) Я = 1000, га = 1, р = 1/4. 15. Задача фирмы «Вольтекс» (разд. 17.5). Предположим, что цена детали, оказавшейся в избытке, v > 0. Как это отразится на значениях х (п) и / (п), приведенных в таблице на рис. 17.3? Подтвердите ваши интуитивные соображения относительно экономических последствий указанного выше фактора, положив v — 5, К = = 50, р = 1/4 и вычислив для данного случая х (п) и / (п) при п =? = 1, 2, 3. 16. Задача фирмы «Вольтекс» (разд. 17.5). а) Рассмотрим таблицу на рис. 17.5. Исходя из здравого смысла, объясните, почему отношение гарантийной части партии деталей к х = n/(i — р) убывает с ростом п. б) Исходя из здравого смысла, объясните, почему отношение [/ (п) — спМп убывает с ростом п (численные значения выражения, взятого в квадратные скобки, приведены в таблице на рис. 17.3). 17. Рассмотрим модель, оптимизирующую размер партии (разд. 17.5). Пусть требуется N исправных деталей. Покажите, каким образом находится численное значение / (N) методом линейного программирования. (Запишите все ограничения для п — 1, 2, . . ., N и для каждого х. Примите допущение, что в случае, когда требуется п деталей, х имеет верхнее предельное значение хп.) Приведите подробную запись всех элементов модели при N = 3, Х 4 = 3, Х 2 = 4, Х3 = 5. Сформулируйте также соответствующую двойственную задачу и интерпретируйте фигурирующие в ней переменные и ограничения. (Указание', переменные двойственной задачи можно рассматривать как вероятности, ассоциированные со случайными величинами исходной задачи.) 18. Задача фирмы «Паутинка» (разд. 17.6). а) Поясните физический смысл каждого слагаемого в рекуррентных соотношениях (1) и (2). (В частности, объясните, почему в этих соотношениях фигурируют затраты, связанные с использованием рабочей силы и материалов, а также издержки, связанные с регулированием уровня выпуска изделий. Объясните, как учитываются в рассматриваемой модели убытки в случае продажи товаров по сниженным ценам, а также покажите, каким образом принимается во внимание возможный экономический ущерб в том случае, когда уровень производства оказывается слишком низким.) Дайте определение f N (х, d) и / ( (х, d). б) Объясните, какие факторы влияют на нижний и верхний пределы Lt (х) и Ut (х). (Поясните, почему предельные значения указанных величин, как правило, зависят от запланированного на предыдущей неделе значения х, а также от порядкового номера рассма-
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
121
триваемой недели.) Укажите также, какие факторы влияют на нижний и верхний пределы функции затрат ct (X \ х). в) Покажите, к каким правилам принятия управляющих решений мы приходим, основываясь на рекуррентных соотношениях рассматриваемой модели. Можно ли в результате анализа модели определить, каким должен быть уровень выпуска в течение каждой недели планового периода? Если ответ окажется отрицательным, предложите метод определения недельного уровня выпуска в рамках данной модели. г) Как изменится структура (1) и (2), если Dt+i зависит как от Z>t, так и от Dt-i? (Всем новым обозначениям необходимо дать определение.) д) Предположим, что s> 0. Сказывается ли это на рекуррентном соотношении (1) и на выборе оптимальной стратегии? В случае положительного ответа дайте надлежащее обоснование. е) Многие фирмы, аналогичные фирме «Паутинка», пользуются методом прогноза спроса, основанным на экстраполяции статистических данных. Можно ли считать, что информация, которую содержат в себе распределения вероятностей pN (D \ d) и pt (D \ d), и есть прогноз спроса? Дайте необходимые объяснения. Почему считают, что pt (D | d) и pN (D | d) должны зависеть как от общего количества заказов, поступивших к i-й недели, так и от порядкового номера № Упражнения 19—25 относятся к стохастической задаче замены оборудования, приведенной в разд. 17.7. 19. Рассмотрим задачу с ограниченным плановым периодом. а) Объясните происхождение каждого члена в рекуррентном соотношении (8). б) Выведите формулу (9) для Rk. (Начните с рассмотрения концептуальной схемы, базирующейся на предположении, что используемое оборудование может выйти из строя в любой интервал времени i = 1, 2, . . ., k либо сохранится в исправном состоянии в течение всего запланированного периода восстановления.) 20. Рассмотрим задачу с ограниченным плановым периодом. Пусть продолжительность периода равняется 6, а ./V = 3. Покажите, каким образом /8 может быть также определено методом линейного программирования. Сформулируйте двойственную задачу и интерпретируйте фигурирующие в ней переменные и ограничения. 21. Рассмотрим задачу с ограниченным плановым периодом. а) Выполните алгебраические действия, с помощью которых можно было бы убедиться, что если в (8) опустить индексы при /, то в результате получим соотношение (10). б) Почему в выражение (11) входит математическое ожидание коэффициента дисконтирования^ Раскройте содержание данной формулы. Ответьте на аналогичные вопросы, обратившись к выражению (15).
122
ГЛАВА 17
в) Покажите, что соотношения (14) и (15) получаются из (13) в результате предельного перехода а —>- 1. 22. а) Проверьте, правильно ли вычислены значения показателей, фигурирующих в таблице на рис. 17.6. б) Объясните, почему стратегия k = 3 остается оптимальной даже в том случае, когда элементы, обозначенные через 0 а, принимают положительные значения. 23. Рассмотрим пример, представленный таблицей на рис. 17.6 при а = 1. Пусть плановый период ограничен, причем N = 5. а) Используя рекуррентное соотношение (8), найдите оптимальную стратегию для « = 1 , 2 , . . ., 6. б) Проделайте то же самое, положив а = 1/2. 24. а) Предположим, что имеется вероятность q (О ^ д ^ 1) того, что необходимости в замене оборудования более не возникнет (так как оно более не понадобится). Покажите, какой вид примет модель в случае ограниченного и в случае неограниченного плановых периодов. б) Пусть потребность в оборудовании наблюдается на каждом отрезке t. Предположим, что имеется вероятность q (О ^ q ^ 1) того, что на любом последующем отрезке это оборудование не потребуется. Покажите, какой вид примет модель в случае ограниченного и в случае неограниченного плановых периодов. 25. Пусть при закупке нового оборудования считается установленным, что вероятность его поломки в течение /-го отрезка по-прежнему равняется PJ, однако точно известно, на каком именно отрезке произойдет поломка. Таким образом, можно принять решение об исключении замены данного оборудования в течение срока, равного от 1 до ] отрезков. а) Постройте рекуррентное соотношение динамического программирования для задач с ограниченным плановым периодом. б) Постройте рекуррентное соотношение динамического программирования для задачи с неограниченным плановым периодом и обсудите метод нахождения оптимальной стратегии. (Пусть коэффициент дисконтирования удовлетворяет условию 0 ^ а < 1.) в) Примените рекуррентное соотношение, полученное в п. а) для анализа задачи, представленной таблицей на рис. 17.6, положив а, = 1. Л" = 5. Найдите оптимальную стратегию для п = 1, 2, . . . . . . . 6. г) Выполните упражнение в), положив а = 1/2. 26. Объясните, как вы понимаете следующие термины: правила принятия управляющих решений; дерево решений; обратная индукция; характеристика решения; гарантийная доля партии (в задаче определения оптимального объема партии).
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
123
УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ
В приведенных ниже упражнениях требуется построить модели в виде рекуррентных соотношений динамического программирования. Все используемые обозначения подлежат исчерпывающему определению. Требуется также привести необходимое выражение оптимизационной функции на этапе, когда до конца планового периода остается один отрезок (шаг). Объясните, с чего начинаются вычисления и когда они заканчиваются. 27. Фирма «Редкие самоцветы» составляет годовой финансовый план на работы, связанные с геологическим поиском месторождений редких минералов. Для поиска фирма располагает N районами, где вероятно обнаружение месторождений этих минералов. По оценке президента фирмы (он же является главным геологом) при затратах в dj долл. на поисковые работы в районе / вероятность обнаружения там ценных минералов равняется PJ (dj). При этом в случае успешного завершения поиска суммарная стоимость месторождения (т. е. доход, который можно получить в результате его эксплуатации) равняется Vj, причем V] — случайная величина, характеризуемая распределением вероятностей q} (Vj). Постройте модель динамического программирования для определения финансового плана на геологические работы, связанные с поиском редких минералов; при этом исходите из того, что суммарные затраты не должны превышать D долл., а максимизации подлежит среднее значение суммарного дохода, получаемого за счет эксплуатации обнаруженных месторождений. 28. Задача фирмы «Вечный двигатель» (разд. 10.3). В первоначальной формулировке задачи требовалось максимизировать чистый доход за счет организации радиорекламы выпускаемых фирмой автомобилей. Пусть теперь преследуется другая цель, а именно предположим, что фирма стремится в основном к тому, чтобы реклама дошла до покупателя определенного типа. По оценкам фирмы дневные передачи рекламы, проводимой радиостанцией ;', достигают внимания покупателей желаемого типа с вероятностью p j , причем величина PJ считается независимой от суммарного количества рекламных объявлений, передаваемых рассматриваемой станцией. Напомним, что Kj (yj) есть число рекламных объявлений, включаемых в программу передач радиостанцией/ при ассигновании на это У] долл. Аналогично обозначим через q) вероятность того, что реклама дойдет до покупателей рассматриваемого типа в утреннее время, а через Я/ (г/;-) — число рекламных объявлений, передаваемых радиостанцией / в утренние часы, при ассигновании на это z/j долл. Определите оптимальный размер ассигнований, при которых минимизируется вероятность того, что покупатель рассматриваемого типа не услышит ни одной передачи радиорекламы данной фирмы.
124
ГЛАВА 17
а) Постройте для данной задачи математическую модель и покажите, как с помощью метода динамического программирования (по аналогии с методом, изложенным ъ разд. 10.3) можно найти оптимальное решение. б) Покажите, как изменится модель, построенная в п. а), если задача заключается в максимизации математического ожидания числа передач радиорекламы, достигающих внимания данного покупателя. 29. Одна японская фирма выпускает портативные телевизоры. Ею разрабатывается дорогостоящая модель телевизора, причем фирма стремится достичь максимума надежности. Телевизор содержит N последовательно соединенных блоков, так что отказ любого блока приводит к неисправной работе всего телевизора. Поэтому в конструкцию модели введены избыточные элементы параллельного типа. Обозначим, в частности, через хп число избыточных параллельных элементов в /г-м блоке, через рп (х) — вероятность того, что n-й блок будет исправно функционировать в течение первого года использования телевизора при заданном уровне избыточности х, а через сп (х) — стоимость изготовления указанного блока. а) Постройте оптимизационную модель, максимизирующую надежность функционирования телевизора в течение одного года при условии, что суммарные затраты на его изготовление не могут превышать С. б) Покажите, как находится решение для построенной вами модели с помощью метода динамического программирования. в) Воспользуйтесь предложенным вами методом для нахождения 2 оптимального решения при N = 3, положив сп (х) = пх , С = 15, а рп (х} = i — /?*, где pi = 0,08, р2 = 0,05, р3 = 0,1. г) Постройте оптимизационную модель, минимизирующую затраты на изготовление телевизора при условии, что надежность функционирования телевизора в течение первого года его использования была бы не менее JR. Покажите, как можно найти решение для построенной вами модели, если воспользоваться методом динамического программирования. 30. Командир космического корабля и его экипаж планируют полет на одну из наиболее удаленных планет с целью выполнения определенной программы космических исследований. Они должны взять с собой N различных типов электронных приборов, которые, увы, даже в наш век небывалого технического прогресса могут прийти в неисправное состояние. Каждая единица оборудования i весит ivt кг, суммарный же вес ограничен и не должен превышать W кг. Значение W является достаточно большим и позволяет взять на борт космического корабля некоторое (естественно, ограниченное) количество запасного оборудования, которым можно было бы воспользоваться в случае возникновения тех или иных неисправностей основного комплекта оборудования. Обозначим через pt (t) распределение вероятностей для числа интервалов времени t, в течение
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
125
которых единица оборудования i нормально функционирует (после чего она выходит из строя и подлежит замене). Пусть xt — число запасных единиц оборудования i, находящихся на борту космического корабля. Как только запас какого-либо типа оборудования полностью истощится (т. е. когда для какого-либо типа оборудования i Xi примут нулевое значение), космический корабль должен будет вернуться на Землю. а) Предложите модель динамического программирования, позволяющую определить такие значения xt, при которых максимизируется математическое ожидание времени пребывания космического корабля на упомянутой выше планете. (Примечание: в процессе выполнения программы космических исследований непрерывно функционируют все N типов оборудования.) б) Предложите модель динамического программирования, позволяющую определить такие значения xt, при которых максимизируется вероятность того, что космические исследования на планете будут проводиться по крайней мере в течение Т интервалов. в) Объясните, как видоизменятся модели, построенные в соответствии с условиями пп. а) и б), если единица оборудования i стоит ct, а суммарные затраты на оборудование ограничены и не могут превышать С. 31. Студенту ./V предстоит выполнить домашнее задание по исследованию операций. Из прошлого опыта студенту N известно, что если он работает слишком долго, то он «выдыхается». Поэтому студент N приходит к заключению, что целесообразно решать задачу в несколько заходов. Обозначим через pq (t) вероятность того, что задача будет решена при затратах времени в количестве t часов при -й попытке. Студент N хочет минимизировать вероятность того, что задача окажется нерешенной. а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию, предположив, что суммарное время, отведенное студентом N на решение задачи, не должно превышать Т часов. (Примечание: студент может, например, предпринять Т попыток по 1 часу каждая. Кроме того, на g-й попытке у него не может остаться более Т — q -\- 1 часов на последующие попытки, поскольку каждая попытка должна длиться не менее 1 часа.) б) Покажите, как упростится модель, если pq (t) не зависит от порядкового номера попытки д, т. е. если вероятность найти решение задачи при каждой попытке зависит только от продолжительности попытки t и не зависит от того, сколько попыток предпринималось ранее. в) Покажите, в какой степени усложнится модель, если вероятность того, что q-я попытка окажется успешной (т. е. приведет к решению задачи), зависит также от суммарного количества времени в часах, затраченного ранее на решение задачи. 32. Профессор Франк Н. Штейн пользуется дурной славой из-за изобретенного им сурового метода приема экзаменов. По окончании
126
ГЛАВА 17
семестра он представляет студентам возможность сдать ему экзамен, который он строит довольно коварно. Он задает экзаменующемуся серию вопросов, сложность которых последовательно возрастает. Если студент правильно отвечает на вопрос k (k = 1. 2, . . ., k), то он получает право выбора: либо продолжить экзамен, попытавшись ответить на следующий (более трудный) вопрос, либо «закончить» экзамен, получив при этом оценку Gh (Gh •< Gfe+1). Если студент оказывается не в состоянии ответить на вопрос k, профессор Штейн объявляет ему, что он провалился. Представьте себе, что вы студент, которому предстоит сдавать экзамен профессору Штейну, и что по вашей оценке вероятность вашего правильного ответа на вопрос k равняется р^. а) Постройте модель динамического программирования, из которой вытекало бы правило, позволяющее определить, на каком этапе следует добровольно остановить экзамен (если к этому времени вас еще не потопили); при этом вы должны стремиться максимизировать среднее значение получаемой вами оценки. б) Покажите, как изменится только что построенная вами модель, если профессор Штейн проявит некоторое великодушие и выгонит вас с экзамена лишь при повторном ошибочном ответе. 33. Фирма «Скороход» располагает парком малогабаритных грузовых автомобилей, которые совершают рейсы в ряд населенных пунктов и доставляют продукты непосредственно покупателям. Предположим, что имеется / видов продуктов и единица веса продукта i (i = 1, 2, . . ., /) занимает в грузовике объем с, м3. Используемый для грузов объем в одном грузовике равняется С м3. Рассмотрим маршрут одного из грузовиков и допустим, что спрос qi на продукт i описывается непрерывным однородным распределением с функцией плотности » = •{
I О
в остальных случаях. Обозначим через xt число единиц веса продукта i, погруженного в рассматриваемый грузовик. Поскольку продукты продаются по одинаковым ценам, задача фирмы заключается в минимизации математического ожидания неудовлетворенного спроса за один рейс. а) Сформулируйте задачу определения оптимального варианта загрузки. Объясните, как эта задача может быть решена с помощью динамического программирования. б) Обсудите другие возможные подходы к решению этой задачи, опираясь на тот факт, что модель содержит нелинейную целевую функцию специального вида при единственном линейном ограничении на неотрицательные переменные. в) Используйте метод, предложенный вами в п. б), для решения задачи, содержащей следующие показатели: Т~А —1 —— —— — !£ гС у = ^ Ок., \1О, к. 74 i <J,
Ъ — ^vj, 90 С/1
h — —?4 t/2 ^^-ч
е
Ъ — ! ^з — 2^^i
h — ^' 97 • ^4
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
127
34. Страховой агент одной страховой фирмы собирается сделать в течение недели Т телефонных звонков в вечернее время, чтобы дозвониться до п потенциальных клиентов. По его оценкам потенциальный клиент / может приобрести страховой полис стоимостью Vj. Для простоты предположим, что агент планирует Xj телефонных звонков потенциальному клиенту /; при этом суммарное количество звонков не должно превышать Т. Если агент дозванивается до / в результате х^ звонков, где х° < Xj, то он тем не менее не пересматривает количество запланированных вначале звонков другим возможным клиентам. Пусть р;- есть вероятность того, что в результате одного звонка возможному клиенту / агент дозванивается до этого лица; допустим, что эта вероятность не зависит от предыдущих, оказавшихся безрезультатными звонков. Агент хочет определить Xj так, чтобы минимизировать математическое ожидание суммарной стоимости страховых полисов (в соответствии с его оценками v) тех возможных клиентов, которым он не смог дозвониться в течение недели. а) Постройте для данной задачи оптимизационную модель. Покажите. как данная задача может быть решена с помощью методов динамического программирования. б) Покажите, как будет выглядеть модель, если агент вместо того, чтобы определить значения всех Xj в начале недели, принимает решения поэтапно (в зависимости от того, до каких потенциальных клиентов ему не удается дозвониться). Приведет ли такая модель к улучшению результата, полученного в п. а)? Ответ необходимо пояснить. 35. Рассмотрим детерминистическую модель управления запасами, представленную соотношениями (1) — (3) в разд. 17.4. Предположим, что функция производственных затрат имеет стохастическую структуру, а именно О при х = 0, С v(х} = ' 13-f сх при причем Р [с = 1] = Р 1с = 3] = ^ • а) Пусть объем производства х требуется определять на каждом отрезке планового периода до того, как станет известным с. Постройте для данной задачи рекуррентные соотношения динамического программирования и покажите, чем они отличаются от соотношений (4) и (5) из разд. 17.4. б) Пусть объем производства х подлежит определению после того, как станет известным с. Постройте для этого случая рекуррентные соотношения динамического программирования. в) Определите оптимальные стратегии при условиях, сформулированных в п. б), для п = 1, 2, . . ., 5. 36. Рассмотрим стохастическую модель управления запасами, заданную рекуррентным соотношением (10) из разд. 17.4. Предположим. что в случае, когда в конце некоторого отрезка планового
128
ГЛАВА 17
периода уровень запасов оказывается ненулевым, имеется вероятность р = 1/5 того, что одна единица запасов окажется непригодной к употреблению. а) Покажите, как при этом изменится рекуррентное соотношение (10). б) Найдите оптимальную стратегию для п = 1, 2, 3. 37. Рассмотрим стохастическую модель управления запасами, описание которой приведено в разд. 17.4. Пусть для каждого отрезка планового периода установлен «целевой» уровень производства х, а отклонение фактического уровня производства от х сопряжено с издержками сглаживания в размере v- [ х — х (, где х — некоторая заранее известная постоянная. а) Покажите, какие изменения следует внести в рекуррентное соотношение (10), чтобы учесть издержки сглаживания. б) Пусть v = 1, а х = 3. Найдите оптимальное решение для п — 1, 2, . . ., 5. 38. Рассмотрим элементарную модель управления запасами, характеризуемую стохастическими уровнями спроса (см. пример, приведенный в разд. 17.4). Предположим, что уровень спроса на отрезке t влияет на уровень спроса на отрезке t + 1, а именно допустим, что
а) Запишите рекуррентное соотношение динамического программирования, аналогичное (10). б) Найдите оптимальную стратегию для п = 1, 2, . . ., 5 и сравните полученные результаты с результатами, приведенными в таблице на рис. 17.2. Положите D0 = 2. в) Выполните упражнение, сформулированное в п. б), предположив, что
- .
Сравните полученные результаты с результатами п. б). г) Каким будет средний спрос за отрезок, если в п. б) плановый период считать неограниченным? Ответьте на этот вопрос для случая. описанного в п. в). 39. Замена оборудования при неопределенной стоимости. Рассмотрим задачу фирмы «Таксолюкс», описание которой дано в разд. 6.5. Предположим, что плата за единицу нового транспортного оборудования, взятого в аренду в начале года i и замененного в начале года /', является величиной случайной. Для конкретности
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
129
рассмотрим случайную переменную г, заданную в г-й год распределением вероятностей р; (г), и предположим, что арендная плата в интервале от i-то до ;'-го года, в начале которого производится замена транспортного оборудования, описывается заданной функцией Cjj (r). Допустим, кроме того, что в момент замены в i-й год значение г известно до принятия решения относительно следующей замены в ;-м году. а) Постройте с учетом сформулированных выше условий модель динамического программирования. б) Предположим, что распределение вероятностей рг (г) зависит от значения г в (i — 1)-й год; обозначим это распределение вероятностей через PI (г \ г г _ 4 ), причем будем считать, что значение г0 (т. е. для i = 1) является известным. Покажите, как изменится при этом модель, построенная в результате выполнения п. а). 40. Модель выбора кратчайшего пути (разд. 6.5). Рассмотрим пример, представленный данными на рис. 6.8. Предположим, что стоимостные характеристики *) дуг представляют собой случайные величины, а переезд вдоль любой из дуг занимает один отрезок времени (т. е. одну условную единицу времени). Пусть в течение t-то отрезка стоимость перемещения вдоль дуги равняется сг1 (где ctj = = О, 1, 2, . . .) с вероятностью Pu.t (cij). Допустим, что при любом значении t величины с^ являются полностью не зависимыми от всех прочих случайных элементов. Предположим, что информацию относительно фактических значений с^ можно получить только по прибытии в узел i. Задача заключается в выборе маршрута из узла 8 (источник) в узел 1 (сток), минимизирующего математическое ожидание суммарных затрат. (Примечание: не пытайтесь выбирать весь маршрут целиком в начале планового периода; на каждом отрезке планового периода дуга выбирается в зависимости от того, какого узла мы достигли и каковыми являются соответствующие стоимостные характеристики.) а) Для нахождения оптимальной стратегии постройте соответствующую модель динамического программирования. б) Предположим, что число отрезков планового периода, необходимое для переезда из узла i в узел /, подчиняется вероятностному закону. Допустим, в частности, что на отрезке t время переезда вдоль дуги равняется djt (djt = 1, 2, . . .) с вероятностью д^, г ( d t j ) . Пусть информацию о фактическом значении dtj можно получить лишь после того, как выбрана дуга (i, j). Покажите, как при этом изменится модель, построенная в п. а). 41. Задача о дилижансах (разд. 8.2). Рассмотрим данные, приведенные на рис. 8.1, и положим вероятность того, что мистер М. при переезде из штата i в штат / не останется в живых, равной с,/20; *) Эти характеристики могут варьироваться в зависимости от конкретного содержания задачи. Например, они могут выражать собой стоимость переезда из одного узла в другой, время переезда и т. д.— Прим. перев.
130
ГЛАВА 17
так, например, вероятность появления смертельной опасности при переезде из штата 2 в штат 6 равняется с 26 /20 = 3/5. Требуется определить маршрут, для которого вероятность благополучного исхода для мистера М. является максимальной. Рискнули ли бы вы отправиться в путешествие, если бы вы оказались на месте мистера М.? Дайте необходимое обоснование. 42. Задача фирмы «Фудзи Стил» (см. упражнение 52 гл. 9). Предположим, что в момент составления технических условий на выпускаемую продукцию уровни спроса DJ точно не известны. Однако до начала производства фирме удается установить значения PJ (D) == P [Dj = D]. Постройте для нового варианта задачи модель динамического программирования. 43. Рассмотрим задачу распределения времени студентом К. при подготовке к выпускным экзаменам (см. упражнения 23 и 24 гл. 10). Предположим, что его оценки баллов, приведенные в упомянутых выше упражнениях, реализуются лишь с вероятностью 3 / 4 , а с вероятностью V 4 студент К. может получить в каждом случае отметку на один балл ниже. Так, например, если студент К. отведет на изучение легких предметов три отрезка из всего имеющегося у него времени для подготовки к экзаменам, то он получит 3 балла с вероятностью 3 /4 и 2 балла с вероятностью V 4 . Пусть случайные события являются взаимно независимыми. а) Постройте соответствующую модель динамического программирования и найдите оптимальное решение; при этом исходите из того, что студент К. стремится максимизировать ожидаемое количество баллов, которое он хочет получить на выпускных экзаменах. б) Пусть цель студента К. заключается в максимизации вероятности того, что он получит на выпускных экзаменах в общей сложности не менее 9 баллов. Реконструируйте модель, полученную в п. а), с учетом новой постановки задачи. 44. Обратимся к задаче скотоводческой фермы, сформулированной в упражнении 32 гл. 10. Предположим, что доход, получаемый в п-ы году, составляет Rn (уп \ р ) , где р — случайная переменная, характеризующая общий уровень цен. Распределение вероятностей для р в и-м году обозначим через дп (р). Предположим также, что число голов не проданного на убой скота возрастает к началу следующего года в / раз, где / — случайная величина, характеризуемая распределением вероятностей q (/). Запишите рекуррентное соотношение динамического программирования, с помощью которого можно определить, сколько голов скота выгодно продавать ежегодно в течение N лет. Рассмотрите следующие варианты: а) Значения р до момента принятия решения относительно уп являются неизвестными; б) Значения р до момента выбора значений уп известны. 45. Задача расширения производственной мощности (см. упражнение 33 гл. 10). Предположим, что Rt есть случайная величина,
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
131
характеризуемая распределением вероятностей pt (R). При R > С введем также в рассмотрение Ht (С, R), учитывая таким образом экономический ущерб, обусловленный нехваткой производственной мощности на отрезке t. Постройте модель расширения производственной мощности в виде рекуррентного соотношения динамического программирования. Рассмотрите следующие случаи: а) до принятия решения относительно значения xt значение Rt является неизвестным; б) значение Rt известно до момента выбора значения xt. 46. Задача акционерного общества «Биржевик» (см. упражнение 34 гл. 10). Представим себе, что акционерное общество «Биржевик» потеряло способность точно прогнозировать цены на акции р (t) и может теперь лишь определять соответствующее распределение вероятности qt (p) для любого будущего отрезка t. Пусть при наступлении отрезка t фактическое значение р (t) становится известным до момента выбора значения xt. а) Сформулируйте данную задачу в виде рекуррентного соотношения динамического программирования, исходя из предположения, что акционерное общество «Биржевик» хочет максимизировать математическое ожидание общей суммы наличных денег к концу планового периода. б) Определите, как изменится только что построенное вами рекуррентное соотношение, если цена акций на отрезке t зависит от цены акций на предыдущем отрезке [соответствующее распределение вероятностей обозначьте через qt (p |/?t_i)]. 47. Мисс К. везет буквально во всем, кроме любви. Представьте себе, что в течение ближайших N дней она имеет возможность делать ставки в игре с вероятностными исходами. Предположим, что мисс К. в начале указанного периода располагает / долл. и каждый день может делать любую ставку, не превышающую, однако, сумму денег, которой она располагала в начале дня. Если в /г-й день делается ставка в уп долл., то вероятность увеличения капитала на такую же сумму равняется рп, а вероятность проиграть указанную сумму равняется 1 — рп. Мисс К. хочет максимизировать вероятность того, чтобы к концу N-дневного периода у нее оказалось S долл. а) Постройте рекуррентное соотношение динамического программирования, с помощью которого можно определить размер ставки в любой из рассматриваемых дней при условии, что известна сумма наличных денег, которой она располагает в начале этого дня. б) Предположим, что ситуация изменилась таким образом, что при ставке уп долл. в и-й день с вероятностью 1/t происходит увеличение капитала на (8рп — 1) уп, где рп имеет прежний смысл (см. выше), и с вероятностью 3 / 4 имеет место проигрыш в размере уп. Покажите, как при данных условиях изменится рекуррентное соотношение, полученное в п. а). в) Пусть N = 3, / = 1, Pi = 3/8, Pz = 5/8 и Рз= V 2 - Определите оптимальные стратегии при условиях, сформулированных в пп. а) и б),
132
ГЛАВА 17
а также при S — 3 и S — 6. Изобразите для каждого из этих случаев соответствующее дерево решений. г) При условиях выигрыша и проигрыша, сформулированных в пп. а) и б), постройте модель, ориентированную на максимизацию математического ожидания суммарного выигрыша по истечении Л'-го дня. д) Используя рекуррентное соотношение, полученное в п. г), и данные, приведенные в п. в), найдите соответствующие каждому из указанных случаев оптимальные стратегии. 48. Специализированному автомобильному магазину нужно сбыть в течение последних Т дней текущего года оставшиеся N автомобилей старой марки. Если в £-й день предложение составит п автомобилей, то, согласно оценке магазина, при цене г долл. за один автомобиль с вероятностью pt (s \ r) (s = О, 1, . . ., п) будет продано s автомашин. Если в конце Г-го дня часть автомашин окажется непроданной, магазин будет вынужден продать оставшиеся автомобили по цене v долл. за каждый. Постройте модель динамического программирования, позволяющую устанавливать цены на автомашины в каждый из дней рассматриваемого периода так, чтобы ожидаемый доход от N оставшихся автомашин был максимальным. 49. В большом продовольственном магазине даже в часы пик обеспечивается быстрое обслуживание покупателей за счет достаточно большого числа контрольно-расчетных прилавков. Заведующий магазином собрал данные относительно числа покупателей, входящих в магазин в течение каждого единичного интервала времени (продолжительностью 15 мин.), а также относительно числа покупателей т, которых успевают обслужить в течение 15-минутного интервала (т зависит как от числа покупателей, находящихся в магазине, так и от числа действующих контрольных прилавков). Обозначим через pt (п) вероятность того, что в течение интервала t в магазин входят п покупателей (для простоты будем считать, что все п покупателей входят в магазин в начале интервала t). Пусть qt (т \ n, s) есть вероятность того, что в течение интервала t обслуживается т покупателей при условии, что в начале интервала в магазине находится п покупателей, а число действующих контрольных прилавков равняется s. Обозначим через w издержки эксплуатации одного контрольного прилавка в течение одного отрезка времени. Заведующим проведена приблизительная оценка издержек, связанных с тем, что покупатели ожидают обслуживания у контрольных прилавков. Обозначим стоимость ожидания от начала до конца интервала t в расчете на одного покупателя через ht. а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию в период наплыва покупателей (пусть этот период состоит из Т интервалов). б) Покажите, как изменится только что построенная вами модель, если учесть, что открытие каждого дополнительного контрольного
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
133
прилавка вызывает дополнительные издержки в размере К (т. е. если в течение одного интервала добавляется р таких прилавков, то суммарные издержки равняются рК). ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ
50. Фирма, выпускающая безалкогольные напитки, планирует начать производство нового прохладительного напитка под названием «Нектар». Если этот напиток будет пользоваться спросом у покупателей, то, согласно предварительным оценкам, фирма получит прибыль в размере R (этот показатель фактически представляет собой приведенное значение прибыли в пределах планового периода продолжительностью несколько лет). По мнению руководителя фирмы, вероятность указанного исхода равняется р. Если же «Нектар» не найдет спроса у покупателей, фирма потерпит убытки в размере L (связанные с расходами на оборудование, упаковку продукции и предварительную рекламу). Прежде чем затратить указанную выше сумму L, руководство фирмы может провести рыночный эксперимент с тем, чтобы составить более обоснованное представление о целесообразности выпуска нового продукта. Допустим для простоты, что имеется всего две зоны, где можно провести упомянутый выше рыночный эксперимент, и предположим, что фирме вовсе не обязательно экспериментировать во второй зоне, пока не будут известны результаты эксперимента в первой зоне. Если на «Нектар» имеется потенциальный спрос, то с вероятностью pt результат эксперимента в первой зоне окажется успешным (вероятность того, что эксперимент в первой зоне окажется безуспешным, обозначим через д^). Аналогично, если на «Нектар» имеется потенциальный спрос, это будет установлено с вероятностью ps2 B результате эксперимента в обеих зонах и с вероятностью р^ в результате эксперимента во второй зоне (при отрицательном результате в первой зоне). Если же на K «Нектар» нет потенциального спроса, то с вероятностью g^2 такому выводу приведет эксперимент в обеих зонах и с вероятностью g s 2 — эксперимент только во второй зоне (при положительном результате эксперимента в первой зоне). Пусть эксперимент в первой зоне сопряжен с затратами Cit а эксперимент во второй зоне — с затратами С^ (при этом допустим, что данные показатели не зависят от результатов эксперимента). а) Нарисуйте для данной задачи дерево решений. (Примечание: руководитель фирмы может принять решение относительно того, выпускать или не выпускать «Нектар», в любой момент времени; при этом затраты в размере L производятся после принятия положительного решения.) б) Объясните, как может быть найдена оптимальная стратегия. Для иллюстрации метода определения оптимальной стратегии используйте следующие данные: R = 100, L = 50, Ci = 5, С2 = 10, pt = = 0,5, ?1 = 0,75, Ps2 = 0,8, р / 2 = 0,5, g /2 = 0,9, qs2 = 0,6.
134
ГЛАВА 17
в) В какой степени упростится (если это вообще возможно) процедура решения, использованная вами при выполнении упражнения п. б), если psZ ~ Pfz и Qf2 ~ 9«2? Поясните два последних условия. Ответ проиллюстрируйте с помощью данных, приведенных в п. б), внеся в них лишь следующие изменения: pf2 = 0,8 (вместо 0,5), qsz — 0,9 (вместо 0,6). 51. Задача подбора кандидатуры на место секретаря (разд. 1.6). а) Запишите эту задачу в виде рекуррентного соотношения динамического программирования. Пусть администратор намерен провести собеседования не более чем с п кандидатками (в разд. 1.6 п = = 3). Покажите, как изменится модель, если предположить, что каждое собеседование обходится администратору с долл. б) Предположим, что администратор не ограничивает себя числом претенденток, которых он намерен проинтервьюировать. Какой бы стратегии вы посоветовали ему придерживаться, если с = О? в) Пусть администратор не ограничивает себя числом претенденток, которых он намерен проинтервьюировать, и предположим, что с > 0. Пусть, кроме того, используется однопериодный коэффициент дисконтирования а (0 ^ а ^ 1). Запишите систему предельных уравнений, позволяющих найти оптимальную стратегию. (Указание: состояния определяются числом баллов, получаемых претенденткой на секретарскую работу, а решение заключается в выборе варианта действий: «нанять» или «перейти к следующему собеседованию».) г) Запишите для условий, сформулированных в п. в), исходную и двойственную задачи линейного программирования. д) Используйте результат выполнения предыдущего упражнения для нахождения оптимального решения при условии, что имеют место данные, приведенные в разд. 1.6, с = 0,15, а а — 1. е) Предположим, что администратор имеет возможность «отсрочить» решение относительно найма, т. е. может провести собеседования с другими претендентками на место секретаря и лишь после этого выбрать либо последнюю из интервьюируемых, либо одну из претенденток, проинтервьюированных им ранее. При каких условиях администратор воспользуется этой возможностью? Как изменится формулировка п. в) с учетом этой дополнительной возможности? Выполните упражнения, приведенные в пп. г) и д ) , приняв во внимание дополнительные возможности администратора. 52. Задача выбора места стоянки автомобиля. На собственном автомобиле вы прибыли на свидание с очаровательной девушкой. Ваша девушка изъявила желание посмотреть новый фильм, который идет в одном из кинотеатров города. Вы направляетесь в район этого кинотеатра и обдумываете оптимальную стратегию выбора места стоянки автомобиля. Автомобиль всегда, разумеется, можно оставить на платной стоянке, что обойдется вам в В центов. Вы можете попытаться «припарковаться» прямо на улице. Однако, если вы оставите автомобиль слишком далеко от кинотеатра, ваша девушка подумает, что вы «размазня» и, по-видимому, так же плохо решаете
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
135
и другие проблемы. Пусть на улице по обе стороны от кинотеатра имеется ./V мест, где можно поставить автомобиль. Для удобства анализа занумеруем их следующим образом: —N, —N + 1, —N + 2, . . ., —1,0, 1, . . ., N — 2, N — 1, N. (Место с номером О находится напротив входа в кинотеатр и для стоянки не используется.) По вашей оценке коэффициент потери «личного престижа» (как водителя и как мужчины!) равняется | п |, где п есть номер стоянки, на которой вы хотите поставить автомобиль. Обозначим через рп (п = — N, —1, 1, . . ., N) вероятность того, что п-е место для стоянки окажется незанятым. а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию поиска места стоянки. Для простоты предположите, что свободные места для стоянки вы обнаруживаете поочередно. (Указание: состояние системы определяется набором характеристик «занято — свободно» для каждого п.) б) Постройте линейную оптимизационную модель, эквивалентную только-что полученной, а также сформулируйте соответствующую двойственную задачу. Рассмотрите случай, когда N = 3. 53. Рассмотрим модель управления запасами при точном прогнозе флуктуации уровня спроса (см. упражнение 12). Предположим, что в результате прогнозирования удается точно определить как текущий уровень спроса, так и уровни спроса на последующих отрезках планового периода. Какую сумму была бы готова заплатить фирма за такого рода точный прогноз, если а) п = 2; б) п = 3? Будем считать, что в начале планового периода запасы отсутствуют. 54. Задача о складах (см. упражнение 36 гл. 5 и упражнение 49 гл. 8). Пусть фигурирующие в данной задаче цены и другие стоимостные показатели представляют собой случайные величины. В частности, рассмотрим случайную величину г, которая характеризуется на t-м отрезке планового периода распределением вероятностей qt (r) (t = 1, 2, . . ., 10). Допустим далее, что рыночная и закупочная цены на t-м отрезке являются известными функциями г; обозначим их соответственно через pt (r) и ct (r). Пусть значения этих функций в начале каждого t-то отрезка становятся известными до момента принятия решения относительно объемов поставок на рынок сбыта и объемов закупок. Постройте модель динамического программирования, с помощью которой можно определить стратегию, максимизирующую среднее значение прибыли. 55. Задача космонавта. Не желая принимать опрометчивых решений, космонавт А обратился за помощью к методам исследования операций. По программе полета космонавт А должен сделать N витков вокруг Земли. В начале каждого нового витка необходимо определить, в каком «состоянии» находится космический корабль: в состоянии 1 (когда все системы функционируют нормально), в состоянии 2 (когда имеются незначительные неполадки) или в состоянии 3 (когда наблюдаются серьезные нарушения режима функционирования бортовых систем). Если космический корабль находится
136
ГЛАВА 17
в состоянии 1, решение определяется однозначно —«продолжать полет» (если, разумеется, к этому моменту программа не оказалась полностью выполненной). В случае когда фиксируется состояние 3, полет должен быть прекращен. Если же наблюдается состояние 2 Т космонавт имеет право выбора: делать очередной виток или же прекратить полет. Обозначим через рп (j \ i) вероятность того, что если после завершения п-то витка космический корабль окажется в состоянии i (где i = l , 2), то после очередного витка будет наблюдаться состояние /', где / ^ i. Введем в рассмотрение состояние ; = 4, которое характеризует аварийную ситуацию, при которой полет должен быть прекращен немедленно; соответствующую данной ситуации вероятность обозначим через рп (4 | i) (i = 1, 2). Если космонавт заканчивает полет после успешного выполнения п витков, результаты полета оцениваются в vn долл. (vn > f n -i)- Если же полет прерывается на п-ы витке по причине возникновения аварийной ситуации, результаты полета оцениваются лишь в wn долл. (wn < У„). а) Постройте модель динамического программирования, позволяющую определить оптимальную стратегию космонавта А. б) Приведите подробную запись исходной и действенной модели линейного программирования для условий, сформулированных в п. а). Рассмотрите случай N = 4. 56. Фирма X, желая принять на работу опытного руководителя, который смог бы возглавить недавно созданный отдел, обратилась за помощью к другой фирме (назовем ее фирмой Y), специализирующейся в подборе кадров административных работников. Фирма Y для каждого перспективного кандидата организует серию тестов и собеседований, которые позволяют выявить деловые качества. За проведение теста (или собеседования) / фирма Y взимает с фирмы X плату в размере с/. Прошлый опыт показывает, что испытуемый выдерживает тест с некоторой вероятностью PJ. (Для простоты будем считать, что процедуры тестирования разработаны настолько тонко, что исходы, связанные с различными видами тестов, являются полностью независимыми.) Фирма X согласна принять на работу только то лицо, которое выдержит все / испытаний; другими словами, если рассматриваемая кандидатура не выдержит хотя бы одно испытание, ее немедленно исключают из списка претендентов на должность руководителя нового отдела. Постройте метод определения последовательности тестов, при которой минимизируются ожидаемые суммарные затраты, связанные с испытанием одного претендента. 57. Мистер Z, президент крупного банка, имеющего несколько самостоятельных отделений, по ошибке послал письмо сугубо конфиденциального характера одному из своих вице-президентов (допустим, что всего имеется N вице-президентов). К своему стыду, мистер Z не помнит, какому из вице-президентов было направлено упомянутое выше письмо, и хочет выяснить это по телефону. По оценке мистера Z вероятность того, что письмо получено ;-м вице-прези-
ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
137
дентом, равняется PJ. С вероятностью q} вице-президент / может не оказаться на месте, когда мистер Z будет ему звонить, и, таким образом, ему не удастся узнать, получено ли вице-президентом письмо или нет. Разработайте модель динамического программирования^ с помощью которой можно определить стратегию мистера Z, минимизирующую ожидаемое число телефонных звонков, которые необходимы для отыскания письма, посланного не по адресу. 58. Задача определения оптимального размера партии. Задачу фирмы «Вольтекс», приведенную в разд. 17.5, можно описать в терминах одношагового процесса. Задачи определения оптимального размера партии нередко возникают и в многошаговых процессах. Рассмотрим, например, производственный процесс, состоящий из четырех этапов (шагов). На первом этапе, как и в примере, приведенном в разд. 17.5, решение должно приниматься относительно первоначального размера партии х, позволяющего изготовить к концу последнего этапа п годных изделий. Однако некоторые из изделий, изготовленных на данном этапе, не отвечают техническим условиям и, следовательно, бракуются. Допустим, что каждое из числа изготовленных на первом этапе годных изделий используется затем на втором этапе технологического процесса. При этом число изделий, изготовляемых на втором этапе (ге°), не может превысить число годных изделий, изготовленных на первом этапе (п*). Однако при п* > п° возникают излишки, которые могут быть проданы. Только что описанная ситуация повторяется на третьем и на четвертом этапах. Если к концу четвертого этапа выпускается менее п годных изделий, весь процесс повторяется с самого начала с тем, чтобы обеспечить выпуск недостающего количества изделий п (как правило, п < п). Обозначим через ct (х) затраты, связанные с производством х изделий на этапе t (t = 1, 2, 3, 4). Пусть ptx (/) представляет собой вероятность того, что / из х компонентов не отвечают техническим условиям. Обозначим через st стоимость забракованного изделия, а через vt — стоимость годного изделия, оказавшегося в излишке(т. е. реализуемого по сниженной цене). а) Постройте для только что описанной ситуации модель динамического программирования. б) Пусть п = 2, и предположим, что размер партии на этапе 1 не может превысить 3 изделий. Приведите для этого случая подробную запись соотношений, полученных в п. а). Постройте модель, линейного программирования, отвечающую полученным выше соотношениям и позволяющую определить оптимальную стратегию фирмы «Вольтекс». Постройте соответствующую двойственную модель. Чему равняется число уравнений и число переменных в упомянутых выше линейных моделях, если на этапе 1 предельный размер партии равняется 4 изделиям? Ответьте на поставленный выше вопРОС, предложив, что п = 3, а предельный размер партии на этапе 1 равняется 4.
ГЛАВА 18
Динамическое программирование на марковских цепях
18.1. ВВЕДЕНИЕ
Все примеры, приведенные в предыдущей главе, можно рассматривать как частные случаи более общей модели, позволяющей описывать так называемые марковские процессы принятия решений. Такое обобщенное рассмотрение выгодно отличается тем, что позволяет выяснить ряд важных динамических свойств, которыми обладают все изученные модели. Так, например, будут установлены достаточные условия существования стационарной стратегии, оптимальной на бесконечном плановом периоде. Читатель сможет также узнать, когда рационально применять методы последовательного приближения и линейного программирования для отыскания числовых решений таких задач, в которых нельзя использовать ни одну из известных форм оптимальной стратегии. Материал этой главы основан на многих идеях, изложенных в гл. 11, 12 и 17. В частности, используются понятия: интегральный дисконтированный эффект *) (разд. 11.2); эквивалентный средний эффект (разд. 11.2); экстремальные уравнения (разд. 12.1 и 12.3); метод итераций по критерию (разд. 12.2); метод итераций по стратегии (разд. 12.2 и 12.3); правила принятия решений или стратегия (гл. 17). Хотя в последующем изложении дается исчерпывающее объяснение всех затрагиваемых вопросов, к обсуждению содержания перечисленных понятий, приведенных в предыдущих главах, когда они были введены впервые, мы больше не возвращаемся. Поэтому читателю рекомендуется потратить несколько минут, чтобы освежить в памяти эти понятия. Основное внимание в данной главе мы обращаем на то, каким образом меняются рассмотренные ранее постановки задач динамического программирования и методы их решения, если учесть введение вероятностных элементов. Поэтому при анализе содержательных сторон рассматриваемого предмета в данной главе мы сосредоточим наше внимание в основном на влиянии неопределенности. На протяжении всей главы мы будем предполагать, что рассматривается задача минимизации, причем целевая функция имеет смысл ожидаемого значения критерия. В зависимости от содержания г ) В дальнейшем применяется термин «дисконтированный эффект», причем вод «эффектом» часто подразумеваются затраты, что ясно из содержания соответствующих задач.— Прим. перев.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
139
примеров смысл целевой функции заключается в оптимизации затрат, дисконтированного или среднего эффекта. Однако следует еще раз обратить внимание на то, что во всех приводимых ниже постановках задач динамического программирования целью оптимизации является минимизация. Для рассмотрения задач максимизации требуется лишь несущественная модификация приведенных формул. (Разумеется, изменив знак целевой функции в задаче на максимум, можно найти оптимальное решение, пользуясь алгоритмом отыскания минимума целевой функции.) 18.2. СТОХАСТИЧЕСКАЯ МОДЕЛЬ ЗАДАЧИ О КРАТЧАЙШЕМ МАРШРУТЕ
При изучении детерминированных моделей динамического программирования в гл. 10 и 12 было показано, что такие модели удобно рассматривать в виде сетей. Напомним, что сеть, соответствующая общей задаче динамического программирования с конечным плановым периодом, состоит из узлов, отображающих систему в s состояниях на отрезках и, и дуг, определяющих результаты решений. Такая сеть является ациклической, а ее конечный узел отображает начальное состояние системы. Сеть, соответствующая общей задаче динамического программирования с бесконечным плановым периодом, строится аналогично, не считая того, что в обозначении узлов более не фигурирует номер отрезка, а определяется только состояние системы. Для случая с конечным плановым периодом рекуррентное соотношение, соответствующее оптимизационной задаче, имеет вид z/;=
min (ayj + сц) при всех г Ф г и ут == О С 1 ;) ° в оети ' (конечный плановый период),
(1)
п
где г — конечный узел, а величина а — коэффициент (норма) дисконтирования на одном интервале. При конечном плановом периоде значение а можно принять любым на отрезке 0 ^ а ^ 1. Точно так же стохастические модели динамического программирования с конечным плановым периодом и конечным числом состояний, подобные рассмотренным в гл. 13, можно представить в виде вероятностной модели задачи о кратчайшем маршруте. Для этого требуется сделать три непосредственных обобщения на основе результатов ранее изученных детерминированных задач о кратчайшем маршруте. Первое из этих обобщений учитывает то обстоятельство, что теперь решение d в узле i может привести к тому, что система перейдет в один из нескольких возможных узлов. Примем следующее допущение: р (j | i, d) есть условная вероятность того, что состояние системы будет определяться узлом / при условии, что в узле i принято решение d, (2)
140
ГЛАВА 18
где при заданных i и d сумма р (j \ г, d) по всем допустимым j равна единице. В сущности (2) представляет собой не что иное, как так называемое допущение о марковском свойстве системы. В частности, постулируется, что любая вероятность перехода в (2) определяется только значениями i и d, а не предысторией системы (предыдущими состояниями и решениями), предшествующей ее переходу в узел i. Второе обобщение учитывает тот факт, что эффект или затраты, которые ставятся в соответствие текущему решению d в узле i, также могут быть случайными величинами. Примем, что cid есть ожидаемый средний эффект на рассматриваемом отрезке при решении d в узле i.
(3)
Если положить, что с (] \ i, d) означает фактический эффект на рассматриваемом отрезке, полученный в результате принятия решения d в узле i, вследствие чего система на следующем отрезке оказалась в состоянии, отвечающем узлу /, то Cid = S с (] \ i, d) P (i \ i, d),
(4)
i
где сумма берется по всем возможным /. Третья модификация относится к обобщенному свойству ацикличности сети (отсутствие петель и контуров). Предположим, что узлы можно упорядочить таким образом, что для конечного узла выполняется условие г = 0, а для всех i, j т. d — условие р (i \ i, d) = 0, если / ^ i (условие ацикличности).
(5)
Иными словами, нельзя перейти из узла i в узел /, если номер узла / больше номера узла г. Следствием условия (5) является то обстоятельство, что в любой реализации движения системы ни в один узел нельзя попасть более одного раза, хотя имеются узлы (состояния), в которые система вообще не попадает. Как будет показано ниже, в задаче управления запасами свойство (5) часто непосредственно следует из структуры исследуемой конкретной задачи. Таким образом, стохастическое обобщение рекуррентного соотношения (1) имеет вид i-l
z / j = m i n [2 P ( j \ i , d)ayi + cid] d£D(i) i=*0
при всех г^=0
и у0 === 0
(6)
(стохастическая задача о кратчайшем маршруте), где D (i) есть множество возможных решений в узле i. Следовательно, величина j/j определяет теперь минимальный ожидаемый дисконтированный эффект достижения узла 0 при выходе из узла i. Читателю следует сравнить выражения (6) и (1) и определить наиболее существенное различие между ними.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
141
Отметим, что значения выражения (6) можно вычислять в порядке ь */2> Уз, • • •• Именно в силу допущения об ацикличности (5) всегда можно найти решение (6), начиная вычисления с узла, имеющего наименьший номер, и двигаясь от узла к узлу с последовательно возрастающими номерами. Вычислительный алгоритм почти полностью совпадает с алгоритмом отыскания кратчайшего маршрута в детерминированной ациклической сети (изложенным в разд. 7.7). Единственное различие заключается в необходимости вычисления значения суммы в правой части выражения (6). Модель управления запасами. Для демонстрации практического аспекта применения модели (6) рассмотрим вновь задачу фирмы «Надежный поставщик». Числовые данные стохастического варианта этой задачи (приведенной в гл. 17) имеют следующие значения: спрос: Р [D - 2] = V 2 , P W = 4] = V 2 ; ограничения: объем производства х ^ 5, конечный уровень запаса / ^ 4; затраты на производство и хранение С (х) + h-j, где объем производства х и конечный уровень запаса j являются неотрицательными целыми, причем
С (0) = О, С (1) = 15, С (2) = 17, С (3) = 19, С (4) =21, С (5) = 23 и А = 1 на всех отрезках. При этих исходных данных получено следующее рекуррентное соотношение (в разд. 17.4) для п = 2, 3, . . .:
(7)
где i = О, 1, . . ., 4 и минимизация производится только по неотрицательным целым значениям в диапазоне 4 — i ^ х ^ min (5, 6 — i). Соответствие между соотношением (7) и сетью такого вида, которая использовалась для (6), можно установить следующим образом. Пусть узел 5тг -f- i обозначает состояние системы, когда до конца планового периода осталось п отрезков п = 1, 2, . . ., а начальный уровень запаса в этом состоянии равен i, (i = О, 1, . . ., 4). Примем, что узел 0 определяет конечное состояние системы. (Обратите внимание на то, что номер каждого узла соответствует единственной паре значений п к i. Так, например, узел 36 соответствует п = 7 и i = 1.) Предположим, что начальный уровень запаса в момент, когда До конца планового периода остается п отрезков, равен i и что принимается решение произвести х единиц. Тогда при оставшихся до конца планового периода п — 1 отрезках начальный уровень запаса
142
ГЛАВА 18
будет либо i + х — 2 при спросе D = 2, либо i + х — 4 при спросе D = 4, причем каждый из указанных вариантов реализуется с вероятностью 1 / 2 . Следовательно, единственно возможные положительные вероятности перехода при п ^> 2 равны р [5 (п - 1) + i + х — 2 | 5га + г, ж] = = р [5 (п - 1) + i + г — 4 | 5n + i, z] = 1/2,
(8)
в чем читателю следует убедиться самостоятельно. При п = 1 оптимальное решение имеет вид откуда
х = 4 - i,
[0 | 5 + г, 4 — i] = 1 при всех г ^ 4 и ге = 1.
(9) (10)
Следует показать, что (8) и (10) удовлетворяют допущению ацикличности (5). Предположим, что в задаче о запасах а == 1. Как показывает (7), ожидаемое значение критерия при решении выпустить а изделий в случае, когда начальный уровень запаса при оставшихся до кон-
1 1 8
Число отрезков да конца планового периода Р и с . 18.1. Стохастическая сеть, отображающая задачу о запасах (стационарная стратегия).
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
143
ца планового периода п отрезках равен г, определяется выражением В результате соответствие между (7) — (11) и решением рекуррентного уравнения (6) записывается в такой форме: z/5n+1 == /n (i) при и > 1 и 0 < i < 4 (12) (Уо — О)- Таким образом, величины у}, j = 1, 2, . . ., можно определить с помощью точно таких же вычислений, как и fn (i), что отражено в таблице, приведенной на рис. 17.2 На рис. 18.1 приведена схема, соответствующая стратегии (9) при п = 1 и стационарной стратегии производства: f 0, если i = 0, Объем производства х={ „ . . „ „ , при п^-2. * [ 6 —г, если i = l, 2, 3, 4, ^ (13) Отметим, что решению относительно объема производства в каждом узле при п ^ 2 соответствуют две дуги, каждая из которых отвечает одной из вероятностей реализации. Постановка и решение задачи в терминах линейного программирования. С вычислительной точки зрения преобразование рекуррентного соотношения (6) в эквивалентную модель линейного программирования практически ничего не дает. Единственным достоинством такого преобразования является широкое распространение запрограммированных алгоритмов решения самых разнообразных задач линейного программирования на ЭВМ и предусмотренная этими алгоритмами возможность проверки чувствительности решения. Однако ознакомление с этим преобразованием является еще одним шагом в подготовке к анализу моделей с бесконечным плановым периодом, излагаемым в последующих трех разделах. Но самое главное заключается в том, что читатель может овладеть при этом техникой введения вероятностных ограничений. Предположим, что узлы пронумерованы числами О, 1, 2, . . ., Т. Оптимальное значение ут можно найти, решив задачу Максимизировать ут (I) при ограничениях i-l
г/г — 2 P ( / M I d)ayj^.dd
при каждом допустимом i и d,
(II)
3=1
где все yt не ограничены по знаку, а величина у0 исключена, поскольку равна нулю. Соответствующая двойственная задача записывается так: т
Минимизировать 2
S ctdXu
(III)
144
ГЛАВА 18
при ограничениях т 2 хи— S S p(j\i,d)axld = Ovpaj = l,2,...,T — l, (IV)
l,
(V)
всеа^Х). (VI) Пример при Г = 3 и d = 1, 2 приведен в таблицах рис. 18.2.
г
.
Прямая задача
d У
г/2
yi
УЗ
S:
1 1
S::
1
2
2
-р(1|2,2)а
3
1 2
— />(1|3, 1)а — р(2|3, 1)а 1 -р(1|3,2)а -р(2|3,2)а 1
1
-^ ^31
1 Максимизировать г/г не ограничены по знаку Двойственная задача
«и .„
«М
' 1 2 3
1 1 -р(1|2,1)а -р(1|2,2)а -р(1|3, 1)а -р(1|3,2)а 1 1 -р(2|3, 1)а -р(2|3,2)а 1 1 C-jjCjo
^21
^"22
^"31
^"32
=0 =0
=1
Минимизироровать
Р и с . 18.2. Постановка стохастической задачи о выборе кратчайшего маршрута в терминах линейного программирования (ациклическая модель).
Можно доказать, что всегда существует оптимальное решение задачи (III) — (VI), такое, что не более чем одна величина xid положительна при всех значениях i. Такое решение соответствует опти-
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
145
мальной стратегии, определяемой (6). Сумма в выражении (III) представляет собой соответствующие ожидаемые дисконтированные затраты на конечном плановом периоде, если начинать суммирование с узла Т и пользоваться оптимальной стратегией. При а = 1 величины xid можно интерпретировать как безусловные вероятности того, что при фактической реализации процесса принятия решений система окажется в состоянии, соответствующем узлу i, и в этом узле будет принято решение d. В этом случае в двойственной модели оптимизационная задача принятия решений рассматривается как задача определения вероятностей состояний системы. Значение 2 (xid) представляет собой вероятность того, что d£D(i)
при фактической реализации процесса система достигнет узла L Если а = 1, то ввести вероятностные ограничения в задачу (III)—(VI) чрезвычайно просто. Так, например, если узел i* по какимлибо причинам нежелателен и этого нельзя адекватно отобразить значениями с г * й , то можно наложить вероятностное ограничение ~ «*'i*d r-*j ~^> ^/-'» n \/VTT1 / где р — достаточно малая вероятность. Если введены вероятностные ограничения, то не всегда справедливо условие, что существует оптимальное решение, в котором лишь одна величина х^ положительна при всех значениях i. На самом деле такое решение обычно определяет случайную (рандомизированную) стратегию, в которой величины (xid-f Л xid) соответствуют условной вероятности принятия решения d' , если известно, что система попала в узел i (в предположении, что 2 Xid > 0). d
Переменное время перехода. В разд. 12.1 упоминалось, что, не вводя существенных усложнений, детерминированную модель можно обобщить на случай, когда время перехода меняется от дуги к дуге. Аналогичный подход можно применить и к вероятностной модели. Пусть а,-;- (d) — коэффициент дисконтирования, соответствующий переходу системы в узел / при условии, что в узле i принято решение d. На самом деле величина а,-7- (d) может сама представлять собой математическое ожидание, т. е. ожидаемый коэффициент дисконтирования, если продолжительность перехода является случайной величиной. Единственная модификация, которую нужно при этом внести в (6), заключается в замене ос на а,7- (d). Точно такие же модификации справедливы и для приводимых ниже формул. 18.3. БЕСКОНЕЧНЫЙ ПЛАНОВЫЙ ПЕРИОД С ДИСКОНТИРОВАНИЕМ (а < 1)
Изложенная в предыдущем разделе вероятностная (стохастическая) модель выбора кратчайшего маршрута основана на ациклической структуре и является эффективным средством исследования
146
ГЛАВА 18
вероятностных моделей динамического программирования с конечным числом состояний, отрезков времени и решений. В этом разделе рассматриваются более общие ситуации с бесконечным плановым периодом, но при конечном числе состояний и решений. Математическое описание рассматриваемой модели можно выразить достаточно просто: нужно решить экстремальные уравнения [ 2 Р ( Л * > d}ay} + c;d] ;£оети
для каждого I,
(1)
где предполагается, что 0 ^ а, < 1 . Заметим, что в данном случае не постулируется свойство ацикличности [как это определялось условием (5) в предыдущем разделе] и теперь конечный узел в сети отсутствует. Значение у; представляет собой минимальный ожидаемый дисконтированный эффект, сопоставленный началу движения из узла i с последующим использованием оптимальной стратегии на бесконечном плановом периоде. Подчеркнем вновь допущение о том, что система обладает марковским свойством относительно вероятностей перехода, т. е. эти вероятности зависят только от i и d и не зависят от предшествующих состояний системы и принятых ранее решений. Выражение (1) достаточно универсально и описывает большинство моделей динамического программирования с конечным числом состояний и решений, бесконечным плановым периодом и стационарными вероятностями перехода. Можно вывести стохастический вариант в каноническом виде для описания дискретных моделей динамического программирования, аналогичный выражению (1) из раздела 12.1. Пусть S есть множество всех возможных состояний; D (s) — множество всех допустимых значений решения d при условии, что система находится в состоянии s; R (s, d) — непосредственно ожидаемый экономический эффект, обусловленный решением d, когда известно, что система находится в состоянии s; Т (s, d) — новое состояние системы на следующем отрезке, где р [Т (s, d)] есть вероятность того, что система достигнет состояния Т (s, d) на следующем отрезке при условии, что в состоянии s на текущем отрезке принимается решение d. При этих условиях стохастический вариант функционального уравнения можно записать следующим образом:
/ (s) = opt {R (s, d) + a 2 / (T (s, d)\p[T (s, d)]} Т
для каждого s£S,
(I)
0
где / (s) есть ожидаемый дисконтированный эффект, определяемый оптимальной стратегией на бесконечном плановом периоде при заданном текущем состоянии s.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
147
Пример задачи о запасах. Рассмотрим еще раз структуру стохастической модели управления запасами, приведенную в предыдущем разделе, предполагая на этот раз, что коэффициент дисконтирования равен а. В предыдущем разделе было показано, как строить эквивалентную сеть при конечном плановом периоде. В случае бесконечного планового периода номер отрезка уже не играет никакой роли, так что состояние системы можно поэтому определить просто значением начального уровня запаса i (i = О, 1, . . ., 4). (Напомним, что такое упрощение было возможно и в детерминированном случае при бесконечном плановом периоде, как было показано в разд. 12.5.) Соответствующее функциональное уравнение динамического программирования записывается в следующем виде: / ( i ) = m i n \C(x) + i [i + x—3]+a±[f(i + x—2)+ ж
^
I.
+ f(i + x — 4)]j
при i = 0, 1, ..., 4, 0
(2) где минимум отыскивается только по неотрицательным целочисленным значениям на отрезке 4 — s < а; < min (5,6 — г)Соответствующие обозначения для сетевой постановки задачи (1) имеют такую форму: Уг = f (0. cix s С (x) + 1 [i + x - 3], р [i + x — 2 | i, x] = p [i + x — 4 | i, x] = у,
(3) (4) (5)
где решение d = x есть количество выпускаемых изделий. Эти данные сведены в таблицу, приведенную на рис. 18.3. Предположим, что применяется следующая стационарная стратегия производства:
{
5, 6 — i, О,
если i = 0, если г = 1, 2, 3, если г = 4.
(6)
Тоща поведение системы можно описать в виде марковской цепи или матрицы вероятностей переходов Начальный уровень запаса на следующем отрезке /=01 2 3 4 Начальный уро- г = О вень запаса на рас1 сматриваемом от2 резке 3 4
о
i/2 о i/2 о •
О О
0 1/2 О 1/2 0 1/2 0 1/2
О
0
1/2
0
0
1/2
О
-]/2
1/2 О .
(7)
d€z>(0 4 0
p a i г, <*) 0
1
1
1
У
1 2
1
1 2
1
т
1
1
21
1 У
1 1
2
1
1 2
У 1
Т
26
18
24
16
1
19
1 У
1 2 1 2
23 2
1
1 2
25
20
У
3
4
1
i
2
0
т
2
4
3
22
1 У
У
3
1
id
4
1
1
IT
5
2
c
3
1
1 2
4
2
2
Т
2
5
3
1
22
1
1
т
17
1
У
20
О б о з н а ч е н и я : i — начальный уровень запаса на рассматриваемом отрезке; / — начальный уровень запаса на следующем отрезке; d — объем производства. Р и с . 18.3. Исходные данные для стохастической задачи о запасах.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
149
[Читателю следует использовать таблицу рис. 18.3, чтобы проверить элементы матрицы (7).] Точно так же любая стационарная стратегия производства приводит к марковской цепи, определяемой матрицей условных вероятностей. Обоснование экстремальных уравнений. Определим стратегию на бесконечном плановом периоде как исчерпывающее описание решений, принимаемых на каждом отрезке и в каждом состоянии. Такая стратегия не обязательно должна быть стационарной в том смысле, что правило принятия решений может изменяться от отрезка к отрезку. Такое определение соответствует понятию стратегии, подробно рассмотренному в гл. 16 и 17. Будем считать, что оптимальная, стратегия обеспечивает минимально достижимые ожидаемые дисконтированные затраты при всех возможных начальных состояниях системы. Такая стратегия также не обязательно должна быть стационарной. Однако в экстремальных уравнениях (1) в неявном виде подразумевается, что существует оптимальная детерминированная стационарная стратегия (одно и то же решение d следует принимать всякий раз, когда система оказывается в состоянии, определяемом узлом i), и существуют единственные значения г/,, удовлетворяющие уравнению (1) и отвечающие такой оптимальной стратегии. Справедливость этих двух допущений необходимо доказать, и действительно можно показать, что справедлива следующая теорема. Т е о р е м а о с т а ц и о н а р н о й с т р а т е г и и при О ^ а < 1. Всегда существуют единственные конечные значения г/ ; , удовлетворяющие экстремальным уравнениям (1), и стационарная стратегия, соответствующая этим значениям yt и являющаяся оптимальной среди всех возможных стратегий. Эта важная теорема аналогична теореме, которая была приведена в разд. 12.1 для детерминированного случая. Поэтому почти все рассуждения, изложенные ранее, остаются справедливыми и сейчас. Эти рассуждения в целях экономии повторяются ниже в несколько сокращенном виде, причем особое внимание уделяется некоторым изменениям, обусловленным необходимостью учета вероятностей переходов. Не прибегая к подробному аналитическому доказательству теоремы о стационарной стратегии, можно указать основную линию рассуждений, используемую для получения окончательного результата. Обозначим общую стратегию (не обязательно стационарную) символом л, указывающим, какие действия следует предпринимать на текущем отрезке времени при известном фактическом состоянии системы и какие действия следует предпринимать на каждом отрезке п в будущем, где п = 2, 3, 4, . . ., при определенном состоянии системы на любом рассматриваемом отрезке. При заданной стратегии п рассмотрим комбинированную стратегию, включающую правило принятия решений в каждом из возможных состояний на начальном
150
ГЛАВА 18
отрезке (обозначим это правило символом /), после чего начинает применяться стратегия л (иными словами, момент, когда вводится стратегия л, сдвинут на один интервал). Пусть (/л) обозначает такую комбинированную стратегию. Таким образом, действия, предпринимаемые на текущем отрезке, определяются правилом /. Правило, которое определяло бы действия на текущем отрезке при стратегии я, используется теперь на отрезке 2 при комбинированной стратегии (/л). Аналогично, правило, которое использовалось бы на отрезке п при стратегии л, при стратегии (/л) применяется на отрезке гс + 1. При этих условиях можно доказать, что: (I) Если при заданной общей стратегии я любая комбинированная стратегия (/л) приводит для каждого состояния к ожидаемому дисконтированному эффекту, который по крайней мере не меньше, чем соответствующий ожидаемый дисконтированный эффект при стратегии л, то стратегия л оптимальна. (II) Если общей стратегии л для любого состояния соответствует ожидаемый дисконтированный эффект, который в любом случае столь же велик, как и соответствующий ожидаемый дисконтированный эффект при комбинированной стратегии (/л), но строго больше по крайней мере для одного состояния, то стационарная стратегия, использующая только правило /, приводит1 в каждом из состояний к такому ожидаемому дисконтированному эффекту, который не превышает аналогичный ожидаемый дисконтированный эффект при стратегии л, причем она характеризуется ожидаемым дисконтированным эффектом, строго меньшим /я-эффекта по крайней мере для одного состояния. Исходя из (I) и (II), можно алгоритмически показать, что существует оптимальная стратегия, которая стационарна. Рассмотрим любую пробную стратегию, являющуюся стационарной. Тогда в силу (I) эта стратегия оптимальна, если только не существует пра-> вил принятия решений на начальном отрезке, обеспечивающих строгое улучшение значения целевой функции по крайней мере для одного состояния. Если же такие правила существуют, то в силу (II), используя их в качестве новой пробной стационарной стратегии, получаем улучшение. Поэтому последовательность улучшенных пробных стратегий можно ограничить таким образом, чтобы она включала только стационарные стратегии. Поскольку число состояний и решений конечно, существует лишь конечное число стационарных стратегий. Следовательно, процесс получения улучшенных пробных решений сходится за конечное число шагов, т. е. за конечное число попыток получаем стационарную стратегию, которая является оптимальной. Теперь можно показать, что упомянутые выше ожидаемые дисконтированные значения целевой функции удовлетворяют экстремальным уравнениям (1), что доказывает существование решения этих уравнений. Однозначность решения следует из анализа алгебраической структуры уравнений (1).
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
НА МАРКОВСКИХ ЦЕПЯХ
151
Последовательные приближения. Решение экстремальных уравнений (1) можно получить методом последовательных приближений в функциональном пространстве. Выберем у° произвольным образом и применим метод итераций по критерию 1
z / « + i = m i n [ S Р(И > d)ay? + ad]
для каждого i
(8)
d£D(i-> jecera (итерация по критерию). Каждая величина у? всегда будет сходиться к пределу, удовлетворяющему экстремальным уравнениям (1), но в общем случае эта сходимость не является конечной. Если все величины cid~^0, а все у° = О, то значения г/f возрастают монотонно. Приняв все у\ = О, получаем процесс решения, аналогичный решению некоторых задач с конечным плановым периодом. В частности, у? определяет ожидаемое дисконтированное значение целевой функции, соответствующей оптимальному маршруту, который начинается в узле i и проходит через п дуг. При любом cid можно добиться сходимости следующим образом. Выберем пробную стационарную стратегию, в которой для сокращения объема записей обозначим любое из решений символом d', Решим далее систему однородных линейных уравнений. J/J — S P ( J \ i , d')ayj = dd- для каждого i (9) г'есети (определение значения критерия) при начальных значениях у° = г/;, которые будут использованы в алгоритме (8). Если на произвольно выбранной итерации т прекратить вычисления и использовать непосредственно следующую из (8) оптимальную стратегию в качестве стационарной стратегии для модели с бесконечным плановым периодом, то соответствующие ожидаемые дисконтированные значения целевой функции не будут превосходить значения j/f в (8). Пример применения алгоритма итераций по критерию приведен в таблицах на рис. 18.4 и 18.5. Этот пример относится к стохастической модели управления запасами, представленной на рис. 18.3. Отметим, что сходимость к оптимальной стационарной стратегии является очень быстрой: на итерации п = 3 (рис. 18.4) и на итерации п = 2 (рис. 18.5). На итерации п = 40 значения zy? при начальных значениях у° — 0 лежат в пределах 1% минимальных значений г/ г -. Начальные значения у\, приведенные в таблице на рис. 18.5, находятся путем решения уравнений, определяющих значения критерия (9), и имеют в данном случае следующий вид: + (l-0,5a)2/ 0 -0,5ш/2 = 22, — 0,5аг/0 + 1;/1 —0,5аг/2 =20, -0,5аг/0 +(1-0,5а)у 2 =18, (10) — 0(5ш/0 —0,5аг/2 + 1г/3 =16, —0,5ау„ — 0,5ш/2 +iyt = i., где а = 0,9, что дает г/о = 202, 1/J = 200, г/ 2 = 189, у3 = 196, г/ 4 = 181. (11)
(« = 0,9) Наге=1 чальный уровень v\ запа- хЩ) са i
ге = 2
*«(Ц
у?
/г = 3
yf
УГ *3(i)
у?
Бесконечный плановый период
У'1
*«(0
VI
0
4
22
4
40
5
54,29 122,89 163,82 178,09
5
185,73
1
3
20
5
34,55
5
49,19 117,75 158,68 172,95
5
180,59
2
2
18
4
32,55
4
47,19 115,75 156,68 170,95
4
178,59
3
1
16
3
30,55
3
45,19 113,75 154,68 168,95
3
176,59
4
0
1
0
19
0
33,64 102,11 143,03 157,30
0
164,94
Начальная итерация: г/° = 0 для каждого i. Р и с . 18.4. Пример стохастической задачи о запасах. (Итерации по критерию производятся снизу.) (а = 0,9)
На-
п=0
чаль-
Бесконеч-
п =2
п =1
ный
уровень запаса i
X
01(1) Л
о
Уг
j/..
U)
j У\
2/ ч
z Ш
2
»г
«Г
У\а
ный
УГ
плано-
вый
период Уг
0
4
202
4
202
5
200,09 191,94 187,89 186,48 185,73
1
3
200
5
196,55
5
195
186,80 182,75 181,34 180,59
2
2
189
4
194,55
4
193
184,80 180,75 179,34 178,59
3
1
196
3
192,55
3
191
182,80 178,75 177,34 176,59
4
0
181
0
181
0
179,44 171,15 167,11 165,70 164,94
Значения у? вычислены из уравнения, определяющего значения критерия (9), с использованием стратегии, приведенной выше в столбце аА,. Р и с . 18.5. Пример стохастической задачи о запасах. (Итерации по критерию в функциональном пространстве производятся сверху.)
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
а = 0,9
Начальный уровень запаса i
*»(0
г/г
*»(')
г/г
*00 (0
г/г
0
5
185,73
4
97,2
4
42
1
5
180,59
5
92,8
3
40
2
4
178,59
4
90,8
2
38
3
3
176,59
3
88,8
1
36
4
0
164,94
0
76,2
0
21
а = 0,8
153
а = 0,5
Р и с . 18.6. Пример стохастической задачи о запасах. (Оптимальные решения при бесконечном плановом периоде.)
Читателю следует записать уравнения (9) для оптимальной стратегии и показать, что минимальные значения yt действительно равны: значениям, приведенным в таблице на рис. 18.4.] Заметим, что сходимость к г/; является более быстрой при начальных значениях /у", соответствующих стационарной стратегии (6), чем в случае, когда все у\ принимаются равными нулю. Читателю надлежит объяснить, почему при i = l, 2, 3 значения у? и гу(- в таблицах на рис. 18.4 и 18.5 различаются на величину 2. Отметим, что из таблицы на рис. 18.6 наглядно видно, как изменяются оптимальная стратегия и значения yt при различных значениях а. Читателю следует такжеобъяснить, почему величины хж (f) уменьшаются при уменьшении: значения а. Решить уравнения (1) можно также методом последовательных приближений в пространстве стратегий, т. е. с помощью алгоритма итераций по стратегиям, имеющего следующую структуру: . Шаг 1. Выбрать произвольную начальную стратегию и принять п = 0. Шаг 2. При заданной пробной стратегии вычислить значения z/f по уравнениям, определяющим значения критерия 3£сети
Для каждого i
(12>
(алгоритм определения значений критерия), где d' обозначает решение, принимаемое в узле i и определяемое конкретной стратегией, оценка которой производится на данном шаге~
154
ГЛАВА 18
Шаг 3. Проверить, улучшается ли стратегия, вычислив minimum [ 2 d£D(i)
jgcera
P ( l \ i > d) а.у^ + ал] = У? для каждого г
(13)
(оценка качества стратегии). Шаг 4. Прекратить вычисления, если У™ = у? при всех i. В противном случае изменить стратегию в каждом узле /с, где У£ < у£, используя решение, дающее У£ в (13). Перейти от п до и+1 и вернуться к шагу 2, используя новую пробную стратегию. Алгоритм итераций по стратегии обладает следующими свойствами: (I) 2/Г1 < г/Г в любом узле i и г/Г1 < г/£, если YKyl(II) Алгоритм сходится за конечное число итераций. (III) При остановке алгоритма стратегия, дающая У™, является оптимальной. В случае применения алгоритма итераций по стратегии к решению стохастической задачи о запасах, приведенной в таблице на рис. 18.3, последовательность стационарных стратегий совпадает с последовательностью, указанной в таблице на рис. 18.5. Однако значения г/?, вычисленные по линейным уравнениям (12), являются минимальными значениями гу г , и поэтому алгоритм останавливается при п = 2. [Читателю рекомендуется показать, что алгоритм останавливается при использовании для проверки (13) значений yf, определяемых значениями у г , которые приведены в таблице на рис. 18.4.] Метод линейного программирования, используемый для отыскания оптимальной стратегии, излагается в разд. 18.5. 18.4.»ЭКВИВАЛЕНТНЫЙ СРЕДНИЙ ЭФФЕКТ (а = 1)
Напомним, что при рассмотрении детерминированных моделей в гл. 13 в случае, когда а = 1, возникли определенные трудности содержательного и вычислительного характера. В частности, в экстремальных уравнениях (1), приведенных в предыдущем разделе, недопустимо просто принимать а = 1. Если пойти по этому пути, то получим систему функциональных уравнений, которая либо вообще не имеет решений, либо имеет неопределенное решение. Для анализа этого случая выделим три момента. Во-первых, определим критерий оптимальности стратегии при а = 1. Далее сформулируем утверждение, что всегда существует стационарная стратегия, которая является оптимальной. И наконец, используем соответствующие экстремальные уравнения и метод последовательных приближений для отыскания стационарной стратегии, оптимизирующей целевую функцию. Первые два момента не требуют какихлибо дополнительных предположений относительно структуры моде.ли, помимо допущений, принятых в предыдущем разделе. Однако
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
155
при изложении третьего момента, связанного с алгоритмом, для упрощения вводятся некоторые слабые дополнительные ограничения. Рассмотрим стратегию заданной формы (не стационарную), обозначаемую символом л*. Допустим, что стратегия я* включает рандомизирующие правила такого типа: «при попадании в узел i выбирается решение d{ с вероятностью р и решение d2 с вероятностью 1 — р». Пусть при любом заданном значении а, 0 < а < 1, у* (а) обозначает ожидаемый дисконтированный эффект, если система начинает движение из узла i и применяется заданная стратегия я*. {Если стратегия я* стационарна и нерандомизирована, то при фиксированном значении а можно вычислить числовые значения у* (а), используя алгоритм определения значения критерия (12), приведенный в предыдущем разделе. В противном случае у* (а) можно вычислить непосредственно, правда, с помощью довольно длительного цикла вычислений.] Как и прежде, обозначим минимальный ожидаемый дисконтированный эффект в начале движения системы из узла i через г/; (а). Отметим, что на этот раз символ ее фигурирует в явном виде и что при фиксированном а величины i/j (а) являются решением экстремального уравнения (1), приведенного в разд. 18.3. Стратегия я* определяется как оптимальная при а = 1, если у* (а) = yi (а) при каждом i (оптимальная стратегия) (1) при всех а, достаточно близких к 1. Иными словами, стратегия я* оптимальна, если существует такое число а* <С 1> что при всех а, лежащих на отрезке а* < а < 1, ожидаемый дисконтированный эффект при выборе стратегии я* равен минимально возможному ожидаемому эффекту. Важный результат, который здесь можно доказать, выражается следующей теоремой. Т е о р е м а о с т а ц и о н а р н о й с т р а т е г и и при а = 1. Всегда существует стационарная стратегия, являющаяся оптимальной. Кроме того, всегда существует стратегия, не включающая рандомизации. Хотя эти утверждения представляются весьма правдоподобными, их доказательство далеко не тривиально. На самом деле утверждения не верны, если число состояний не ограничено, поскольку при этих условиях может не быть оптимальной стратегии, являющейся одновременно стационарной и детерминированной. Структура марковской цепи. Прежде чем вывести соответствующие экстремальные уравнения и изложить алгоритм их решения, рассмотрим более детально вероятностную структуру модели при использовании стационарной стратегии. Введем в выражение (3), приведенное ниже, допущение, которое исключает некоторые особые случаи, представляющие интерес для узких специалистов. Это допущение существенно упрощает рассуждения, не сужая в то же время практической применимости рассматриваемого аппарата. В дальнейшем дается нестрогое описание поведения марковской цепи. Если
156
ГЛАВА 18
читатель уже знаком с теорией марковских процессов, то он можег лишь бегло просмотреть или совсем опустить эти примеры. Для упрощения изложения будем в дальнейшем предполагать, что состояния системы пронумерованы числами О, 1, . . ., Т. Рассмотрим произвольную стационарную стратегию и с целью сокращения записей обозначим каждое из определяемых этой стратегией решений символом d'. Тогда закон движения системы полностью определяется соответствующей квадратной матрицей вероятностей перехода из состояния i на одном отрезке в состояние / на следующем отрезке времени:
"р р
р
(0 0, d') d') (0 (0
d') . . . р а 0, d') . . . 1, d')... р а. 1, d').. .
1.
Р (1 10, Р (1
i, d')
Р (1
*, d')... р
Р (1
г,
.р (0 т,
d')
d')...
(7
р0
р (Т \ О, d') ч p(T\i, d') р(Т
Т, d') . . . р (Т | Т, d') (2)
Такая система, полностью определяемая своими вероятностями перехода для одного отрезка, получила название марковской цепи. [Читатель уже ознакомился с примером матрицы вероятностей перехода, описывающей модель управления запасами (7) в разд. 18.3.} Следуя общепринятым канонам, марковские цепи описываются далее в терминах состояний, а не в терминах узлов сети. При рассмотрении алгоритмов решения задач вновь используется «сетевой язык». Прежде чем записать экстремальные уравнения при а = 1, предположим теперь, что существует оптимальная стационарная стратегия с решениями d*, имеющими стационарные вероятности QJ, j = = О, 1, . . ., Т, которые однозначно определяются Г - f l линейными уравнениями Ч}=
1=0
при у =
(постулат об однозначности стационарных вероятностей) (3)
и ограничением 2; = 1. Это допущение не выполняется для всех марковских цепей, но справедливо для большинства случаев, представляющих практический интерес. Излагаемые ниже теоретические соображения и вычислительные приемы можно соответственно модифицировать при рассмотрении случаев, когда допущение, принятое в (3), неоправдано. Выражению (3) можно дать следующую интерпретацию. Предположим, что каждая величина qj есть вероятность того, что на рассматриваемом отрезке система находится в состоянии j. Тогда пра-
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
157
вая часть (3) представляет собой не что иное, как вероятность того, что система будет находиться в том же состоянии / на следующем отрезке. В соответствии с (3) значения q, таковы, что обе эти вероятности равны между собой. Таким образом, рассуждая аналогично, приходим к выводу, что если величины д7- удовлетворяют уравнению (3) и действительно являются вероятностями того, что система на начальном отрезке находится в состоянии j, то эти величины представляют собой также вероятности того, что система будет находиться в состоянии / на любом последующем отрезке. Другая интерпретация величин д^, справедливая в большинстве реальных случаев, сводится к тому, что значения этих величин определяют предельные вероятности того, что система будет находиться в состоянии / на отрезке, значительно удаленном от текущего момента времени, т. е. тогда, когда система приближается к состоянию статистического равновесия. Третья интерпретация, неточная, но интуитивно ясная, заключается в том, что каждая величина q, представляет собой установившуюся относительную частоту пребывания системы в состоянии /. Стационарные вероятности играют важную роль, так как они отражают основную информацию, необходимую для расчета рабочих характеристик системы. Так, например, ниже [выражение (5)] будет показано, как использовать значение д;- для вычисления ожидаемого эффекта от использования системы в течение каждого отрезка времени. Из последующих глав читатель узнает, каким образом особая структура определенных моделей марковского типа позволяет в явном виде записывать выражения для QJ. Примеры стационарных вероятностей. Нижеследующие примеры поясняют понятие стационарных вероятностей. Случай 1. Пусть матрица вероятностей перехода имеет вид 1/
2/
V2
Va
Поскольку g0 + g 4 = 1, из (3) при / = 0 получаем уравнение: откуда
до = до (V 3 ) + (1 - д„) (V 2 ), до = 3/7,
9l
= 4/7.
.
(П) (Ill)
Обозначим через QJ (п) вероятность того, что система находится в состоянии / в начале отрезка п, где QJ (1) = qs есть некоторая 'заданная вероятность пребывания системы в состоянии / на начальном отрезке. Тогда по аналогии с (3) легко показать, что
i=0
158
ГЛАВА 18
Если Т — 1, то можно доказать, что выражение (IV) записывается в следующем виде: qj (п + 1) =gi + [qj - gj] [1 - р (1 | 0, d*) -
-р(0 И, <**)]" при ; = 0, 1.
(V>
Член в правой части (V), следующий за знаком сложения, называется переходной коррекцией, поскольку он отображает разницу [?j (п + 1) — <Ы> характеризующую функционирование системы лишь на конечном плановом периоде. Вопрос читателю: каков диапазон возможных значений [1 — р (1 | 0, и*) — р (0 | 1,^*)]? В случае (I), поскольку (1 —2 / 3 —1/г)" — (1/6)" стремится к О при возрастании п до произвольно большой величины, значения qj(n-\-i) в пределе стремятся к q}. Таким образом, значения / в (III) можно интерпретировать и как предельные вероятности пребывания системы в состоянии у, и как установившиеся относительные частоты. Случай 2. При заданной матрице марковской цепи 1/3
2
имеем
qa = 1/3,
?i
= 2/3.
(VII)
Во всех случаях, когда строки марковской матрицы идентичны, стационарные вероятности равны элементам таких строк. Читателюследует вычислить д;(п-|-1), воспользовавшись выражением (V). Случай 3. При заданной матрице вероятностей перехода !
/з
V,
можно показать, что стационарные вероятности равны ?0
= 1/2, ?i = 1/2.
(IX)
Во всех случаях, когда сумма элементов каждого столбца матрицы марковской цепи равна 1, все величины qj равны между собой (т. е. qj = 1/Г+1). Такая матрица называется дважды стохастической. Случай 4. Нужно показать, что при матрице вероятностей перехода
'i' 'о) стационарные вероятности равны до = 3/5, дч = 2/5.
<х> (XI)
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
159
Случай 5. Предположим, что матрица марковской цепи имеет следующий вид:
V3
2
о
Отметим, что, когда система достигает состояния 1, она навсегда остается в этом состоянии. Состояние 0 носит название переходного состояния. Соответствующие стационарные вероятности равны д0 = 0, д 4 = 1. (XIII) Если система находится в состоянии 0 на начальном отрезке, то можно, используя (V), показать, что она все еще будет находиться в этом состоянии в начале отрезка п с вероятностью (1/3)п. Таким образом, при произвольно большом п вероятность пребывания в состоянии 0 становится пренебрежимо малой и в пределе равна 0. Следовательно, результат (XIII) соответствует интерпретации QJ как предельных вероятностей, так и установившихся относительных частот. Случай 6. Предположим, что вероятности перехода имеют следующие значения: /О 1\
<XIV>
(i о)'
т. е. система переходит из состояния 0 в состояние 1 и обратно, или, иными словами, совершает колебания между этими состояниями. Для этого случая можно показать, что
до = 1/2,
qi
= 1/2.
(XV)
Хотя интерпретация значений (XV) как установившихся относительных частот является интуитивной, заметим, что из (V) следует QJ , L — QJ
при п четном, при п нечетном.
(XVI)
Следовательно, значение д 7 -(ге-)-1) при условии, что д ^ 1/2, зависит от того, является ли п четным или нечетным, и не стремится к пределу при возрастании п до произвольно большой величины. Поэтому в таком случае интерпретация значений (XV) как предельных вероятностей того, что система находится в состоянии /, является неверной. Этот случай представляет собой пример так называемой циклической цепи. Случай 7. Рассмотрим в заключение систему, описываемую следующей матрицей вероятностей перехода:
1 О
0\ 1 '
< XVII >
160
ГЛАВА 18
Отметим, что если система в начальный момент находится в состоянии ;', то она остается в этом состоянии навсегда. В этом случае уравнения (3) не имеют единственного решения. Любые вероятности qj удовлетворяют уравнениям (3). Система (XVII) представляет собой пример системы, иногда называемой множественной цепью. Это означает, что систему можно разбить на подсистемы, каждую из которых можно анализировать независимо. Таким образом, предположение, что уравнения (3) имеют единственное решение, соответствующее оптимальной стационарной стратегии, исключает системы с оптимальными стратегиями, соответствующими множественным цепям. На самом деле нетрудно найти оптимальные стратегии и для множественных цепей, но эти случаи здесь не будут рассматриваться. Экстремальные уравнения. Предположим, что детерминированная стационарная стратегия л* является оптимальной. Тогда по определению при значении а, достаточно близком к 1, имеем т yi = minimum [ 2 p ( / | i > d) ayj + ctd] = d£D(i) j=0 т = S P (/' [ z> d*) ay; + cid* для каждого г, (4) 7=0
где d* обозначает решение в узле t, определяемое стратегией л*. Примем далее условие т
c* = i=0 S qfcid*,
(5)
где q* — стационарные вероятности, рассчитанные по уравнениям (3) для стратегии я*. Интуитивной интерпретацией величины с* является рассмотрение этой величины как ожидаемого установившегося эффекта от использования системы в течение одного интервала (который может иметь так же смысл затрат). Хотя такая трактовка несколько неточна, в дальнейшем величина с* рассматривается именно в этом смысле. В разд. 12.3 для вывода приближенных экстремальных уравнений в случае а = 1 применялся эвристический подход. Точно такой же метод используется и на этот раз. Однако стоит вновь предупредить читателя, что весь ход рассуждений направлен лишь на то, чтобы получить окончательное выражение для экстремальных уравнений, которое может показаться несколько неожиданным. Вывод этих уравнений не является строгим в математическом отношении с точки зрения теории функциональных уравнений. Иной эвристический подход излагается далее. Рассмотрим ожидаемый эквивалентный эффект (1 — а) г/ г и определим величину Wi с помощью тождества (1 — ее) yt = (1 — a) W j + c* для каждого i. (6)
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
161
Теперь можно переписать функциональные уравнения (4) в виде т с Wi + , = minimum Г Y р (/ | i, d) a. ( Wj + , ° } + cid] для (7) 1
~~
а
Поскольку
d£D(i)
~^
каждого г. т = и 2 Р (i М> ^) 1 величина с* постоянна, член, вклю-
j=0
чающий с*, можно перенести из правой части выражения (7) в левую. Легко показать, что, выполнив это преобразование и положив а = 1, мы получаем экстремальные уравнения т wi -\-с* = minimum [ 2 Р (Л i, d) Wj + ad] для каждого i (8) d£D(i)
j=0
(экстремальные уравнения при а = 1). Разность wt — Wj можно рассматривать как приращение ожидаемого эффекта, если начать движение из узла i, а не узла /. (Формально разность Wi — Wj есть предельное значение разности yt — uj, когда а стремится к. 1.) [Как было указано в гл. 12, для того чтобы этот вывод был точным, нужно использовать в (6) и (7) обозначения yt (а) и wt (а) и определить wi в (8) как предельное значение wt (а) при стремлении а к 1 снизу.] Следует показать, что если множество величин и;; удовлетворяют (8), то этим уравнениям удовлетворяют и множество величин (и;,- + + К), где К — произвольная постоянная. Поэтому необходимо ввести нормирующее ограничение. Удобным является ограничение w0 = 0 (нормирование). (9) Используя такие же рассуждения применительно ко второму равенству в (4), получаем следующие уравнения определения значения критерия для стратегии я*: г wijrc*= ^ j p ( j \ i , d*)wj-{-Cid* для каждого i (10) j=0
(алгоритм определения значения критерия). Система (9) и (10) состоит из Т + 2 линейных уравнений, содержащих Т -\- 2 неизвестных w0, w1: . . ., WT и с*. Из постулата (3) о существовании единственных стационарных вероятностей следует существование единственного решения уравнений (9) и (10). Кроме того, получаемое значение с* оказывается на самом деле равным значению, определяемому с помощью выражения (5). Чтобы убедиться в этом, умножим сначала каждое соотношение в (10) па q*. а затем просуммируем полученные результаты по i, в результате чего получим 2 qf (wt + с*) = 2 3? S Р (i I i, d*) Wj + S g?cid*.
t=0
'
i=0
j=0
i=0
(1 1)
162
ГЛАВА 18
Далее нужно использовать (3), чтобы показать, что уравнение (11) можно упростить, сведя его к уравнению (5). Сформулируем теперь основной вывод, следующий из анализа экстремальных уравнений. Необходимые условия оптимальности, а) При заданной детерминированной стационарной стратегии я* в случае, когда стратегия я* оптимальна, решение (9) и (10) удовлетворяет экстремальным уравнениям (8) и (9). б) Обратно, если решение (9) и (10) не удовлетворяет экстремальным уравнениям (8) и (9), то стратегия я* не оптимальна. Поскольку всегда существует стационарная стратегия, являющаяся оптимальной, всегда существует и решение экстремальных уравнений (8) и (9). Необходимое условие оптимальности содержит утверждение, что оптимальная стационарная стратегия дает решение экстремальных уравнений. Покажем теперь, что стационарная стратегия, дающая решение экстремальных уравнений, является оптимальной. Рассмотрим стационарную стратегию я', включающую решения d'. Пусть w\ и с' являются соответственно решениями уравнений
и>; = о, т wl + с' = S p ( j \ i, d') w] + си-
(12) для каждого i.
(13)
;=0
Тогда можно доказать следующее утверждение. Достаточные условия минимума ожидаем о г о э ф ф е к т а н а о т р е з к е , а ) П р и заданной детерминированной стационарной стратегии я' в случае, когда соответствующие величины w'j и с' из (12) и (13) удовлетворяют экстремальным уравнениям (8) и (9), величина с' является наименьшей по всем стратегиям, б) Обратно, если величина с' не является наименьшей, то решение (12) и (13) не удовлетворяет экстремальным уравнениям (8) и (9). Следовательно, стационарная стратегия дает решение экстремальных уравнений только тогда, когда соответствующая величина с' имеет такое же значение, как и при оптимальной стратегии. Заметим, однако, что такая стратегия п' может оказаться неоптимальной с точки зрения частного определения оптимальной стратегии в (1), т. е. я' может быть и неоптимальной для каждого узла г, когда значение а близко к 1. Тем не менее в целом ряде практических случаев вполне возможен выбор стратегии, обеспечивающей минимальный достижимый ожидаемый эффект в течение каждого отрезка. Кроме того, возможно обобщение, при котором используются вычислительные методы отыскания оптимальной стратегии, отвечающей определению (1). Эти вопросы представляют интерес для специальных исследований и здесь более не рассматриваются.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
163
Справедливость сформулированного достаточного условия можно показать следующим образом. Пусть, как и прежде, d* обозначает некоторое решение, принадлежащее оптимальной стационарной стратегии п*. Поскольку стратегия я' дает при использовании (12) и (13) решение экстремальных уравнений, отсюда следует, что т w\-\-c'^C 2 P ( j \ i i d*)w'i + dd* для каждого i. (I) 3=0
Применяя соотношение (10), можно записать (I) в следующем виде: т т w'i + c'— S P(i\i, d*)w-<.Wi + c*— 2 P ( j \ i , d*)wj. (II) з=о 3=0 Умножив (II) на стационарные вероятности gf, определяемые стратегией я*, и просуммировав по i, получим с' < с*. (III) Поскольку, согласно принятому допущению, значение величины с* минимально, с' = с*, что и требовалось показать. Когда модель является фактически детерминированной, экстремальные уравнения (8) сводятся к уравнениям, приведенным в гл. 12, а именно к уравнениям (6) из разд. 12.3. Примеры 3 и 6 в разд. 12.4 показывают, как стационарная стратегия может давать решение экстремальных уравнений, которое не является оптимальным в смысле приведенного выше в этой главе определения 1. Итеративный процесс в пространстве стратегий. С помощью непосредственного обобщения алгоритма поиска в пространстве стратегий, рассмотренного в разд. 12.3, можно получить стратегию л', обладающую минимальным значением с'. Для упрощения изложения этого метода принимается дополнительное допущение, которое выполняется в большинстве реальных ситуаций. Предположим, что для каждой пробной стратегии я', оцениваемой на шаге 2 приводимого ниже алгоритма, существуют единственные стационарные вероятности. (Алгоритм можно легко модифицировать с целью его использования в случае, когда это допущение не выполняется.) Алгоритм поиска в пространстве стратегий состоит из следующих шагов: Шаг 1. Выбрать произвольную исходную стационарную стратегию и положить п = 0. Шаг 2. При заданной пробной стратегии я' на итерации п решить Уравнения, определяющие значения критерия: ц>« = 0 (алгоритм определения значения критерия), т п и?Г + с = S P(i\i, d ' ) w f3 + cid' для каждого i, з=о где d' есть решение в узле i, определяемое конкретной стратегией, которая подвергается оценке.
164
ГЛАВА 18
Шаг 3. Вычислить т minimum [ 2 Р (/ I г '
c;d] = И7™ для каждого г.
j=0
(15)
Шаг 4. Прекратить вычисления, если W? = wfjrcn при любом i; при этом значение с™ минимально. В противном случае изменить стратегию в каждом узле /с, где W% < w%-\-c , используя решение, дающее W% по уравнению (15). Перейти от п к re-f-l и вернуться к шагу 2 при новой пробной стратегии. Алгоритм итераций по стратегии сходится за конечное число итераций. В таблице на рис. 18.7 приведен пример применения алгоритма к решению стохастической задачи о запасах, условия которой даны
Начальный уровень запаса i
0
ге = 0
*0(i)
«-•?
4
0
1
3
-2
2
2
-4
3
1
-6
4
0
-21
с
п
20
п =1
W\
*i(0
20
4
4 4 9i 2
-1
«4
ге = 2
W\
г
а(0
*1
Щ
0
"т
•4
5
5
-4 4
5
4
-4 4
4
"Т
Ч
3
->4 4
3
э! 7
4
0
-21
-4
0
0
«4
-4 4 3
а
-20 20?2
-4
•4
Р и с . 18 7. Пример стохастической задачи о запасах. (Итерации по стратегии.)
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
165
в таблице на рис. 18.3. Используя на шаге 1 стратегию выпуска партий наименьшего допустимого объема, получаем, что алгоритм сходится на итерации п — 2. Рассмотрим вновь пример фирмы «Надежный поставщик». Рекуррентное соотношение при 0 ^ а < 1 приведено в разд. 18.3 [соотношение (2)]. Если для рассмотрения этого соотношения воспользоваться теми же эвристическими рассуждениями, к которым мы прибегали для получения экстремальных уравнений (8), то получим соответствующие функциональные уравнения
(I) Это рекуррентное соотношение можно вывести также с помощью иных эвристических соображений, которые позволяют уточнить смысл величин it>;. Прежде чем изложить эти соображения, приведем из таблицы на рис. 18.7 решение экстремальных уравнений (I)
с* = 17 А
!»!=—б4=—5,43,
w0 = 0,
w2=— 7-f = — 7,43,
3
ш 3 =-94=-9,43, 2
(П)
u; 4 =—20-f=—20,29.
Рассмотрим теперь рекуррентное соотношение (7) для конечного планового периода из разд. 18.1. Вполне разумно предположить, что при достаточно большом значении п значение функции /n (i) будет приблизительно в п раз больше ожидаемых затрат на отрезке с* плюс некоторая поправка, учитывающая начальное условие, что исходный уровень запаса равен г, т. е.
/„ (г) « пс* + щ,
(III)
где ivi обозначает на сей раз поправочный коэффициент. Покажите, что в результате подстановки правой части (III) в рекуррентное соотношение (7) из разд. 18.1 и последующих упрощений также получается приведенная выше система экстремальных уравнений (1). Используя условие нормировки w0 = 0, получаем из (III) Л, (0 - /* (0) &wt-w0 = Wi. (IV) При п = 5 и значениях соответствующих величин, взятых из таблицы на рис. 17.2, приходим к следующим результатам: /п (1) - /п (0) = -5,57, fn (3) - /„ (0) = -9,57, /п (2) - /„ (0) = -7,57, /„ (4) - /„ (0) = -20,38, что уже хорошо согласуется с результатами (II).
v ;
18.5. ПОДХОД, ОСНОВАННЫЙ НА ИСПОЛЬЗОВАНИИ АППАРАТА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Численные решения экстремальных уравнений, рассмотренных Двух предшествующих разделах, можно получить также с помощью методов линейного программирования. Этот подход аналогичен в
166
ГЛАВА 18
подходу, изложенному в разд. 12.6 для детерминированной модели выбора кратчайшего маршрута. Рассмотрим прежде всего случай, когда 0 ^ а < 1. В этом случае экстремальные уравнения (1) из разд. 18.3 приводят к линейным неравенствам г/г — 2 ;£сети
Для любых i
P ( J \ i i d)ayi^.Cid
и
d,
(1)
где величины yt не ограничены по знаку. Все минимальные значения yt можно найти исходя из максимизации целевой функции S rjyj,
(2)
}£сети
где любая величина г,- представляет собой произвольное, но строго положительное число. [Если 2 О ~ 1> то величины г} можно рассматривать в качестве вероятностей того, что на начальном интервале система находится в состоянии, соответствующем узлу у, а значение (2) можно интерпретировать как соответствующее ожидаемое дисконтированное значение эффекта.] Соответствующая двойственная задача записывается следующим образом: МиНИМИЗИрОВатЬ
J S CidZid ;£сети d£D(t)
(3)
при ограничениях X}d— 2
S P (i I i. d) aa;id = Гу для каждого у £ сети,
(4)
i£cera d£B(i)
xid > 0 при любых значениях t и d
(5)
Можно показать, что оптимальное базисное решение содержит одну величину xid^>Q для каждого г, которая соответствует оптимальной стратегии. Рассмотрим теперь случай, когда а = 1, введя те же допущения, что и для алгоритма итераций по стратегии в разд. 18.4. (В случаях когда такие допущения неоправданы, можно построить модифицированные модели линейного программирования большей размерности.) Соответствующая прямая модель линейного программирования записывается следующим образом: Максимизировать с при ограничениях т Wt—2 Р (i \ i , d) Wj-\-c^Cid ;=0
где wi и с не ограничены по знаку.
для любых i и d,
(6)
(1)
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
167
Двойственная модель имеет при этом вид Минимизировать
2
S ctdVtd (ожидаемые затраты на отрезке)
г£Сети d£D(i)
при ограничениях 3 tyd— S
(8) S / > ( / ! * - d)y i d = 0 Д ля каждого ; 6 сети
г£сети d£D(i)
d£D(.7)
(«сохранение» вероятностей), S
S у гсг = 1 (нормирующее ограничение),
г£сети d£D(i)
i>i d ^ О при любых значениях i и d.
(9) (10) (11)
Величину У; d можно рассматривать как совместную вероятность того, что система находится в состоянии, соответствующему узлу i, и что при этом принимается решение d. Таким образом, в двойственной модели оптимизация сводится к определению вероятностей каждой возможной пары (i, d). Ограничение (9) можно интерпретировать как уравнение «сохранения» вероятностей. Иными словами, общая вероятность выхода из узла / равна общей вероятности попадания в этот же узел /. Ограничение (10) отражает условие, что сумма совместных вероятностей должна быть равна единице. Можно доказать, что всегда существует оптимальное решение задачи (8) — (11), такое, что значение не более одной величины vid>0 при любом i. Это решение соответствует стратегии, дающей минимальное значение с в задаче (6) — (7). Поскольку двойственная модель описывается в терминах вероятностей, она является удобным средством постановки задач в условиях, когда нужно ввести стохастические ограничения. Однако в общем случае при введении таких ограничений в оптимальной стратегии должны, как правило, содержаться элементы рандомизации, т. е. оптимальная стратегия может включать более одной строго поло жительной величины vid. В таком случае отношение uid 2 vm представляет собой оптимальпую вероятность выбора решения d', когда система находится в состоянии, соответствующем узлу i. Пример задачи о запасах. Двойственная модель стохастической задачи о запасах (фирма «Надежный поставщик») приведена в таблице на рис. 18.8. Оптимальным является решение
Соответствующие ожидаемые затраты на отрезке равны А. 25 + ^- 26 + А.24 + -1-. 22 + ^.1^174.
(13)
168
/ 0
ГЛАВА 18
У
04
3
4
05
1 ' 1 2
1
2
У
1
^13
"14
1 ~2
V
22
V
"24
23
У
31
У
32
V
33
У
40
1
1
1
1
2
2
~~2
2
1 2
1 2
1
' i ' 1 2
~~т
"15
~т 1
Т
11
'
7 '
2
1 ~~2
1
~т
^42
=0
1
1 ~2
1
1 2
1
41
~т
Т ~Т
!
У
1
2
=0
1
1
2
2 1 ~~2~
'
' т
=0
=0
=0
Нормирующее ограничение по всем i, ж МиНИМИЗИрОВаТЬ 22 ^ по всем i, x
— 3]}
Р и с . 18.8. Двойственная задача линейного программирования для стохастической модели управления запасами.
При детерминированном спросе (D = 3) на каждом отрезке эта 4 величина равна 15 / 6 . Кроме того, в детерминированном случае объем производства 2 составляет 0 изделий в течение / 5 отрезков и 5 изделий в течение 3 /5 отрезков. В стохастическом варианте вероятности (12) показывают, что объем производства изделий равен 0 в течение 4 / 1 4 отрезков, 1 3 и объемам в 3, 4 и 5 изделий в течение /i 4 , "/14 и /i 4 отрезков соответственно. Таким образом, ожидаемое производство на отрезке составляет 6
что отвечает допущению о полном удовлетворении спроса.
(14)
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
169
18.6. ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ
При оценке вычислительных трудностей, связанных с получением численных решений задач динамического программирования на марковских цепях, нужно учитывать два момента. Первый относится к общей вычислительной реализуемости применяемого алгоритма, второй — к относительной эффективности каждого вычислительного процесса, изложенного в разд. 18.2—18.5. Если обозначить через NI число различных решений, которые можно принять в узле i, где i = О, 1, . . ., Т, то структуру сетевой модели можно приближенно рассматривать в виде прямоугольной матрицы размерностью 2 Nt на Т + 1. На рис. 18.3 приведена такая матрица, описывающая модель задачи о запасах, фигурирующей в данной главе. Отметим, что матрица имеет примерно такую же размерность, как и задача линейного программирования, изложенная в предыдущем разделе. Даже в случае простейшей задачи значения 27Vj и Т + 1 могут быть достаточно велики. В силу этого существенно найти вычислительные приемы, которые позволяли бы выгодно использовать частные особенности оптимальной стратегии в каждом конкретном случае. Приводимый в следующем разделе пример наглядно иллюстрирует это положение. Иногда модель задается в виде марковской цепи, чтобы отобразить форму оптимальной стратегии. Часто задание модели в таком виде приводит к некоторому увеличению числа состояний, однако при этом резко уменьшается число возможных решений в большинстве состояний (см. упражнения 50 и 51). Что же касается относительной эффективности каждого алгоритмического процесса, то замечания, приведенные в гл. 12, в равной степени справедливы и на этот раз. В частности, при а < 1 метод итераций по критерию обладает преимуществом, связанным с простотой численных приемов, но в то же время страдает таким недостатком, как отсутствие конечной сходимости. Достоинством метода итераций по стратегии является сходимость за конечное число итераций, однако объем вычислений на каждой итерации возрастает, поскольку приходится решать полную систему однородных линейных уравнений. (Довольно просто можно объединить эти две схемы в единый комбинированный алгоритм.) Преимущество применения метода линейного программирования заключается в том, что можно воспользоваться широко распространенными сложными программами решения задач линейного программирования на ЭВМ, не говоря уже о том, что использование симплексного метода решения двойственных задач, приведенных в разд. 18.5, тесно связано с методом итераций по стратегии. В частности каждая итерация симплексного метода соответствует улучшению стратегии только в единственном состоянии, а не во всех состояниях, где в принципе возможно какоелибо улучшение.
170
ГЛАВА 18
18.7. МОДЕЛЬ ЗАМЕНЫ ОБОРУДОВАНИЯ В ВИДЕ МАРКОВСКОЙ ЦЕПИ
Вспомним стохастическую модель замены оборудования, рассмотренную в разд. 17.7. В этой модели приняты следующие обозначения: k — плановый период замены; PJ — вероятность того, что оборудование впервые выйдет из строя в течение ;-го отрезка эксплуатации; TJ — стоимость эксплуатации оборудования в течение /-го отрезка при условии, что оно исправно работает на этом отрезке; (г; "т~ sj) — штрафные потери, обусловленные эксплуатацией оборудования в случае, когда оно выходит из строя в течение /-го отрезка эксплуатации при ;' < k. Если на отрезке восстановления t плановая замена предусматривается в периоде k, но оборудование выходит из строя в конце отрезка t -f- /, где ; <С k, то оборудование заменяется в начале отрезка t + j + i. При коэффициенте дисконтирования а = 1 оптимальное значение k находится как решение уравнения h
g= minimum I• f h=i, 2
N \
Л
ft
),
U I J'
(1)
где fih есть ожидаемый эффект, а Е [/ | k] — ожидаемое число отрезков безотказной работы каждой единицы оборудования при условии, что плановый период замены равен k. Вывод столь простого решения основан на том, что оптимальная стратегия принадлежит к типу стратегии восстановления. Покажем теперь, как можно поставить и решить эту же самую задачу с помощью аппарата марковских цепей. Рассмотрение этого вопроса служит двум целям. Во-первых, демонстрируется, что стохастическая модель замены оборудования является частным случаем модели, приведенной в разд. 18.4. Во-вторых, показывается, что «прямолинейная» марковская постановка задачи слишком громоздка в сравнении с более тонким подходом, учитывающим вид оптимального решения (см. упражнение 50, п. е), где дана такая постановка. Пусть узел j соответствует возрасту оборудования в начале рассматриваемого отрезка, т. е. сразу же после принятия решения о сохранении или замене оборудования. Таким образом, / = О означает, что закуплена новая единица оборудования, а / = 1, 2, . . . указывает, что продолжает работать старое оборудование.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
171
Примем следующие обозначения: di — решение заменить оборудование в начале следующего отрезка; dz — решение не заменять оборудования в начале следующего отрезка при условии, что оно не вышло из строя в течение рассматриваемого отрезка. Тогда для всех г справедливы соотношения
Р (О | г, d^ = 1,
(2)
= l-p(0|i, cZ2),
(3)
h=i r
Cidi — i
И
p (0 | i, d2) st.
°idz —
(4)
Отметим, что величина р (0 | i, d2) представляет собой вероятность того, что закуплена новая единица оборудования вследствие выхода из строя старого оборудования до истечения планового периода замены. i
P (I \ i. d)
d
0 1 1
0
1
Т ^
2
"d
3 4
i i Т i 0
^l di
2
«id
3
4
i
100
*
3 4
100 + 4- -20 4
4
l 0
^
i
2
1
20 2 3
20 + 4-180 О
1
20 20 + 0-0 56
Р и с . 18.9. Марковская постановка задачи замены.
Постановка задачи, приведенной на рис. 17.6 (стр. 113), в виде марковской цепи дана в таблице на рис. 18.9.
172
ГЛАВА 18
Оптимальной является
следующая
стратегия:
di при i ^ 2 и d2 в противном случае.
(5)
Легко показать, что экстремальным уравнениям (8) и (9) из разд. 18.4 в соответствии со стратегией (5) удовлетворяют следующие значения неизвестных: wn = 0, ц>! = -220/3, wz = —30, ws = —30, u;4 = 6, с* = 50 (6) и что соответствующие стационарные вероятности равны до = 4/Ю,
?1
= д 2 = 3/10.
(7)
4
Поскольку в течение /ю рассматриваемого периода система находится в узле 0, т. е. только что закуплена новая единица оборудования, то ожидаемая продолжительность отрезка между двумя последовательными закупками составляет f l '•тг] = '^~^\ отрезка, что согласуется со значением Е [j \ 3] на рис. 17.6 (стр. ИЗ). Решение этой задачи методом линейного программирования или методом последовательных приближений в пространстве стратегий требует выполнения вычислений, связанных с операциями над матрицей размерностью 9 x 5 , как это показано на рис. 18.9. Применение этих методов в случае такой «прямолинейной» постановки задачи неэффективно в сравнении с использованием простого метода оптимизации (1). КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ
1. Рассмотрим стохастическую модель выбора кратчайшего маршрута, приведенную в разд. 18.2. а) Предположим, что с ( j | i, d) обозначает фактический эффект на текущем отрезке, получаемый за счет принятия решения d в узле i, в результате которого состояние системы на следующем отрезке будет соответствовать узлу /. Выполните промежуточные преобразования, приводящие к рекуррентному соотношению (6) в случае, когда величина cid вычисляется по формуле (4). б) Покажите справедливость соотношения (6) и сравните (6) с его детерминистским аналогом (1). Покажите также, каким образом используется допущение об ацикличности при записи выражения (6). в) Объясните, как при отыскании числового решения (6) определяется оптимальная стратегия. Укажите, как применить такую стратегию. 2. Рассмотрите пример задачи о запасах из разд. 18.2. а) Предположите, что производственное ограничение составляет максимум 6 изделий вместо 5. Как это изменение влияет на сетевое описание модели?
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
173
б) Предположите, что ограничение на конечный уровень запаса составляет максимум 5 изделий вместо 4. Как следует пронумеровать узлы в соответствующей сетевой постановке задачи? в) Покажите, что единственными положительными вероятностями перехода являются величины, определяемые выражением (8). Покажите также, что (8) и (10) согласуются с допущением (5) об ацикличности. г) Объясните смысл равенства (11). Является ли величина C 5n+t,x математическим ожиданием? Дайте необходимые пояснения. д) Постройте сеть, аналогичную сети на рис. 18.1, для стратегии, формулируемой следующим образом: объем производства при п ^ 2 равен 3, если i = О, 1, 2, 3, и равен 0 в противном случае. 3. Рассмотрим стохастическую модель выбора кратчайшего маршрута в терминах линейного программирования, которая описана в разд. 18.2. а) Выполните промежуточные алгебраические преобразования, позволяющие перейти от рекуррентного соотношения (6) к ограничениям (II). б) Покажите, что (III) — (VI) являются постановкой задачи, двойственной к (I) — (II). в) Запишите прямую и двойственную задачи линейного программирования при 71 = 4 и й = 1,2, Зв форме, аналогичной таблицам на рис. 18.2. г) Какое влияние оказывает допущение об ацикличности на вид прямой и двойственной задач, подобных приведенным в таблицах на рис. 18.2? д) Предположим, что а = 1. Дайте интерпретацию всех линейных ограничений двойственной задачи. е) Сколько переменных и ограничений в прямой и двойственной задачах о запасах в предположении, что плановый период состоит из трех отрезков, как это показано на рис. 18.1? ж) Дайте ответ на вопрос п. е), предположив, что ограничение на максимальный объем производства составляет не 5 изделий, а 6. з) Дайте ответ на вопрос п. е), предположив, что ограничение на максимальный конечный уровень запаса составляет не 4 изделия, а 5. и) Рассмотрите пример, приведенный в виде таблиц рис. 18.2, и положите ос = 1. Покажите, какое ограничение нужно ввести в двойственную задачу, чтобы вероятность «попадания» системы в узел 2 была не менее V 4 и не более 3 / 5 . Покажите также, как обеспечить в двойственной задаче выполнение следующего условия: если система попадает в узел 2, то d = 1 выбирается с вероятностью, не превышающей 1 /з4. Модель оптимального размера партии (разд. 17.5). Предположим, что для работы требуется три изделия, а у поставщика можно заказать единовременно не более пяти изделий.
174
ГЛАВА 18
а) Покажите, как можно представить эту задачу в виде стохастической задачи выбора кратчайшего маршрута. Обязательно определите узлы сети и укажите их число. Поясните связь между такой постановкой и рекуррентным соотношением (2) разд. 17.5. б) Постройте сеть, отображающую стратегию, при которой всегда заказывается на два изделия больше, чем требуется. (Указание: используйте фиктивный узел, отображающий условие, что в полученном заказе указано достаточное число изделий для удовлетворения существующих потребностей.) в) Запишите в явном виде формулы для каждого ожидаемого эффекта. г) Запишите в явном виде условные вероятности р Q \ i, d). (Указание: рассмотрите вероятности рх (/')/[! — рх (х}} при / = О, 1, . . . . . ., х — 1 и дайте их интерпретацию.) д) Какие трудности возникают при постановке стохастической задачи о выборе кратчайшего маршрута в терминах рекуррентного соотношения (1), приведенного в разд. 18.2? 5. Покажите справедливость следующего утверждения: если модель, описываемая экстремальными уравнениями (1) из разд. 18.3, является на самом деле детерминированной, уравнение (1) упрощается до соответствующего рекуррентного соотношения из гл. 12. 6. В каждом из указанных ниже пунктов приведено некоторое изменение допущений, положенных в основу стохастической модели управления запасами, описанной в разд. 18.3. Объясните подробно, какие изменения нужно внести в таблицу на рис. 18.3 в соответствии с каждой конкретной модификацией. а) Функция затрат па содержание запаса имеет вид 1 -(i -f- x — — D)2, где D обозначает уровень спроса. б) Вероятность того, что уровень спроса равен 2, 3 или 4, составляет */з для каждого значения спроса. в) Максимальный объем производства равен 6, где С (6) = 25. г) Максимальный начальный уровень запаса равен не 4, а 5. д) Предположите, что максимальный начальный уровень запаса равен не 4, а 5 и что в стратегии (6) принято: х = О, если i = 5. Запишите матрицу вероятностей перехода, аналогичную (7). Сделайте то же самое для следующей стратегии: объем производства равен 3, если i = О, 1, 2, 3, и равен 0 в остальных случаях. 7. Рассмотрите стохастическую модель управления запасами, описанную в разд. 18.3. а) Выполните шаги алгоритма итераций по критерию и проверьте значения величин, стоящих в таблице на рис. 18.4, при п = 1, п = 2 и п = 3. б) Запишите уравнения (9) для оптимальной стратегии при бесконечном плановом периоде, когда а = 0,9, и проверьте минимальные значения величин yt, приведенные в таблице на рис. 18.4. в) Объясните, почему при i = 1, 2, 3 значения г/™ и yt в таблицах на рис. 18.4 и 18.5 различаются на 2.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
175
г) Вычислите дисконтированные значения критерия при использовании стратегии, показанной в таблице на рис. 18.5 при п = 1 и бесконечном плановом периоде. д) Дайте правдоподобное объяснение, почему значения величин ха (i) уменьшаются при уменьшении значения а, как это показано в таблице на рис. 18.6. е) Запишите уравнения (9) для оптимальной стратегии при бесконечном плановом периоде ос = 0,5 и проверьте минимальные значения г/;, приведенные в таблице рис. 18.6. ж) Предположите, что в результате применения алгоритма итераций по стратегии при п = 2 значения у\ равны оптимальным значениям г/;, указанным в таблице на рис. 18.4. Выполните проверку (13), чтобы показать, что алгоритм останавливается. 8. Рассмотрите применение алгоритма итераций по критерию, описываемого выражением (8) из разд. 18.3. Предположите, что начальные значения у\ получены путем выбора стационарной пробной стратегии и решения уравнения (9). В тексте указано, что если остановиться на итерации т и применить оптимальную стратегию, непосредственно вытекающую из (8) для модели с бесконечным плановым периодом, то соответствующие ожидаемые значения yi не будут превосходить у™ в (8). Покажите, что этот вывод следует из рассуждений, приведенных в разд. 18.3, где дается обоснование теоремы о стационарной стратегии. 9. а) Сравните алгоритм итераций по критерию, использованный для решения стохастической задачи выбора кратчайшего маршрута в разд. 18.3 с аналогичным алгоритмом решения детерминированной задачи, приведенным в гл. 12. В чем эти алгоритмы совпадают? В чем они отличаются друг от друга? Сравните объем вычислений и свойства сходимости. б) Дайте ответы на вопросы п. а) для случая алгоритма итераций по стратегии. 10. Интерпретируйте определение оптимальной стратегии при а = 1, выраженной равенством (1) из разд. 18.4. (Указание: вспомните, что величины у* (а) вычисляются при заданной стратегии я*.) Напомним также, что в гл. 12 показано, что при а = 1 несколько различных стратегий могут приводить к одинаковому среднему эффекту на отрезке при бесконечном плановом периоде, но эти стратегии могут отличаться поведением в «переходном режиме». (Так, например, два денежных потока 100, 1, 1, 1, . . . и 10, 1,1, 1, . . . характеризуются одинаковым средним эффектом на отрезке, равном 1.) Как в определении (1) учитывается такое влияние переходных процессов? 11. В каждом из указанных ниже пунктов определите, существуют ли стационарные вероятности, и в случае положительного ответа на этот вопрос вычислите их значения. а) Случаи 2 и 3 из разд. 18.4. б) Случай 4 из разд. 18.4.
176
ГЛАВА 18
в) Случай 6 из разд. 18.4.
гN
/
1/4
'Ч
,, Va V a / '
Л/4
ж)|
V/. ° к)
Л/4 3/ 1 /4 \1
3
/4
V* 0
3
3/ |f °/4
Д
0 ,
/4\
, ,
-
3)
, ^/4 -
Л)
з/ \
v
3
/4
V6
3
0
Va V a
0
I/a V a /
/5
\
3/
/4 /4 I 11 3/ 1 /4 / 4 '
0 0
с)
(
•
\0
3 ;
3
0'
3 /4
0 1/4
и)
м)
.
/4/
3
/4
/4
'/ А
/4 0 •V 4 \0 0 1
/ 0 0 IX п) 1 0 0 \0 1 0/
У
.
.
0 Va Va\
1 0 0
!
<J
x/
Л/4 0
V 41
0
0
Л/4
/4\
\1 0 0/
•
/4
3/ ч
/°
1/
0 1/4 3 / 4
13/
04
*V O 1 оУ 1 °\ 0 0 о)
/Va '/2 0 0 х 1 V, х / « 0 0 1
0 \0
1/
\0
/4/
/ V 4 3/4 0 \ \
Г0Л
Г
Р)
е)
•
1 3 /4
/4
0 3 /4\ 0 1/ 4 0 оУ
\0 0
3
/ V4
"' \ 3 /4 V 4 /
°\
3
V,i
н)
ч
Va Va Va Va
l/ 2 l/ 2 \
0 0
0 Г 0/
т)
/2/
(;
х)
12. Формулы (IV) и (V) из разд. 18.4 показывают, как вычислять вероятность ду- (п) того, что система находится в состоянии / на отрезке п при заданных вероятностях ^-состояний системы на начальном отрезке. В каждом из указанных ниже пунктов вычислите 7- (п) при п = 2, 3, 4, предполагая, что q0 = i (система в начальный момент находится в первом состоянии). а)Рассмотрите следующие пункты упражнения 11: а), б), г), д), к), м), н), о), т), у), ф), х). б) Дайте ответы на вопросы пунктов, указанных в п. а), положив < ? ! = ! . в) Среди приведенных выше в данном упражнении задач укажите, в каких из них д7- (п) не стремится к пределу при произвольно большом возрастании п.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
177
13. а) Рассмотрите экстремальные уравнения (8) из разд. 18.4. Приведите промежуточные выкладки, обосновывающие переход от (7) к (8). б) Рассмотрите эвристические доводы, приводящие к (8). Объясните, где в рассуждениях используется допущение о существовании оптимальной стационарной стратегии, обладающей стационарными вероятностями, однозначно определяемыми (3). в) Покажите, что если wt удовлетворяют (8), то этому уравнению удовлетворяют и величины wt + К, где К — произвольная константа. г) Произведите алгебраические преобразования, приводящие к (И), и используйте (3), чтобы показать, каким образом можно упростить (И), сведя его к виду выражения (5). 14. а) Рассмотрите необходимое условие оптимальности, сформулированное в разд. 18.4. Объясните, почему части а) и б) этого условия эквивалентны. Почему оно называется необходимым? б) Рассмотрите достаточное условие минимума ожидаемого эффекта, сформулированное в разд. 18.4. Объясните, почему части а) и б) этого условия эквивалентны. Почему оно называется достаточным ? 15. Сравните алгоритм итераций по стратегии при а = 1, изложенный в разд. 18.4, с аналогичным методом решения детерминированных задач, приведенным в гл. 12. В чем эти алгоритмы совпадают? Чем они отличаются друг от друга? Сравните объемы вычислений и свойства сходимости для этих алгоритмов. 16. а) Таблица на рис. 18.7 иллюстрирует применение алгоритма итераций по стратегии для решения стохастической задачи управления запасами, приведенной в таблице на рис. 18.3. Проверьте значения всех величин в таблице на рис. 18.7. б) Примените этот алгоритм, начав на шаге 1 со следующей стратегии: объем производства равен 3, если i = О, 1, 2, 3, и равен О во всех остальных случаях. 17. Рассмотрите пример фирмы «Надежный поставщик», изложенный в конце разд. 18.5. а) Покажите, как вывести (I) из рекуррентного соотношения (2) из разд. 18.3. б) Покажите, что значения величин, определяемые (II), удовлетворяют экстремальным уравнениям (I). в) Покажите, что подстановка правой части (III) в рекуррентное соотношение (7) из разд. 18.1 и последующее упрощение также приводят к системе экстремальных уравнений (I). 18. Рассмотрите каноническую форму дискретных моделей динамического программирования, определяемую выражением (I), котоРое приведено в начале разд. 18.3. а) Используйте эвристические рассуждения из разд. 18.5 для в ывода функционального уравнения при а = 1, приняв обозначения w (s) и с*.
178
ГЛАВА 18
б) Запишите аналогичным образом уравнение для случая конечного планового периода, используя обозначение /n (s). Далее положите /n (s) » пс* -г w (s) и выведите функциональное уравнение с помощью метода, изложенного в конце разд. 18.4, при условии а = 1. 19. Рассмотрите прямую и двойственную задачи линейного программирования, изложенные в разд. 18.5. а) Подробно запишите выражения (1) — (5) для сети, содержащей узлы О, 1, 2, 3, в которой в каждом узле можно принять два решения: d — 1 и d = 2. б) При условии, что каждая величина г;- является строго положительной, докажите, что базисное решение двойственной задачи (3) — (5) содержит в точности одну величину xid > 0 для каждого узла i. в) Выполните задание п. а) для случая (6) — (11). г) Покажите, какое ограничение нужно ввести в двойственную задачу пункта в), чтобы вероятность перехода системы в узел 2 была не менее 1 / 4 , но не более 3/5. Покажите также, какое нужно ввести дополнительное условие, чтобы после перехода системы в узел 2 решение d = 1 выбиралось с вероятностью, не превышающей V 3 . 20. а) Покажите, что решение (12) задачи о запасах, приведенное в разд. 18.5, является допустимым и оптимальным для двойственной задачи линейного программирования, отраженной в таблице на рис. 18.8. Преобразуйте решение (12) в правило принятия решений. б) Какими должны быть коэффициенты в таблице на рис. 18.8, если вероятность того, что спрос составляет 2, 3 или 4 единицы, равна V 3 ? в) Найдите оптимальную стратегию при условиях опросов, указанных в п. б). 21. Рассмотрите прямую задачу (1) — (2) из разд. 18.3. Предположите, что имеется два узла (i = О, 1) и в каждом из них возможны три решения (d = 1,2, 3). Примите далее, что вероятности р (/ | i, d) равны 3 р (0 | 0,1) = V 4 , р (О | 0,2) = / 4 , р (0 | 0,3) = V 2 , 3 р (1 | 0,1) = / 4 , р (1 | 0,2) = V 4 , Р (1 I 0,3) = V 2 , р ( 0 | 1 , 1 ) = 1 / з , Р (0 | 1,2) = V 2 , p ( 0 | l , 3 ) = V 3 , /7(1 |1,1) = 2 / 3 , р (1 | 1,2) = V 2 , р (1 | 1,3) = V 3 , а затраты составляют с01 = 24, с 02 = 60,
с 03 = 48,
са = 36, с12 = 24, с13 = 45.
Положите, кроме того, что а = Vs. Запишите подробно все уравнения. Постройте график в пространстве решений и покажите, что оптимальное решение получается при любых положительных г 0 и rj в подлежащей максимизации целевой функции г0уа
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
179
22. Рассмотрите стохастическую модель замены оборудования из разд. 18.7. а) Дайте обоснование метода определения вероятностей переходов (2) и (3), а также ожидаемых затрат (4). б) Покажите, что оптимальная стратегия определяется выражением (5). Используйте для этого экстремальные уравнения (8) и (9) разд. 18.4 и значения величин (6). 23. Объясните, как вы понимаете следующие термины: марковский процесс принятия решений; стационарная стратеги детерминированная стратегия; стохастическая модель выбора кратчайшего маршрута; марковское свойство; экстремальные уравнения; алгоритм итераций по крите, рию (алгоритм последовательных приближений в функциональном пространстве); алгоритм определения значения критерия; алгоритм итераций по стратеги(алгоритм последовательных приближений в пространстве стратегий);
закон движения для системы; марковская цепь; стационарные вероятности; предельные вероятности; статистическое равновесие; рабочие характеристики; переходная коррекция; дважды стохастическая матрица; переходное состояние; циклическая цепь; множественная цепь; ограничения сохранения вероятностей; нормирующее ограничение.
УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ
Во многих приводимых ниже упражнениях читатель должен построить модели, описываемые рекуррентными соотношениями динамического программирования. При этом очень важно точно определить смысл каждого используемого обозначения. 24. Покажите для перечисленных ниже упражнений гл. 17, как ставятся соответствующие задачи в виде стохастической задачи выбора кратчайшего маршрута, аналогичной задаче управления запасами, описанной в конце разд. 18.2. а) Упражнение 23. з) Упражнение 47, п. б), б) Упражнение 38, п. б). и) Упражнение 49, п. а), в) Упражнение 39. к) Упражнение 51, п. а), л) Упражнение 52, п. а), г) Упражнение 41, п. а). м) Упражнение 53, п. а), д) Упражнение 42, п. а). н) Упражнение 56. е) Упражнение 42, п. б). ж) Упражнение 47, п. а).
180
ГЛАВА 18
25. Рассмотрите экстремальные уравнения (1) из разд. 18.3. Предположите, что имеются нижняя и верхняя оценки Z/, и Ut соответственно по каждому неизвестному, т. е. //,- ^ г/; ^ U ;. Покажите, что нм га/ж каких условиях выбор решения d' £ D (i) не может быть оптимальным, если
2 p(j\ i, d') aLj + cid< > min [ 2
P (1 1 i, d) U} + ad] .
Предположите, как можно использовать это неравенство для ускорения сходимости алгоритмов последовательного приближения. 26. Рассмотрите модель управления запасами с неопределенными производственными затратами (упражнение 38, п. б), гл. 17). Примите а = 1 и найдите оптимальную стратегию при бесконечном плановом периоде. 27. Рассмотрите пример стохастической задачи управления запасами, приведенный в таблице на рис. 18.3. Предположите, что максимальный объем производства составляет 6 и что С (6) = 28,5, а ее = 1. а) Примените алгоритм итераций по стратегии для отыскания оптимальной стратегии. (Указание: выберите исходную пробную стратегию на основе анализа таблиц на рис. 8.17 и 8.18.) б) Как было показано в конце разд. 18.4, разность /„ (i) — — /л (0) равна примерно wt. Определите, насколько точным является это приближение для каждого i и п = 3, 4, 5, используя значения «?;, найденные в п. а), и /n (i), взятые из рис. 8.17. 28. Рассмотрите стохастическую модель управления запасами, приведенную в упражнении 40 гл. 17, п. б). Примите а — 1 и найдите оптимальную стратегию при бесконечном плановом периоде, используя алгоритм итераций по стратегии. 29. Рассмотрите пример задачи управления запасами, приведенный в разд. 18.3. Предположите, что распределение спроса меняется от отрезка к отрезку следующим образом: £>[D = 2] = 4£- >
Р[£> = 4 ] = — &
(отрезок t),
P I D = 1 ] = ~- ,
P[D = 4]=*~
(отрезок t + i).
а) Покажите, как нужно изменить при этих условиях рекуррентное соотношение (2). б) Примите а = 1 и напишите соответствующие экстремальные уравнения. в) Найдите оптимальную стратегию при условиях, указанных в п. б). 30. В каждом из указанных ниже пунктов найдите оптимальную стратегию пополнения запасов при бесконечном плановом периоде и а = 1, используя алгоритм итер'аций по стратегии.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
181
а) Упражнение 41, п. а), гл. 17. б) Упражнение 41, п. б), гл. 17. 31. Рассмотрите стохастическую задачу управления запасами, приведенную в разд. 18.2. Предположите, что спрос на продукцию имеет место не на каждом отрезке. В частности, примем, что при наличии спроса на отрезке t спрос на продукцию возникает на отрезке t + s, где s = 1, 2, 3, с вероятностью qs = 1 / 3 . а) Измените соответствующим образом рекуррентное соотношение (7). (Заметим, что если в конце отрезка t уровень запаса равен /, а в следующий раз спрос возникает на отрезке t + s, то затраты на хранение / изделий увеличиваются в s раз.) б) Предположите, что плановый период бесконечен и что коэффициент дисконтирования равен а, где 0 ^ а < 1. Покажите, как следует при этих условиях изменить экстремальные уравнения (2) из разд. 18.3. в) Предположите, что плановый период бесконечен. Выведите соответствующие экстремальные уравнения при а = 1. г) Найдите оптимальную стратегию, используя результат, полученный в п. в). 32. Студентка-общественница Н,, которая учится в колледже, расположенном за городом, и живет там в общежитии, субботние вечера проводит в городе, принимая участие в собраниях. Считая, что на собрания ее должен сопровождать мужчина, она каждую неделю обращается с этой просьбой к одному из трех своих приятелей-студентов В., Г. и Д. Для упрощения рассуждений предположим, что в случае отказа приятеля, к которому она обратилась, студентка отправляется в город одна. Предположим далее, что условные вероятности согласия сопровождать Н. зависят от того, к кому она обращалась с этой просьбой на предыдущей неделе и определяются следующей таблицей. а) Предположите, что до летних каникул осталось п недель. Постройте модель динамического программирования, с помощью которой можно отыскать стратегию, максимизирующую ожидаемое
Условия поездки на предыдущей неделе
Вероятность удовлетворения просьбы
В. Без сопровождения Вместе с В. Вместе с Г, Вместе с Д.
1/2
д.
Г.
1/2
3
/4
1/3
1/4
1/4
2
Vs
3
2
1/2
/5
/з
/5
V5
ГЛАВА 18
182
число случаев, когда студентка получает согласие любого из приятелей сопровождать ее в город. б) Предположите, что «плановый период» студентки не ограничен и что учитывается коэффициент дисконтирования а = 1. Запишите соответствующие экстремальные уравнения. Исходя из приведенных в таблице данных и указанных допущений, найдите оптимальную стратегию. в) Предположите, что при условиях, приведенных в п. б), студентка хочет максимизировать «ожидаемое число спутников в неделю». Выведите соответствующие экстремальные уравнения и найдите оптимальное решение. 33. Директору одного универмага нужно принять решение о том, какого вида рекламное объяснение целесообразно поместить в местной воскресной газете. В частности, он может выбрать краткую рекламу (L) и подробную рекламу (Н). Еженедельные объемы продаж директор разделяет на три группы: средний объем (А), выше среднего (АА) и ниже среднего (ВА), считая, что объем продаж рассматриваемой недели зависит в вероятностном смысле как от объема продаж предыдущей недели, так и от категории рекламы. Он пользуется следующими данными, приведенными в таблице: Краткая реклама (L) Объем продаж предыдущей недели
АА А ВА
Подробная реклама (Н)
Объем продаж текущей Объем продаж текущей недели недели АА А ВА АА А ВА
0,2 0 0
0,5 0,6 0,3
0,3 0,4 0,7
0,6 0,4 0,2
0,3 0,5 0,7
ОД 0,1 0,1
Так, например, если объем продаж предыдущей недели относится к группе А, а уровень рекламы принадлежит к группе Н, то с вероятностью 0,4 объем продаж текущей недели составит АА, с вероятностью 0,5 составит А и с вероятностью 0,1 составит ВА. Предположите, что краткая реклама L стоит 100 долл., а подробная Н — 300 долл. и что недельная прибыль (без учета затрат на рекламу) при объеме продаж АА равна 1200 долл., при объеме А — 1000 долл. и при объеме В А — 800 долл. а) Примените алгоритм итераций по стратегии для отыскания стратегии рекламы, максимизирующей чистую еженедельную прибыль (с учетом затрат на рекламу) на бесконечном плановом периоде.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
183
б) В каком диапазоне изменения затрат на рекламу типа L остается оптимальной стратегия, найденная в п. а)? Тот же вопрос относительно затрат на рекламу типа Н. в) В каком диапазоне изменения недельной прибыли при объеме продаж А А остается оптимальной стратегия, найденная в п. а). Тот же вопрос при объеме продаж А, ВА и применительно к пп. г) и д) этого упражнения. г) Пусть Pi обозначает вероятность того, что объем продаж текущей недели составлял АА, а р2 — вероятность того, что он составлял А при условии, что объем продаж предыдущей недели равнялся А и уровень рекламы на той же неделе составлял Н, где Pi ~г Р2 — 0,9. Каков диапазон изменения p t , в пределах которого стратегия, найденная в п. а), остается оптимальной? д) Сформулируйте постановки прямой и двойственной задач линейного программирования и найдите оптимальное решение двойственной задачи. Разъясните смысл этого решения. 34. Крупная фирма, производящая моющие средства и пользующаяся широкой известностью в связи с успехами в исследованиях по созданию новых продуктов и их рекламированию, выпустила на рынок новый высококачественный стиральный порошок, названный LYE. Руководитель, возглавляющий производство этого продукта, совместно с отделом рекламы разрабатывает специальную рекламную кампанию по сбыту порошка, для которой принят девиз «Порошок LYE нужен всем!» Как и все продукты фирмы, новый продукт в течение первого полугодия будет иметь высокий уровень сбыта. Руководитель полагает, что с вероятностью 0,8 этот уровень сбыта сохранится и в последующем полугодии при условии проведения особой рекламной кампании и что эта вероятность составит всего 0,5, если такую кампанию не проводить. В случае, если уровень сбыта снизится до среднего, у руководителя имеются две возможности. Он может дать указание о проведении исследований с целью улучшения качества продукта. При этом условии с вероятностью 0,7 уровень сбыта к началу следующего полугодия повысится до первоначального высокого значения. С другой стороны, можно ничего не предпринимать в отношении улучшения качества продукта. Тогда с вероятностью 0,6 в начале последующего полугодия уровень сбыта останется средним, однако вследствие изменений потребительских вкусов он может вновь подняться до высокого значения лишь с вероятностью 0,4. Если сбыт нового стирального порошка начинается на высоком уровне при обычной рекламе, то прибыли в течение полугодия равны 19 единицам в случае, когда этот уровень сохраняется, и равны 13, если уровень сбыта падает. При проведении специальной рекламной кампании соответствующие показатели равны 4,5 и 2 единицам. Если начальный уровень сбыта окажется средним и при этом проводятся исследования с целью улучшения качества продукции, то прибыли составят 11 единиц в случае, когда уровень сбыта поднимается
184
ГЛАВА 18
до высокого, и 9 единиц в противном случае. При сохранении продукта в неизменном виде соответствующие прибыли равны 13 и 3 единицам. Предположим, что одна и та же проблема принятия решений относительно сбыта стирального порошка LYE повторяется через каждые полгода в течение бесконечного планового периода. а) Запишите необходимые экстремальные уравнения динамического программирования для случаев 0 ^ а < 1 и а = 1. (Примечание: оптимизация имеет смысл максимизации.) б) Запишите при условии использования результатов, полученных в п. а), прямую и двойственную задачи линейного программирования. в) Решите задачу для случая а = 1 с помощью алгоритма итераций по критерию. 35. Задача управления денежным потоком. Предположим, что в примере упражнения 55 гл. 17 период планирования бесконечен и что распределение вероятностей ежедневных колебаний является стационарным. Запишите соответствующие экстремальные урвнения для случаев 0 ^ а < 1 и а = 1. 36. Задача фирмы «Самосад» (разд. 11.3). Предположим, что в конце каждого отрезка весь лес полностью сгорает с вероятностью 1 — р. а) Сформулируйте постановку оптимизационной задачи для случая принятия единичного решения, предполагая, что сгоревший лес не имеет стоимости и что лесной пожар не может уничтожить спиленные деревья. б) Выполните то же задание при условии бесконечного планового периода, предполагая, что если лес сгорает до отрезка, на котором запланирована валка, то на следующем отрезке производится посадка нового леса. Приведите формулы определения оптимального числа k отрезков от посадки леса до валки для случаев 0 < а < 1 и а = 1. 37. Гидротехническая система состоит из плотины, а также приплотинного и вспомогательного водохранилищ. Емкость приплотинного водохранилища составляет К единиц. На каждом отрезке поступление воды в это водохранилище составляет S единиц, где фактическое количество S на отрезке t характеризуется распределением вероятностей pt (S). Если количество воды в водохранилище плюс величина S превышают К, то избыток сбрасывается. Пусть потребность в воде на отрезок t составляет Dt, причем эта потребность может удовлетворяться за счет воды из приплотинного либо из вспомогательного водохранилища, но не за счет слива. (Для простоты предположим, что в приплотинное водохранилище вода поступает до того, как определяется потребный расход.) Обозначим стоимость единицы количества воды, забираемой из приплотинного водохранилища на отрезке t, через с1(, а стоимость единицы воды из вспомогательного водохранилища —- через c 2 j, где cit < c 2 (. С практической точки зрения можно считать, что вспомогательное водохрани-
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
185
лищс имеет неограниченную емкость, в связи с чем всегда существует реализуемая стратегия удовлетворения спроса на воду. а) Постройте модель динамического программирования для отыскания стратегии определения количеств воды, забираемых из приплотинного и вспомогательного водохранилищ, причем такой, которая минимизирует ожидаемые дисконтированные затраты в течение планового периода, состоящего из Т отрезков. (Пусть а обозначает при этом коэффициент дисконтирования на одном отрезке, где 0 ^ <а<1.) б) Покажите, как нужно изменить постановку задачи п. а), если уровень спроса Dt определяется распределением вероятностей It (Dt). в) Покажите, как следует изменить постановки задач пп. а) и б), если распределение вероятностей St зависит от 5j_i, что обозначается pt (S | St_i). Дайте ответ на тот же вопрос в случае, когда распределение вероятностей St зависит от Si + S2 -f- . . . + St-\, t-i что обозначается pt (S \ 2 Sj)5=1 г) Определите, становится ли проблема принятия решения проще или сложнее, если в пп. а) и б) все распределения вероятностей и затраты стационарны во времени и плановый период бесконечен. д) Предположите, что единица любого сбрасываемого избытка воды на отрезке t стоит vt. (Так, например, этот избыток может быть использован для орошения или направлен в другое водохранилище.) Покажите, как при этом условии нужно применить постановку п. а). 38. Задача полицейского управления города Шумгам-сити (упражнение 25 гл. 2). Пусть pt (rt) — распределение вероятностей минимальной потребности в полицейских на отрезке t. Предположим, что точное значение г, известно до того, как принимается решение xt о выделении числа полицейских, назначаемых на дежурство. а) Примите, что коэффициент дисконтирования на одном отрезке равен а, где 0 ^ а < 1, а плановый период бесконечен. Постройте соответствующую модель динамического программирования. б) Покажите, упрощается ли модель п. а), если все распределения вероятностей идентичны, т. е. pt (г) = /? (г). в) Выведите экстремальные уравнения, которые должны удовлетворяться в пп. а) и б) при а = 1. 39. В больнице города Шумгам-сити принят четкий порядок комплектования отделения неотложной помощи студентами-медиками. Однако иногда наблюдается поступление больных, превышающее среднюю норму. В связи с этим приходится привлекать к работе в отделении дополнительное число студентов. Больнице нужно выработать рациональную стратегию, позволяющую определять, когда следует привлекать к работе дополнительный контингент студентов, а также численность этого сверхнормативного штата. Предположим, что каждому дополнительно привлеченному студенту приписывается
180
ГЛАВА 18
коэффициент затрат с, относимый к одному отрезку времени (15 мин.) Пусть w обозначает коэффициент затрат, определяемый временем, в течение которого больной ожидает медицинскую помощь (значение этого коэффициента оценивается в начале каждого отрезка). Состояние системы определяется числом больных, ожидающих оказания медицинской помощи. Исходя из этих соображений, администрация больницы принимает решение о привлечении дополнительного числа студентов s, которое требуется для неотложки. Предположим, что р (j \ г, s) есть вероятность того, что / больных будут •ожидать оказания помощи в начале следующего отрезка при условии, что i больных ожидали помощи в начале текущего отрезка и привлечено дополнительно s студентов. Накопленный опыт показывает, что число ожидающих больных ни разу не превысило 10. а) Напишите систему экстремальных уравнений, определяющих стратегию, которая минимизирует ожидаемые затраты на отрезке. б) Поясните, какие трудности возникают при оценке параметров модели. в) Объясните, как нужно изменить постановку задачи п. а), «ели в связи с изменением числа дополнительно привлекаемых студентов на отрезках t — 1 и t приходится нести затраты k (s f _i, st). 40. Капитан Р., служащий в одной судоходной компании, командует судном, совершающим регулярные рейсы между двумя портами А и В. Предположим, что продолжительность рейса составляет 1 сутки. Каждое утро капитан должен решить, стоит ли ему загружать судно имеющимся в наличии грузом и отправляться в порт назначения или обождать сутки в надежде, что на следующий день может подвернуться более выгодный груз. Пусть затраты на один рейс составляют c t , а затраты, связанные с суточным простоем судна в порту, составляют с 2 , где cd > с2. Предположим, что в порту А имеется два вида грузов, стоимостью ai и а а , где а 4 > я 2 - Обозначим вероятность того, что груз вида at имеется в наличии, символом Ра. (откуда 1 — ра есть вероятность того, что имеется только груз вида а2). Предположим также, что наличие груза в рассматриваемый день не зависит от его наличия в предыдущие дни (таким образом, •если капитан не уходит в рейс, то все равно сохраняется вероятность ра получения груза al на следующий день). Аналогично пусть стоимость грузов в порту В составляет & t и Й 2 , где & 4 > & 2 , и пусть рь — вероятность наличия груза bj. а) Постройте модель динамического программирования при -бесконечном плановом периоде. Рассмотрите случаи 0 ^ а < 1 и а = 1. б) Запишите прямую и двойственную задачи линейного программирования, соответствующую модели п. а). в) Укажите, как нужно изменить модель п. а), если продолжительность рейса между портами составляет 3 суток. Тот же вопрос для случая, когда рейс из А в В занимает 3 суток, а из В в А — 2 суток.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
187
г) Поясните, как нужно изменить модель п. а), если продолжительность каждого рейса t представляет собой случайную величину с распределением вероятностей р (t). 41. Ежедневно утром производится проверка дорогостоящей машины с целью выявления, находится ли она в исправном состоянии, требует мелкого ремонта или нуждается в серьезном ремонте. Обозначим эти состояния О, 1, 2 соответственно. Если машина находится в совершенно исправном состоянии, то вероятность того, что она останется в таком же состоянии на начало следующего дня, равна р (0 | 0). вероятность того, что потребуется мелкий ремонт, равна р (1 | 0) и вероятность того, что возникает необходимость серьезного ремонта, равна р (2 | 0). В случае когда машина требует ремонта, фирма может прибегнуть к услугам двух ремонтных фирм, одна из которых (фирма F, гарантирующая качество ремонта) взимает плату М за мелкий ремонт и плату R за крупный. Вторая (фирма Т, не гарантирующая качества ремонта) взымает соответственно плату т и г, где т < М и г < R. Легко себе представить, что качество работ, производимых фирмой F, выше, чем у фирмы Т, что отражается значением вероятности полностью исправного состояния машины на начало следующего за ремонтом дня. Пусть решение d= 1 определяет выбор фирмы F и решение d= 2 — выбор фирмы Т. Обозначим через р (j \ i, d) вероятность перехода машины в состояние j на следующем отрезке (/ = О, 1, 2) при условии, что она находится в состоянии i на текущем отрезке (i = 1, 2) и принимается решение d (d = 1, 2). а) Запишите экстремальные уравнения динамического программирования при 0 ^ а < 1 и а = 1, которые определяют оптимальную стратегию на бесконечном плановом периоде и позволяют решить, какую фирму целесообразно привлечь для ремонта при известном состоянии машины. б) Запишите соответствующие прямую и двойственную задачи линейного программирования по аналогии с разд. 18.5. в) Примем а = 1 и предположим, что р (0 | 0) р (0 | 1,1) р (0 | 1,2) р (0 | 2,1) р (0 | 2,2)
= 0,6, = 0,9, = 0,7, = 0,6, = 0,5,
р (1 | 0) = 0,3, р (1 | 1,1) = 0,1, р (1 | 1,2) = 0,2, р (1 | 2,1) = 0,3, р (1 1 2,2) = 0,4,
р (2 [ 0) = 0,1, р (2 | 1,1) = О, М = 14, р (2 1 1,2) = 0,1, т = 12, р (2 | 2,1) = 0,1, R = 21, р (2 | 2,2) = 0,1, г = 19.
Найдите оптимальную стратегию и минимальные затраты на отрезке. (Используйте алгоритм итераций по стратегии.) Покажите соответствующее оптимальное решение двойственной задачи линейного программирования, поставленной в п. б). г) Предположите, что фирме F для выполнения крупного ремонта требуется 1 полный рабочий день, а фирме Т — 2 полных рабочих
188
ГЛАВА 18
дня. Считайте далее, что фирма — владелец машины несет потери в размере с единиц за каждый день ее простоя. Покажите, как при этих условиях нужно изменить уравнения п. а). (Указание: определите два новых состояния — «первый день простоя», «второй день простоя».) д) Найдите оптимальную стратегию для п. г), используя данные, приведенные в п. в), и приняв с — 2. 42. Задача об оптимальной замене оборудования. Фирма «Твердая память», выпускающая полупроводниковые запоминающие устройства, обслуживает несколько вычислительных комплексов на мысе Кеннеди. Один из таких дорогостоящих комплексов ежедневно по утрам подвергается проверке в рабочем режиме, после чего оценивается его состояние /, где / = 1, 2, . . ., /. Состояние j = / означает, что запоминающее устройство вышло из строя и должно быть заменено. Оценки результатов испытаний ранжированы таким образом, что состояние j лучше состояния ; + 1. Если в результате испытаний установлено, что запоминающее устройство находится в состоянии i (i < /), то фирма может принять решение о продолжении его эксплуатации и в течение рассматриваемого дня. Обозначим это решение через d — 1 и вероятность того, что устройство будет в состоянии j на следующее утро,— через р (/ | s, 1). Фирма может также принять решение о замене этого устройства, что обозначается как d = 2. Соответствующая вероятность перехода равна просто р (j | 2) и не зависит от текущего состояния i. Эксплуатационные затраты по комплексу, находящемуся в состоянии /, составляют Cj в расчете на один отрезок времени. При замене запоминающего устройства возникают затраты, равные с 0 . Если его состояние ухудшается до / к началу следующего отрезка, то необходимы дополнительные затраты с3. а) Запишите соответствующие экстремальные уравнения при условиях 0 ^ с с < 1 и а = 1 для бесконечного планового периода, позволяющие определять состояние, при котором целесообразна замена запоминающего устройства. б) Покажите, как нужно изменить уравнения п. а), если на замену запоминающего устройства требуется 1 или 2 рабочих дня. Пусть величина v0 определяет затраты, которые обусловлены простоем комплекса, связанным с заменой запоминающего устройства. (Указание: введите два новых состояния «замена в течение 1 дня», «замена в течение 2 дней). в) Рассмотрите задачу со следующими данными: / = 3, с 0 = = 100, q = 5, с 2 = 10, с 3 = 75 и р(1 |1,1) =0,7, р (2 | 1,1) = 0,2, р ( 3 |1,1) =0,1, р ( 1 |2,1) = 0,1, р (2 I 2,1) - 0,7, р (3 |2,1) = 0,2, р (1 | 2) = 0,8, р (2 \ 2) = 0,1, р (3 1 2) = 0,1. Запишите подробно уравнения п. а) при этих исходных данных и найдите оптимальное решение, используя алгоритм итераций по стратегии.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
189
г) Запишите прямую и двойственную задачи линейного программирования по аналогии с разд. 18.5 для примера, указанного в п. в), лри 0
190
ГЛАВА 18
ник» 2 и d = 12 — только к состоянию 12. Пусть соответственно р (] | i, d) обозначает вероятность того, что система находится в состоянии / на следующей неделе при условии, что ее состояние на текущей неделе равно i, и принимается решение d. а) Перечислите все возможные стратегии и опишите каждую из них. Объясните, почему в силу вероятностных и экономических допущений нет смысла заменять прибор, пока он находится в рабочем состоянии. Поясните, почему вероятность р (12 | 1,0) может оказаться не равной р (12 | 2, 0) и почему то же самое возможно для вероятностей р (12 | 0,0) и р (12 | 1,0) -р (12 | 2,0). б) Постройте модель динамического программирования для бесконечного планового периода, используя критерий минимизации ожидаемых затрат за неделю, и покажите, при каких условиях удовлетворяются экстремальные уравнения. в) Сформулируйте соответствующие прямую и двойственную задачи линейного программирования по аналогии с задачами из разд. 18.5. Укажите в явном виде те из величин р (j \ i, d), которые равны нулю. ДОПОЛНИТЕЛЬНЫЕ
УПРАЖНЕНИЯ
44. Рассмотрим стохастическую модель выбора кратчайшего маршрута из разд. 18.2. Предположим, что если принять решение d на отрезке t, когда система находится в состоянии, соответствующем узлу i, то система перейдет в узел / на отрезке t + hjj (d) с вероятностью р (] | i, d), где hij (d) — неотрицательное целое. Пусть а — коэффициент дисконтирования на одном отрезке, где О < с с < 1. а) Покажите, как при этих условиях изменится выражение (6) из разд. 18.2. б) Укажите, как обобщается этот пример на случай бесконечного планового периода при 0 ^ а < 1. Покажите, как для этого нужно изменить выражение (1) из разд. 18.3. в) Укажите, как обобщается этот пример на случай бесконечного планового периода при а = 1. Покажите, как нужно изменить выражение (8) из разд. 18.3. (Указание: обратитесь к детерминированному случаю, приведенному в конце разд. 12.3.) г) Предположите, что htj (d) — случайная величина. Обозначьте через q (h \ i, j, d) вероятность того, что величина Ъц (d) равна h. Покажите, как при этом следует изменить задачу п. б). [Примечание: применяя эту модель, нужно вычислять значение cid, чтобы учесть случайные изменения htj (d).] д) Покажите, как нужно изменить задачу п. в) при условиях, указанных в п. г). 45. Покажите, что алгоритм итераций по критерию (8) из разд. 18.3 обеспечивает по крайней мере геометрическую сходип мость, т. е. что | у? — yi | 5$ а К при любом i и соответствующем выборе константы К.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
191
46. В разд. 18.4 утверждается, что теорема о стационарной стратегии не справедлива, если число возможных состояний бесконечно. Ниже иллюстрируется это утверждение. а) Рассмотрим сеть, содержащую узлы 1, 2, 3, . . . (рис. 18.10), Обратим внимание на то, что в каждом нечетном узле принимаются два решения (из узла выходят две дуги), каждому из которых отвечают затраты 1, а в каждом четном узле принимается одно решение, причем ему отвечают затраты 1 /и. Предположим, что процесс начинается в узле 1 и критерием являются минимальные затраты на отрезке при бесконечном плановом периоде. Покажите, что не существует
Р и с . 18.10.
какой-либо стратегии, дающей нулевые затраты на отрезке при бесконечном плановом периоде. Покажите далее, что при любой заданной стратегии существует другая стратегия, которой соответствуют строго меньшие (но положительные) затраты на отрезке. Следовательно, не существует оптимальной стратегии. (Указание: покажите,
_ 2
_ 3
Ь
"1 5
S
Р и с . 18.11. как при заданном произвольно малом, но положительном числе е находится стратегия, обеспечивающая затраты, равные или меньшие е.) б) Рассмотрим сеть, содержащую узлы 1, 2, 3, . . . (рис. 18.11). Пусть действие 1 означает переход из узла i в узел i -\- 1, а действие 2 — переход из узла i обратно в этот же узел. Предположим, что процесс начинается в узле 1 и критерием является минимум ожидаемых затрат на отрезке при бесконечном плановом периоде. Покажите, что любой стационарной стратегии без рандомизации соответствуют строго положительные затраты на отрезке. Покажите также, что существует нестационарная стратегия без рандомизации, которой соответствуют нулевые затраты на отрезке. (Указание: рассмотрите, что произойдет, если после того, как система впервые оказалась в состоянии i, предпринимается действие 2 в течение i последующих отрезков, а затем предпринимается действие 1.) Покажите далее, что существует стационарная рандомизированная стратегия,
192
ГЛАВА 18
при которой ожидаемые затраты на отрезке равны нулю. (Указание: рассмотрите, что произойдет, если в каждом узле i выбирается действие 1 с вероятностью Hi. Запишите марковскую цепь при этой стратегии и выясните, существуют ли стационарные вероятности.) 47. Рассмотрите теорему о стационарной стратегии из разд. 18.4 при а = 1. Докажите предложение, что всегда существует оптимдльная стратегия без рандомизации. 48. Рассмотрим экстремальные уравнения (10) из разд. 18.4 при а == 1. Предположим, что используется стратегия d*. Для упрощения обозначений символ d* при определяемых ниже величинах М;0 и С{0 опущен. Пусть Mio обозначает ожидаемое число отрезков, за которое система переходит в состоянии 0 при начале движения из состояния i (иногда эту величину называют математическим ожиданием продолжительности первого перехода). Величину М 0 о можно назвать ожидаемой продолжительностью цикла для состояния 0. Аналогично обозначим через С,о ожидаемые затраты (доход) за то же число отрезков. Величину С00 можно назвать ожидаемыми затратами цикла для состояния 0. а) Покажите, что величины Мю и Cio можно вычислить с помощью линейных уравнений т j=i т .,
I
X1
п (1 I i
iO — ^id* "т" / i /^ V/ I > 3=1
rl*\ f
/^JO'
i
Л
^ — ^i
4
Т
•*• ? . . . , . / .
(Указание: переход из состояния i в состояние 0 происходит по крайней мере в течение одного отрезка. Если первый переход происходит в состояние /, j =/= 0, то ожидаемое дополнительное число отрезков таково, что можно считать будто система начинает движение из состояния ;'. Аналогично cj d * есть ожидаемые затраты на первом отрезке. Если первый переход совершается в состояние /, где / =/= О, то ожидаемые дополнительные затраты таковы, что можно считать за начало движения системы состояние /•) б) Рассмотрите следующие величины в качестве решения экстремальных уравнений (10)
*^^w M w
c
wl = Cio—c*Mio.
Интерпретируйте эти величины. Докажите, что соответствующее значение w0 равно 0. Используйте формулы п. а), чтобы показать, что эти величины действительно удовлетворяют уравнениям (10). в) Вычислите значения Mio и Cio при i = О, 1, . . ., 4 для примера задачи о запасах, приведенной в таблице на рис. 18.3, используя при этом оптимальную стратегию, указанную в таблице на рис. 18.7 (п = 2).
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
193
г) Вычислите значения всех величин Mio и С г о Д л я оптимальной стратегии, найденной в упражнении 26. Вычислите также значения с* и Wi в соответствии с условиями п. б). 49. Одна машиностроительная фирма эксплуатирует сложный станок, который иногда работает вполне исправно, а иногда нет. Обозначим через ;' = 0 состояние исправно работающего станка, а через / = 1 состояние, когда станок нуждается в ремонте. Если станок используется в случае, когда он абсолютно исправен, то ежедневные производственные затраты составляют с0. В случае же, когда станок используется, находясь в неисправном состоянии, ежедневные производственные затраты равны с1; где ci > c0. Определить истинное состояние станка можно лишь с помощью дорогостоящих испытаний деталей, обработанных на нем в течение дня. Обозначим через / затраты на проведение таких испытаний. В результате ремонта станок с гарантией переводится в полностью исправное состояние, причем стоимость ремонта составляет R единиц. Обозначим через р вероятность того, что станок находится в абсолютно исправном состоянии в начале следующего отрезка при условии, что он находился в таком состоянии в течение текущего отрезка, где за длину отрезка принят один рабочий день. Предположим, что если станок находится в состоянии, требующем ремонта, то он остается в этом состоянии и в дальнейшем. Обозначим через Р вероятность того, что станок находится в абсолютно исправном состоянии на начало некоторого отрезка. Объясните, почему значение Р можно использовать для представления состояния производственной системы. Приведите рекуррентное соотношение динамического программирования при бесконечном плановом периоде (приняв 0 ^ а < 1), определяющее, что целесообразно делать: использовать станок в течение рабочего дня без проведения испытаний продукции, провести такие испытания или провести ремонт при заданном текущем значении Р. (Указание: покажите, что вероятность того, что станок абсолютно исправен на начало следующего отрезка без проведения испытаний и ремонта, равна Pp.) Многие важные примеры моделей, рассмотренных в данной главе, отличаются особой структурой, которую можно использовать для упрощения постановки задач в терминах марковских цепей, а также для отыскания оптимального решения. В двух заключительных упражнениях дается представление о некоторых методах использования особенностей структуры моделей. 50. Сепарабельные марковские задачи принятия решений. Рассмотрите стохастическую модель выбора кратчайшего маршрута при бесконечном плановом периоде, аналогичную модели, рассмотренной в разд. 18.3. Предположим первоначально, что имеются узлы (или состояния) i = l, 2, . . . , Т и что в каждом состоянии возможно принять К различных решений. Особая структура этих К решений определяется экстремальными уравнениями, которые
lf)4
ГЛАВА 18
должны ими удовлетворяться. Вот эти уравнения: т т yi = min { 2 р (i \ 1) cez/j- + сц + Ьь . . . , 2 Р О' 1 •&) 5= 1
3 =1
Т
min [ S j p ( / | { , d)a^ + c id ]}.
i = l, 2, . .., Т1,
где 0 ^ a < 1. а) Интерпретируйте экономические и структурные допущения относительно К различных решений. Пусть NI есть число решений в подмножестве D (i). Определите число ограничений и переменных в соответствующих прямой и двойственной задачах линейного программирования, аналогичных (1) и (2) из разд. 18.5. б) Покажите, что, введя дополнительный узел 0, можно получить решение приведенных выше экстремальных уравнений, решив вместо них уравнения т т г/о = min [ 2 /> (Л 1) «!/; + &ь •••. ^£iP (j \K)ayj+bK], г=1 ?=1 т
г/г = min {г/о + яг,
min [ 2 Р (j \ i, d) ayj + cid]},
i = 1, 2, . . ., Т.
в) Запишите прямую и двойственную задачи линейного программирования, аналогичные (1) и (2) из разд. 18.5, и соответствующие экстремальным уравнениям п. б). Определите число переменных и ограничений в этих задачах. г) Примите 2 г = а, -\- у0 — yt, i = 1, 2, . . ., Т та покажите, как исключить Т линейных ограничений п. в) путем такой замены переменных. (Указание', вспомните, что величины гу г не ограничены по знаку.) Объясните, как следует изменить постановку задачи, если К различных решений можно принять только в узлах i = 1, 2, . . ., t, где t < Т. д) Выведите соответствующие экстремальные уравнения при ос = = 1, аналогичные уравнениям п. б), и приведите упрощенную прямую задачу линейного программирования, аналогичную задаче п. г). е) Примените полученные в предыдущих пунктах результаты для построения модели замены оборудования, подобной моделям из разд. 17.7 и 18.7 [Указание: можно принять, что узел i отражает возраст оборудования на начало рассматриваемого отрезка до того, как принимается решение заменять его или нет. Запишите подробно упрощенную модель линейного программирования, соответствующую п. г).] ж) Продолжая рассмотрение вопросов, содержащихся в п. е), запишите подробно модель линейного программирования, соответствующую п. д), используя данные примера, который приведен в таблицах на рис. 17.6 и 18.9. Найдите соответствующее оптимальное решение.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ НА МАРКОВСКИХ ЦЕПЯХ
195
з) Примените полученные выше результаты для построения модели контроля качества в упражнении п. а). Подробно запишите упрощенную модель линейного программирования, соответствующую п. г). 51. Сепарабельные марковские задачи принятия решений (продолжение). Рассмотрим стохастическую модель выбора кратчайшего маршрута с бесконечным плановым периодом, подобную модели из разд. 18.3. Прежде всего предположим, что в модели имеются узлы (или состояния) i = 1, 2, . . ., Т и что в каждом состоянии можно принять К различных решений. Особая структура этих К решений определяется экстремальными уравнениями, которые должны ими удовлетворяться. Вот эти уравнения:
т min [ S Р (i \ i, d) ayt + cid] } , z/i= min
3=1
i = 1 , 2, . . . , t ,
/
где 0 ^ а < 1 и ^ Г ^ < ^ Г — К. (Предположим, что значения всех величин а г , Ъ^жс^ гарантируют существование однозначного конечного решения.) а) Интерпретируйте экономические и структурные допущения относительно К различных решений. Пусть Nt есть число решений в подмножестве D (г). Определите число ограничений и переменных в соответствующей прямой модели линейного программирования, аналогичной модели (1) — (2) из разд. 18.5. б) Покажите, что, введя дополнительный узел 0, можно получить решение приведенных выше экстремальных уравнений, решив вместо них уравнения
yt+K т min [ 2 Р (Л i, d)ctyj + cid]} , 1 = 1 , 2 , . . . , * ,
= min [ 2 p ( j \ i , d) ay j -\-dd],
i = t + l, - . . , T.
в) Запишите прямую задачу линейного программирования, аналогичную (1) и (2) из разд. 18.5 и соответствующую экстремальным уравнениям п. б). Определите число ограничений и переменных в этой задаче. г) Покажите, как исключить Т линейных ограничений в задаче п. в) путем замены переменных
Zi = Яг + г/о — Уп
i = 1, 2, . . ., t.
196
ГЛАВА 18
Покажите, как можно исключить еще К линейных ограничений, вторично заменив переменные следующим образом: Zt+h = at+k+bh — z i+ft , k = 1, 2, . . ., К. д) Выведите соответствующие экстремальные уравнения при а = 1, аналогичные уравнениям п. б), и запишите упрощенную прямую задачу линейного программирования, подобную задаче п. г). е) Рассмотрим стохастическую модель управления запасами, в которой р (q) обозначает вероятность того, что спрос равен q (спрос имеет независимое и одинаковое распределение на различных отрезках), S + сх [х = 1, 2, . . ., где S > 0] — покупную цену изделий, Н (I — д) — функцию издержек хранения и штрафа, где I — уровень запаса после размещения заказа (в предположении, что поставки осуществляются немедленно), но до момента возникновения спроса. Допустим, что при превышении спроса q над уровнем I избыточный спрос теряется. Допустим, что стремятся найти стратегию следующего вида. Если начальный уровень запаса превышает 10, то заказ на пополнение не размещается. Если начальный уровень запаса меньше или равен 10, то заказ на пополнение может быть размещен (но не в обязательном порядке). Уровень запаса после размещения заказа, но до момента возникновения спроса не может превышать 15. (Примем, что в начале планового периода уровень запаса равен 0.) Постройте модель, описываемую системой экстремальных уравнений, аналогичных уравнениям п. а). Определите число ограничений и переменных в соответствующей прямой модели линейного программирования. Покажите, как свести задачу к модификации п. б), и вновь определите число ограничений и переменных в соответствующей прямой задаче линейного программирования. Используйте результаты п. г) и запишите подробно соответствующую модель линейного программирования. [Указание: примите at = —ci и bh~ = S + (k + 10) с + 2 H (k + 10 - q) p (q).] q
ж) Рассмотрите пример п. е). Покажите, что задачу можно также описать экстремальными уравнениями упражнения 50 [пп. а) и б)]. Определите число ограничений и переменных, соответствующих прямым задачам линейного программирования. Запишите полностью соответствующую упрощенную модель линейного программирования для г). Является ли такая модификация более выгодной, чем в п. е)? Дайте необходимые пояснения.
ГЛАВА 19
Стохастические модели управления запасами
19.1. НОВЫЙ ПОДХОД
В предыдущих главах основное внимание уделялось вопросам построения наиболее распространенных математических моделей и описанию алгоритмов, позволяющих находить для них оптимальные решения. Так, например, в гл. 2, 6, 8, 10 и 11 рассматривались модели линейного программирования, сетевые модели и модели многошаговой структуры; изложению методов нахождения численных решений для такого рода моделей посвящены гл. 4, 7 и 12. Все модели и алгоритмы сопровождались конкретными примерами, позволяющими составить определенное представление о реальных ситуациях, в которых задачи организационного управления решаются с помощью методов исследования операций. В гл. 19 и 20, а также в приложениях II и III вместо подхода «от модели — к ее приложению» принят противоположный подход. Здесь рассматриваются конкретные классы задач организационного управления, при решении которых оказалось целесообразным использовать методы исследования операций. К этим задачам относятся управление запасами и проектирование систем массового обслуживания. При этом математические модели и алгоритмы строятся применительно к условиям, характерным для этих вполне конкретных задач, а получаемые в результате решения, как правило, представляют собой не просто плановые «ориентиры», а определяют оптимальную стратегию «поведения» в реальной обстановке. Со строго формальной точки зрения каждую из получаемых ниже моделей и каждый из используемых алгоритмов можно, разумеется, поставить в соответствие определенному классу моделей и алгоритмов, рассмотренных нами в предыдущих главах. Тем не менее возникают новые аспекты проблемы, которые выявляются лишь путем анализа физической природы модели и не определяются самим фактом ее принадлежности к той или иной категории (например, к категории линейных, нелинейных или динамических оптимизационных моделей). Далее нам придется полностью использовать специфические структурные характеристики рассматриваемых моделей. Перемещение акцента в этом направлении требует от нас соответствующего пересмотра самого подхода к процессу исследования. Нам следует теперь стремиться к выявлению тех фундаментальных понятий, которые лежат в основе анализа большинства задач, относящихся к вполне конкретной сфере организационного управления.
198
ГЛАВА 19
Поскольку множество ситуаций, возникающих в практике организационного управления в любой сфере деятельности, неисчерпаемо, представить все модели, требующиеся для описания всех возможных стечений обстоятельств, не удалось бы ни в одной книге (не говоря уже о книге, претендующей лишь на изложение основ исследования операций). Однако читатель сможет ознакомиться с основными идеями, формирующими остов моделей упомянутого выше типа; изложению этих идей посвящена настоящая и следующая главы, а также приложения II и III. При изучении указанного материала читатель должен помнить о необходимости ответить на следующие вопросы: 1. Принятие каких управляющих решений рассматривается в данной главе? Какая задача организационного управления при этом исследуется? 2. В силу каких причин реальная организационно-управленческая ситуация оказывается настолько сложной, что для принятия управляющих решений приходится прибегать к помощи операционной модели? Какие элементы этой ситуации учитываются в модели? Как наличие этих элементов сказывается на решении? Какие элементы задачи моделью не учитываются? 3. Чем отличается управляющее решение высокого качества от плохого управляющего решения? 4. Как бы вы использовали результаты анализа, если вы оказались на месте руководителя? Каким образом вы хотели бы (или были вынуждены) «подправить» полученный результат, принимая во внимание то обстоятельство, что ряд факторов моделью в явном виде не учитывается? Следует иметь в виду, что ответы на эти вопросы должны отражать «динамический» характер рассматриваемых ниже организационно-управленческих задач, поскольку условия в них меняются с течением времени. 19.2. НАУЧНЫЙ ПОДХОД К РЕШЕНИЮ ЗАДАЧИ УПРАВЛЕНИЯ ЗАПАСАМИ
Читатель, привыкший видеть запасы повсюду и постоянно, возможно, не задумывается над тем, что все эти запасы являются непосредственным результатом принятия управляющих решений. Он, по-видимому, вспоминает об этом лишь в тех случаях, когда, зайдя в магазин или в лавчонку, внезапно обнаруживает, что требуемые ему продукты или изделия отсутствуют. Тогда он, вероятно, с раздражением говорит: «Кто-то допустил просчет». Если отсутствующим товаром оказалась новогодняя поздравительная открытка и этот печальный факт обнаруживается 31 декабря, то не исключено, что лицом, допустившим просчет, является сам разочарованный покупатель. Вряд ли мы увидим в книжной лавке большой запас такого товара, прогнозируемый спрос на который пренебрежимо мал.
СТОХАСТИЧЕСКИЕ МОД ЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
199
Разумеется, сам факт возникновения задач регулирования запасов буквально во всех отраслях промышленности еще не является достаточным доказательством необходимости применения методов исследования операций для решения этих задач. Чтобы промышленная фирма согласилась пойти на этот шаг, требуется выполнение по по крайней мере одного дополнительного условия: как вероятность неправильного решения вопросов, связанных с управлением запасами, так и отрицательные экономические последствия такого решения должны быть достаточно ощутимыми, чтобы появились основания для проведения научного анализа проблемы. Например, для большого магазина канцелярских товаров может оказаться весьма выгодной разработка, скажем, оптимальной стратегии регулирования запасов карандашей, тогда как намерение построить оптимальную стратегию управления запасом карандашей в чьем-либо письменном столе было бы довольно глупой затеей. Обоснование этого утверждения, по-видимому, не вызовет у читателя никаких затруднений. Чтобы не создать у читателя ложной картины слишком большим числом примеров из области розничной торговли, сразу же отметим, что наиболее распространенные приложения моделей управления запасами относятся к сфере промышленного производства и оптовой торговли, хотя сложившиеся ранее традиции начинают быстро изменяться. Встречаются, в частности, научно обоснованные системы управления запасами, используемые на крупных промышленных предприятиях в связи с регулированием процедур складирования сотен, а порой даже тысяч различных видов сырья, полуфабрикатов и готовой продукции. В такого рода системах принятие всех управляющих решений относительно пополнения запасов возлагается, как правило, на очень ограниченное число людей. Читателя, вероятно, заинтересует, каким образом выведенная математическим методом стратегия управления запасами может улучшить решения, принимаемые опытными руководителями. Ответ на этот вопрос приводится ниже. Комплексный подход. Во многих случаях при решении вопроса относительно пополнения запасов того или иного вида сырья или готовой продукции руководителю действительно удается превзойти возможности, заложенные в математической формуле. Однако для этого он должен дать точный прогноз потребностей в рассматриваемом виде сырья (или готовой продукции) и в любой момент времени знать, какое время необходимо для реализации заказа на пополнение запаса. Если речь идет о таком виде сырья, полуфабриката или готовой продукции, который представляет для фирмы значительный интерес (либо потому, что он относится к числу дорогостоящих, либо в силу того, что он играет существенную роль в производственном процессе), то наилучшей из всех стратегий управления может оказаться непосредственный контроль за уровнем соответствующих запасов со стороны руководителя. Но число товаров, которое
200
ГЛАВА 19
может держать под постоянным прицелом один человек, весьма ограничено. Поскольку большинство фирм держит запасы огромного количества различных видов сырья, полуфабрикатов или готовой продукции, многие из них с неизбежностью регулируются либо стереотипным путем, либо наобум. Для такого рода мулътиноменклатурных складских систем исследование операций позволяет выработать способы управления запасами, являющиеся рациональными с экономической точки зрения. Устанавливая продуманные в методическом плане процедуры пополнения большинства складируемых изделий, научный подход к решению проблемы управления запасами освобождает руководителя от необходимости заниматься такого рода вопросами и дает ему возможность приложить свои способности к анализу особых ситуаций, где его опыт исключительно ценен. Таким образом, эффективно функционирующая научная система управления запасами предполагает непременное гармоническое сочетание суждений, генерируемых человеком, и математических формул. Простота операционной модели. Модели управления запасами относятся к числу весьма редко встречающихся операционных моделей, для которых результирующие оптимальные решения могут быть реализованы в режиме быстрой смены ситуаций (когда, например, условия меняются ежедневно). Это объясняется тем, что применительно к управлению запасами суть оптимального решения состоит в том, чтобы сформулировать два следующих правила: 1) Правило, позволяющее определить, когда (т. е. при наличии каких условий) запасы подлежат пополнению. 2) Правило, позволяющее определить объем пополнения запасов. Другими словами, эта стратегия дает возможность рассчитывать время и объем каждого очередного пополнения запасов, т. е. основные параметры управляющего решения. Независимо от степени сложности математической модели и алгоритма решения задачи, с помощью которых отыскивается такого рода стратегия, ее формулировку в виде правил указанного выше типа всегда легко интерпретировать. В ряде случаев формирующие стратегию правила задаются в виде таблиц, и от руководителя требуется лишь простановка значений различного рода показателей, таких, как стоимость единицы складируемой продукции или средний уровень спроса. Нередко же система является полностью автоматизированной; в этих случаях ЭВМ постоянно следит за текущим уровнем запасов и в надлежащее время заполняет бланк заказа на поставку требуемой продукции с указанием точных количественных параметров. Хотя модели управления запасами и получили достаточно широкое распространение, все еще встречаются многочисленные ситуации, в которых управляющие решения по вопросам складирования товаров принимаются волевым порядком, несмотря на то что отрицательные экономические последствия ошибок могут оказаться весьма существенными. Основная причина того, что в ряде организаций
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
201
запасами продолжают распоряжаться наобум, заключается в том, что условия функционирования такого рода организаций еще недостаточно усиленно анализируются специалистами в области исследования операций. Если же и удавалось в некоторых случаях добиться решения задачи, то оно выглядело гораздо более сложным по сравнению с решениями, содержащими в себе лишь два указанных выше правила. Следовательно, практическое приложение такого рода решения сталкивалось соответственно с большими трудностями. Задача, как правило, чрезвычайно усложняется тогда, когда наблюдается существенная взаимозависимость между уровнями потребностей в товарах различных наименований (когда, например, имеет место взаимозаменяемость изделий различных видов), а также при наличии нескольких мест складирования одного и того же вида изделий (когда, например, имеется большой районный склад и несколько складских помещений непосредственно при торговых точках). Со временем исследование операций успешно справится с решением и такого рода сложных задач. Цель изучения. В оставшейся части данной главы, а также в приложении II будет предложено несколько форм записи для моделей управления запасами. Каждая из рассмотренных ниже формулировок является прототипом структуры целого класса моделей, исследованием которых занимались многие операционисты-теоретики. Разобравшись в основных подходах к построению такого типа моделей, читатель получит достаточно полное представление о наиболее существенных положениях теории управления запасами вообще. Это означает, что ему удастся освоить все то, что в совершенстве следует знать руководителю, а именно цели, возможности и пределы возможностей научного подхода к управлению запасами. Более того, после проработки представленного здесь материала читатель сможет при желании заняться изучением более серьезных работ, посвященных операционным моделям управления запасами. 19.3. ОСНОВНЫЕ ФАКТОРЫ, УЧИТЫВАЕМЫЕ ПРИ АНАЛИЗЕ СИСТЕМ УПРАВЛЕНИЯ ЗАПАСАМИ
Какие соображения являются существенными для принятия решения относительно того, когда и в каком объеме складировать тот или иной товар? Факторы, играющие в этой связи наиболее важную роль, распадаются на три основные группы. Здесь эти факторы обсуждаются с общих позиций; в последующих разделах они уточняются в рамках конкретных математических моделей. Чтобы добиться большей ясности изложения, рассмотрим фирму «Блеск», ведущую оптовую торговлю различного рода металлоизделиями (алюминиевыми стержнями, спиралями, листами, пластинами и т. д.), которые она приобретает у выпускающей алюминиевые изделия фирмы-поставщика. Если читатель захочет вместо фирмы «Блеск» рассмотреть какую-либо другую фирму, которой приходится решать
202
ГЛАВА 19
проблемы регулирования запасов, то при установлении соответствующих аналогий у него не должно возникнуть никаких трудностей. Спрос и предложение. Фирме, занимающейся оптовой торговлей, естественно, требуется тем или иным способом прогнозировать потребности своих собственных клиентов в каждом конкретном виде изделий. Такого рода прогноз непосредственно отражается на объемах оформляемых фирмой заказов; результат прогнозирования чаще всего удается представить в виде некоторого распределения вероятностей. На протяжении всей этой главы предполагается, что уровни спроса на различные виды товаров взаимно независимы. Даже в тех случаях, когда это допущение строго не выполняется, оно является вполне адекватным приближением к реальности и может служить основой для разработки стратегии управления запасами. Более того, распределение вероятностей для уровней спроса предполагается независимым от характера правил пополнения запасов, а также от всех прочих управленческих действий. С помощью более утонченных математических методов анализа удается строить оптимальные стратегии управления запасами, полностью абстрагируясь от приближенного характера принимаемых допущений. Использование аппарата теории вероятностей для описания прогнозируемых уровней спроса — удобный способ интегрального представления (в виде единой формулы) как частичных сведений об исследуемом процессе, так и частичных пробелов в наших знаниях о нем. Устанавливая вид и задавая параметры распределения вероятностей (такие, как среднее значение для пуассоновского распределения или среднее значение и дисперсию для биномиального распределения), мы тем самым утверждаем, что нам известны относительные вероятности уровней спроса. Таким образом, формулируя тот или иной закон вероятностного распределения, мы даем компактное представление той степени неопределенности относительно будущих уровней спроса, в условиях которой нам приходится действовать. Торговой фирме-оптовику требуется также знать срок запаздывания поставки, т. е. то время, которое проходит с начала операции пополнения запасов до того момента, когда заказанная продукция оказывается в наличии и может быть использована для удовлетворения потребительского спроса. Соответствующий интервал, разумеется, включает все то время, которое требуется фирме-поставщику для выполнения операций, связанных с исполнением полученного заказа, включая время отгрузки и транспортировки заказанных изделий; в этот интервал входит также время, которое тратится самой фирмой «Блеск» на оформление заказа на поставку, а также на прием и распаковку прибывших изделий. Продолжительность срока запаздывания поставки может быть определена в зависимости от конкретных обстоятельств либо полностью детерминированным образом, либо в вероятностном смысле.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
203
В ряде случаев может иметь место расхождение между числом товарных единиц, указанным в заявке, и числом фактически полученных единиц. Так, например, для некоторых производственных процессов существенное значение имеют потери от брака и фирме-поставщику может понадобиться доставлять в пункты назначения определенный резерв сверх заказанного числа изделий. Такого рода ситуации в этой главе не рассматриваются. Для их исследования требуется применение более сложных методов анализа. Экономические показатели, учитываемые при управлении запасами. Если обратиться к крупномасштабным системам управления запасами, то нетрудно убедиться в том, что большими партиями на склады завозятся обычно те изделия, потребность в которых возникает довольно часто. Это объясняется целым рядом причин. Наиболее важная из них заключается в том, что при малых объемах поставок наблюдалось бы возрастание их частоты и, следовательно, возросли бы накладные расходы, связанные с составлением и пересылкой заказов (т. е. так называемые организационные расходы, или затраты на оформление заказов). Вторая (менее очевидная) причина состоит в том, что при больших объемах заказов фирме удается устранить частое возникновение такой ситуации, когда ее запасы оказываются полностью исчерпанными. В ряде случаев являются существенными и другие соображения, которые не учитываются в рамках моделей, рассматриваемых в данной главе. К их числу относятся ситуации, когда фирма-поставщик делает скидку цены в зависимости от объема заказа или лимитирует нижний предел объема поставки. Возможны также и такие случаи, когда прогнозируется повышение цен на товары, приобретаемые у данной фирмы-ноставщика. Какие соображения заставляют ограничивать объем заказа на поставку? Основным фактором являются затраты на содержание запасов. Сосредоточение изделий на складах сопряжено с отрицательными экономическими последствиями в силу того, что в этом случае происходит «замораживание» капитала, которому можно было бы найти выгодное применение. Кроме того, это влечет за собой затраты на хранение, страхование и т. д. К числу других лимитирующих элементов, которые учитываются в реальных условиях (но не фигурируют в рассматриваемых ниже моделях), относится возможная порча товаров, хранящихся на складах, их устаревание, ограниченность бюджета фирмы, недостаток в складских помещениях и т. п. Пока мы не касались вопроса о том, какие виды товаров (сырья, полуфабрикатов или готовой продукции) целесообразно иметь на складах торговой фирме-оптовику. Совершенно очевидно, что даже универсальные магазины держат на своих складах далеко не все, что может найти спрос у покупателей. При этом, по-видимому, в каждом случае, когда фирма не имеет в наличии запрошенного клиентом товара, можно говорить о потере прибыли или о своего рода штрафе за неудовлетворение спроса. Несостоявшийся акт продажи
20/i
ГЛАВА 19
того или иного товара реальному покупателю, естественно, равносилен снижению доходов торговой фирмы. Но фирма терпит экономический ущерб даже тогда, когда покупатель готов ждать исполнения своего заказа, поскольку в этом случае торговая фирма оказывается вынужденной идти на некоторые дополнительные издержки, связанные с учетом неудовлетворенных заказов и их удовлетворением при оформлении последующих заявок на пополнение запасов. Поэтому она содержит запасы тех товаров, отсутствие которых на складе может принести ей серьезный ущерб; этому выводу (формулировка которого носит пока чисто качественный характер) в каждом из рассмотренных ниже примеров придается вполне конкретное содержание. В соответствии со сложившимися традициями критерием оптимальности для моделей управления запасами считается не ожидаемая прибыль, а ожидаемые затраты. Поскольку в большинстве такого рода моделей цены, по которым продаются фигурирующие в задаче товары, предполагаются фиксированными, такой выбор критерия оптимальности вполне правомерен, правда, при условии, что при этом уделяется должное внимание определению издержек «штрафного» характера, когда имеет место потеря прибыли или происходит отсрочка в ее получении (из-за невозможности удовлетворить спрос или в случае разрешенной задержки выполнения заказа). Другой довод в пользу упомянутого выше критерия заключается в следующем: модели управления запасами часто используются применительно к таким видам складируемой продукции, которые потребляются только самой фирмой и, следовательно, не подлежат реализации с получением прибыли в истинном смысле этого слова. Применительно к товару, подлежащему хранению, оптимальной является такая стратегия управления запасами, которая позволяет надлежащим образом сбалансировать затраты на обеспечение поставок, расходы, связанные с содержанием изделий на складе, и экономические потери от неудовлетворенного (или несвоевременно удовлетворенного) спроса. Как будет показано ниже, каждый из этих трех экономических показателей оказывает влияние как на выбор объема пополнения запасов, так и на определение сроков оформления соответствующей заявки. Решение относительно сроков пополнения запасов обычно равносильно определению некоторого критического уровня: всякий раз, когда объем запасов падает ниже этого уровня, фирма принимает меры для пополнения своих запасов. Чем выше критический уровень, тем надежнее гарантия того, что не возникнет нехватки товара, запрашиваемого клиентурой. Итак, изменение количественного показателя, характеризующего критический уровень запасов, непосредственно сказывается на взаимозависимости затрат на содержание запасов и потерь от неудовлетворенного спроса. Следует, между прочим, заметить, что если объемы пополнения запасов достаточно велики и фирма в значительной степени гарантирована от полного исчерпания складских запасов соот-
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
205
ветствующих изделий, а заказчики допускают задержку в выполнении своих заказов, то оптимальным может оказаться решение делать заявку на пополнение запасов лишь тогда, когда накапливается значительный портфель невыполненных заказов. Такого рода случай рассматривается в разд. 19.5. Анализ, проведенный в предыдущих главах, показывает, что в тех случаях, когда функция критерия эффективности выражается через приведенное ожидаемое значение соответствующего экономического показателя, в процессе оптимизации должен учитываться фактор взаимозависимости между доходами, получаемыми немедленно, и уровнями доходов в будущем. Так, например, при увеличении процентной ставки оптимальная стратегия сведется к уменьшению объема заказа в текущий период, поскольку отсрочка в накоплении большего количества товаров обходится фирме дешевле, если экономический эффект оценивать с учетом коэффициента дисконтирования. Важно иметь в виду, что в процессе практического применения моделей управления запасами оценка затрат, связанных с реализацией заказов на товарные поставки, а также расходов на хранение и убытков в «штрафных» ситуациях представляет собой совсем не легкую задачу. Тем не менее трудности, возникающие при решении этой задачи, отнюдь не относятся к числу непреодолимых; это подтверждается хотя бы тем фактом, что такого рода модели уже нашли весьма широкое практическое применение. Пока мы затрагиваем лишь проблему выработки процедур приближенных и достаточно удовлетворительных оценок стоимостных показателей, связанных с хранением и накоплением складских запасов. Вопросы практического применения операционных систем управления запасами более подробно обсуждаются в разд. 19.7. Индивидуальные особенности операционной системы. К третьей группе факторов, влияющих на выбор стратегии пополнения запасов, относится разнообразие условий и обстоятельств, из которых лишь некоторые поддаются контролю со стороны руководителя. Одна из характеристик операционной системы определяет режим слежения за уровнем имеющихся в наличии запасов: текущий объем заскладированных товаров может контролироваться либо непрерывно, либо периодически (дискретно). При непрерывном контроле заказ на поставку оформляется сразу же, как только запас того или иного вида изделия опускается до уровня, лежащего ниже критического. В случае когда такого рода контроль осуществляется периодически, «положение дел» на складах проверяется только по истечении некоторых, заранее заданных интервалов времени (например, каждый понедельник). При этом пополнение запасов происходит лишь через определенные интервалы, несмотря на то что уровень запасов может оказаться ниже критического в более ранние моменты времени (до истечения текущего интервала). Анализ модели с непрерывным слежением за уровнем запасов при стоха-
206
ГЛАВА 19
стическом характере спроса приведен в разд. 19.6. Случай дискретного контроля рассмотрен в приложении П. Как и все прочие математические модели, исследуемые нами модели управления запасами позволяют описывать реальные процессы лишь приближенно. Поэтому при решении практических задач выбор непрерывного или дискретного режима слежения за состоянием запасов зависит от того, какой из упомянутых вариантов позволяет точнее отражать реальное положение дел. Для более подробного ознакомления с критериями выбора режима слежения за текущим уровнем запасов читателю рекомендуется обратиться к специальной литературе, посвященной вопросам управления запасами. Вместе с тем каждый из желающих изучить материалы, приведенные в приложении II, должен уделить серьезное внимание сравнению упомянутых выше типов моделей и лежащих в их основе предположений с тем, чтобы увидеть признаки их различия. К разряду специфических характеристик относятся также ограничения на объемы заказываемых партий изделий. Иногда бывает необходимо или желательно заказывать изделия в количествах, которые можно выразить лишь целым числом некоторых общепринятых единиц измерения, например целым числом дюжин. (Заметим, что в таких случаях переход к другой шкале измерения, вообще говоря, не допускается, так как потребности покупателей в новых единицах измерения могут и не найти правильного отражения.) В ряде случаев объем заказа лимитируется по той причине, что фирма имеет лишь ограниченное количество мест в располагаемых ею складских помещениях. Методика учета такого типа ограничений обстоятельно анализируется во многих работах по исследованию операций. Здесь же эти вопросы подробно не обсуждаются. Следует, наконец, отметить, что на выбор стратегии пополнения запасов могут повлиять факторы комплексного характера. Так, например, возможна ситуация, когда фирме «Блеск» не удастся в нужное время получить требуемые ей объемы товаров с заводов фирмыпоставщика из-за нехватки грузоподъемных или транспортных средств. Следовательно, объемы заказов на те или иные виды изделий должны определяться и с учетом такого рода внешних ограничений. К тому же не исключено, что какой-нибудь из приобретаемых фирмой изделий размещается на нескольких отдельных складах, разбросанных по разным местам, и, следовательно, при разработке плана действий фирма окажется вынужденной рассматривать сразу несколько уровней запасов. В целях упрощения анализа построения оптимизационных моделей управления запасами подобные ограничения нами также не учитываются, хотя специалистами в области исследования операций успешно решаются и такого рода усложненные задачи. Выводы и взгляд вперед. Попытаемся дать общую характеристику используемых нами методов анализа. Прежде всего отметим, что в моделях, рассматриваемых в данной главе и приложении II,
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
207
каждый вид складируемых изделий рассматривается отдельно. В этих моделях считаются заданными такие характеристики системы, как режим контроля за уровнем запасов [непрерывный или периодический (дискретный)], продолжительность планового периода, срок запаздывания поставок (по отношению к моменту оформления соответствующих заказов), прогнозируемые уровни спроса, покупная цена изделий, накладные расходы, затраты на содержание каждого изделия и коэффициент дисконтирования. Никаких дополнительных ограничений при этом не накладывается. При ознакомлении с рассматриваемыми ниже моделями читатель должен подумать о том, как повлиял бы на выбор оптимальной стратегии учет индивидуальных особенностей и внешних условий функционирования той или иной системы управления запасами. Несмотря на то, что в данной главе основной целью является анализ моделей, в которых одновременно предполагается как стохастический характер спроса, так и динамическая (рекуррентная) структура самой задачи управления запасами, читатель найдет полезным рассмотреть каждый из этих элементов отдельно. Так, например, в разд. 19.4 обсуждается метод определения оптимальной стратегии управления запасами в том случае, когда спрос носит вероятностный характер, а управляющее решение относительно объема заказываемых изделий принимается только один раз. В разд. 19.5 рассматривается ситуация, когда задача организационного управления является динамической, но уровни спроса предполагаются точно прогнозируемыми (по средним значениям). В разд. 19.6 и приложении II упомянутые выше ситуации анализируются в комплексе, чтобы более четко выявить взаимосвязь между характеризующими их факторами. В каждом из рассмотренных случаев задача заключается в том, чтобы дать исчерпывающее описание оптимальной стратегии, используя только два показателя: критический уровень запасов (точка заказа) и объем заказа на дополнительную поставку того или иного изделия. В результате для нахождения оптимального решения используется алгоритм оптимизации значения нелинейной целевой функции всего двух переменных. Как будет показано ниже, при заданной структуре оптимального решения и при наличии столь незначительного числа управляемых переменных задача алгоритмизации процедуры отыскания оптимального решения является весьма легкой; при этом удается успешно применять простые, но очень эффективные методы «числовых» аппроксимаций. 19.4. СТАТИЧЕСКАЯ МОДЕЛЬ
В этом разделе рассматривается так называемая статическая х модель ), в которой решение относительно запасов принимается всего только один раз с учетом прогнозируемых уровней спроса, 1
) В статических моделях плановый период не подлежит дроблению (т. е. состоит из единственного временного отрезка).
208
ГЛАВА 19
представленных значениями некоторой случайной переменной. Эта модель интересна по двум причинам. Во-первых, как мы вскоре убедимся, такого типа модели в ряде случаев действительно адекватно описывают реальные ситуации. Во-вторых, оптимизационная процедура в этом случае является своего рода прологом к исследованию рассмотренных ниже динамических моделей. Приведенный ниже пример, основные элементы которого взяты из практики, дает определенное представление о том, как можно использовать статическую модель в реальных условиях. (При этом мы не обращаем внимание на некоторые детали, которые, хотя и влияют на выбор стратегии, но не имеют существенного значения с методической точки зрения.) Представим себе, что крупное столичное издательство, выпускающее газету «Дейли Страж», пытается определить, какое количество газет необходимо доставлять в каждый из газетных киосков. Непроданные газеты возвращаются в издательство. При существующей системе распределения стоимость нереализованных газет достигает 1 млн. долл. в год. Более рациональный способ распределения выпускаемого тиража газет по киоскам может обеспечить значительное снижение экономического ущерба. Несмотря на то что ежедневно принимаемые решения относительно числа газет, подлежащих доставке в каждый из киосков, по своей природе рекурренты (т. е. решения подлежат ежедневному пересмотру), организационная, задача в целом может быть решена в рамках статической модели. Поскольку газета, выпускаемая в тот или иной день, не представляет никакого интереса на следующий день, принцип определения числа газет, направляемых в пункты их продажи, необходимо выработать «раз и навсегда». Ежедневный спрос на газеты можно считать случайным (недетерминированным), т. е. лишь частично предсказуемым, и зависимым от того, в какой день недели выходит газета и насколько она насыщена интересным (или важным) материалом. Кроме того, в разные дни недели оказываются неодинаковыми удельные затраты на выпуск одного экземпляра газеты; например, печатанье каждого экземпляра газеты наиболее объемистого воскресного выпуска обходится издательству дороже, чем печатанье одного экземпляра той же газеты в какойлибо другой день недели. С учетом этих обстоятельств издательство газеты «Дейли Страж» решило прибегнуть к помощи операционной модели наподобие той, которая приведена ниже в разделе, посвященном рассмотрению случая линейного характера функции затрат на содержание запаса и функции потерь в штрафных ситуациях. (Исходя из некоторых, весьма очевидных соображений, задачу, представленную моделью такого типа, называют задачей издателя газеты или просто задачей газетчика.) В используемой модели экономические показатели, характеризующие затраты, и распределение вероятностей для спроса определяются прогнозируемыми условиями на каждый конкретный день.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
209
Читателю предлагается придумать другие задачи коммерческого характера, анализ которых может быть выполнен с помощью статической (однопериодной) модели управления запасами. При каких условиях окажется экономически выгодным применение методов исследования операций для решения таких задач? Форма представления стратегии пополнения запасов. Введем прежде всего следующие обозначения: i — уровень запасов перед принятием решения об оформлении заказа на дополнительную поставку; х — объем заказываемого товара ( ж ^ О ) ; у = i + х — суммарный объем имеющихся в наличии запасов, которые можно использовать для удовлетворения будущего спроса; q — фактический уровень спроса (q — случайная переменная, удовлетворяющая условию q ^ 0); р (q) — вероятность того, что уровень спроса равняется д. Допустим для удобства, что i, х, у и q принимают целочисленные значения 1). Оптимальные значения переменных х и г/, как правило, зависят от исходного (первоначального) уровня запасов i; поэтому в символическом представлении (т. е. в математической записи) оптимальной стратегии будут фигурировать функции х (i) и у (i). Не представляет большого труда построить такие модели, которые выглядят весьма правдоподобно, но приводят к оптимальным стратегиям парадоксального вида. Все, кому любопытно ознакомиться с примерами такого рода моделей, могут это сделать в процессе внимательного прочтения специально посвященного этим вопросам материала в последующих разделах данной главы. Чаще всего в связи с управлением запасами руководителями используется следующий простой вид правила пополнения запасов: у (i) = i, х (i) = 0
при i ^ s
у (i) = S, х (i) = S — i
при i < s
(заказ на поставку не оформлять), (оформлять заказ на поставку).
(1)
Согласно (1), заказ на поставку не оформляется, если начальный объем запасов i превышает или равен s; если же i < s, то оформляется заказ с целью пополнения запасов до суммарного объема S, который идет на удовлетворение будущего спроса покупателей. Правило (1) называют (s, $)-стратегией; здесь s —• критический уровень запасов (точка заказа), a S — уровень запасов, достигаемый в результате пополнения (т. е. после реализации заказа на дополнительную поставку товаров). 1 ) Случай, когда эти переменные могут принимать любые (непрерывные) значения, будет рассмотрен нами отдельно.
210
ГЛАВА 19
Ниже будет показано, при выполнении каких экономических условий (т. е. при наличии какого комплекса стоимостных показателей) оптимальную стратегию пополнения запасов действительно можно представить в форме (s, S) — [правило (1)]. Однако, прежде чем перейти к рассмотрению одношаговой статической модели общего вида, рассмотрим подробно наиболее важный вариант моделей такого типа. Случай линейных функций затрат на содержание запасов и потери в штрафных ситуациях. Предположим, что ожидаемые затраты за весь плановый период равняются сумме покупной стоимости продукции, математического ожидания затрат на содержание продукции на складе и экономических потерь, возникающих в штрафных ситуациях г). Для определенности будем считать, что затраты, связанные с приобретением х изделий, выражаются формулой
0
при х~0, при
где неотрицательная величина К представляет собой накладные расходы, а с есть стоимость одного изделия, приобретаемого у фирмыпоставщика (при этом естественно с ^ 0). Допустим, что ожидаемые затраты на содержание запасов и ожидаемое значение экономических потерь в штрафных ситуациях в течение всего планового периода зависят лишь от у = i -\- х, т. е. от суммарного объема продукции, который имеется в наличии и, следовательно, доступен покупателям. Обозначим функцию ожидаемых затрат через L (у) и предположим, в частности, что L (у) определяется следующей формулой: L(U)=
Ufo-(7)p(?) + S n(q-y)p(q)
g=0
9>0
0/>0),
(3)
где неотрицательная величина h есть затраты на содержание одного изделия, остающегося на складе до конца планового периода, а величина я — штрафные потери в расчете на одно изделие, отсутствующее на складе в конце этого периода. Следовательно, в выражении (3) первая сумма представляет собой ожидаемые затраты на содержание запасов, а вторая сумма — ожидаемые штрафные потери. Нами приняты также вполне разумные предположения о том, что с 4 - ^ > 0 и л > с (откуда следует, что h + п > 0). В качестве иллюстрации рассмотрим случай, когда р (q) = 1/5 при q = О, 1, . . ., 4, и, следовательно, Е [q] — 2. (4) х ) Как н в предыдущих главах, потери, возникающие в штрафных ситуациях, или просто штрафные потери, представляют собой тот экономический ущерб, который терпит фирма в случае неудовлетворения (или несвоевременного удовлетворения) спроса покупателей.— Прим. перев.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
211
Легко убедиться, что при этом
для г/>4,
•fSto-d+T S («д=0 д=У+1 Значения I/ (г/) при /г. = 5 и я = 0, 5, 10, 20 и 25 приведены в таблице на рис. 19.1 J). Заметим, что значение г/, минимизирующее значение L (у), увеличивается по мере возрастания я. Штрафные потери я (экономические потери в случае неудовлетворенного спроса) У
0
5
10
20
25
0
0
10
20
40
50
1
1
7
13
25
31
2
3
6
9
15
18
3
6
7
8
10
11
4
10
10
10
10
10
5
15
15
15
15
15
У >6
5(у-2) 5(j/-2) 5 (? -2) 5 (У -2)
5(0-2)
Р и с . 19.1.
В случае если каждое непроданное в конце планового периода изделие (т. е. избыточные запасы) удается реализовать по некоторой цене v (удовлетворяющей условию 0 <^ v -^ с), то из стоимости содержания изделия соответствующего вида величину v необходимо вычесть. Таким образом, в соотношении (3) под h в действительности 1 ) Желающим убедиться в правильности понимания формулы (5) рекомендуется самостоятельно вычислить значения L (у) при Л = 5 и я = 1 0 и сравнить полученные результаты с данными, приведенными в таблице па рис. 19.1. Кроме того, мы предлагаем читателю вычертить график функций L (у) с целью убедиться, что эта функция является выпуклой.
212
ГЛАВА 19
следует подразумевать переучтенную (чистую) стоимость содержания единицы складируемых изделий (h = h' — v), которая может принимать и отрицательные значения. Точно так же, если идет речь об изделиях, складируемых для последующего коммерческого сбыта, и возникает ситуация, когда объем заказов, превышающий имеющиеся в наличии запасы, полностью теряется, величина л включает в себя ту цену г, по которой данный товар можно было бы продать (я = п' + г). Нетрудно убедиться, что в данном частном случае (s, ^-правило определяет оптимальную форму представления стратегии пополнения запасов; Покажем теперь, каким образом находятся оптимальные значения s и S. Положим
(6) v > и назовем отношение (6) критическим отношением 1). Заметим, что R удовлетворяет условию 0 < R < 1, так как мы предположили, что я; > с и л -j- /г > 0. При этих условиях можно доказать, что значение неотрицательной величины S равняется наименьшему из целых чисел, для которого P(S)=%p(q)>R. g=0
(7)
Поскольку Р (S) есть не что иное, как статистическая (кумулятивная) функция распределения при q = S, оптимальным является такое значение S, для которого суммарный спрос полностью удовлетворяется, по крайней мере с вероятностью R. Из формулы (6) следует, что 1) R возрастает с увеличением значения л, так что S является неубывающей функцией штрафных потерь; 2) R убывает как с возрастанием значения /г, так и с возрастанием значения с, так что S есть невозрастающая функция hue; 3) если я ^г 2с + h, то R ^ 1/2, а значение S лежит по крайней мере не ниже уровня медианы распределения вероятностей для объемов спроса. Проиллюстрируем эти утверждения на примере модели, представленной соотношениями (4) и (5). График статистической функции распределения 2/ = 0, 1 , - . . , 4 ,
(8)
9=0
приведен на рис. 19.2. Чтобы упростить проблему интерпретации данного графика, мы изобразили его в виде лестницы. Иногда величину R называют определяющим параметром.— Прим, перев.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
213
Предположим, что затраты, связанные с хранением одного изделия, составляют 5 денежных единиц (h = 5), а штрафные потери в расчете на каждое изделие равняются 10 денежным единицам (я = 10); пусть, кроме того, с — 0. При этом R = 2/3 и, согласно (7) и (8), S представляет собой наименьшее из целых чисел, удовлетворяющих условию (S + 1)/5 > 2/3, (9) t,oи, следовательно, 5 = 3. (10) °'8L Я^-
Оптимальное значение S всегеГ °'В да удается сразу же отыскать геометрическим путем, если известна статистическая а.2> функция распределения наподобие той, которая изобра- - 2 - 1 0 1 2 3 * 5 6 жена на рис. 19.2. Для этого у достаточно проделать еледующее: указать на верти- Р и с. 19.2. Функция распределения Р (у). кальной оси точку, соответствующую найденному значению R, и провести через эту точку горизонтальную прямую до пересечения с вертикальной составляющей ломаной, изображающей функцию Р (у}', при этом значение S совпадает с тем значением г/, которое соответствует упомянутой выше точке пересечения 1). Каким было бы оптимальное значение S при /1 = 5, я = 10 и с = 5? Подводя итоги, можно утверждать, что для нахождения оптимального значения S вначале вычисляется по формуле (6) значение Л, а затем используется статистическая функция распределения Р (у). Заметим, что для определения S нет никакой необходимости вычислять значение L (у). Предположим, что накладные расходы К (т. е. расходы, связанные с процедурой оформления заказа, отгрузкой и транспортировкой) равны 0. Тогда, как будет показано ниже, оптимальным является вариант, когда s = S. Это означает, что при любом началь1 ном объеме запасов i, меньшем, чем б , оформляется заказ на дополнительную поставку в объеме х = S — г. Если же i > S, пополнения запасов не требуется. Рассмотрим несколько более сложный случай, когда К ^> 0. При этом условии оптимальное значение критического уровня запасов s должно подчиняться жесткому условию s < S. Это объясняется тем, что если накладные расходы К сравнительно велики, 1
) Если точка, определяющая значение R, лежит на продолжении горизонтального отрезка графика Р (у), то в этом случае значение S выбирается равным значению у, соответствующему левой граничной точке этого отрезка.
214
ГЛАВА 19
а начальный объем запасов i (^<S) достаточно близок по своему значению к S, то дополнительные накладные расходы и затраты на приобретение заказанных изделий не всегда удается скомпенсировать снижением удельной стоимости содержания запасов и штрафных потерь. Для простоты мы будем предполагать, что оптимальное значение s ^ 0. В соответствии с (s, ^-правилом при условии, что начальный объем запасов равняется s, заказ на дополнительную поставку товаров не оформляется. Следовательно, сумма ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь при у = s 1 ), т. е. L (s), не должна превышать сумму накладных расходов, ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь при у = S 2) [т. е. величину К + с (S — s) -f- L (S)]. При обязательном же заказе в случае, когда i < s, все экономические соображения для ситуации, характеризующейся условием г/ = s — 1, носят совершенно иной характер. Подводя итоги, мы можем утверждать, что в качестве s выбирается наименьшее из чисел, удовлетворяющих условию 3 ) L (s) ^ К + с (S - s) + L (S). (11) Итак, при К > 0 критический объем запасов s вычисляется следующим образом: вначале находится численное значение L (у), а затем полученный результат сравнивается с численными значениями суммы К + с (S — у) + L (S) для убывающего ряда пробных значений у (начиная с у = S); вычислительная процедура заканчивается, как только находится у = s, являющееся наименьшим из пробных значений, для которого выполняется условие (11). [При выполнении такого рода вычислений читатель, возможно, сочтет более удобным производить эквивалентное по своему содержанию сравнение числовых значений величин L (у) + су и К + cS -f L (S), поскольку последняя представляет собой константу.] В примере (8) при h ~ 5, я = 10 и с = 0,1 неравенство (11) выглядит следующим образом: L (s) ^ К + 0,1 (3 - s) + 8 = 8,3 + К - 0,1s. (12)
Предположим,
что К ~ 4. Тогда s = 2, поскольку L (2) = 9 < 8,3 + 4 - 0,1 -2 = 12,1, L ( l ) = 13 > 8,3 + 4 -0,1-3 = 12,
(13)
где значения L (s) получены с помощью таблицы, приведенной на рис. 19.1. Каким было бы оптимальное значение s при К = 12? При каких условиях оформляется в этом случае заказ на пополнение запасов? *) То есть в случае х = 0. 2 ) В этом случае объем заказа z равен S — s. ) Соотношение (11) фактически является определением уровня запасов. 3
критического
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
215
Мы продемонстрировали способ нахождения оптимальной (s, S)стратегии для весьма важного частного случая, когда функция затрат на содержание запасов и функция штрафных потерь являются линейными. Оставшаяся часть данного раздела посвящена рассмотрению структуры статической модели с более общей точки зрения Нами будут обсуждены методы построения и решения статической задачи при других функциях затрат и показано, при каких условиях, накладываемых на функции затрат, реализуется оптимальная (s, S)стратегия. Общее описание модели. Мы по-прежнему будем использовать приведенные выше определения величин i, x, у, q и р (q). Кроме того, введем следующее обозначение: 8 (У \ i) — ожидаемые средние затраты в случае, когда объем наличных запасов для удовлетворения потребностей клиентуры после реализации заказа на пополнение становится равным у при условии, что начальный объем запасов равнялся i. В большинстве случаев практического применения статических моделей задача решается при начальном условии i = 0. Однако бывают и исключения. В действительности мы можем даже допустить возможность такой ситуации, когда i < 0; это условие означает, что имеет место разрешенная задержка в удовлетворении спроса, оказавшегося неудовлетворенным в предыдущие периоды. Таким образом, величину i можно интерпретировать как истинную (переучтенную) оценку состояния запасов до принятия решения относительно приобретения товаров у фирмы-поставщика. Заметим, что в определении функции ожидаемых затрат g (у \ i) фигурирует не х, а у. Поскольку х = у — i, правомерно использование в качестве одного из аргументов функции g как переменной х, так и переменной у; однако второй вариант с математической точки зрения представляется более удобным. Подчеркнем еще раз, что g (у \ г) представляет собой математическое ожидание затрат. При конкретных значениях у и i фактические затраты в течение планового периода следует рассматривать как величину стохастического характера, поскольку объем спроса q предполагается случайным. Освежим в памяти основные элементы метода динамического программирования, в соответствии с которыми задача оптимизации может быть сведена к нахождению (y\i), (14) т. е. минимальных ожидаемых затрат при условии, если начальный объем запасов равняется i. Ниже мы всюду будем предполагать, что значения у ограничены снизу значением г; никаких трудностей концептуального характера в случае снятия этого ограничения не возникает *). *) Ситуация, когда у < i, может, например, возникнуть в связи с намерением фирмы ориентироваться на полную распродажу товаров.
216
ГЛАВА 19
Зная надлежащее оптимальное значение у (i), объем заказа находится с помощью соотношения
x ( i ) = y (i) - i.
оптимальный
(15)
В большинстве случаев значения функции g (у i) вычислить нетрудно. По мере увеличения у чаще всего g (у \ i) неограниченно возрастает. [Объяснить такое поведение функции g (у \ i) предоставляется самому читателю.] Поэтому даже при отсутствии каких-либо специфических свойств g (у \ i), которые можно было бы учесть при решении задачи минимизации (14), вычислительная процедура при нахождении оптимального значения у (i) оказывается весьма примитивной: в худшем случае приходится перебирать всевозможные варианты значений у = i, i + 1, . . . до тех пор, пока не будет достигнут минимум g (у | i). В процессе вычислений нужно быть внимательным, с тем чтобы не принять минимум локального характера за глобальный. Читатель может предположить, что, зная у (i) для одного или нескольких значений i, можно судить о том, какие значения примет у (i) при других значениях i. Попытаемся проверить, является ли это основанное лишь на интуиции предположение правильным. Допустим, что начальный объем запасов равняется i, причем i может принимать лишь следующие значения: О, 1, . . ., 8. Пусть максимальный уровень спроса равняется 8. Кроме того, предположим, что у (i) ^ 8 при любом значении i (если, разумеется, функция затрат удовлетворяет надлежащим требованиям). Допустим, что, пытаясь найти решение задачи минимизации, представленной соотношением (14), мы начинаем вычислительный процесс с рассмотрения следующих двух вариантов J): Вариант 1. Если i = 7, у (i) = 8 и, следовательно, х (i) = 8 — — i = 1. Какими, по мнению читателя, будут значения у (i) ж х (i) при i = О, 3, 4? Вариант 2. Если i = 3, у (i) = 4 и, следовательно, х (i) = 4 — — i = 1. Какими, по мнению читателя, оказались бы значения у (i) и х (i) при i = 0, 4, 7? Ответы на поставленные выше вопросы и краткое их обоснование рекомендуется записать на отдельном листе бумаги. К этим записям интересно будет вернуться после ознакомления с примером, к рассмотрению которого мы переходим. Случай единовременного штрафа. С помощью этого примера мы попытаемся показать, что даже простые на вид модели (т. е. модели, содержащие ограничения примитивного характера) могут приводить к оптимальным решениям весьма необычной структуры. Допустим, что возможны лишь два значения уровней спроса: 4 и 8. Пусть 1 ) Способ нахождения числовых значения у (i) при заданных i автором сознательно не указывается. В противном случае поставленные им вопросы были бы лишены смысла.— Прим, перее.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ. ЗАПАСАМИ
217
также известно, что
р (4) = р (8) = V 2 ,
(16)
а при д Ф- 4,8 p(q) = 0. Допустим, что выполняется условие
при y = i
0
(ж = 0),
Предположим, что затраты на содержание запаса равны нулю, а также будем считать, что товары, «залежавшиеся на складе» к концу планового периода, полностью обесцениваются (т. е. их не удается реализовать). Вместе с тем допустим, что в случае, когда спрос (потребности клиентуры в товаре данного вида) превышает г/, фирма несет единовременные штрафные потери я > 0. При этих предположениях функцию ожидаемых штрафных потерь можно записать в виде
{
л л/2
для у = 0, 1, 2, 3, для у = 4, 5, 6, 7,
О
для у — 8.
(18)
Учитывая (16), легко убедиться в том, что формула (18) приводит к одинаковым штрафным потерям (я) независимо от того, на какое количество изделий фактический спрос q превышает имеющийся в наличии объем запасов у [проверка правильности вычисления правой части соотношения (18) возлагается на читателя]. Ниже приводится хотя и несколько искусственный, но весьма показательный пример, поясняющий условия, при которых модель «единовременных штрафов» может найти практическое применение. Предположим, что житель пригорода N отправляется на собственном автомобиле за покупками в центральную часть города, где ему придется парковаться на открытой стоянке, оборудованной специальным счетчиком-коллектором. Пусть q есть то количество времени, которое потребуется N для завершения всех покупок, ay — количество оплаченного времени стоянки принадлежащего ему автомобиля *). Улица, оборудованная счетчиками-коллекторами в местах разрешенных платных автомобильных стоянок, тщательно контролируется полицией, так что если на выполнение (предположим, что речь идет о мужчине) всех поручений супруги N понадобится больше времени, чем оплачено (q > у), то ему наверняка вручат дополнительный счет (своего рода штраф за превышение времени стоянки) в размере п. Поскольку N не может предсказать g с абсолютной точностью, перед ним возникает следующая задача: рассчитать у так, чтобы не допустить сильного просчета ни в количестве опущенных 1 ) Продолжительность оплаченного времени определяется, например, числом пятицентовых монет, опущенных в приемник коллектора рядом со стоящей машиной.— Прим. перев.
218
ГЛАВА 19
пятицентовых монет, ни в возможном штрафе за превышение оплаченного времени стоянки. [Другим примером организационной задачи, в которой должна учитываться возможность единовременных штрафных потерь, является задача составления расписания для так называемых аэробусных рейсов на авиалинии Нью-Йорк — Вашингтон. На такого рода рейсы билеты не резервируются: если пассажир прибывает в аэропорт вовремя, авиакомпания гарантирует ему место в самолете. Если все места на запланированный рейс оказываются занятыми, авиакомпания обязана назначить дополнительный внеплановый рейс, даже если в самолете планового рейса не хватило места всего одному пассажиру.] Резюмируя изложенные выше рассуждения, мы можем утверждать, что функция ожидаемых затрат g (у \ i) представляет собой сумму затрат, связанных с реализацией заказа на пополнение запасов [см. (17)] и ожидаемого значения штрафных потерь [см. (18)], т. е. g(y\i)=c(y-i)
+ L (у).
(19)
Обращаясь к соотношениям (16) — (18), мы сразу же приходим к выводу, что при любом значении i в процессе поиска оптимального решения рассмотрению подлежат лишь следующие варианты стратегии: у = i, 4 или 8; х = 0, 4 — i или 8 — i. (20) Аргументация только что сделанного нами утверждения возлагается на читателя. Рассмотрим теперь два примера, в которых экономические показатели имеют конкретное количественное выражение. Проанализируем вначале случай, когда с = 1, К = 4,5, а я = 12. При начальном уровне запасов i = 7 оптимизационная задача [см. (14)] выглядит следующим образом: / (7) = min g ( y \ l ) = min [g (1 \ 7), g (8 | 7)] = S/?-7
= min[0 + 12/2, 4,5 + 1-1 + 0] = = 5,5 при у (7) = 8.
(21)
Таким образом, при начальном уровне запасов i = 7 оптимальным является заказ в объеме х (7) = 8 — 7 = 1. Рассмотрим теперь случай, когда i = 0. При этом
= min[0 + 12; 4,5 + 1,4 + 12/2; 4,5 + 1,8 + 0] = 12 при у(0)=0. (22) Легко убедиться, что для i = 3 и i = 4 у (3) = 8, а у (4) = 4,
(23)
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
и, следовательно, в итоге имеем у (i) = i, x (i) = 0 у (г) = 8, х (г) = 8 — i
при i = О, 4, 5, 6, 8, при i = 1, 2, 3, 7.
219
(24)
Читателю предлагается перевести соотношения (24) на обычный «язык предписаний», употребляемый при формулировке стратегии пополнения запасов. Согласуются ли результаты, полученные интуитивно при рассмотрении варианта 1 (см. предыдущий раздел) с (24)? Если нет, то чем это можно объяснить? Теперь рассмотрим вариант, в котором с = 1, К = i, а я = 5. Нетрудно проверить, что у (О = i, x (i) = 0 при i 4= 3, 7, г/ (3) = 4, а; (3) = 1 при i = 3, (25) i/ (7) =8, ж (7) = 1 при i == 7. Интерпретируйте соотношения (25), используя обычные термины, принятые при описании стратегии пополнения запасов. Согласуются : ли ваши ответы на вопросы, поставленные при рассмотрении вариан; та 2 (см. предыдущий раздел), с (25)? Если нет, то чем это можно [ объяснить? Несмотря на то что стратегии (24) и (25) действительно оптимальны, операционист может столкнуться с определенной трудностью, когда ему придется доказывать опытному руководителю, что при нулевом начальном уровне запасов заказ на пополнение оформлять не следует, а при начальном уровне запасов i = 3 целесообразно пополнить запасы, не взирая на возникающие при этом накладные расходы. Попытаемся теперь уточнить, какие условия, налагаемые на функции затрат, являются достаточными для того, чтобы простая по структуре (s, ^-стратегия (которая легко воспринимается руководящими лицами всех рангов) могла бы обеспечить оптимальное решение задачи управления запасами. Оптимальяая (s, $)-стратегия. Прежде всего нам необходимо вспомнить определение выпуклой функции, приведенное в гл. 9. Функция L (у), где у принимает целочисленные значения, называется выпуклой, если для любого значения у L(y + i)-L(y)^L(y)-L(y-
1).
(26)
Предположим, что функция ожидаемых затрат представляет собой сумму расходов, связанных с реализацией заказа на поставку, и величины, включающей в себя ожидаемые затраты на содержание запасов и ожидаемые штрафные потери, т. е. g ( y \ i ) = c(y-i)+L (у).
(27)
Пусть затраты, связанные с реализацией заказа с (у — i), состоят из накладных расходов К ^ 0 и покупной стоимости заказанной
220
ГЛАВА 19
партии изделий (при цене одного изделия с ^ 0): 0
при у = i (£ = 0), П ри j / > i (x = y-J>0).
K + c(y_i}
(28)
Допустим, что су + L (у) при г/ | -v оо неограниченно возрастает, и предположим, что функция L (у) является выпуклой. Будем считать, что затраты на содержание представляют собой возрастающую функцию h (у — q), где (у — q) — излишек запасов (возникающий при условии q -<г/). Предположим формально, что >0 при />0, =0
при/<0,
и будем считать и (/) возрастающей функцией в области, где / ^Э 0. Аналогично предположим, что штрафные потери описываются возрастающей функцией п (q — у), где (q — у) — неудовлетворенный спрос (такая ситуация, естественно, возникает лишь при q > у). Снова предположим формально, что 0
"(/){ ^ О
при ;>0, при /<0,
и будем считать я (/) возрастающей функцией / в области, где / ^ 0. Тогда функция ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь запишется в следующем виде: м
S й(У — ?)^(g)+ S л (д— г/) p ( q ) при г/>О, >у «=° " П 2: (<1—У)Р(<}) при г/<0.
(29)
75=0
Можно показать, что если сумма функций фактических затрат на содержание запасов и штрафных потерь h (j) + л (—j) представляет собой выпуклую функцию при любом целочисленном значении /, то и функция ожидаемых затрат L (у), определяемая соотношением (29), является выпуклой г). Легко доказать следующую теорему. О п т и м а л ь н о с т ь (s, <S)-стратегии для с т а т и ч е с к о й м о д е л и . Если функции затрат определяются соотношениями (27) и (28) и функция L (у) выпукла, то оптимальная стратегия имеет форму (s, ^-правил, представленных соотношениями (1). Кроме того, численное значение S не зависит от объема наклад*) В тех случаях, когда затраты па содержание запасов подлежат оценке при известном значении у до получения данных относительно уровней спроса, у ^ h (у — q) р (q) в (29) заменяют на h (у). 9=0
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
221
ных расходов К [см. (28)], а если К = 0, то критический уровень s = S. Когда форма представления оптимальной стратегии известна, вычислительная процедура, вытекающая из соответствующего правила пополнения запасов, значительно упрощается, поскольку при этом требуется лишь определить значения s и б1. Мы уже убедились в том, насколько простыми оказываются вычисления в случае, когда функция затрат на содержание запасов и функция штрафных потерь являются линейными. (Сформулированная выше теорема о структуре оптимальной стратегии г) остается справедливой и при более общих предположениях относительно функции ожидаемых затрат; однако вопросы, связанные с модификацией условий упомянутой теоремы, здесь нами обсуждаться не будут.) Ниже приводится доказательство (s, £)-теоремы и рассматриваются в общем виде вычислительные процедуры, используемые при анализе задачи управления запасами. Прежде всего заметим, что ming(y\i), У* (I) = min
(II)
y>i
Поскольку и су, и L (у) выпуклы, их сумма также является выпуклой и, согласно принятому нами предположению, неограниченно возрастает при [ у \ —>• оо. Следовательно, существует такое значение S, для которого
(Ill)
min[cy + L ( y ) ] = c S + L(S). у
Легко показать, что локальный оптимум является также и глобальным оптимумом. Предположим, что i ^ S; тогда, согласно (III), ci + L(i), так что
(IV)
K—ci + min [су + L (у)} > L (i).
Следовательно, с помощью (II) для i ^ S мы имеем / (i) = L (0,
y(i) = i
и .т (i) - 0,
i > 5.
Теперь предположим, что i ^ »S; тогда, согласно (II) и (III), К — cl-\-cS-{-L (S)
при y = S,
L(i)
при z/-=z,
Ее называют также (s, 5)-теоремой.— Прим.
перев.
(V)
222
ГЛАВА 19
Рассмотрим случай, когда К = 0; в силу (III) L (i) > —ci + cS+L (S),
(VII)
так что минимум, определяемый соотношением (VI), достигается при f(i)=c(S-i) + L (S), y ( i ) = S (VIII) и x ( i ) = S — i при i<£, Я = 0. Теперь проанализируем случай, когда К > 0; при этом для значений i, лежащих в окрестности 5, значение функции L (i) в (VI) может оказаться меньшим по сравнению со значением, принимаемым выражением [К — ci-\- cS-\-L (S)]. Пусть s есть наименьшее из чисел, удовлетворяющих условию (IX)
L (s) < К - cs + cS + L (S).
Запишем (IX) в другом, совершенно эквивалентном виде: (X)
S).
В этом случае соотношения (V) остаются справедливыми и для i тогда как при i < s S),
и x ( i ) = S - i . (XI)
y(i) = S
Заметим в заключение, что значение 5, так же как и значение s в соотношении (12), найдено в соответствии с (III) и (X) и с учетом того, что Г K + c(S — i) + L(S) при i<s, / ( 0 = 1( Lг Jv -^ (ХП> (i) при i>s. Для нахождения оптимального значения 5 в случае, когда модель предполагает линейный характер функций затрат на содержание запасов и штрафных потерь, нами были предложены простые формулы (6) и (7). Эти формулы можно вывести следующим образом. В силу (III) S должно удовлетворять условию [с (S + 1) + L (S + 1)1 > [cS + L (S)],
(XIII)
что эквивалентно условию L (S + 1) - L (S) > -c.
(XIV)
В выражении, стоящем в левой части соотношения (XIV), можно выделить компоненты, имеющие отношение только к затратам на содержание запасов, а именно S+l
S
A l S (S + i-q)p(q)~^(S-q)p(q)\ g=0 g=0
S
= h^p(q) = hP(S). g=0
(XV)
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
223
Аналогично, выделяя в левой части (XIV) компоненты, относящиеся к штрафным потерям, получаем g=S+2 г
"vi
/n\l
тт Г \
Р (^M
^^"Л7Т\
y>s
Учитывая (XV) и (XVI), мы можем записать неравенство (XIV) в виде (h + л) Р (S) — л ^ -с, (XVII) которое после упрощения приводит к (7). Рассмотрим случай линейных функций затрат на содержание запасов и штрафных потерь, предположив, что р (q) представляет собой плотность вероятности, а у может принимать непрерывный ряд значений; при этом *) оо
при у>0, • \п-щ — у ) р \ у ) Щ -
при г/<0.
Тогда, если существует производная L' (у) = dL (y)ldy, значение у = S, минимизирующее [су -f- L (у)]> долнгно удовлетворять условию с + L' (у) = 0. (XVIII) Читатель, знакомый с дифференциальным и интегральным исчислением, без труда сможет показать, что для у ^з> О У
оо
L' (y) = h(y—y)p(y) + о у (XIX)
= (h + n)(p(q)dq — n.
о Таким образом, в силу (XVIII) и (XIX) S удовлетворяет условию S
(XX) !) Читатель сразу же отметит, что приведенное здесь выражение для L (у) является непосредственным обобщением формулы (29) на случай непрерывных значений переменных.— Прим. перев.
224
ГЛАВА 19
Численное значение s находится в результате решения неравенства (11). В этом разделе во всех формулах для затрат на содержание запасов фигурируют объемы изделий, остающиеся на складах к концу планового периода. Если затраты на содержание запасов носят линейный характер и оцениваются по значению у, то
Если предположение относительно линейности сохраняется, но сумма затрат на содержание запасов оценивается по среднему значению уровня запасов J), то я + 0,5/1
'
19.5. МОДЕЛИ ЭКОНОМИЧЕСКИ ВЫГОДНЫХ РАЗМЕРОВ ЗАКАЗЫВАЕМЫХ ПАРТИИ
В данном разделе мы будем исходить из предположений, существенно отличающихся от тех, которые постулировались нами при построении моделей статического типа. Мы переходим к рассмотрению ситуации, когда продолжительность планового периода не ограничена, и, следовательно, будет иметь место бесконечное число отдельных пополнений запасов. Поскольку динамический фактор значительно усложняет анализ проблемы, мы для упрощения модели будем предполагать, что спрос можно точно прогнозировать и он равномерно распределен по времени; другими словами, допустим, что количество изделий, запрашиваемых клиентами в течение единичного отрезка времени, равняется некоторому фиксированному 2 числу М ). Выбор шкалы времени (что эквивалентно выбору продолжительности упомянутого выше единичного отрезка) диктуется соображениями удобства и зависит от конкретных условий задачи. В нашем же случае при обсуждении приведенной ниже модели будем для определенности подразумевать под единичным временным отрезком 1 неделю; например, если М = 30, то это будет означать, что, согласно принятому нами предположению, в течение недели общий спрос клиентов составит ровно 30 изделий, в течение 2 недель — 60 изделий, в течение V a недели — 15 изделий и т. д. Следует, кстати, отметить, что в большинстве учебных пособий по исследованию операций модель, к построению которой мы приступаем, рассматривается в главах, посвященных детерминистическим задачам управления запасами наподобие тех, которые были нами изучены в гл. 9. Мы перенесли подробное обсуждение этой *) Ожидаемое среднее значение запасов для заданного планового периода равняется 0,5г/ + 0,5((/ — ). 2 ) В таких случаях говорят, что имеет место постоянная норма спроса М.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
225
= Q- 45, s = О, М=
Неделя
Неделя
Неделя
Неделя
Неделя
Р и с . 19.3. Пилообразный график (s, ^-стратегии пополнения запасов. М — норма спроса; s — критический уровень запасов; S — объем запасов после очередного пополнения; Q = S — s — объем заказа на очередную поставку.
модели именно в данную главу по той причине, что на практике почти всегда вместо детерминированной модели приходится использовать ее модифицированный вариант, позволяющий учитывать вероятностный характер спроса. Читатель должен рассматривать излагаемый здесь материал как основу для анализа стохастических вариантов моделей управления запасами, приводимых в следующем разделе. В рассматриваемых ниже задачах, связанных с определением оптимального размера объема заказа, как само время, так и уровни запасов описываются непрерывными переменными. Заметим, что это предположение резко контрастирует с условиями, которые постулировались для большинства динамических моделей, представленных нами в предыдущих главах. Вследствие непрерывности переменных различные элементы модели легко удается изобразить графически. Предположим снова, что М = 30, а стратегия пополнения запасов формулируется в виде следующего правила: всякий раз. когда уровень запасов становится нулевым, оформляется заказ на поставку 45 изделий. Допустим также, что запаздывание поставок (по отношению к моменту оформления заказа) отсутствует, т. е. товары после того, как соответствующая заявка сделана, поступают на склад немедленно. Тогда уровень имеющихся в наличии запасов как функцию времени можно представить геометрически в виде графика (рис. 19.3). Приведем следующие характеристики рассматриваемой нами пилообразной модели: (I) С течением времени объем запасов от значения 45 единиц непрерывно убывает до нуля. (II) Скорость убывания запасов равняется 30 единицам в неделю, т. е. совпадает по своему значению с нормой спроса М.
226
ГЛАВА 19
(III) Пополнение запасов осуществляется через каждые полторы недели (SIM = 45/30 = 1,5). Совершенно очевидно, что лишь в очень редких случаях можно быть уверенным в столь «безупречном» поведении спроса. Постулаты относительно стационарности и безошибочности прогнозирования спроса являются весьма жесткими. Тем не менее многие промышленные фирмы все же применяют в своей практической деятельности модели указанного выше типа, получая при этом значительные экономические выгоды за счет снижения затрат на содержание складских запасов. Однако, прежде чем использовать пилообразную модель управления запасами, ее, как правило, несколько модифицируют, с тем чтобы отразить вероятностный характер спроса. Обобщение модели, в результате которого удается учесть неопределенность значений уровня спроса, рассматривается в следующем разделе. Чтобы подготовиться к изучению этой обобщенной модели, читателю полезно ознакомиться с методом нахождения оптимальной стратегии пополнения запасов в случае, когда спрос прогнозируется с абсолютной точностью. Пусть затраты, связанные с пополнением запасов, складываются из накладных расходов К ^ 0 и покупной стоимости заказанной партии изделий 1 ), т . е .
0
при а; = 0, при х>Ъ.
^
Предположим, что затраты на содержание запасов пропорциональны объему заскладированных изделий и являются линейной функцией времени; стоимость содержания одного изделия в течение единичного отрезка времени (недели) обозначим через h (h ^ 0). Обратим внимание на то, что все экономические показатели ведут себя стационарно, т. е. не меняются с течением времени. Заметим также, что в силу определения h затраты на хранение, например, 5 изделий в течение 1 недели совпадают с затратами на хранение, скажем, 1 изделия в течение 5 недель или 2,5 изделия в течение 2 недель и т. д. Обычно /г является функцией с (возможен, например, вариант, когда h = h'c); однако, чтобы не усложнять обозначений, мы будем использовать только символ h. При анализе получаемых ниже формул следует помнить о том, что при изменении значения с, как правило, меняется и значение h. He представляет большого труда проанализировать модели, основанные на более сложных предположениях относительно фигурирующих в них экономических показателей; в частности, функция затрат, связанных с приобретением изделий у фирмыпоставщика, может иметь такой вид, при котором обеспечивается учет скидки цены в зависимости от размера приобретаемой партии. J
) Покупная стоимость заказанной партии товаров равняется сх, где х — количество приобретаемых изделий, а с — цена одного изделия (с !> 0).
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
227
Однако в данной главе подобного рода ситуации не анализируются (см. упражнение 52). Поскольку, согласно принятому нами предположению, пополнение запасов может производиться неоднократно, можно ввести дополнительное требование, заключающееся в том, чтобы спрос удовлетворялся в полном объеме. (Приведенные ниже формулы фактически позволяют определить, при каких обстоятельствах предпочтительнее отказаться от дополнительного складирования того или иного изделия.) Фирма, однако, прежде чем оформлять заказ на дополнительную поставку, может позволить себе накопление портфеля невыполненных заказов; в таких случаях по прибытии заказанной партии изделий имеющиеся заявки должны быть немедленно удовлетворены, а оставшаяся часть изделий складируется для удовлетворения будущего спроса. Ситуации, при которых возникает портфель невыполненных заказов, характеризуются отрицательными значениями i. Для многих вполне реалистичных стационарных (т. е. линейных по времени) функций штрафных потерь, обусловленных разрешенной отсрочкой выполнения заказов, оптимальная стратегия обладает (s, 5)-структурой. т. е. формулируется следующим образом: когда i = s, оформляется заказ на поставку в объеме
Q = S - s.
(2)
Формулировка (2) выглядит по сравнению с описанием (s, ^-стратегии, приведенным в предыдущем разделе, более краткой. Это объясняется тем, что если в какой-либо момент времени объем запасов равняется S, то по истечении Q/M недель он окажется точно равным s, поскольку мы предполагаем непрерывность расходования запасов с заранее известной скоростью М единиц в неделю. Читатель, по-видимому, сразу же заметит, что оптимум не может быть достигнут при выполнении жесткого неравенства s>0, поскольку при этом всегда имели бы место наличные запасы в объеме s (>0), хранение которых было бы сопряжено с феделенньтми затратами, но которые не участвовали бы в коммерческом обороте. Аналогично в условиях многократного пополнения запасов для любой реалистичной функции штрафных потерь оптимум не может быть достигнут при соблюдении жесткого неравенства S < 0. (Обоснование этого утверждения возлагается на читателя.) Таким образом, поиск оптимальных значений s и 5 обычно ограничивается областями значений s и 5, удовлетворяющих условиям s ^ 0 и S ^ 0. Если предположить, что продолжительность интервала времени исполнения заказа равняется нулю, т. е. пополнение запасов происходит сразу же после оформления соответствующей заявки- то получающийся в результате график (s, 5)-стратегии (в ее наиболее общей формулировке) будет иметь форму пилы с периодически повторяющимися экстремумами (рис. 19.4). Чтобы график функции, описывающей стратегию пополнения запасов, имел указанный вид,
228
ГЛАВА 19
фактически достаточно вместо условия «мгновенной» поставки заказанных изделий принять менее жесткое ограничение, а именно предположить, что продолжительность интервала времени, требуемого для реализации заказа, является константой, численное значение которой заранее известно. Если продолжительность этого интервала времени равняется L, а фирма хочет получить заказанные ею изделия в тот момент, когда объем имеющихся в наличии запасов равняется s, то соответствующий заказ оформляется заблаговременно с упреждением в L недель. Поэтому если LM < Q, то критический уровень запасов просто смещается на LM единиц вверх по отношению к критическому уровню s, полученному при условии L = 0.
Р и с . 19.4. Пилообразный график функции, описывающей (s, 5)-стратегию пополнения запасов.
Отметим, что в случае, когда s < 0, норма спроса остается неизменной (т. е. равной М единиц в неделю), и, следовательно, значение тангенса угла наклона отрезка Ss по отношению к оси времени (рис. 19.4) остается неизменным и равным —М внутри каждого цикла. Наконец, предположим, что смысл оптимизации заключается в сведении к минимуму затрат в единицу времени. Если изделия подлежат складированию, то с учетом расходов на их приобретение и хранение можно получить для средней суммы затрат в единицу времени следующее выражение: КМ
Каждое из слагаемых выражения (3) интерпретируется следующим образом: (1) KMIQ представляет собой среднее значение накладных расходов в единицу времени, поскольку MIQ — среднее число оформлений заказов в единицу времени. (2) Поскольку спрос покупателей должен быть удовлетворен полностью, в единицу времени у фирмы-поставщика закупается
СТОХАСТИЧЕСКИЕ
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
229
в среднем М изделий, и, следовательно, соответствующие расходы в среднем составляют сМ. (3) При пилообразном поведении уровня запасов (рис. 19.4) объем запасов характеризуется положительным значением на протяжении (5/0-й доли планового периода. Средний объем запасов в течение интервала времени, когда уровень запасов положителен, равняется S/2. Таким образом, произведение (S/Q) -(5/2) представляет собой средний объем запасов, отнесенный к единичному интервалу времени, и, следовательно, соответствующие затраты на хранение равняются hS2/2Q. Если критический уровень запасов s < 0, т. е. до прибытия пополнения накапливается портфель невыполненных заказов, то к выражению (3) следует прибавить средние штрафные потери за единицу времени. Поскольку в рассматриваемой нами модели задолженность по поставкам изделий клиентам полностью погашается за счет очередного пополнения запасов, клиенты не аннулируют свои заказы и, таким образом, штрафные потери не включают такой показатель, как потерянная прибыль. Однако накопление портфеля отсроченных заказов часто сопряжено с дополнительными канцелярскими работами учетного характера. В таких случаях штрафные потери включают дополнительную составляющую, значение которой предполагается пропорциональным объему отсроченных заказов по состоянию на момент времени, непосредственно предшествующий пополнению запасов (т. е. в тот момент, когда уровень запасов становится равным —s). В противоположность только что описанной ситуации в тех случаях, когда поступающее на склады изделие находит спрос внутри фирмы, штрафные потери нередко содержат составляющую, пропорциональную не только объему ожидающих исполнения заказов, но и продолжительности времени ожидания. Каждый из упомянутых случаев подробно исследуется ниже. Чтобы не возникало неясностей относительно влияния различных видов штрафных потерь на выбор оптимальной стратегии, а также чтобы не усложнять математические выкладки, мы рассмотрим каждый из указанных выше вариантов отдельно. Разумеется, возможна и комбинированная ситуация, анализ которой предполагает построение соответствующей единой модели. Здесь такого рода комплексные модели не рассматриваются. Штрафные потери, пропорциональные объему отсроченных заказов. Предположим, что если хотя бы некоторые из заказов клиентуры выполняются с отсрочкой, то соответствующие потери равняются произведению я на максимальное количество недостающих изделий (—s), где я > 0, a s ^ 0. Отсюда вытекает, что штрафные потери в размере л (—s) для каждого цикла носят единовременный характер, и, следовательно, соответствующие средние потери за единицу времени равняются
я (—s) MIQ.
(4)
230
ГЛАВА 19
Поскольку Q = S—s, мы можем в выражении (4) вместо —s подставить Q — S ; легко убедиться в том, что после выполнения упомянутой операции замены мы с учетом (3) получаем следующую формулу для среднего значения затрат в единицу времени: Среднее значение затрат в единицу времени
КМ , ,f . kS?- . „, АП = АС=з—+сМ + - = - + яМ
nMS
, сч . (5)
Анализ задачи значительно упрощается, если дополнительно предположить, что я > (2Kh/M)1/2; это ограничение не является, вообще говоря, слишком жестким, так как численное значение коэффициента я обычно бывает весьма большим. Если изделие подлежит складированию, то, как будет показано ниже, оптимальное значение S равняется Q и, следовательно, s = 0. Однако оптимальным может оказаться вариант полного отказа от складирования. Для начала предположим, что оптимум действительно достигается при S = Q. Тогда формула (5) упрощается и принимает следующий вид: АС = —~- -+- сМ -\—^-.
(6)
Оптимальное значение Q находится в результате решения уравнения, которое получается после приравнивания нулю первой производной АС по Q. В итоге мы будем иметь следующие формулы: 1
Оптимальное значение Минимальное значение
Q = (2KM/h) /*, 1 2 АС = сМ -\- (2KhM) / .
Значение Q. получаемое с помощью приведенной выше формулы' часто называют экономически выгодным размером заказываемой партии (ЭВРП), а само соотношение, определяющее оптимальное значение Q. иногда называют формулой Уилсона. Если рассматриваемое изделие не складируется, то возникают потери, связанные с невозможностью удовлетворить спрос в объеме М за единицу времени. Предположим для простоты, что эти потери равняются пМ. Поскольку в рассматриваемом случае коэффициент я должен учитывать вероятность потери заказов (и, следовательно, потерю соответствующей части прибыли), он может с я и не совпадать. Из экономических соображений ясно, что если
1
яМ ^ сМ -г (2KhM) ^, то изделие складировать не следует.
(8)
В противном же случае изделие складируется, причем объем каждого очередного заказа на его поставку определяется с помощью формулы (7).
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
231
Изложим в сокращенном виде аргументацию, лежащую в основе доказательства утверждения о том, что при я > (2Kh/M)l/z оптимальное значение Q равняется либо S, либо нулю. Введем в рассмотрение новую величину /, определяемую соотношением 5 s /. (I) Из (I) следует, что / удовлетворяет условию 0 ^/ ^ 1, поскольку s ^ 0 и S ^ 0. Кроме того, рассмотрим некоторую функцию С (/), такую, что СМ, если />0, О, если / = 0. Тогда после замены S —>• fQ в (5) задача оптимизации сведется к минимизации AC (Q, /) = KM/Q + С (/) + hfQ/2 + пМ - nMf. (II) Чтобы Q было оптимальным, необходимо, чтобы выполнялось условие *) —~~i = 0 при />0, (III) откуда получаем, что л ^ , Оптимальное значение Q = —(2KM/h). (IV) f/lVjlL/.y 1
.-,
f
.-,
/ТТТЧ
В результате подстановки (IV) в (II) мы будем иметь AC [Q (/), /], представляющее собой линейную функцию /. Вычислим первую производную AC [Q (/), /] по / при / > 0: 9 АС [?(/). /]= (2KhM)l/2—nM
при/>0.
(V)
Из (V) следует, что dAG/df <; 0, поскольку, согласно предположению, л > (2Kh/M)1^. Таким образом, условие / = 1 является оптимальным, если AC [Q (1), 1] ^ nAf [см. соотношение (8)]. Как уже отмечалось выше, рассмотренная нами модель имеет прямое отношение к ситуации, когда заказы в случае отсутствия наличных запасов тех или иных изделий теряются. Если предположить, что за счет каждой единицы неудовлетворенного спроса прибыль торговой фирмы сокращается на величину я, то можно доказать, что оптимальной снова является следующая стратегия: либо S — Q (спрос полностью удовлетворен), либо 3 = 0 (спрос остается полностью неудовлетворенным). Анализ ЭВРП на чувствительность. Заметим, что величина ЭВРП возрастает медленнее, чем в прямой пропорции к накладным расхоJ ) Это условие не является достаточным, поскольку оно не уточняет характер «экстремума». Убедиться в том, что определяемое условием (III) значение Q действительно соответствует минимуму, а не максимуму, можно лишь путем исследования второй частной производной АС по Q.— Прим. перев.
232
ГЛАВА 19
дам К и норме спроса М, и убывает медленнее, чем в обратной пропорции к затратам на содержание запасов А. Например, если М увеличивается четырехкратно, ЭВРП возрастает лишь вдвое. Аналогичным образом легко убедиться, что при увеличении вчетверо значения h значение ЭВРП уменьшается только наполовину. Учтем, что продолжительность временного интервала между последовательными оформлениями заказа на поставку определяется следующей формулой: .-. ЭВРП = /I --— гк и/2 .„. Оптимальное значение т1 = \ . (У) Следовательно, по мере возрастания нормы спроса М не только увеличивается оптимальное значение Q, но и уменьшается оптимальное значение Т, т. е. заказы на поставку изделия оформляются чаще. Фирма-поставщик нередко требует, чтобы объем заказываемых изделий выражался круглой цифрой. Так, например, если оптимальное значение Q = 53, то приходится (учитывая пожелание фирмыпоставщика) заказывать либо 50, либо 60 изделий. Попытаемся показать, что на величине среднего значения затрат лишь незначительно сказывается то обстоятельство, что вместо оптимального значения Q берется значение Q, лишь близкое к оптимальному. Допустим, что Фактическое значение Q = — г -(Оптимальное значение Q) = r (2KM/h)V2, где г > 0. Пусть переменную составляющую затрат можно записать в следующем виде *): КМ . h-Фактическое значение Q _ ^ ' ~~ Фактическое значение Q ' 2 __
hr(2KM/h)1/2
KM
,-Г
2
'
.... \ '
С помощью (11) нетрудно проверить, что
Подставляя в (12) различные пробные значения г, можно убедиться в том, что значение переменной части затрат при небольших отклонениях значения Q от оптимального возрастает незначительно. Так, например, VC (r)/VC (1) < 1,1 в интервале 0,64 < г < 1,56. (13) [Заметим также, что VC (r)/VC (1) не меняет своего значения при замене г на г', где г' == 1/г.] х
) Соотношение (11) получается из формулы (6) простой подстановкой вместо оптимального значения Q его фактического значения (фиксированную компоненту сМ при этом, естественно, следует опустить).
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
233
Модель, аналогичная только что рассмотренной, но предполагающая дискретную структуру планового периода и дискретный характер переменной, определяющей объем складируемых изделий, анализировалась нами ранее (разд. 11.4) с помощью так называемого метода восстановления. Чтобы удобнее было сравнивать дискретный и непрерывный варианты задачи, воспроизведем основные элементы модели, приведенной нами в разд. 11.4, используя обозначения, которые приняты в настоящей главе. Для определенности будем понимать под М целое число изделий, запрашиваемых клиентами в течение недели. Пусть Ст — суммарные затраты, связанные с реализацией заказа на поставку МТ единиц товара, где Т = 1, 2, . . . . Другими словами, величина Ст включает в себя все расходы фирмы за Г-недельный период и определяется формулой
(I)
CT = K-{-cMT + ^hM(T — \ ) T . Задача
заключается в том, чтобы
Минимизировать (%£-} =min № + cM + ±-hM (T — l ) \ . T = i 2 ..
\ -*
/
у
I J
^
J
(II)
Временно абстрагируясь от условия дискретности Т. продифференцируем правую часть соотношения (II), приравняем вычисленную производную по Т нулю и разрешим полученное таким образом уравнение относительно Т. В результате получим Т* = (2А7Ш)1/2, что совпадает с выражением (9). Соответственно получим Q* = МТ* = (2KM/h)V*.
(III) (IV)
Поскольку значение Т*, вычисленное по формуле (II), как правило, оказывается дробным, требуется вычислить значение правой части соотношения (I) для ближайших целых чисел, округляющих Т* снизу и сверху, и выбрать более выгодный вариант. Чтобы лишний раз убедиться в правильности понимания способа получения формулы (5), необходимо вычислить СТ1Т в случае, когда фигурирующие в модели переменные могут принимать непрерывный ряд значений. В результате после замены МТ ->- Q должно получиться выражение, эквивалентное правой части соотношения (5). Штрафные потери, пропорциональные среднему объему задолженности по поставкам. Предположим теперь, что потери торговой фирмы оцениваются по среднему значению объема невыполненных заказов на единичном отрезке времени, т. е. аналогично тому, как оценивались затраты на содержание запасов. Обращаясь снова к графику, приведенному на рис. 19.4, мы видим, что доля времени,
234
ГЛАВА 19
в течение которого система функционирует в режиме разрешенной отсрочки выполнения заказов, равняется —s/Q, где критический уровень s ^ O . Средний размер портфеля неудовлетворенных заказов на отрезке времени, характеризуемом отрицательным уровнем запасов, составляет (—s/2) изделий. Следовательно, средний объем неудовлетворенных заказов на единичном отрезке времени равняется sz/2Q. Чтобы определить среднее значение штрафных потерь за единицу времени, эту величину нужно умножить на соответствующий «штрафной» коэффициент, который для удобства сравнения с результатами, полученными в предыдущем подразделе, мы снова обозначим через я (>0). Однако следует иметь в виду, что показатель я в рассматриваемой модели имеет иную интерпретацию, чем в предыдущем случае. Если говорить определеннее, то следует заметить, что теперь я характеризует потери фирмы-поставщика, отнесенные к одному изделию и к единичному интервалу времени, тогда как в рассмотренном выше примере под я мы просто подразумевали штраф за отсрочку поставки клиентуре одного изделия вне зависимости от продолжительности задержки заказа. Вновь воспользовавшись тождеством S — s = Q, с тем чтобы исключить величину s, мы после некоторых упрощений получим следующую формулу для среднего значения затрат в единицу времени: Г Среднее значение "1 затрат в единицу = АС = ±£- + сМ + ( + "' S'" — nS + ~ Q. I времени I
(14)
(В данном случае нет никакой необходимости рассматривать в явном виде предположение о том, что значение я превышает значения экономических показателей, характеризующих другие виды затрат.) Возьмем теперь частную производную АС по 5 и приравняем ее нулю. После соответствующих упрощений получим
Повторив указанные выше операции над Q и применив (15) для того, чтобы исключить 5, получим следующие формулы: Оптимальное значение Q = (2КМ)1/* (i/h + Ш)1/2. Оптимальное значение S = (2/ШУ/г)1/2 (я/ (А. + я))1/2, 1 2 1 2 Оптимальное значение s = — (2КМ/Л.) / (n/(h + я)) ' , l z 1 3 Минимальные АС = cM + (2KM) f f(i/h + 1/я) / .
(16)
Каким оказывается при этом оптимальный интервал времени между последовательными пополнениями запасов? Как и в предыдущем случае, решение относительно того, целесообразно или нет складировать изделия, определяется результатами сравнения АС в (16) с потерями, возникающими от неполного удовлетворения спроса.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
235
Мы уже предупреждали читателя о том, что единицы измерения штрафных потерь, используемые в формулах (16), не совпадают с единицами измерения аналогичного рода экономических потерь, использованными нами при получении формул (7). Тем не менее поучительно сравнить результаты, представленные соотношениями (16), с результатами, представленными формулами (7), используя одинаковые численные значения я. Из (16), в частности, вытекает, что при ограниченном значении я оптимальное значение Q больше оптимального значения Q в предыдущем случае; оптимальное значение S меньше оптимального значения S в предыдущей модели; критический уровень s (s < 0) в (16) ниже соответствующего значения s в предшествующем случае; минимальные средние затраты в (16) меньше минимальных средних затрат в (7). Лишь в случае, когда п —>• оо, значения перечисленных выше характеристик в обоих вариантах модели оказываются одинаковыми. Кроме того, следует отметить, что только при h -*- оо оптимальным является решение S = 0; однако даже в этом случае Q и s принимают ограниченные значения. Читателю предлагается внимательно исследовать формулы (16) с тем, чтобы определить, как изменяются оптимальные значения Q, S. s и АС при вариациях значений К, h, л и. М. В частности, следует обратить внимание на то, что оптимальное значение Q убывает с ростом я, а оптимальное значение s убывает как при увеличении накладных расходов К. так и при возрастании нормы спроса М. Заметим, что, согласно соотношению (15), при h = я в течение второй половины интервала между последовательными пополнениями запасов происходит накопление портфеля невыполненных заказов (т. е. торговая фирма функционирует в режиме разрешенной задержки удовлетворения запросов клиентуры). Проблема запасов на промышленных предприятиях. Рассмотренные выше модели экономически рационального регулирования запасов соответствовали ситуации, когда фирма, занимающаяся оптовой торговлей теми или иными изделиями, приобретает их у промышленной фирмы-поставщика. Стратегия регулирования запасов соответственно формулировалась так, чтобы отвечать когда и в каком количестве заказывать требуемые товары. Обратимся теперь к задаче регулирования запасов в рамках самой промышленной фирмы, если некоторые из видов продукции выпускаются этой фирмой отдельными партиями. Многие из экономических категорий, фигурирующих в рассмотренных моделях (такие, как накладные расходы, затраты на содержание запасов, штрафные потери от неудовлетворенного спроса и т. д.), в равной степени характеризуют и только что упомянутую ситуацию. Предположим, что управляемые переменные стационарны во времени, и допустим, что предположения относительно спроса остаются в достаточной степени реалистичными. Можно ли при этих условиях утверждать, что оптимальная стратегия складирования продукции и регулирования уровней производства
236
ГЛАВА 19
будет иметь (s, 5)-структуру, аналогичную структуре, представленной формулами (7) или (16)? Анализ показывает, что далеко не всегда. Существенная разница между ситуацией, когда изделия приобретаются у фирмы-поставщика, и ситуацией, когда изделия выпускаются промышленным предприятием, принадлежащим самой фирме, заключается в том, что для обеспечения производственного процесса требуются ресурсы совершенно иного рода, а именно рабочая сила, оборудование, различные компоненты для изготовления конечного продукта и т. п. Многие промышленные предприятия тщательно планируют свои производственные показатели заранее, учитывая наличие рабочей силы, ограниченность производственных мощностей и возможность обеспечения производства необходимыми материалами. Поэтому, если поставить задачу регулирования запасов всех видов изделий, производимых фирмой, и анализировать ее с помощью изложенных выше методов (или, например, с помощью метода, к рассмотрению которого мы перейдем в следующем разделе), то полученный таким путем результат, возможно, не удастся согласовать с разработанным фирмой производственным планом. Короче говоря, однопродуктовая модель ЭВРП в условиях, когда имеет место множество различных видов изделий, производимых самой фирмой, как правило, оказывается плохим приближением к действительности, ибо такая модель не учитывает текущих ограничений на дефицитные виды ресурсов. Для оптимизации производственно-коммерческих процессов фактически требуется динамическая модель планирования, в которой комплексно учитываются как различные категории затрат, фигурирующие в модели ЭВРП, так и ограничения, индуцированные многопродуктовой структурой исследуемой системы. В такой модели плановый период должен делиться на достаточно короткие отрезки времени, так чтобы планируемые показатели можно было обеспечивать путем решения производственных вопросов в оперативном порядке. Ряд последних достижений в области исследования операций уже теперь позволяет успешно решать такого рода сложные задачи организационного управления; однако используемые при этом методы оказываются чрезвычайно сложными и выходят за рамки данной книги. Запасы сырья. Еще одна область организационного управления, связанная с решением проблемы запасов, относится к складированию сырья, необходимого для обеспечения производственного процесса на промышленных предприятиях. Экономические соображения, учитываемые в моделях ЭВРП, оказываются справедливыми и применительно к регулированию запасов сырья. Однако аналогично рассмотренной выше ситуации, где речь шла о запасах производимой фирмой продукции, на стратегию пополнения запасов в задаче управления запасами сырья оказывает влияние сам производственный процесс (посредством вырабатываемых для него календарных
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
237
планов). Лишь в случае непрерывного характера управляемых параметров и почти стационарного производственного графика можно надеяться на то, что модель ЭВРП окажется в какой-то степени пригодной для решения задачи регулирования запасов сырья. При анализе ситуаций, связанных с хранением сырья, более широкое применение находят модели динамического программирования, аналогичные моделям, рассмотренным в гл. 9. В такого рода моделях требования, заложенные в календарном производственном плане, трактуются как показатели уровня спроса и при минимизации затрат одновременно учитывают условия, гарантирующие обеспечение производственных процессов необходимым сырьем. 19.6. ДИНАМИЧЕСКИЕ ВЕРОЯТНОСТНЫЕ МОДЕЛИ С РЕЖИМОМ НЕПРЕРЫВНОГО КОНТРОЛЯ УРОВНЯ ЗАПАСОВ
В данном разделе изложенный выше метод анализа задачи определения экономически оптимальных объемов заказываемых партий изделий обобщается на случай, когда спрос носит стохастический характер. По-прежнему будем рассматривать время как непрерывную переменную; как и в предыдущих моделях, расходы, связанные с реализацией заказа, и затраты на содержание запасов предполагаются стационарными:
{
О 17 , л-fez
при х = 0 при х>0П
(затраты, связанные с реали\ зациеи~ заказа),
h = Стоимость содержания одного изделия в течение единичного отрезка времени.
(1) (2)
где К ^ 0, с ^ 0 и /г ^ 0. Будем предполагать, что заявки клиентов, поступающие в моменты времени, когда запасы фирмы равны нулю, откладываются в портфель невыполненных заказов и со временем удовлетворяются. Допустим, что штрафные потери л > О стационарны и пропорциональны объему портфеля невыполненных заказов по состоянию на момент прибытия заказанной партии изделий (т. е. на момент очередного пополнения запасов). Задача заключается в минимизации ожидаемого значения средних затрат за единицу времени. Введем следующие обозначения: М — ожидаемое число изделий, запрашиваемых клиентами в течение единичного отрезка времени; L — интервал упреждения, т. е. продолжительность отрезка времени от момента размещения заказа (3) до момента получения заказанной партии изделий; Мъ — ожидаемое количество единиц изделий, затребованное покупателями на отрезке L, при этом предполагается, что значение L является фиксированным и заранее известным.
238
ГЛАВА 19
Поскольку «математическое ожидание суммы некоторых величин всегда равняется сумме математических ожиданий этих величин»: ML = ML. (4) Если L = 0 (заказ исполняется мгновенно), то процедура анализа формулы (5) предыдущего раздела нуждается лишь в незначительной модификации. Если товар подлежит складированию и значение критического уровня s = 0, то полученные в предыдущем разделе формулы (7) для оптимальных значений Q и АС оказываются справедливыми и в рассматриваемом нами случае (если иметь в виду, что все стоимостные характеристики теперь понимаются «в смысле их средних значений»). Это объясняется тем, что при L = 0 вероятность возникновения случаев, когда приходится идти на отсрочку исполнения заявок, полностью исключается. Если же L > 0, ситуация коренным образом меняется. Обозначим через gL фактический объем спроса в интервале между моментом размещения заказа и временем его исполнения. Этот интервал будем называть интервалом упреждения. Значение случайной переменной gL может превзойти s (т. е. уровень имеющихся в наличии запасов в начале интервала упреждения), так что возможна ситуация, когда необходимо будет пойти на отсрочку исполнения заказов. Как в таких случаях определяются оптимальные значения Q и s? Один из «наивных» подходов к решению задачи заключается в следующем: вначале вычисляется по формуле (7) из предыдущего раздела значение Q, а значение s подбирается с помощью статической модели (разд. 19.4), в которой распределение вероятностей для уровней спроса распространяется и на интервал упреждения, а функция ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь определяется соотношением (3) из разд. 19.4. Затем с помощью соотношения S = s + Q определяется значение S. Пусть, например, с = 1; к = 31, 25; h = 5;
я = 20; М = 2;' Легко убедиться, что при этом Q = (2KM/h)4*
L = 1.
= 5.
(5) (6)
Теперь предположим, что распределение вероятностей для спроса в течение интервала упреждения имеет следующий вид: (qL) = ~ при g = 0 , l , . . . , 4 ,
PL
E[qL] = ML = 2.
(7)
Распределение вероятностей (7) совпадает с распределением вероятностей, заданным соотношениями (4) в разд. 19.4, и, согласно данным, приведенным в таблице на рис. 19.1, л = 20, s = 3 и, следовательно, S=s + Q = 8. (8)
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
239
Таким образом, «наивный» метод анализа рассматриваемой задачи приводит к стратегии (s, S) = (3, 8). Логическая ошибка, допущенная при использовании только что описанного метода, заключается в том, что в процессе анализа не учитывалась экономическая взаимозависимость s и Q (т. е. взаимосвязь между критическим уровнем запасов и объемом заказа на очередную поставку изделий). Так, например, если значение s сохранять фиксированным, а значение Q увеличивать, то составляющая средних затрат, обусловленная штрафными потерями, в действительности уменьшится. Это объясняется тем, что в данном случае сокращается число пополнений запасов и соответственно уменьшается частота возникновения таких ситуаций, когда требуемое изделие на складе отсутствует. Следовательно, среднее значение затрат можно сократить, придав Q большее значение по сравнению с оптимальным значением этого параметра, определяемым формулой Уилсона [см. (7) в предыдущем разделе]. Точно так же экономия средств может быть достигнута за счет дальнейшего понижения критического уровня s. Согласившись с тем, что оптимальные значения s и Q являются взаимозависимыми, мы можем приступить к изучению метода их вычисления. Как правило, сначала определяют вид целевой функции (т. е. соответствующего критерия эффективности); после этого оптимизируют значение целевой функции путем надлежащего выбора значений s и Q. Прежде чем сделать первый шаг в этом направлении, примем ряд дополнительных предположений. При исследовании реальных проблем фигурирующие в операционных моделях предположения, разумеется, являются в том или ином отношении лишь приближением к действительности. При выборе предположений, сформулированных нами ниже, мы в первую очередь исходим из желания упростить как изложение материала, так и математическую сторону рассматриваемого вопроса. Вместе с тем анализируемая далее модель и ее незначительные модификации зарекомендовали себя на практике весьма эффективным средством решения задач, связанных с выбором приемлемых стратегий регулирования запасов. В связи с построением критериальной функции (критерия эффективности) будем исходить из следующих предположений: (I) Распределение вероятностей для уровней спроса на интервале упреждения [обозначим это распределение через рь (qL)] не зависит от того, когда уровень запасов достигает своего критического значения s; (II) Уровень запаса i можно рассматривать как непрерывную переменную. (III) После получения очередного заказа, пополняющего запасы, по истечении некоторого времени наступает момент, когда i = s, и, следовательно, вновь принимаются меры, направленные на пополнение запасов.
240
ГЛАВА 19
(IV) Для оптимальной стратегии критический уровень s > О, и на любом интервале упреждения фактический объем спроса не превышает объема заказываемой партии изделий, т. е. qL ^ Q. Смысл этих предположений совершенно ясен; теперь необходимо лишь показать, в какие моменты при построении критерия эффективности используется каждое из сформулированных выше условий. Предположение о том, что оптимальное значение Q ^ qL, заслуживает дополнительного пояснения. Отметим, что в момент, непосредственно предшествующий очередному пополнению, объем запасов равняется s — q^. а сразу после поступления пополнения — (s — qL -\- Q), т. е. в силу предположения (IV) эта величина не может быть меньше s. Поэтому в любой момент времени число заказов, находящихся в процессе реализации, не может быть больше одного. (Обоснование этого утверждения мы предоставляем читателю.) Мы сразу же обратили внимание читателя на то, что сформулированные выше постулаты необходимы лишь для конкретизации математической записи функции средних затрат. Поэтому с практической точки зрения они здесь не обсуждались. Используя четкие математические формулировки условий (I) и (III), можно доказать, что на любом временном интервале Т распределение вероятностей для уровней спроса в течение Т должно быть пуассоновским и характеризоваться единственным параметром МТ, который равняется одновременно и среднему значению спроса, и соответствующей дисперсии. Применительно к реальным процессам такое условие выглядит чрезмерно жестким. На практике редко имеют место случаи, когда среднее значение и дисперсия спроса совпадают по своему значению: чаще всего дисперсия в несколько раз превышает среднее значение. Принятые нами (исключительно ради упрощения математических выкладок) постулаты (I) и (III) позволяют использовать во всех вычислительных процедурах распределение вероятностей pL (qL) совершенно произвольного вида. В заключение можно отметить, что рассмотренная нами модель, несмотря на некоторую внутреннюю противоречивость, часто оказывается отличным приближением к действительности. Ожидаемые затраты. Составляющая целевой функции, определяемая затратами на реализацию заказа на поставку, в точности совпадает с соответствующим элементом модели ЭВРП, т. е. имеет следующий вид: KM/Q + cM.
(9)
Перейдем теперь к выводу формул для ожидаемых затрат на содержание запасов и ожидаемых штрафных потерь. [Читатель может при желании пропустить процедуру вывода упомянутых формул и сразу же перейти к окончательному результату, представленному формулой (16).]
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ Случай, когда
Интерпол упреждения продолжительностью L
241
tjfL<s
Момент осрор млет/я заказа на пополнение
Случай, когда
f-
P и с. 19.5. Пилообразные модели управления запасами при стохастическом характере спроса. qL — спрос в течение интервала упреждения; Q — объем заказа для пополнения запа- Момент оФор сов; s — критический уровень мления заказа запасов. на пополнение
Момент оформления заказа на пополнение
Рассмотрим отрезок времени между двумя последовательными оформлениями заказов на поставки. Графики на рис. 19.5 иллюстрируют две возможные ситуации: случай, когда фактический объем спроса на интервале упреждения меньше критического объема запаи сов ( случай, когда qL > s. Если при qL > s исходить из того, что на всем отрезке времени до поступления пополнения уровень запасов равен нулю, то формула для затрат на содержание сильно усложнится. Поэтому в качестве математического приближения допустим, что при qL > s уровень запасов становится равным нулю в момент времени, непосредственно предшествующий поступлению пополнения. Тогда легко убедиться, что ("Ожидаемый средний уровень запасов 1 _ LB течение интервала упреждения J 2
у[
(10) QL =O
242
ГЛАВА 19
Г Ожидаемый средний уровень запасов I на отрезке после пополнения до очеI редного заказа на пополнение
(11) Теперь нужно найти «взвешенное» значение выражения (10) путем его умножения на величину ML/Q, представляющую собой долю времени, в течение которого система функционирует в режиме ожидания заказанной партии изделий и взвешенное значение выражения (11) путем его умножения на величину (1 — MJQ). Легко убедиться, что после выполнения упомянутых операций и сложения полученных в результате их выполнения выражений мы придем к следующей формуле для ожидаемого среднего уровня запасов на единичном отрезке времени: Г Ожидаемый средний уровень запасов! _ 1на единичном отрезке времени J
(12)
Нетрудно показать, что
S (s-qi)pM = s-ML- g Е(*-дь)р1.Ы, >s
<JL=0
(13)
L
и, следовательно, правую часть соотношения (12) можно записать в виде —
Наконец, Г Ожидаемая нехватка изделий в"1 [течение интервала упреждения J
у , „ >s^b L
s
)PL\4t-)-
(
. _. )
Умножая последнее выражение на весовой коэффициент M/Q, приходим к выражению для ожидаемого объема нехватки в расчете на единицу времени (которое аналогично соответствующему выражению в модели ЭВРП, рассмотренной в предыдущем разделе). Складывая выражение (9), умноженное на h выражение (14) и умноженное на я -MIQ выражение (15), получим следующую формулу: Г Ожидаемые средние затраты ~] _ „ . „ _ КМ , м , \ в единицу времени J =£ [л^\——^--\-см + (qL-s)PL(qL).
(16)
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
243
Чтобы понять характер взаимосвязи между формулой (16) и соответствующими формулами, приведенными в предыдущем разделе, заметим, что если бы спрос был детерминированным, то критический объем запасов равнялся бы ML (s = ML), а сумма в правой части (16) обратилась бы в нуль, так как имело бы место тождество рь (qL) = 0. В результате мы пришли бы к формуле (6) из разд. 19.5. Вычислив частную производную дЕ [AG]/dQ, приравняв ее нулю и разрешив полученное в результате уравнение относительно Q, мы придем к следующей формуле:
(17) Определим статистическое распределение для спроса следующим выражением: РьМ = S pL(qL). 9l
(18)
=o
Тогда можно показать, что оптимальное значение s (s ^ 0) есть наименьшее из целых чисел, удовлетворяющих условию
где
PL (s) > -ft *)
(определение критического уровня),
(19)
Ш ь /2 + Мл'
Точнее это можно сформулировать так: объем заказа Q и критический уровень запасов s являются оптимальными, если они одновременно удовлетворяют (17) и (19). Подставляя (17) в (16), получаем [AC]=cM-f 'I/ '
I
V 2 ~~r
L
) /-I ^ 9L>S
' "L "L' J """"
^
L
''
^
'
где s находится из условия (19). Читатель должен ответить на вопрос: какие члены в (21) отражают влияние фактора неопределенности? [Чтобы решить, стоит ли вообще держать запасы данного изделия, минимальное значение Е [АС], полученное с помощью формулы (21), сравнивается с тем значением ожидаемых затрат, которое соответствует случаю отказа от складирования.] Заметим, что из-за наличия в (17) члена (Мъ + 2nM/h) X s X S (
244
ГЛАВА 19
тим также внимание на то, что при уменьшении значения s значение Q возрастает. Точно так же легко убедиться и в том, что чем больше значение Q, тем меньше значение определяемого формулой (20) значение R и тем ниже значение s, при котором начинает выполняться условие (19). Значение PL (у) при у = s иногда называют уровнем обслуживания, а значение у — Е [дь] при у = s — буферным, или гарантийным, запасом. До тех пор пока мы не примем ряд дополнительных предположений, уточняющих форму распределения вероятностей pL (g L ), нам почти ничего не удастся выяснить относительно чувствительности оптимальной стратегии к вариациям экономических показателей, а также относительно ее зависимости от нормы спроса М и продолжительности интервала упреждения. Чтобы понять, чем это объясняется, допустим, например, что штрафные потери л возрастают. С одной стороны, это сразу же приводит к увеличению численного значения второго члена под знаком корня в формуле (17); с другой стороны, увеличение численного значения я косвенным образом, а именно через штрафные потери, непосредственно влияющие на R и s [см. соотношения (19) и (20)], приводит к уменьшению численного значения выражения [МL 4- (2nM/h)]. Ряд примеров, иллюстрирующих проблему чувствительности стратегии управления запасами, приводится ниже при обсуждении вопросов приближенного описания вероятностных процессов с помощью нормального распределения. Следует отметить, что формулы (17) и (19) можно использовать не только в рамках тех моделей, которые нами анализировались с учетом целого ряда предположений сугубо частного характера: возможности применения этих формул гораздо шире. В качестве примера допустим, что мы имеем дело с ситуацией, когда величина L является случайной, хотя по-прежнему предполагается, что на интервале упреждения выполняется условие qL ^ Q. В этом случае схема модели в целом сохраняется, хотя и возникает необходимость соответствующим образом «переопределить» pL (qL) *). Приведем другой пример. Пусть значение s по-прежнему определяется из условия (19), однако предположим, что величина R носит вероятностный характер, причем правило выбора ее значения предопределено лицом, принимающим управляющее решение, а именно с помощью R задается минимальная допустимая вероятность полного удовлетворения спроса на интервале упреждения. [Величина (1 — R) представляет собой максимально допустимую вероятность возникновения ситуации, при которой требуемое изделие на складе отсутствует.] Если постулировать, что поиск должен быть 1
) Величина pL ( g b ) по-прежнему интерпретируется как распределение вероятностей для уровней спроса на интервале упреждения, однако при этом учитывается, что продолжительность этого интервала, т. е. величина L, сама оказывается непостоянной.— Прим. перев.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
245
ограничен рассмотрением лишь стратегий, представимых в (s, ^-форме, и если задача заключается в минимизации ожидаемых средних затрат на приобретение товаров и их содержание в течение единичного интервала времени, то оптимальное значение Q вычисляется по формуле (17) при я = 0. Вспомним вместе с тем, что при наличии вероятностного ограничения Р (s) ^ R (гл. 16) рандомизированная стратегия может привести даже к более низким значениям ожидаемых затрат, связанных с закупкой изделий и их хранением на складе. Наконец, рассмотренный нами метод с совершенно незначительными дополнениями и изменениями оказывается применимым и в условиях, когда неудовлетворенный спрос просто аннулируется (см. упражнение 56). Алгоритмический метод решения. Ниже дается описание весьма простой процедуры, с помощью которой вычисляются значения Q и s, одновременно удовлетворяющие условиям (17) и (19): Шаг 1. Положите начальное пробное значение Q равным Шаг 2. Вычислите R по формуле (20), используя текущее пробное значение (?, а затем из условия (19) найдите соответствующее пробное значение s. Шаг 3. Прекратите вычисления, если новое пробное значение s совпадает с предыдущим. В противном случае с помощью (17) вычислите новое пробное значение Q, после чего вернитесь к шагу 2. Заметим, что на каждой последующей итерации пробные значения s уменьшаются, а пробные значения Q возрастают. В случае когда оптимальное значение s является положительным, рассмотренный метод решения всегда обеспечивает сходимость за конечное число итераций. Для сходимости достаточно выполнения следующего условия: (hML/2) + Mn max <- - где
246
ГЛАВА 19
и (7), т. е. предположим, что с = 1, К = 31,25,
L = 1, Р ь Ы = у -
/i = 5,
л = 20,
д = 0, 1, . . ., 4,
(23)
£ [
(24)
Тогда, реализуя шаг 2, получаем Я = 1-5+^46 = 0,44
и
^(2)>0,44.
(25)
Для пробного значения s = 2, согласно шагу 3, находим пробное значение
Q = /25 + 18-0,6 = 5,98.
(26)
Повторив процедуры, предписанные шагами 2 и 3, будем иметь R = 0,34 и Р (1) ^ 0,34, а пробное значение = 1/25+1,2-18 = 6,83.
(27)
На заключительной итерации R = 0,24 и Р (1) ^ 0,24, а оптимальное значение s = 1. При этом Оптимальное значение Q = 6,83, Оптимальное значение S = = s + = 7,83, (28) и, следовательно, min Е [АС] = 2 + /10 [62,5 + 45-1,2] + 5 (1 - 2) = 31,13.
(29)
Посмотрим теперь, в какой степени найденное нами оптимальное решение отличается от стратегии (6) и (8), полученной в результате простейшего (наивного) анализа задачи. При таком способе рассуждений мы пришли к стратегии (s, S) = (3, 8); соответствующие ожидаемые затраты, согласно (16), равняются 33,9, т. е. на 9% превышают оптимальное значение (29). Чтобы еще раз убедиться в умении пользоваться рассмотренным выше алгоритмом, читатель может повторить только что проделанную вычислительную процедуру, положив в (23) величину я = 30. (В результате должно оказаться, что оптимальным является решение в =2.) Аппроксимация, основанная на использовании нормального распределения. Всякий раз, когда рассматриваемая в данном разделе модель используется для анализа мультитоварных систем управления запасами, pL (qi), как правило, аппроксимируется каким-нибудь конкретным распределением вероятностей (пуассоновским, биномиальным, равномерным и т. п.). Когда тип распределения определен, остается лишь задать численные значения соответствующих
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
247
параметров. Очень удобным оказывается использование нормального распределения, которое является непрерывным, со средним значением и дисперсией вида E[qL]=ML,
Var[g L ]= S (
(30)
Такой метод аппроксимаций оказывается с практической точки зрения исключительно эффективным, несмотря на то что математические свойства нормального распределения (такие, как наличие симметрии, допустимость сколь угодно малых и сколь угодно больших значений случайной переменной и прочие) могут существенно отличаться от pL ( необходимо исследовать, насколько он адекватен реальному распределению в том диапазоне значений параметров, который представляет интерес в рассмотренном случае. Введем в рассмотрение величину
— ^.
так что
(3D (32)
s = ML + us VV^.
Пусть, как и в предыдущем
случае,
R==i
~
Обозначим нормированную вероятностей через
'
функцию
нормального
(33)
распределения (34)
а так называемую нормированную интегральную функцию потерь, отвечающую нормальному распределению (34), — через _ -
(35)
*
Используя функцию потерь *) (35), мы можем написать следующее приближенное равенство: S (
(36)
В таком случае для определения us вместо условия (19) используется соотношение PN Ы = R, 1
(37)
) Значения функций PN (и) и IN (и) для ряда значений и приведены в таблице на рис. 19.6.
248
ГЛАВА 19
и
PN(u)
IN (и) PN(-U) /л-(-и)
0 0,1
0,5000 0,5399 0,5793 0,6180 0,6555 0,6915 0,7258 0,7581 0,7882 0,8160 0,8414 0,8644 0,8850 0,9032 0,9193 0,9332 0,9453 0,9555 0,9641 0,9713 0,9773 0,9822 0,9861 0,9893 0,9919 0,9938 0,9954 0,9966 0,9975 0,9982 0,9987
0,3989 0,3509 0,3068 0,2667 0,2304 0,1977 0,1686 0,1428 0,1202 0,1004 0,0833 0,0686 0,0561 0,0455 0,0366 0,0293 0,0232 0,0182 0,0142 0,0110 0,0084 0,0064 0,0048 0,0036 0,0027 0,0020 0,0014 0,0010 0,0007 0,0005 0,0003
0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2
2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0
0,5000 0,4601 0,4207 0,3820 0,3445 0,3085 0,2742 0,2419 0,2118 0,1840 0,1586 0,1356 0,1150 0,0968 0,0807 0,0668 0,0547 0,0445 0,0359 0,0287 0,0227 0,0178 0,0139 0,0107 0,0081 0,0062 0,0046 0,0034 0,0025 0,0018 0,0013
0,3989 0,4509 0,5068 0,5667 0,6304 0,6977 0,7686 0,8428 0,9202 1,0004 1 ,0833 1,1686 1,2561 1,3455 1 ,4366 1,5293 1,6232 1,7182 1,8142 1,9110 2,0084 2,1064 2,2048 2,3036 2,4027 2,5020 2,6014 2,7010 2,8007 2,9005 3,0003
Р и с . 19.6. Значения функций PN (и) и IN (и) в случае нормального распределения.]
а для вычисления оптимального значения Q вместо (17) используется формула
2КМ 2пМ [Оптимальное! /ч»\ <38> [значение Q \ Читателю предлагается вывести формулу для min E (АС), которая является аналогом выражения (21).] Алгоритм поиска оптимального решения выглядит следующим образом:
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
249>
Шаг 1. Находится начальное пробное значение Q, которое предполагается равным (2KM/h)1/2. Шаг 2. По формуле (33) для данного пробного значения Q вычисляется R, после чего с помощью (37) определяется соответствующее пробное значение us и с помощью (32) —• пробное значение s. Шаг 3. Если новое пробное значение s приблизительно совпадает с предыдущим, вычислительная процедура заканчивается. В противном случае по формуле (38) вычисляется новое пробное значение Q, после чего возвращаются к шагу 2. Следует заметить, что для реализации шага 3 необходимо количественно определить «допуск», т. е. интервал, в пределах которогодва пробных значения s считаются приблизительно совпадающими. В качестве иллюстрации построенного выше алгоритма рассмотрим случай, когда К = 32, h = 1, я = 9, L = 1, М = ML = 16, VL = 48. (39) Выполнив вычисления шага 1, получаем Начальное значение Q = 32, а в результате
(40)
реализации шага 2 находим
так что в соответствии с таблицей на рис. 19.6, Пробное значение u s = 0,8,
(42)
Пробное значение s = 16 + 0,8 1/48 = 21,6. Затем на шаге 3 получаем Пробное значение Q = = У 32 -32 +(16 + 144) |/48~-0,12 = 35,71.
(43)
Возвращаемся к шагу 2 и находим 35,71
= 11^77 = 0,765, "«/2+144
(44)
и, следовательно, Пробное значение us = 0,72, Пробное значение s = 16 + 0,72 1/48 = 21,01. Тогда на шаге 3 имеем Пробное значение Q = = У 32-32 + (16 + 144) V 48-0,14 = 36,24.
(45)
(46)
Случай
1
2
Разновидности основного варианта
s
Q
E [AC]
Без изменений
11
26
28,0
24
л = 99
15
25
31 , 2
24
К = 64
10
36
37,2
33,9
пг=99 А' = 64
14
35
40,2
33,9
М=16
19
34
37,4
32
Ls = Ь
49
28
32,5
24
VL = 2"
11
28
29,6
24
Без изменений
109
52
80,7
45,3
я=9
88
56
64,2
45,3
К =-- 32
111
38
69,3
32
Я =9 К = 32
91
42
53,2
32
М =9
65
39
59,0
33,9
L=l
29
48
61,0
45,3
FL = 80
97
49
65,9
45,3
ЭВРП
С л у ч а й ! : /г = 1, я = 9, А: = 32, с -О, М — 9, L = : Случай 2: А = 1, я = 99, А = 64, с = 0, ЛГ = 16, Л = 5 (^ = 80), FL = 240. (Для s и Q приведены округленные значения.) Р и с. 19.7. Анализ чувствительности стратегии управления запа•самп в случае, когда р^ (qL) аппроксимируется нормальным распределением.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
251
Последующие итерации приведут к пробным значениям s и Q, отличающимся от значений (45) и (46) лишь «в дробной части». Для соответствующей величины ожидаемых затрат получим
Е [АС] = с!6 + 41,3.
(47)
Для закрепления материала читателю рекомендуется самостоятельно определить оптимальную стратегию в случае, когда М = 16, L = 5. ML = 80, VL = 240, а значения К, h и я совпадают с только что рассмотренными. (В результате оптимальное значение s должно оказаться равным приблизительно 91.) Ряд оптимальных стратегий, полученных изложенным выше приближенным методом, приведен в таблице на рис. 19.7. Следует обратить внимание на то. что увеличение численного значения каждого из параметров п, К, М, L и VL приводит к одновременному увеличению оптимальных значений s и Q; исключение составляет случай уменьшения Q при возрастании п и случай уменьшения s при возрастании К. Такая зависимость оптимальной стратегии от выбора численных значений фигурирующих в модели показателей наблюдается лишь в случае, когда, согласно аппроксимирующему величину PL (QL) нормальному распределению, вероятность отрицательных значений qL пренебрежимо мала, что имеет место в тех случаях, когда МL/Y VL > 2. Отметим также, что оптимальное значение Q, найденное изложенным выше методом, может в значительной степени превысить аналогичный показатель, вычисленный с помощью модели ЭВРП; однако даже в этих случаях для нахождения оптимального решения требуется всего 3—4 итерации. 19.7. НЕСКОЛЬКО ОБЩИХ ЗАМЕЧАНИЙ ПО ВОПРОСУ О, ПРАКТИЧЕСКОМ ИСПОЛЬЗОВАНИИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ
В этой главе мы совершенно не претендуем на подробное обсуждение тех мероприятий, осуществление которых является необходимым при внедрении научно обоснованной системы управления запасами. Однако в свете наших утверждений относительно того, что при решении реальных проблем находят эффективное применение даже весьма простые модели (например, наподобие той, которая рассматривалась нами в предыдущем разделе), мы попытаемся показать, как различного рода аппроксимирующие условия используются на практике. Следует постоянно помнить о том, что при обсуждении вопросов применения математических моделей управления запасами всюду подразумевается, что речь идет о товарах, складирование и реализация которых должны осуществляться стереотипным путем. Условие стационарности. В рассмотренной выше динамической модели с непрерывным контролем уровня запасов постулировалось, что экономические показатели, так же как и распределение уровней спроса, не изменяются во времени. При решении практических
252
ГЛАВА 19
задач всякий раз, когда осуществляется поиск оптимальной стратегии регулирования запасов того или иного вида товара, учитываются текущие значения фигурирующих в модели экономических показателей, а при оценке структуры и параметров распределения вероятностей для уровней спроса больший «вес» придается наиболее свежим данным относительно потребностей клиентуры в данном виде товара. В большинстве систем управления запасами каждая из стратегий пересматривается с учетом новых данных не чаще одного раза в 3 месяца, а нередко лишь по истечении 6 месяцев или даже года. Если значения экономических показателей и распределение спроса изменяются настолько быстро, что предположения, принятые нами при построении приведенной выше модели, оказываются некорректными (т. е. явно не соответствующими действительности), задачу приходится решать методом динамического программирования, аналогичным методу, изложенному в приложении II. Выбор функции экономических затрат. Приведенные выше выражения для функций затрат на приобретение и хранение товаров имеют явно упрощенную структуру и должны, естественно, восприниматься как сугубо приближенные. Тем не менее и в таком виде они позволяют получать приемлемые по точности оценки упомянутых экономических показателей. Накладные расходы обычно оцениваются путем сопоставления суммарных годовых затрат на оплату рабочей силы с той частью годовых затрат, которая связана с размещением заказов на поставки и с получением соответствующих товаров на склады. Обычно рассматриваются усредненные накладные расходы за целое число интервалов пополнения запасов. Нередко решающим элементом при определении политики в сфере регулирования запасов является объем оборотного капитала фирмы. Дополни^ тельные затраты, связанные с хранением товаров на складе, и соответствующие расходы на страхование легко вычисляются как в совокупности, так и для каждого вида товара в отдельности. Оценка штрафных потерь, т. е. экономического ущерба, возникающего из-за отсутствия требуемого товара на складе, сопряжена с наибольшими трудностями. Как правило, вначале производится грубая прикидка, основанная лишь на догадках, после чего осуществляется анализ на чувствительность с тем, чтобы внести в первоначальные оценки соответствующие коррективы. (Несколько дополнительных замечаний, относящихся к данному аспекту анализа, см. в подразделе «Проблема экономического обоснования».) Выбор функции распределения вероятностей для уровней спроса. Для систем управления запасами с широкой номенклатурой хранимых товаров должны быть разработаны типовые процедуры оценки распределения спроса на основе ретроспективных данных. При этом, как правило, используются обычно статистические методы вычисления средних значений и дисперсии. Однако на этапе обработки данных следует проявить определенную осторожность. Так, например, следует избегать использования данных, которые настолько уста-
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
253
рели, что не могут быть использованы для прогнозирования будущих потребностей покупателей. Не следует также ориентироваться на так называемые экстремальные значения уровней спроса, поскольку это может привести к сильному увеличению среднего пробного значения спроса и таким образом породить иллюзию необходимости решать задачу регулирования запасов данного вида товаров нестереотипным способом. Как правило, постулируется один из хорошо известных видов распределения вероятностей. Если, например, используется приближение, основанное на аппроксимации реального распределения вероятностей нормальным (см. предыдущий подраздел), то при этом требуется лишь произвести оценку среднего значения спроса и соответствующей дисперсии на интервале упреждения. Часто при рассмотрении конкретного вида изделия после проведения надлежащего анализа данных методом статистической регрессии обнаруживается, что между средним значением спроса и его дисперсией существует некоторая приближенная зависимость. Например, может оказаться, что отношение среднего значения спроса к значению соответствующей дисперсии приблизительно постоянно. В таких случаях количественную оценку дисперсии можно осуществлять косвенно, используя результаты вычисления математического ожидания спроса. Определение оптимальной стратегии. Существует множество различных методов отыскания оптимальных стратегий регулирования запасов. Выбор конкретной оптимизационной модели в решающей степени зависит от использования ЭВМ в процессе сбора и обработки текущих данных, характеризующих состояния запасов. Как правило, фирмы, применяющие ЭВМ для учета имеющихся в наличии запасов, применяют их и для определения оптимальных стратегий пополнения запасов, т. е. возлагают на ЭВМ выполнение всех вычислительных процедур, предусмотренных выбранным алгоритмом решения. ЭВМ с учетом новейшей информации «модернизирует» используемые стратегии. (Как уже отмечалось выше, применяемые фирмой стратегии пополнения запасов регулярно пересматриваются от одного до четырех раз в год.) В более сложных системах регулирование запасов ЭВМ, зарегистрировав снижение уровня запасов до критического значения, сама заполняет бланк заказа на очередную поставку товаров, который и отсылается затем фирме-поставщику. Научный подход к решению задачи управления запасами успешно применялся также и теми фирмами, которые при регулировании запасов пользуются услугами ЭВМ лишь в незначительной степени. При этом таблицы (или номограммы) составляются таким образом, чтобы административному работнику, решающему вопросы складирования товаров, не требовалось для определения оптимального варианта выполнять какие бы то ни было сложные вычисления, а достаточно было использовать скромное количество учитываемых моделью экономических показателей и уровней спроса. Сами же эти таблицы, как правило, составляются с помощью ЭВМ.
254
ГЛАВА 19
Проблема экономического обоснования. У читателя, познакомившегося с целым рядом упрощающих задачу предположений, наверняка теперь возникнет вопрос: как же можно убедиться в том, что система управления запасами, основанная на использовании рекомендуемых стратегий (которые получены в результате применения того или иного метода моделирования), действительно является более совершенной по сравнению с существующими методами решения задачи управления запасами? Наиболее важный критерий — это степень согласованности используемых стратегий во всей их совокупности. В связи с реализацией такого рода агрегированных тестов наиболее широкое применение получили методы имитационного моделирования с помощью ЭВМ; именно для этих целей были разработаны специальные стандартные программы. Поскольку вопросы имитационного моделирования подробно обсуждаются в гл. 21, здесь мы ограничимся лишь некоторыми предварительными замечаниями. Простой, но весьма эффективный метод обоснования полученного решения заключается в следующем. Выбирается какой-нибудь перечень подлежащих складированию товаров, затем на основе ретроспективных данных, относящихся к весьма отдаленному прошлому, производится численная оценка соответствующих статистических параметров, после чего определяются и формулируются рекомендуемые стратегии. В заключении проводится имитационный эксперимент, позволяющий определить, насколько согласованными оказываются эти стратегии в условиях, когда вместо старых данных используются более свежие. При этом все вычислительные процедуры выполняются ЭВМ, т. е. людские трудозатраты при проведении такого эксперимента оказываются незначительными. Результаты имитирования сравниваются с соответствующими ретроспективными показателями, с такими, как средние уровни запасов, частота оформления заказов на поставки, объемы отсроченных заявок клиентуры и т. д. Как правило, при этом проводится анализ решения на чувствительность, причем в первую очередь он выполняется для параметров, характеризующих нехватку товаров. Ясно, что чем выше штрафные потери, тем большим должен быть средний объем запасов. При оценке результатов имитационного анализа рассматриваемой стратегии на чувствительность мнение опытных административных работников, безусловно, важнее самых квалифицированных заключений операционистов. И это вполне объяснимо: именно лица, реализующие оперативное управление запасами фирмы, несут в конечном счете ответственность за все последствия принимаемых ими решений.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
255
КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ
1. Проанализируйте каждую из указанных ниже задач и попытайтесь определить, при каких обстоятельствах или в силу каких причин решение вопросов, связанных с управлением запасами в каждом конкретном случае, может оказаться далеко не тривиальным. В частности, изложите ваши соображения относительно необходимости учитывать при решении задач, сформулированных в пп. а) — м), факторы и показатели, обсуждению которых посвящен разд. 19.3. Попытайтесь определить: а) оптимальный запас томатного сока в вашем кухонном шкафу; в складском помещении столовой или ресторана; на полках продуктового магазина; б) оптимальное число автобусов, курсирующих на пригородных линиях, и сроков их замены новыми автобусами; в) оптимальный запас хранимых у вас дома батареек для ручного электрического фонарика; г) оптимальное количество и мощности вспомогательных электрогенераторов в клинической больнице; д) оптимальное количество канцелярских скрепок, которое должен иметь в ящике своего письменного стола служащий; е) оптимальное количество резервных реактивных двигателей, которым должна располагать авиакомпания на своих базах обслуживания; ж) оптимальное количество блокнотов различного размера, которое должно храниться на складе канцпринадлежностей учреждения; з) оптимальное количество мест в проектируемом кинотеатре; и) количество мест в салоне первого класса проектируемого реактивного сверхзвукового пассажирского лайнера; к) оптимальный объем ежегодно выделяемых фондов для оказания помощи так называемым районам стихийных бедствий (т. е. районов, где произошли землетрясения, пожары, наводнения и т. п.); л) количество кубометров воды, сбрасываемой через гребень плотины гидроэлектростанции; м) оптимальное количество спасательных кругов и спасательных шлюпок на борту трансокеанского парохода. 2. Опишите несколько коммерческих ситуаций, в которых могла бы найти применение однопериодная модель управления запасами. Охарактеризуйте обстоятельства или условия, при которых для разработки стратегии регулирования запасов считалось бы экономически целесообразным воспользоваться услугами специалистов по исследованию операций. 3. а) Рассмотрите стратегию пополнения запасов (s, S) = (3, 10). Чему равен объем заказа, если начальный объем запасов равняется 0? 2? 3? 5? 10? 15? Чему равен в каждом из этих случаев наличный объем запасов, предназначенных для удовлетворения
256
ГЛАВА 19
запросов клиентуры, после размещения заказа на пополнение? Предположите, что доставка заказанного товара осуществляется мгновенно, т. е. запаздывание равно нулю. б) Пусть с (х) определяется соотношением (2), приведенным в разд. 19.4. Предположим, что К — 5, а с — 2. Начертите график с (х), выбрав значения х = О, 1, 2, . . ., 5. в) Рассмотрим функцию ожидаемых затрат, определяемую формулой (3) из разд. 19.4. Объясните, почему логично предположить, что с -f- ft !> О и я >• с. Покажите, что из этих двух неравенств вытекает неравенство h + л > 0. г) Докажите, что распределение вероятностей (4) (разд. 19.4) приводит к выражению (5) для L (у) (там же). д) Пусть в формуле (5) из разд. 19.4 h = 5, a it = 10. Вычислите L (у) и сравните полученные результаты с соответствующими данными, приведенными в таблице на рис. 19.1. Начертите также график L (у). е) Повторите упражнение п. д), положив я = 20 (вместо л = 10). ж) Повторите упражнение п. д), положив л = 5 (вместо я = 10). з) Повторите упражнение п. д), положив h = 10 (вместо h = 5). (Указание: воспользуйтесь при этом результатом выполнения упражнения п. е).) и) Подробно объясните, почему затраты на содержание запасов в расчете на одно изделие (h) фигурирующие в формуле (3) из разд. 19.4, можно интерпретировать как чистую стоимость после вычитания из них остаточной стоимости изделия. Какой вид имела бы оптимальная стратегия, если бы остаточная стоимость v изделия превышала бы его покупную стоимость с? к) Предположите, что начальный объем запасов равен нулю и оптимальное значение s > 0. Выведите формулу для «цены неопределенности» в соответствии с (2) и (3) из разд. 19.4. 4. Рассмотрите величину R, определяемую соотношением (6), приведенным в разд. 19.4. а) Пусть с = 0 и h = 1. При каких значениях л мы будем иметь R = 1/2? R = 3/4? R = 9/10? R = 99/100? б) Ответьте на вопросы п. а), положив с — 1 и h = 1. в) Ответьте на вопросы п. а), положив с = 10 и h = 1. г) Ответьте на вопросы п. а), положив с — 10 и h = 10. д) Ответьте на вопросы п. а), положив с — 100 и h = 10. е) Опишите оптимальную стратегию при с = h = 0. ж) Опишите оптимальную стратегию в случае, когда л ^ с. (Дайте соответствующее обоснование.) 5. Рассмотрите величину Л, определяемую соотношением (6) из разд. 19.4. а) Изобразите графически область значений л/с и h/c, для которых выполняется условие 0,8 ^ Л ^ 0,9. б) Изобразите графически область значений я/Л и c/h, для которых выполняется условие п. а).
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
257
в) Изобразите графически область значений с/я и h/n, для которых выполняется условие п. а). 6. Рассмотрите величину /?, определяемую соотношением (6) из разд. 19.4. Предположите, что 0,8 ^ Л ^ 0,9, и определите соответствующие ограничения для л, положив а) с = 0, h = 1; б) с = 1, h = 1; в) с = 10, h = 10; г) с = 100, h = 10. д) Повторите упражнения пп. а) — г) при условии 0,7 ^ /?^ <0,8. е) Повторите упражнения пп. а) — г) при условии 0,85 =sC Л < < 0,95. 7. а) Рассмотрите распределение, представленное на рис. 19.2. Определите с помощью (7) из разд. 19.4 оптимальное значение S при h = 5, л = 10 и с = 5. (Для R = 0,8; для R = 0,6.) б) Начертите график cy-\-L (у) при h = 5, я = 10 и с = 5; укажите оптимальное значение 5". 8. Рассмотрите величину R, заданную соотношением (6) из разд. 19.4. В каждом из указанных ниже случаев найдите оптимальное значение S для значений R = 1/2, R = 3/4 и R = 9/10: а) р (д) = (? + 1)/15 при q = О, 1, . . ., 4; б) р (0) = р (4) = 1/9, р (1) = р (3) = 2/9, р (2) = 3/9; в) р (q) = (5 - g)/15 при q = О, 1, . . ., 4;
г) Р(0)=р (4) = 3/11, р (1) = р (3) = 2/11, р (2) = 1/11. 9. Рассмотрите распределение вероятностей, определяемое формулой (8) из разд. 19.4, и предположите, что в (2) и (3) h = 5, я = 10 и с = 0,1. а) Убедитесь, что оптимальное значение S равно 3. б) Начертите график L (у), рассмотрев значения у = О, 1, . . ., 5. в) Положите .ИГ = 4 и начертите график К-\-с (S — у) + L (S), где 5 = 3. Покажите графически, что оптимальное значение s = 2. г) Выполните упражнение п. в), положив .ИГ = 12. д) Определите диапазон значений величины К, для которых решение s = 1 является оптимальным. 10. Допустим, что р (q) = 1/10 (q = 1, 2, . . ., 10). Пусть в однопериодной модели, представленной соотношениями (2) и (3) из разд. 19.4, /i = 5, я = 10 и с = 0,1. а) Найдите оптимальное значение S. б) Найдите оптимальное значение s при К = 1; при /Г = 2; при ^ = 5; при К = 10. в) Определите диапазон значений величины К, при которых оптимальное значение s равняется 2. г) Выполните упражнения пп. а) и б), положив с = 5. 11. Рассмотрите статическую модель в ее общей формулировке (разд. 19.4). Предположите, что р (д) — 1/10 (q = 1, 2, . . ., 10).
258
ГЛАВА 19
Пусть ожидаемые затраты определяются формулой g(y\i)=c-(y — i)+% h.(y-g)*p(q)+% 5=0
n.(q-yfp(q),
z/>0,
g>y
где у — объем имеющихся в наличии запасов, готовых для удовлетворения заявок клиентуры, после исполнения заказа фирмойпоставщиком при условии, что начальный объем запасов равняется г. а) Пусть i = 0 , /i = 5, л = 10 и с = 0,1. Найдите оптимальное значение у. б) Повторите упражнение п. а), положив с = 5 (вместо с = 0,1). 12. Рассмотрите пример, представленный соотношениями (16) — (18) из разд. 19.4. а) Используя (16), объясните, почему из (18) следует, что фактические потери, равные я, не зависят от того, в какой степени фактический спрос q превышает имеющиеся в наличии запасы у. б) Убедитесь, что количественные оценки, фигурирующие в правой части (18), найдены правильно. в) Почему в процессе оптимизации можно ограничиться рассмотрением только тех стратегий, которые определены соотношениями (20)? г) Проверьте правильность результатов, представленных соотношениями (21) — (23). д) Опишите стратегию пополнения запасов (24). 13. а) Рассмотрите случай п. а) упражнения 11. Определите оптимальную (s, 5)-стратегию, включив в выражение для функции затрат на приобретение товаров накладные расходы К = 1. б) Выполните сформулированное выше упражнение для К = 5. 14. Дайте подробное обоснование соотношений (I)— (XII), приведенных в конце разд. 19.4. 15. Дайте подробное обоснование соотношений (XIII) — (XVII), приведенных в конце разд. 19.4. 16. Рассмотрите примеры ЭВРП, представленные на рис. 19.3 и 19.4. Положите Q = 45, s = —10, М = 30. а) Вычислите S, среднее число оформлений заказов в течение одной недели, средний уровень запасов в течение отрезка времени, когда уровень запасов выше нуля, и средний уровень запасов в пределах недели. б) Пусть продолжительность интервала упреждения L = 1 неделя. Когда необходимо начать принимать меры по пополнению запасов? в) Пусть L = 2 недели. Когда необходимо начать принимать меры по пополнению запасов? г) Выполните упражнения пп. а) — в) при Q = 60. д) Выполните упражнения пп. а) — в) при М = 15. е) Выполните упражнения пп. а) — в) при s = —5. 17. а) Проверьте алгебраические выкладки, с помощью которых была получена приведенная в разд. 19.5 формула (5) для среднего значения затрат в единицу времени.
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
259
б) Покажите, что если S = Q, то (5) сводится к (6). в) Покажите, что из первой формулы (7), т. е. из формулы для <2, вытекает вторая формула (7), т. е. формула для минимального значения средних затрат. г) Продифференцируйте выражение (6) по Q, приравняйте найденную производную нулю и разрешите полученное уравнение относительно Q; убедитесь, что в результате получится формула для оптимального значения Q в (7). 18. а) Рассмотрите формулу (7) из разд. 19.5. Определите, при каком значении отношения Klh объем заказа Q соответствует недельному спросу; 2-недельному спросу; 3-недельному спросу; 12-недельному спросу; 26-недельному спросу (при фиксированной норме спроса М). б) Введите в рассмотрение величину (назовем ее «гарантийным показателем»), равную отношению среднего объема запасов к норме спроса. Получите формулу для гарантийного показателя, исходя из предположения, что значение Q определяется соотношением (7). Покажите, как изменяется значение упомянутого показателя при вариациях нормы спроса, а также при вариациях величины Klh. 19. а) Убедитесь, что из приведенной в разд. 19.5 формулы (11) вытекает следующая за ней формула (12), позволяющая проанализировать чувствительность модели по отношению к вариациям Q. б) Определите диапазон значений г [см. формулу (12) в разд. 19.5], для которых выполняется условие VC (r)/VC (I) =Sj 1,15. в) Объясните, почему значение VC (r)/VC (1) [формула (12) из разд. 19.5] не меняется при замене г ->- г' = 1/г. г) Начертите график функции р (г) = VC (r)/VC (1) в интервале значений г, удовлетворяющих условию 0,1 ^ г ^ 10. 20. Рассмотрите формулу (7) из разд. 19.5 (т. е. формулу ЭВРП). Предположите, что М — истинная норма спроса, хотя при этом не исключена вероятность того, что норма спроса окажется равной r-М, где г > 0. Обозначьте переменную часть затрат через VC (г) [по аналогии с обозначением, использованным нами в формуле (11)] и допустите, что в формуле (7) произведена замена М на г -М. а) Выведите формулу для VC (r)/VC (1). б) Определите интервал значений г, внутри которого VC (r)/VC (1)< U. в) Начертите график функции К (г) = VC (r)/VC (1) для значений г, лежащих в интервале 0,1 ^С г ^ 10. 21. Проведите анализ, предусмотренный упражнением 20, для случая, когда варьируемым показателем является К (т. е. для случая, когда вначале недооценивалась возможность того, что накладные расходы будут равняться не К, а гК, где г > 0). 22. Проведите анализ на чувствительность модели по отношению к вариациям затрат на содержание запасов (т. е. предположив, что h -»- г -h, где г > 0).
260
ГЛАВА 19
23. Рассмотрим модель, в которой штрафные потери пропорциональны среднему объему отсроченных заказов, т. е. модель, для которой функция затрат определяется формулой (14), приведенной в разд. 19.5. а) Убедитесь в справедливости формулы (14). б) Возьмите частную производную выражения (14) по S, приравняйте ее нулю и разрешите полученное уравнение относительно S; убедитесь, что в результате получится формула (15). в) Проверьте формулы (16). г) Чему равна продолжительность интервала между последовательными оформлениями заказа на поставку требуемых изделий? д) Положите в формулах (16) h = я и дайте истолкование формулам, полученным в результате упрощения. е) Положите в формулах (16) 3h = я и дайте истолкование формулам, полученным в результате упрощения. 24. Пусть /i = l, я = 9, К = 32, с = О, М = 9. а) Вычислите по формулам (16) из разд. 19.5 оптимальные значения Q, S, s и минимальное значение АС. б) Повторите упражнение п. а), положив h = 4 (вместо h = 1). в) Повторите упражнение п. а), положив я = 36 (вместо я = 9). г) Повторите упражнение п. а), положив М = 36 (вместо М = 9). 25. Рассмотрим приведенные в разд. 19.5 формулы (16), определяющие оптимальную стратегию пополнения запасов. Предположим, что фактический объем заказа в г раз превышает объем заказа, вытекающий из соответствующей формулы (16) (г > 0). Обозначим через VC (г) соответствующую переменную часть затрат (т. е. затраты за вычетом фиксированной величины сМ). а) Выведите формулу для VC (r)/VC (1). б) Положите h = \, я = 9, К — 32, Af = 9 и начертите график функции VG (r)/VC (1) в интервале 0,1 ^ г ^ 10. 26. Рассмотрим формулы (16), приведенные в разд. 19.5, которые определяют оптимальную стратегию. Предположим, что М есть истинная норма спроса, но не исключено, что нами она занижена, т. е. норма спроса может оказаться равной г -М, где г >> 0. Пусть VC (г) — переменная (т. е. не учитывающая компоненты сМ) часть затрат, получаемая подстановкой в (16) вместо М величины г -М. а) Выведите формулу для VC (r)/VC (1). б) Положите и = 1, я = 9. .ИГ = 32, .М = 9 и определите интервал значений г, внутри которого VC (r)/VC (I) ^ 1,1. в) Начертите график функции А, (г) = VC (r)/VC (1) в интервале 0,1<г<10. 27. Повторите упражнение 26, варьируя указанным выше образом значение К. 28. Повторите упражнение 26, варьируя значение h. 29. Повторите упражнение 26, варьируя значение я. 30. Рассмотрите оптимальную стратегию (16) (разд. 19.5). Начертите график каждой из приведенных в (16) величин
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
261
а) как функции h при л = 9, К = 32, М = 9; б) как функции л при fe = 1, К = 32, М = 9; в) как функции К при h = 1, л = 9, М = 9; г) как функции М при /г. = 1, л = 9, К = 32. 31. а) Воспроизведите алгебраические операции, используемые для получения приведенных в разд. 19.6 формул (9) — (15), из которых в итоге вытекает формула (16) для ожидаемых средних затрат на единичном отрезке времени. б) Возьмите частную производную дЕ [AC]/dQ, приравняйте ее нулю и разрешите полученное таким образом уравнение относительно Q; убедитесь, что в результате будет получена формула (17). в) Выведите формулу (19), определяющую оптимальное значение s. г) Подставьте оптимальное значение Q, определяемое соотношением (17), в формулу (16) для Е [АС] и проверьте, что в результате этого получается формула (21). Какой член в выражении (21) отражает наличие условий неопределенности? 32. а) Проверьте вычисления, связанные с иллюстрацией алгоритма определения (s, £)-стратегии на конкретном примере, рассмотренном в разд. 19.6 [см. (23) — (29)]. б) Найдите оптимальную стратегию, сохранив в (23) прежние численные значения всех параметров, за исключением л, а последний положив равным 30. 33. Пусть pL (qL) = 1/10 (g = 1, 2, . . ., 10), где L = 1. Положите /i = 5, л = 1 0 и с = 0,1. В каждом из указанных ниже случаев определите оптимальную стратегию пополнения запасов, применив алгоритм, описание которого дано в разд. 19.6. Рассмотрите случаи, когда а) К = 1; г) л = 20, К = 10; б) К = 5; д) я = 50, К = 10. в) К = 10; 34. Пусть pL (qL) = 1/20 (q = О, 1, . . ., 19) при L — 1. В перечисленных ниже случаях воспользуйтесь алгоритмом, предложенным нами в разд. 19.6, для получения графиков оптимальных значений Q, s, S и ожидаемых затрат как функций указанного в каждом пункте параметра. (Рассмотрите лишь случаи, когда оптимальное значение s > 0. Читателю рекомендуется выбрать несколько пробных значений рассматриваемого параметра и построить соответствующую кривую на глаз.) а) Положите h = 1, л = 50, а в качестве переменного параметра возьмите К, ограничившись при этом интервалом 0< К ^ 30. б) Положите h = 1, К = 20, а в качестве переменного параметра возьмите л, ограничившись при этом интервалом 0 < л ^ 100. в) Повторите упражнения пп. а) и б), положив L = 2. 35. Рассмотрите метод приближенного описания pL (qL) с помощью нормального распределения вероятностей (см. конец разд. 19.6). В каждом из указанных ниже случаев определите при-
262
ГЛАВА 19
ближенно оптимальные значения Q, s и S и соответствующих ожидаемых затрат. Рассмотрите: а) Случай, когда М = 16, L = 5, МL = 80, VL = 240, а все прочие показатели принимают значения, указанные в (39). б) Случай 1, характеризуемый данными, приведенными в таблице на рис. 19.7. в) Случай 2, характеризуемый данными, приведенными в таблице на рис. 19.7. 36. Ознакомьтесь с результатами анализа модели на чувствительность, приведенными в таблице на рис. 19.7. Попытайтесь найти правдоподобное объяснение тому, что возрастание численного значения каждого из параметров я, К, М, L и VL приводит к одновременному возрастанию как оптимального значения s, так и оптимального значения Q, за исключением случая убывания Q при увеличении л и случая уменьшения s при увеличении К. (Проследите за тем, как значения указанных экономических показателей влияют на численные значения переменных, описывающих стратегию управления запасами, а также попытайтесь выявить эффект, обусловленный скрытыми взаимосвязями между значениями переменных, описывающих оптимизируемую стратегию.) 37. Объясните, как вы понимаете следующие термины: продолжительность интервала линейный характер затрат на упреждения (срок исполнехранение запасов; ния заказа); линейный характер штрафных накладные расходы; потерь; затраты на содержание запасов; критический параметр; штрафные потери; единовременные штрафные постатическая модель; тери; (s, 5)-стратегия; гарантийный запас; критический уровень запасов спрос в течение интервала (точка заказа); упреждения. УПРАЖНЕНИЯ НА* ПОСТРОЕНИЕ МОДЕЛЕЙ И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ
38. Авиакомпания «Родные прерии» заказывает партию новых пассажирских реактивных самолетов. Если запасные части к двигателям самолетов приобретаются одновременно с закупкой самих самолетов, то цены на них будут ниже по сравнению со случаем закупки аналогичных запасных частей в последующие моменты времени, когда у авиакомпании возникнет в них острая нужда. Предположим, например, что покупная цена одной запчасти, приобретаемой одновременно с самолетами, равняется c t , а покупная цена одной запчасти, заказываемой впоследствии, равняется с а , причем с4 < с 2 . Допустим, что каждую неиспользованную запчасть, оставшуюся на складе после того, как приобретаемые авиакомпанией самолеты будут сняты с эксплуатации, можно будет реализовать
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
263
по цене v. Обозначим через р (d) вероятность того, что за все время эксплуатации приобретенных самолетов авиакомпании понадобятся запчасти в количестве d штук. а) Покажите, как будет выглядеть формула для ожидаемого значения суммарных затрат при закупке Q запчастей одновременно с приобретением самолетов. б) Выведите формулу, позволяющую определить оптимальное значение Q. (Сформулируйте самостоятельно некоторые предположения относительно значения и.) 39. Авиакомпании «Родные прерии» необходимо также решить, сколько в приобретаемых ею самолетах должно быть мест первого класса и сколько туристского класса. Предположим, что в самолете можно разместить R рядов пассажирских кресел. Обозначим через Г) число рядов для мест первого класса, а через г 2 — число рядов для мест туристского класса. Пусть pi (d^ — вероятность того, что при бронировании или покупке билетов на каждый рейс di пассажиров изъявят желание лететь первым классом. Для простоты будем считать, что, если на данный рейс все места первого класса окажутся распределенными, пассажиры предпочтут воспользоваться услугами другой авиакомпании. Обозначим через y t прибыль, получаемую за счет каждого проданного места первого класса. Аналогично обозначим через pz (d2) вероятность того, что на каждый рейс поступит d% заявок на места туристского класса, а через v2 — прибыль, получаемую авиакомпанией за счет каждого проданного места туристского класса. Запишите применительно к рассматриваемой ситуации выражение для ожидаемой суммарной прибыли и объясните, как бы вы подошли к определению оптимального варианта распределения имеющихся в самолете пассажирских мест по классам. 40. (k, ())-стратегия пополнения запасов. Рассмотрим однопериодную модель с показателями затрат, определяемыми формулами (2) и (3) из разд. 19.4. Предположим, что объем заказа должен быть кратным Q, где Q — заранее известное число или некоторая удобная единица измерения (например, дюжина, тонна, кубический метр и т. п.). а) Покажите, что оптимальная стратегия имеет следующую форму представления: если значение начального объема запасов меньше некоторого числа k, то оформляется заказ на поставку изделий в объеме IQ, где Z — наименьшее из целых чисел, при которых объем запасов после пополнения становится по крайней мере равным k; если начальное значение объема запасов равняется или превышает k, заказ на поставку оформлять не следует. Пусть, например, имеет место стратегия (k, Q) = (8, 5); это означает, что если начальный объем запасов равняется 8 или более изделий, то пополнения запасов не требуется; если начальный объем запасов составляет 3, 4, . . ., 7 изделий, то заказ оформляется на поставку 5 изделий; если начальный уровень запасов равен —2, —1, . . ., 2, то оформляется заказ на поставку 10 изделий и т. д.
264
ГЛАВА 19
б) Покажите, как вычисляется оптимальное значение k для стратегии, форма записи которой указана в п. а). в) Примените предложенный вами метод вычисления k в случае, когда р (q) и L (у) определяются соотношениями (4) и (5), положив при этом h — 5, я = 10 и с = 0,1. Найдите оптимальные стратегии при Q = 2 и Q = 4. г) Пусть р (q) — 1/10 (g — 1, 2, . . ., 10). Положим h = 5, зт = = 10 и с = 0,1. Примените предложенный вами метод [см. п. a)J для определения оптимальных стратегий при Q = 2 и Q = 4. 41. Рассмотрим однопериодную модель с линейным характером затрат на содержание запасов и штрафных потерь, в которой спрос задается некоторой плотностью распределения (см. конец разд. 19.4). Пусть р (q) = me~mq для q > 0, причем т > 0 и £ [д] = 1/пг. а) Выведите формулу для определения оптимального значения 5. б) Получите выражение для оптимального значения s. [Указание: оптимальное значение s находится в результате решения уравнения L (s) + cs = К + cS -\- L (S).] Пусть/) = <S — s; попытайтесь выразить результаты, полученные в п. а), через D. в) Выведите приближенное выражение для оптимального значения D, используя результат, полученный в п. б), и аппроксимацию ех да 1 + х + 0,5а;2 (т. е. ограничившись в формуле разложения ех в ряд первыми тремя членами). 42. В каждом из рассматриваемых ниже случаев положите h = = Н-с и я = П-с, где с — покупная стоимость одного изделия. Обсудите вопрос относительно характера зависимости оптимальной стратегии от значения с. Рассмотрите следующие варианты моделей: а) Модель ЭВРП, представленную соотношениями (6) и (7) из разд. 19.5. б) Модель ЭВРП, представленную соотношениями (16) из разд. 19.5. в) Модель управления запасами при стохастическом поведении спроса, представленную соотношениями (17) — (20) из разд. 19.6. 43. Рассмотрите модели ЭВРП, в которых средние затраты определяются приведенными в разд. 19.5 формулами (5) и (14). а) Покажите, как изменятся выражения для средних затрат (5) и (14), если покупная стоимость Q изделий равняется cQ^ (вместо cQ). б) Выведите соответствующую формулу для оптимального размера заказываемой партии изделий. 44. Рассмотрим модель ЭВРП, приводящую к формуле (6) из разд. 19.5 для средних затрат в единицу времени (при оптимальном s = 0). Предположим, что фирма-заказчик просит фирму-поставщика /-ю часть запрошенного количества товара доставить немедленно, а остаток — после того, как запас в объеме fQ будет полностью исчерпан. а) Предположим, что значение / задано. Выведите формулу для определения оптимального значения Q, аналогичную формуле (7) из разд. 19.5. (Примечание: затраты на хранение запасов оценивают-
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
265
ся только по количеству изделий, находящихся непосредственно на складе торговой фирмы.) б) Пусть определению подлежит как значение /, так и значение Q. Выведите формулы для определения оптимальных значений / и Q. Какова продолжительность отрезка времени между поступлением на склад fQ изделий и поступлением остатка в объеме (1 — /0 изделий? 45. Модель управления запасами продукции, производимой промышленным предприятием. Рассмотрим модель, аналогичную той, которая представлена пилообразным графиком на рис. 19.3. Однако предположим, что складируемая продукция производится самой фирмой в количестве ./V единиц за единицу времени, причем N > М. При этом вид графика для уровня запасов, естественно, изменится, поскольку не будут наблюдаться мгновенные (представленные на графике вертикальными линиями) скачки, возникающие при поступлении на склад заказанной партии изделий от поставщика в объеме Q единиц. В рассматриваемом случае уровень запасов будет возрастать постепенно [угол наклона соответствующего отрезка прямой равняется arctg (N — М)} до тех пор, пока не достигнет значения Q, а затем начнет убывать со скоростью М. а) Предположим, что N = 75, а все прочие показатели совпадают с представленными на рис. 19.3. Начертите для этого случая график поведения уровня запасов. б) Пусть s = 0, так что S = Q. Выведите формулу для средних затрат в единицу времени [аналогичную формуле (3) из разд. 19.5} и определите соответствующее значение ЭПРП. Получите также выражения для соответствующих минимальных затрат и для оптимальной продолжительности отрезка времени между начальными точками последовательных производственных циклов. в) Покажите, как изменятся только что полученные результаты, если допустить, что s может принимать отрицательные значения, а штрафные потери пропорциональны среднему объему отсроченных заказов клиентуры. Получите формулу для средних затрат в единицу времени [аналогичную формуле (14) из разд. 19.5] и определите соответствующее значение ЭВРП, оптимальные значения s и S, минимальное значение средних затрат и оптимальную продолжительность интервала между начальными точками последовательных производственных циклов. г) Придайте результатам, полученным в пп. б) и в), числовое выражение, положив h = 1, К = 32, с = О, М = 9, N = 36, я = 9. 46. Пусть pL (gL) = 1/10 (q = 1, 2, . . ., 10) при L = 1. Предположим, что h = 5, л = 10, а с = 0,1. В каждом из указанных ниже случаев определите оптимальную стратегию, используя алгоритм, описание которого дано в разд. 19.6. (Полученные результаты сравните с результатами для упражнения 10.) Рассмотрите случаи, когда а) К == 5; б) К = 10.
266
ГЛАВА 19
47. Пусть PL (qL) = 1/20 (g = О, 1, . . ., 19), где L = 1. Предположим, что h — I, а К = 20. а) Найдите значения s, соответствующие -PL (s) = 0,75; 0,8; 0,85; 0,9; 0,95 [см. (18) — (20) из разд. 19.6]. б) Вычислите [с помощью формулы (17)] соответствующие значения Q, положив п — 0. С помощью (12) вычислите соответствующие ожидаемые значения для среднего уровня запасов в расчете на единицу времени. в) Объедините результаты пп, а) и б) с помощью графического изображения ожидаемого среднего уровня запасов как функции уровня обслуживания P L (s). Дайте экономическое истолкование полученных вами результатов. 48. Пусть PL (qL) = 1/20 (q = О, 1, . . ., 19), где L = 1. Предположите, что h = 1 и К = 20. а) Найдите значения s, соответствующие PL (s) = 0,75; 0,8; 0,85; 0,9; 0,95 [см. (18) - (20) из разд. 19.6]. б) Для каждого из полученных в п. а) значений s определите такое значение л, которое в результате применения формулы (17) приводит к значению В, вычисляемому по формуле (20) и равному PL (').
в) Используя результаты п. б), вычислите по формуле (12) соответствующие средние уровни запасов на единичном интервале времени. г) Объедините результаты пп. а) — в) с помощью графического изображения математического ожидания среднего уровня запасов как функции уровня обслуживания PL (s). Начертите также график P L (s) как функции я. Дайте экономическое истолкование полученных выше результатов. 49. Пусть р (q) представляет собой вероятность того, что в течение недели объем спроса будет равняться д, причем q — О, 1, . . ., D. Обозначим через t (L) вероятность того, что продолжительность интервала упреждения равняется L неделям, где L = 1, 2, . . ., /. Предположим, что случайные переменные, описывающие объем •спроса за неделю и продолжительность интервала упреждения, являются абсолютно независимыми. а) Предложите метод, позволяющий находить численные значения величины ръ (qL), которая представляет собой вероятность того, что объем спроса в течение интервала упреждения будет равен qL. б) Проиллюстрируйте предложенный вами метод, рассмотрев случай, когда р (q) = 1/4 (q = О, 1, 2, 3), a t (L) = 1/3 (L = 1, 2, 3). в) Используя данные, полученные в п. б), вычислите вероятность возникновения дефицита в случае, когда критический уровень запасов равняется 5; 8; 10. 50. Рассмотрите случай 1, описанный в таблице на рис. 19.7. а) Допустим, что по вашим оценкам норма спроса равняется 6 (М^ = 6) и вы применяете стратегию, найденную с учетом этого предположения, в то время как фактическая норма спроса оказы-
СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
267
вается равной М 2 = 9. Каково увеличение ожидаемых средних затрат, обусловленное такого рода недооценкой спроса клиентуры? Ответьте на такой же запрос, предположив, что вместо прогнозируемой вами нормы спроса MI = 12 фактическая норма спроса оказывается равной М2 = 9. (Указание: в каждом из указанных случаев вычислите ожидаемые значения средних затрат для значения нормы спроса MI и отдельно для М2.) б) Предположим, что по вашим оценкам дисперсия спроса на интервале упреждения равняется FI = 6 и вы придерживаетесь стратегии, соответствующей этому предположению, однако фактическое значение дисперсии оказывается равным У 2 = 9. Каково увеличение ожидаемых средних затрат, обусловленное недооценкой значения дисперсии на интервале упреждения? Ответьте на такой же вопрос, предположив, что вместо прогнозируемого вами значения дисперсии Vi = 12 фактическое значение дисперсии оказывается равным F2 = 9. в) Ответьте на вопросы, сформулированные в пп. а) и б), предположив, что вы ошиблись в прогнозе и приняли оценочное значение как для нормы спроса, так и для соответствующей дисперсии равным 6; равным 12. 51. Рассмотрите случай 2, описанный в таблице на рис. 19.7. Предположите, что, согласно вашей оценке, продолжительность интервала упреждения равняется 4 и вы придерживаетесь стратегии, отвечающей данной оценке. Пусть, однако, фактическая продолжительность интервала упреждения равняется 5. В какой степени возрастет ожидаемое значение средних затрат из-за ошибки, допущенной вами при прогнозировании продолжительности интервала упреждения? Ответьте на аналогичный вопрос в случае, когда вы ошибочно прогнозируете продолжительность интервала упреждения равной L = 6, тогда как в действительности L = 5. (Указание: вычислите ожидаемые средние затраты для случаев L = 4, L = 5, L — 6 и сравните полученные результаты.) ДОПОЛНИТЕЛЬНЫЕ УПРАЖНЕНИЯ
52. Рассмотрим модель ЭВПР, согласно которой средние затраты на единичном отрезке времени определяются приведенной в разд. 19.5 формулой (6) (при оптимальном s = 0). В каждом из указанных ниже случаев предложите метод нахождения оптимального размера заказываемой партии изделий, исходя из условия, что фирма-поставщик при больших объемах закупок идет на определенную скидку цен. а) Пусть Cj — стоимость одного изделия при условии, что указанный в заказе объем Q удовлетворяет неравенству q, ^ Q < < c}-_i Js 0. Предположите также, что h = *Н-Cj. Проиллюстрируйте предложенный вами метод на примере, характеризуемом следующими данными: К = 32, М = 9, Н ~ 1 и с 4 = 16 при 0 «? < 7, с2 = 9 при 7 « ? < 7 5 и с 3 = 1 при 75 < Q. Опре-
268
ГЛАВА 19
делите, изменится ли решение, если с 2 = 9 при 7 ^ ( ) < 5 0 и с з = 1 при 50 ^ Q. (Указание', поясните используемый вами метод графически; для каждого значения с7- постройте график для усредненных затрат как функции Q.) б) Пусть суммарные затраты С (Q), связанные с закупкой у фирмы-поставщика Q изделий, имеют следующий вид: C(Q)=C (qj) + с, (Q - q,)
при
Ч]
^ Q < qj+l,
где Cj > Cj_i ^ О и С (0) = 0. Другими словами, продажная цена снижается с увеличением заказываемой партии изделий. Проиллюстрируйте предложенный вами метод определения оптимальной стратегии пополнения запасов, используя данные п. а) и положив h — Н -C(Q)/Q. (Указание: поясните применяемый вами метод путем построения для различных значений с/ графиков, позволяющих в каждом случае проследить за поведением средних затрат как функции Q.) 53. Рассмотрите фирму, покупающую п различных видов изделий у единственной фирмы-поставщика и заинтересованную в определении оптимальной продолжительности (Т) отрезка времени между последовательными оформлениями заказов на все п видов изделий. Обозначим норму спроса на /-и вид изделий через Af/, стоимость изделия /'-го вида — через с7-, а затраты на содержание изделия /'-го вида — через hj. Предположите, что если п = 1, то соответствующие средние затраты на единичном отрезке времени определяются приведенной в разд. 19.5 формулой (6) (при s = 0). При п > 1 по-прежнему исходите из предположения, что накладные расходы, относимые к заказу в целом (который включает теперь п различных наименований), равняются К. а) Выведите формулы, позволяющие определить оптимальные значения Т и Q для каждого вида изделий. б) Используйте формулы, полученные в п. а), и найдите численные решения в случае, когда п = 2, К = 32, М\ = 9, М2 = 36, hj — I и Cj = 0 (при любом значении /'). в) Предположите, что фирма может заказывать оба подразумеваемых в п. б) изделия (/' = 1, 2; га = 2) раздельно, но должна иметь в виду, что накладные расходы, связанные с реализацией заказа на поставку изделий /'-го вида, определяются соотношением Kj = = 32 -г, где г > 0. Определите, при каком значении г стратегия одновременной закупки изделий обоих видов и стратегия раздельных закупок упомянутых изделий экономически равнозначны (т. е. приводят к одинаковым суммарным затратам). 54. Рассмотрим случай, когда численные значения фигурирующих в модели параметров определяются соотношениями (23) из разд. 19.6. Предположим, что фирма располагает складскими помещениями и отделами сбыта в двух удаленных друг от друга географических пунктах. Допустим, что данные, рассчитанные на основе (23), применимы как в условиях первого, так и в условиях второго
СТОХАСТИЧЕСКИЕ
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ
269
пунктов, а уровни спроса в упомянутых пунктах независимы. Предположим, что фирма решает дилемму: либо складировать товары в обоих пунктах и, таким образом, придерживаться стратегии (28) и идти на затраты, вдвое превышающие затраты, определяемые формулой (9), либо ориентироваться на совокупный рынок сбыта и складировать товары в одном месте. в) Выведите оптимальную стратегию для варианта совокупного учета спроса клиентуры. Каково различие в затратах, соответствующих указанным выше вариантам дислокации складских запасов? [Указание: вычислите распределение вероятностей для суммы независимых уровней спроса, отвечающих упомянутым географическим пунктам, на интервале упреждения, учитывая, что региональный спрос характеризуется распределением вероятностей, указанным в (23).) б) Выполните анализ, предусмотренный п. а), используя данные (39) и метод, основанный на аппроксимации pL (д^) нормальным распределением. (Указание: учтите, чт-о дисперсия для суммы двух независимых случайных переменных равняется сумме дисперсий, найденных отдельно для каждой случайной переменной.) 55. Если довольствоваться более грубым приближением, то выражение для ожидаемых средних затрат на единичном отрезке времени [аналогичное приведенному в разд. 19.6 выражению (16)] можно получить следующим образом. Предположим, что самый низкий уровень запасов равняется в среднем s — Е [qz], так что в некотором приближении средний объем запасов равняется сумме (Q/2) -++ s—E[qL]. а) Определите вид функции затрат [аналогичный формуле (16), приведенной в разд. 19.6]. б) Выведите формулы для оптимального объема заказа и критического уровня запасов и сравните их с соответствующими формулами (17)—(20). 56. а) Покажите, как модифицируется процедура вывода формул (9)—(16) из разд. 19.6, если неудовлетворенные в течение интервала упреждения заказы теряются и, следовательно, уровень запасов никогда не падает ниже нуля. В частности, определите при указанных условиях ожидаемые средние затраты в единицу времени и выведите формулы, позволяющие определять оптимальное значение объема заказа на пополнение запасов и оптимальное значение критического уровня запасов. Полученные результаты сравните с выражениями (16)—(20). б) Выведите формулу для ожидаемых средних затрат [см. п. а)], взяв отношение ожидаемых затрат на отрезке времени, заключенном между последовательными оформлениями заявок на пополнение запасов, к ожидаемой продолжительности упомянутого временного отрезка. (Исходите из предположения, что продолжительность интервала упреждения постоянна и что в любой момент времени в процессе исполнения не может находиться более одного заказа.)
ГЛАВА 20
Модели массового обслуживания
20.1. ВВЕДЕНИЕ
Системы массового обслуживания, как и системы управления запасами, встречаются повсюду. Мы сталкиваемся с ними буквальнона каждом шагу. Действительно, вряд ли найдется среди читателей такой, которому не приходилось бы за прошедшие два-три дня стоять в очереди в ожидании обслуживания. Это могло произойти в кафетерии, магазине, парикмахерской, библиотеке, на бензозаправочной станции и т. д. К числу менее очевидных примеров можно отнести такие ситуации, когда приходится задерживаться перед светофором, ожидать получения справки по телефону или, скажем, ждать прибытия утренней почты. Для всех упомянутых выше ситуаций характерно наличие индивидуумов или объектов, нуждающихся в обслуживании, и возникновение задержек в тех случаях, когда механизм обслуживания занят. Такого рода процессы образования очередей или задержек в обслуживании (заторов) удается весьма эффективно анализировать методами исследования операций. Однако расходы, связанные с проведением научного анализа той или иной практической задачи массового обслуживания, можно (как и в любой другой области организационного управления) считать оправданными лишь при том условии, что экономические последствия управляющих решений в рассматриваемой сфере деятельности носят весьма существенный характер. Как показывает опыт, практическое применение моделей массового обслуживания экономически выгодно при решении двух типов задач. (Мы вскоре убедимся, что между ними нельзя провести четкой границы, так что могут существовать различные промежуточные варианты.) К первому типу относятся задачи проектирования и эксплуатации систем, состоящих из большого числа тождественных или сходных элементов. В качестве примеров, иллюстрирующих характер такого рода задач, можно назвать задачу определения количества контрольно-расчетных прилавков в каждом из продовольственных магазинов, которые принадлежат фирме, имеющей разветвленную торговую сеть; задачу определения количества бензоколонок и численности обслуживающего персонала на каждой бензозаправочной станции крупной нефтяной компании;
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
271
задачу определения количества магистральных линий связи на каждой местной автоматической телефонной станции; задачу определения численности персонала, занятого ремонтом арендуемого фотокопировального оборудования в каждом из крупных населенных пунктов, обслуживаемых рассматриваемой фирмой. Несмотря на то что условия функционирования различных подсистем большой операционной системы массового обслуживания могут оказаться неодинаковыми, при анализе, ориентированном на оптимизацию количественных показателей, относящихся к различным однотипным компонентам системы (таким, как количество узлов обслуживания, численность обслуживающего персонала и т. п.), можно использовать совершенно идентичные процедуры. Следовательно, разработанные однажды методология исследования и метод решения задачи можно применять многократно, ибо в каждом конкретном случае фирме требуется лишь учесть соответствующие численные значения параметров, фигурирующих в используемой модели. Ко второму типу можно отнести задачи, связанные с определением количества и грузоподъемности скоростных лифтов в проектируемом многоэтажном здании для административных подразделений фирмы, задачи отыскания оптимального комплекта оборудования для большого сталелитейного завода, задачи определения количества и габаритных характеристик взлетно-посадочных полос в крупном аэропорту и т. п. Заканчивая обсуждение вопроса о сферах применения теории массового обслуживания, приведем два примера, указывающих на существование задач, в которых сочетаются элементы и особенности как систем первого, так и систем второго типа. Это задачи определения количества регистрационных пунктов в помещении аэровокзала и количества пожарных машин в каждом из пожарных депо крупного населенного пункта. Читателю предлагается вспомнить о своей собственной деятельности в течение нескольких минувших дней и выделить среди всех ситуаций, когда ему пришлось стоять в очереди, те, которые, по его мнению, действительно заслуживают анализа на научной основе. В этой связи читателю следует попытаться ответить на следующие вопросы: с каким из упомянутых выше типов задач ассоциируется каждая из этих ситуаций? Какие организационно-управленческие меры могли бы быть приняты в результате системного анализа каждой из названных ситуаций? Как можно было бы отличить правильное управляющее решение от ошибочного? Некоторые общие соображения. Существует множество разнообразнейших моделей массового обслуживания. Даже книга в несколько сотен страниц не смогла бы вместить в себя исчерпывающий обзор всех теоретических результатов, относящихся к моделям массового обслуживания. Но даже если бы такой обзор и удалось составить, через один-два года его пришлось бы существенно дополнить,
272
ГЛАВА 20
чтобы охватить новые результаты непрерывно ведущихся исследований, фронт которых постоянно расширяется. Поэтому в настоящей главе и приложении III нам, возможно, не удастся охватить все виды моделей массового обслуживания. Вместе с тем мы рассматриваем в данной главе наиболее типичные и важные элементы анализа систем массового обслуживания и методы их моделирования, а также приводим ряд конкретных моделей, которые относятся в настоящее время к разряду основных моделей в теории массового обслуживания. В данной главе и приложении III приведено весьма большое число моделей массового обслуживания, поддающихся количественному анализу. Системы массового обслуживания, представленные этими моделями, выглядят на фоне реальных ситуаций сильно упрощенными. Здесь мы хотим лишь показать, что изучаемые нами относительно простые модели могут быть использованы и для получения качественного или приближенного количественного представления о поведении систем, обладающих более сложной структурой. В следующей главе мы познакомим читателя с возможностями применения для анализа сложных систем массового обслуживания методов имитационного моделирования с помощью ЭВМ. В предыдущих главах все наиболее важные результаты были доказаны нами по крайней мере на эвристическом уровне. Всякий раз, когда для анализа задачи требовался слишком сложный математический аппарат по сравнению с тем, которым мы пользуемся в настоящей книге, мы ограничивались чисто словесным обоснованием окончательных результатов, имея при этом в виду, что строгое их доказательство также возможно. При этом мы исходили из предположения, что читатель сможет глубже понять приводимые нами результаты, если он «прочувствует» метод их получения. Такой стиль изложения будет иногда использоваться и в разделах, посвященных моделям массового обслуживания. Однако следует заметить, что, на наш взгляд, изложение математических приемов, используемых при решении задач массового обслуживания, нередко не столь уж существенно для восприятия получаемых результатов, если иметь в виду чисто прикладные интересы читателя. (Математические методы, с помощью которых анализируются системы массового обслуживания, разумеется, представляют серьезный интерес для операционистов-теоретиков, которым, возможно, придется применять аналогичные методы для решения совершенно иных задач массового обслуживания.) Поэтому некоторые формулы в данной главе приводятся как готовые рецепты. Особое значение мы придаем здесь анализу моделей на чувствительность. При ознакомлении с излагаемым ниже материалом серьезное внимание должно быть уделено изучению особенностей фигурирующих в различных моделях предположений и анализу влияния этих особенностей на качественные характеристики окончательных результатов. Необходимо также следить за тем, как сказывается
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
273
на решении той или иной задачи вариация численных значений различных параметров модели. Читатель скоро увидит, что научный анализ процессов массового обслуживания во многих случаях носит весьма сложный характер, так что при оценке влияния на режим функционирования системы таких показателей, как частота поступления заявок на обслуживание *), время обслуживания поступающих заявок, количество и размещение различных компонентов обслуживающего комплекса и т. д., далеко не всегда можно полагаться на одну лишь интуицию. В отличие от остальных глав в настоящей главе и в приложении III основное внимание уделяется операционным характеристикам моделей. К этим характеристикам относятся средняя длина очереди 2 ), среднее время ожидания обслуживания, вероятность того, что все компоненты обслуживающей системы окажутся занятыми, а также другие показатели функциональной эффективности системы. После оценки такого рода характеристик можно переходить к построению соответствующей экономической модели и к последующим процедурам поиска оптимальных управляющих решений. Степень сложности задачи оптимизации зависит от структурных особенностей самой системы массового обслуживания и от того, насколько широк диапазон альтернатив, которые мы намерены проанализировать. Так, например, если требуется выбрать один из двух конкретных вариантов решения, определяющего число контрольно-расчетных прилавков в магазине самообслуживания, то оптимальное решение находится с помощью простого сравнения количественных характеристик каждого из рассматриваемых вариантов. Однако если речь идет, скажем, о разработке системы управления воздушным движением для оживленного аэропорта, то для решения задачи может потребоваться более сложный метод оптимизации по сравнению с методом, который заключается в рассмотрении каждого из допустимых вариантов, ибо число возможных вариантов в этом случае может оказаться неограниченно большим. Пока не существует единого подхода к решению задач оптимизации в сфере массового обслуживания. В большинстве случаев для решения каждой конкретной задачи применяется метод оптимизации с узкой целевой установкой (т. е. метод, пригодный для решения только данного класса задач). Однако в настоящее время ведутся интенсивные научные исследования, ориентированные на обобщение методов динамического программирования (аналогичных рассмотренному в гл. 18), что создаст предпосылки для разработки единой методологической основы теории массового обслуживания. *) Наряду с термином «заявка на обслуживание» нами часто будет использоваться идентичный термин «требование». Оба термина получили в отечественной литературе по исследованию операций одинаково широкое распространение.— Прим. перев. а ) Под длиной очереди понимается число клиентов (индивидуумов или объектов), ожидающих обслуживания.— Прим. перев.
274
ГЛАВА 20
20.2. КЛАССИФИКАЦИЯ МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
Прежде чем приступать к изучению методов решения конкретных задач массового обслуживания, полезно ознакомиться с некоторыми общими характеристиками фигурирующих в этих задачах функциональных систем. В данном разделе излагаются основные концепции теории массового обслуживания и приводится соответствующая терминология, причем приводятся термины, получившие достаточно широкое распространение. В конце раздела дается краткое описание содержания последующих разделов настоящей главы. Систему массового обслуживания можно описать, задавая следующие ее компоненты: 1) входной поток, т. е. поток поступающих требований или заявок на обслуживание; 2) дисциплину очереди; 3) механизм обслуживания. В данном разделе мы обсуждаем каждый из указанных выше компонентов в общем плане. В последующих разделах в процессе анализа задач частного характера все исходные предпосылки формулируются математически в более конкретном виде. Входной поток. Для описания входного потока обычно требуется задать вероятностный закон, управляющий последовательностью моментов поступления требований на обслуживание, и указать количество таких требований в каждом очередном поступлении. Так, например, требования на обслуживание в парикмахерской или в ресторане могут поступать в среднем каждые 10 мин. При этом в условиях парикмахерской каждый раз поступает единичное требование (клиенты приходят в парикмахерскую по одному), а в условиях ресторана могут поступать как единичные, так и групповые требования (посетители могут входить в ресторан как по одному, так и группами). (Системы, в которых требования могут поступать пакетами, содержащими более одной заявки, будем называть системами с групповым обслуживанием.) Длительности интервалов между последовательными поступлениями требований во многих случаях практически являются статистически независимыми и ведут себя стационарно в течение продолжительного периода времени, хотя, разумеется, возможны ситуации и совершенно иного характера. Диаметрально противоположными по своему характеру являются, с одной стороны, потоки, в которых моменты поступления требований строго предопределены, и, с другой стороны, потоки, в которых длительности интервалов между поступлениями требований являются полностью независимыми. (Точное определение понятия статистической независимости событий приводится в следующем разделе.) Источник, генерирующий требования, обычно считают неисчерпаемым. В качестве примера, иллюстрирующего систему массового обслуживания с источником требований неограниченной мощности, можно привести крупную железнодорожную станцию. В ряде случаев мощностные показатели источника требований на обслуживание вызывают необходимость в моделировании, учиты-
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
275
вающем их ограниченность. К числу систем массового обслуживания с источником требований ограниченной мощности относится, например, парк станков какого-либо завода, ремонт которых при их неисправности производит специальная механическая мастерская. В некоторых случаях при наличии большой очереди требование может отказаться от ожидания (т. е. в очередь не становится). В зависимости от обстоятельств оно может поступить на вход обслуживающей системы позднее. В ряде случаев требование не может встать в очередь из-за отсутствия свободных мест в блоке ожидания. Таким образом, характеристики входного потока (т. е. потока заявок на обслуживание) частично зависят от состояния самой обслуживающей системы. Дисциплина очереди. Данная характеристика позволяет описать порядок обслуживания требований, поступающих на вход системы. Чаще всего используется дисциплина очереди типа: первым пришел— первым обслуживаешься. Такой порядок обслуживания с точки зрения математического моделирования является наиболее простым; следует также заметить, что он имеет отношение лишь к таким ситуациям, когда требования в ожидании обслуживания выстраиваются в ряд. Читателю из его личного опыта известно, что возможны многочисленные виды дисциплины очереди, отличающиеся от упомянутой выше. Иногда используется дисциплина «пришел последним— обслуживаешься первым». Посмотрите, например, что происходит, когда вы входите первым в совершенно пустой лифт на одном из верхних этажей многоэтажного здания: по мере того как лифт начинает спускаться, он заполняется теми, кто вошел в него позднее. Дисциплину очереди в данной ситуации вполне можно отнести к типу «пришел последним — обслуживаешься первым», если обслуживание связать с очередностью вашего выхода из лифта, когда он прибывает на первый этаж. В некоторых случаях порядок обслуживания является фактически случайным. Он часто практикуется, например, школьными учителями при опросе учеников. Иногда дисциплина очереди строится по некоторой системе приоритетов (так, например, в случае, когда принимаются меры по спасению пассажиров тонущего корабля, в спасательные шлюпки первыми сажают женщин и детей). Наконец, по тем или иным соображениям клиент может отказаться от ожидания и принять решение покинуть очередь до того, как его успеют обслужить (т. е. имеет место очередь с ограниченным временем ожидания поступающих требований). Механизм обслуживания. Обслуживающий механизм аналогично входному потоку требований характеризуется продолжительностью процедур обслуживания и количеством требований, удовлетворяемых в результате выполнения каждой такой процедуры. В приведенном выше примере, где речь шла об обслуживании клиентов в парикмахерской или в ресторане, процедура обслуживания счи-
276
ГЛАВА 20
тается завершенной, когда клиент (а в случае обслуживания в ресторане, возможно, и целая группа клиентов) покидает соответствующее заведение после предоставления ему услуг. Продолжительность интервала времени, требуемого для реализации процедуры обслуживания, частично зависит от запросов клиента (или группы клиентов). Но она может зависеть также и от состояния самой обслуживающей системы; так, например, обслуживающий персонал может форсировать процедуры обслуживания, если обслуживание ожидает большое число клиентов. Как и продолжительности интервалов между поступлениями требований, длительности обслуживания в каждой из обслуживающих точек могут (хотя это и не обязательно) описываться с помощью независимых случайных переменных с идентичными распределениями вероятностей их численных значений. В ряде случаев приходится также учитывать вероятность выхода обслуживающего прибора *) из строя по истечении некоторого ограниченного интервала времени. Для описания механизма обслуживания требуется также указать количество и взаимное расположение обслуживающих приборов или каналов. Так, например, прилетев из Нью-Йорка в аэропорт Лондона, пассажир должен пройти там так называемую паспортную проверку. При этом все пассажиры выстраиваются в одну линию и каждый из дождавшихся своей очереди пассажиров направляется к одному из освободившихся чиновников, производящих проверку паспорта. Совершенно иная картина наблюдается, например, в часы пик в банке, когда очереди образуются ко всем без исключения кассирам. В этом случае посетитель должен выбрать одну из очередей и ожидать обслуживания со стороны вполне определенного кассира. Если ваш выбор оказался неудачным, пребывание в очереди может отнять у вас даже больше времени, чем у некоторых из пришедших после вас, которым посчастливилось стать в более «быстрые» очереди. (Если очереди не слишком велики, можно схитрить, перейдя от выбранного вначале окна к другому, возле которого очередь стала короче.) В каждом из приведенных выше примеров приборы (или каналы) функционируют параллельно. Существует также множество систем массового обслуживания, в которых приборы расположены последовательно, так что клиент вынужден переходить от одного прибора к другому, иногда простаивая возле каждого из них в очереди. К числу такого рода систем относится, например, предприятие с мелкосерийным производством, где для изготовления партии заказанных изделий они должны пройти последовательную обработку в ряде цехов или мастерских. Еще одна ситуация, для которой характерно последовательное расположение обслуживающих приборов, возникает при движении *) Термин «обслуживающий прибор» следует понимать в его самом общем смысле. Например, в случае ожидания обслуживания в ресторане прибором является официант.— Прим. перев.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
277
автомобиля по одной из городских магистралей с большим количеством регулируемых перекрестков, что вызывает неоднократные вынужденные остановки машины перед красным светофором. Об анализе систем массового обслуживания. Проведенное в предыдущих подразделах краткое обсуждение различных типов систем массового обслуживания носило явно фрагментарный характер. Но и его достаточно, чтобы представить, насколько многообразно и многочисленно семейство таких систем и соответствующих им математических моделей. Каждый из возможных вариантов нетрудно описать на строгом математическом языке; однако это часто почти ничего не дает, если оценивать результаты, получаемые на основе такого рода описаний, с практической точки зрения. Поэтому при анализе систем массового обслуживания в большинстве случаев практикуется комбинированное применение следующих двух подходов к решению такого рода задач. Первый подход заключается в использовании для приближенных описаний реальной системы простых математических моделей, наподобие тех, что приводятся в данной главе. Затем, располагая результатами анализа исходных простых моделей и используя эти результаты в качестве некоторого ориентира, операционист может разработать имитационную модель, которая с помощью ЭВМ позволит учесть те аспекты задачи, которые, являясь существенными, в то же время трудно поддаются анализу на первом этапе математического моделирования. Поскольку методам имитационного моделирования посвящена гл. 21, в настоящей главе они больше не упоминаются. Ответ на вопрос о том, какие операционные характеристики являются наиболее важными для формирования управляющих решений, разумеется, может быть дан лишь с учетом конкретных условий задачи. Однако следует отметить, что операциониста, как правило, интересуют распределения вероятностей для числа поступивших в систему требований и для длительностей их ожидания или по крайней мере средние значения случайных переменных, описывающих эти характеристики, на большом отрезке времени. Кроме того, иногда требуется знать вероятность того, что все обслуживающие приборы окажутся свободными или занятыми; распределение вероятностей для продолжительности свободных или, наоборот, занятых периодов; вероятность того, что длина очереди (число ожидающих требований) превысит некоторое наперед заданное число, а также распределение вероятностей для интервала между последовательными моментами завершения процедур обслуживания. Если модель массового обслуживания не очень сложна, то для всех упомянутых выше характеристик удается получить строгие, записанные в явном виде аналитические выражения, весьма удобные для вычислений; именно так обстоит дело в настоящей главе. Однако по мере усложнения условий задачи эти показатели нередко удается выразить лишь в виде неявных функций фигурирующих в задаче переменных т. е. представить с помощью так называемых трансформ. Ряд
278
ГЛАВА 20
примеров, иллюстрирующих это положение, приводится в приложении III. В предыдущем разделе подчеркивалось, что операционные методы исследования систем массового обслуживания ориентированы на оптимизацию соответствующих управляющих решений. Читателю рекомендуется проанализировать несколько примеров из данного и предшествующего разделов и описать в каждой из изложенных ситуаций то множество возможных вариантов действий, которое целесообразно рассматривать при проектировании операционной системы. При этом обнаружится, что практически в каждой из этих ситуаций руководитель должен принимать во внимание все три компонента системы массового обслуживания: входной поток требований на обслуживание, дисциплину очереди и механизм обслуживания. Более того, между различными вариантами управляющих решений существует ряд сложных взаимосвязей. Например, среднюю продолжительность ожидания для требования на обслуживание можно уменьшить путем изменения частоты поступлений требований на вход обслуживающей системы, увеличением числа обслуживающих приборов, использованием более быстродействующих приборов, а также путем сокращения разбросов времен обслуживания. Вопросы об относительной эффективности каждой из этих возможностей обсуждаются в последующих разделах. Оставшуюся часть данной главы можно рассматривать как иллюстрацию метода синтеза систем. В следующем разделе мы приступаем к описанию процесса поступления требований на обслуживание во входной контур системы. Мы рассматриваем при этом вероятностные характеристики, пожалуй, наиболее важного в теории массового обслуживания процесса поступления, а именно пуассоновского процесса. В разд. 20.4 проводится исследование временнйх показателей, характеризующих процесс обслуживания требований. Классический вариант синтеза описан в разд. 20.5, где рассматривается система с одним обслуживающим прибором. Обобщенная модель, описывающая систему с несколькими обслуживающими приборами, приводится в разд. 20.6. В конце главы рассматривается самый общий вид модели поступления и обслуживания требований; с помощью этой модели можно (как частные случаи) получить многие из результатов, приведенных в разд. 20.3—20.6. 20.3. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ ДЛЯ ДЛИТЕЛЬНОСТЕЙ ИНТЕРВАЛОВ МЕЖДУ ПОСЛЕДОВАТЕЛЬНЫМИ ПОСТУПЛЕНИЯМИ ТРЕБОВАНИЙ НА ОБСЛУЖИВАНИЕ
Начиная с данного момента и далее мы будем отождествлять событие, которое описывается термином «поступление требования», с фактом прибытия в систему одного нуждающегося в обслуживании
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
279
клиента. (Случай группового обслуживания рассматривается лишь в упражнении 34.) Механизм поступления требований удобнее всего описывать, задавая распределение вероятностей для длительностей интервалов времени между последовательными поступлениями требований на обслуживание. Предположим, что продолжительности интервалов между поступлениями требований статистически независимы, определяются одним и тем же распределением вероятностей и описываются некоторой непрерывной функцией, представляющей собой плотность распределенияу Такого рода входной поток требований представляет собой типичный пример так называемого процесса восстановления, а последовательность поступлений является иллюстрацией так называемой последовательности рекуррентных событий. (Пусть / (f) есть плотность распределения продолжительностей (it) интервалов между любой парой смежных поступлений (при этом t^Q). Определим также величину 1/А как среднее значение длительности временного интервала между поступлениями требований, так что К можно интерпретировать как среднее число поступлений в единицу времени, или как среднюю частоту поступлений. Если функция / (t) задана, значение А выражается через математическое ожидание оо
\ if (t) dt == 1/А (средняя длительность интервала (1) о между поступлениями). Так, например, если единицей времени является 1 ч, а А = 4 есть среднее количество поступлений в течение часа, то 1/А = 0,25 ч, т. е. в среднем в течение каждой четверти часа в систему поступает одно дополнительное требование. Аналогично, если каждые 10 мин в систему поступает в среднем одно требование, то частота поступления А равняется 0,1 требование/мин. Случайные поступления. Наиболее важный пример распределения длительностей интервалов между поступлениями требований соответствует случаю совершенно случайных поступлений. Термин «совершенно случайный» означает, что вероятность поступления требования в любом достаточно малом интервале (Т, Т + К) зависит только от длины интервала h и не зависит ни от положения на оси времени «стартовой» точки Т, ни от протекания процесса поступлений требований на обслуживание в моменты времени, предшествующие Т. Другими словами, входной поток является стационарным (или, как его нередко называют, однородным) и не обладает памятью. Ниже мы дадим строгое доказательство того, что предположение о совершенно случайном характере поступлений эквивалентно записи / (t) = Ае-м, t > О (экспоненциальное распределение со средним (2) 2 значением 1/А и дисперсией 1/А. ),
ГЛАВА 20
280
0,5
1,0
1,5
2,0
2,5
3,0
3,5
Р и с . 20.1. Экспоненциальное распределение.
где е — основание натурального логарифма (е = 2,71818 . . .). Ряд графиков экспоненциального распределения, соответствующих различным значениям К, приведен на рис. 20.1. Для проверки того, что экспоненциальное распределение не обладает памятью, допустим, что стартовой точкой является точка t = 0. Тогда вероятность отсутствия поступлений на интервале (О, Т) равняется вероятности того, что первое поступление имеет' место после момента времени Т: -е-™.
(3)
При этом условная вероятность отсутствия поступлений на интервале (О, Т + К) при условии, что не было ни одного поступления
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
281
на интервале (О, Т), по определению равняется 00
(4) и
I Ье- dt Т
т. е. зависит только от h. Согласно (4), вероятность отсутствия поступлений на интервале (Г, Т + h) остается одной и той же независимо от того, отсутствуют ли поступления на интервале (О, Т) или в момент времени Т имеет место поступление требования и, следовательно, наблюдается акт возобновления потока, Существует другой способ доказательства того, что события, фигурирующие в экспоненциальных процессах, носят совершенно случайный характер_Л Здесь идея доказательства излагается грубо приближено, но это доказательство можно сделать и абсолютно строгим, f Пусть на интервале (О, Т) количество поступлений равняется п. Тогда, если длительности интервалов между последовательными поступлениями распределены по экспоненциальному закону, моменты поступлений распределены на интервале (О, Т) взаимонезависимо и равномерно. Эти соображения можно положить в основу целого ряда статистических испытаний, позволяющих установить, насколько адекватно экспоненциальное распределение описывает реальные процессы формирования очереди на входе системы массового обслуживания. Свойства экспоненциального распределения длительностей интервалов между последовательными поступлениями становятся более Ul прозрачными, если воспользоваться разложением e~ в' ряд Тейлора'Р
Г Отсутствие поступлений"] в любом интервале, =е-м = i_ имеющем длину h J
L
(5)
Для достаточно малых положительных значений h член 1 — АЛ в разложении (5) превосходит по своему значению сумму остальных членов ряда. Следовательно, для достаточно малых значений h вероятность, определяемая соотношением (5), может быть аппроксимирована суммой двух первых членов разложения. Таким образом, для достаточно малых положительных значений h будем иметь Отсутствие поступлений Т в любом интервале, име- яа 1 — Kh. ющем длину h —
-J
(6)
Весьма наглядный, хотя и не совсем корректный, способ обоснования правомерности очередного математического хода заключается в принятии следующего допущения: на интервале достаточно малой продолжительности h количество поступлений не превышает единицы [т. е. количество поступлений внутри достаточно малого интервала
282
ГЛАВА 20
(Т, T-\-h) равняется либо нулю, либо единице]. Поскольку приближенная формула для вероятности отсутствия поступлений на интервале (Т, Т-\-К) имеет вид (6), мы приходим к следующему выражению: Р
Г Одно поступление | в любом интервале, I ^> Kh [имеющем длину h \
(для достаточно малых значений k). (7)
Более последовательный метод вывода формулы (7) связан с разложением в ряд Тейлора точного выражения для вероятности единичного поступления в интервале (Т, Т-}-h); после этого потребовалось бы показать, что для достаточно малых значений h в упомянутом разложении можно пренебречь всеми членами, исключая АЛ (как бесконечно малыми более высокого порядка). В данной главе символ » всюду означает, что в разложении функции в ряд мы пренебрегаем членами «более высокого порядка малости». Допустим, например, что К равняется четырем поступлениям в час. Тогда вероятность отсутствия поступлений на интервале 0,1 ч, согласно (5), равняется 0,96079, а согласно приближенной формуле (6), 1 — 0,04 = 0,96; вероятность одного поступления на указанном интервале, согласно (7), равняется 0,04. Если плотность распределения длительностей интервалов между поступлениями требований на обслуживание имеет экспоненциальный вид (2), то плотность распределения полного времени у для произвольным образом выбранного ряда из п последовательных поступлений определяется следующей формулой: g(y}=
ft—1)!—•
#>° (гамма-распределение),
(8)
где п — положительное целое число. Величину у можно интерпретировать как сумму п независимых выборок из экспоненциального распределения (2). Тогда Полное время для любой последовательности из п поступлений равно .или меньше Т
тг-1
j=0
в чем легко убедиться, прибегнув к многократному интегрированию по частям. Наконец, следует отметить, что предположение об экспоненциальном характере распределения длительностей интервалов между поступлениями равносильно следующему утверждению: распределение вероятностей попадания п поступлений в произвольным образом выбранный интервал продолжительностью Т является пуассо-
МОДЕЛИ МАССОВОГО
ОБСЛУЖИВАНИЯ
283
невским, т. е. п поступлений в любом интервале, длина кото- | = рого равняется Т При этом
Е [п \ Т] = КТ
—
и
-кг
, где п = 0, 1, 2 (пуассо-
новское распределение).
(10)
Var [п \ Т] = КТ.
(11)
Теперь нам ясно, почему термины «экспоненциальный закон распределения поступлений» и «пуассоновский процесс» являются синонимами. (Иногда используется термин «марковский процесс» или, в сокращенной записи, «М-процесс» 1).) Легко убедиться, что из (9) и (10) вытекает следующее равенство: Полное время для любой последовательности из п поступлений равно или меньше Т
Число поступлений в любом интервале продолжительности Т равно или больше п
.(12)
Равенство-(12) фактически имеет место не только дляпуассоновского, но и для любого рекуррентного процесса формирования входного потока при условии, что стартовая точка указанного интервала совпадает с одним из моментов поступления. Приведенные выше формулы находят непосредственное применение для описания процессов чистого рождения. Рассмотрим систему, в которой в начальный момент 0 требования отсутствуют. Предположим, что процесс поступления (рождения) является пуассоновским, и допустимым, что поступившие в систему требования на выходе не появляются (т. е. остаются в системе в течение бесконечно большого интервала времени). Тогда пуассоновское распределение (10) определяет вероятность того, что в момент Т в системе окажется п требований, а формула (9) представляет собой плотность вероятности для полного времени поступления первых п требований. Попытаемся теперь дать краткое (но более строгое) обоснование того, что из некоторого вполне определенного ряда предположений относительно свойств процесса поступления вытекает показательное распределение длительностей интервалов между поступлениями, и входной поток, таким образом, является пуассоновским. Мы исходим из следующих постулатов: 1
) Пуассоновский процесс является. частным случаем разрывных цепей Маркова. Поэтому всякий раз, когда распределение вероятностей определяется формулой (10), следует употреблять термин «пуассоновское распределение». Что же касается использования сокращенной записи «М-процесс», то ее вряд ли можно считать общепринятой, хотя она и согласуется с так называемыми обозначениями Кендалла.— Прим. перев.
284
ГЛАВА 20
(A) Длительности интервалов между последовательными поступлениями взаимонезависимы и распределены идентичным образом; при этом вероятность поступления требования в интервале (Т, Т + К) зависит лишь от h и не зависит от Т. Плотность вероятности, соответствующую такому характеру входного потока, обозначим через / (t). (Б) Существует некоторая ненулевая вероятность поступления в течение любого интервала h > 0. (B) При достаточно малых значениях h количество поступающих заявок не превышает единицы. Предположим для простоты, что система начинает функционировать, начиная с момента 0, причем первое поступление имеет место в момент t(t~> 0). Отсюда следует, что / (t) представляет собой плотность вероятности как для продолжительности интервалов между двумя поступлениями, так и для фактического времени появления первого требования. Определим т r(T) = i-\f(t)dt, (I)
так что /тл — р Г Первое требование поступает "1 |_ после момента Т J.
(II)
Тогда в силу постулатов (А) и (Б) г (Т -f h) = г (Т) -г (К) для любых Г
и h > 0.
(Ill)
Легко доказать, что единственной функцией, удовлетворяющей (III), является г (Т) = е-хт, (IV) где А, есть константа, причем К > 0. Таким образом, т t,
(V)
откуда получаем / (0 = Яе-w,
(VI)
что и требовалось доказать. Определим Рп (Т) = Р [п поступлений в интервале (О, Т)].
(VII)
Пусть t = x есть время первого поступления, причем, согласно постулату (В), в момент х поступает единственное требование.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
285
Учитывая постулат (А), мы можем написать т т Рп (Т) = J P n _, (T-x)f (x) dx = J /Vt (У) f(T-y) dy 6 о для п = 1, 2, . . . ,
(VIII)
где у = Т — х. Используя (VI), получим т Рп (Т) = J Pn-i (У) Ke-W-ti dy.
(IX)
Продифференцировав Рп (Т) но Т, будем иметь *) i(T),
n = l,2, . . . .
(X)
Поскольку РО (Т) = g (Т) = e~XT, уравнение (X) можно решить методом индукции, начиная с п = 1; при этом на каждом шаге нам придется иметь дело с линейным дифференциальным уравнением первого порядка с постоянными коэффициентами. В результате мы придем к решению, которое представляет собой не что иное, как пуассоновское распределение ,
« =0 , 1 , 2 , . . . .
(XI)
Легко убедиться в том, что функция Рп (Т), определяемая формулой (XI), действительно удовлетворяет уравнению (X); для этого достаточно продифференцировать выражение (XI) по Т. Таким образом, формула (X) нами доказана. Случай с такси. Приведем пример, иллюстрирующий свойство экспоненциального распределения «не помнить о прошлом» и одновременно демонстрирующий в некотором смысле парадоксальную ситуацию, которая может иметь место в системах массового обслуживания. Представим себе, что мы пытаемся поймать такси в какомх ) Уравнение (X) получено в предположении, что Я является константой. При анализе процессов рождения Я с более общих позиций может рассматриваться как функция п. Тогда вместо (X) имеет место уравнение
n (Т) + Ьп-iPn-l (Т). При Яп = п-К процесс поступления называется линейным; этот процесс при некоторых начальных условиях описывается так называемым распределением Юла — Фарри, имеющим следующий вид: -ХТ(1-«-ХГ)я'1
при «=1,2 .....
Возможны также нелинейные процессы поступлений, характеризуемые более сложной структурой соответствующих им плотностей распределения. — Прим. перев.
286
ГЛАВА 20
нибудь месте на одной из центральных площадей города. Допустим, что мимо этого места каждые 30 с проходит в среднем одно свободное такси, т. е. средняя продолжительность интервала между появлениями такси в заданной точке равняется 1А = 30 с. Предположим, что мы пытаемся поймать такси, начиная с некоторого произвольным образом выбранного момента времени. Сколько в среднем секунд нам придется ждать появления свободного такси? Многие отвечают, что ждать придется 15 с. Так ли это? Ниже будет показано, что такой ответ был бы правильным лишь при условии, что свободные такси появляются у места, где мы их ловим, строго через каждые 30 с. Если имеет место хотя бы некоторый разброс интервалов между появлениями свободных такси у выбранного нами места, продолжительность нашего ожидания всегда будет больше 15 с. Можно доказать, что если рассматривать систему в произвольный момент времени t, то Средняя продолжительностьинтервала от момента t до ближайшего момента поLявления такси Дисперсия длительности интервала между появлениями такси
(13)
Следовательно, если дисперсия в формуле (13) отлична от нуля, то средняя продолжительность ожидания с момента t до появления первого такси, превышает (1/2) -(1А,). Заметим, что в случае экспоненциального распределения длительностей интервалов между после2 довательными появлениями дисперсия равняется 1А, , и, следовательно, среднее время ожидания с момента t до появления такси равняет2 ся 1Д. Если же дисперсия принимает значения, превышающие 1Д , то среднее время ожидания свободного такси (отсчитываемое от момента t) оказывается на самом деле большим, чем среднее значение длительности интервала между появлениями свободных такси. Этот результат может показаться на первый взгляд несколько удивительным. Распределение Эрланга. Другим важным частным случаем распределения длительностей интервалов между последовательными поступлениями требований на обслуживание является распределение Эрланга *)
г ) Распределение Эрланга иногда называют гс-фазным. Это объясняется тем, что оно описывает процесс обслуживания, в котором требование как бы проходит через п фаз.— Прим. перев.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
287
где п — положительное целое число. Для математического ожидания и дисперсии соответственно имеем Е [t] = 1/Я,
2
Var It] = 1/мХ .
(15)
(Это распределение часто обозначают символом Еп.) Произведя в (14) замену Кп -> X, мы получим гамма-распределение (8). Варьируя надлежащим образом значениями К и п, мы можем использовать распределение Эрланга в качестве хорошего приближения распределений других видов; ряд графиков, иллюстрирующих поведение / (if) при некоторых частных значениях Я, и п, приведен на рис. 20.2. Следует обратить внимание на то, что при п = 1 распределение Эрланга становится тождественным экспоненциальному распределению. Отметим также, что при п ->• оо, когда Var [t] ->- О, распределение Эрланга соответствует случаю регулярного (или строго периодического) поступления, т. е. случаю, когда длительности (1А) интервалов между поступлениями одинаковы и не меняются со временем (т. е. являются константами). Примеры практического применения такого распределения приведены в приложении III. 20.4. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ ДЛЯ ДЛИТЕЛЬНОСТЕЙ ОБСЛУЖИВАНИЯ
Рассуждения, связанные с конкретизацией плотности вероятности для длительностей обслуживания, в значительной степени схожи с рассуждениями, позволяющими установить форму распределения длительностей интервалов между поступлениями требований во входной контур системы. Мы исходим из предположения, что каждый прибор обслуживания (или канал) может в одно и то же время обслуживать только одно требование 1). Допустим, что для каждого рассматриваемого прибора длительности следующих один за другим интервалов обслуживания распределены независимым и идентичным образом и могут быть описаны с помощью плотности распределения, представляющей собой непрерывную функцию. Пусть ,. _
Плотность распределения вероятностей того, что в интервале, продолжительность которого равняется t, будет обслужено одно требование (t 1> 0)
Пусть также оо
["Среднее время]= Г t ,f) df _J_ L обслуживания J J ^ ' 1
) Групповое обслуживание здесь не рассматривается.
(2)
О
0,2
0,4
Of
0,8
1,0
1,2
/,4
1,6
1,8
2,0 2,2
2,6 2,8 3,0
t
13
Р и с . 20.2. Распределение Эрланга при Я, = 1 (а). Распределение Эрланга при К = 0,2 (б).
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
289
так что
[
Число требовании, обслуженных ~1 за единицу времени, в течение кото- . рого прибор занят обслуживанием *) J
(3)
Так, например, если за единицу измерения времени принимается 1 ч и если ц, = 5, т. е. в течение 1 ч действующий обслуживающий прибор успевает обслужить пять требований, то среднее время обслуживания одного требования составляет 1/fi = 0,2 ч. Аналогично, если на обслуживание одного требования в среднем уходит 30 мин, то скорость обслуживания составляет LI = 2 требования в час (при этом в расчет принимается только то время, когда прибор занят обслуживанием). Часто предполагают, что распределение длительностей обслуживания является экспоненциальным:
g (t) = це-v,
г >О
(4)
Основной мотив, побудивший нас принять такое предположение, остается прежним — он заключается в стремлении упростить математическую сторону вопроса. Однако предположение о том, что механизм обслуживания функционирует в режиме экспоненциального распределения, может одновременно служить некоторым ориентиром при анализе операционных характеристик любой системы массового обслуживания, поскольку в нем находят отражение особенности систем «экстремального» типа, т. е. систем, в которых обслуживающие приборы не обладают памятью. В случае показательного распределения длительностей обслуживания вероятность завершения обслуживания клиента в любой последующий интервал времени (t, t-\-h) не зависит от того, сколько времени уже потрачено на обслуживание этого требования. Таким образом, если в момент t требование уже обслуживалось и мы рассматриваем систему в момент (t-\-h), то в силу (4) Обслуживание в интервале (t, t-\-h) I __ не заканчивается J
^h
,_.
Следовательно, при очень малых положительных значениях h п -Г
и
Г Обслуживание в интервале 1 , ,. L (t, t + К) не заканчивается J
,
Обслуживание заканчивается 1 ^ , в интервале (t, t + К) \ J
,
Л/ 1 — Lift
,„,
(Ь)
,„.
) Величину (д, для краткости будем иногда называть скоростью обслуживания, что соответствует ее физическому смыслу.
290
ГЛАВА 20
Рассмотрим следующую модель чистой гибели. Пусть система функционирует начиная с момента t — 0. Предположим, что в момент О в системе находится М требований и что после момента 0 новые требования в систему более не поступают. Допустим, что в системе имеется единственный прибор, скорость обслуживания которого характеризуется показательным распределением (4). Пусть ( Вероятность того, что в момент Т колиРп (Т}= < чество требований, находящихся в систе( ме, равняется п. [Зависимость Рп (Т) от М в принятой нами символике не отражена]. С целью логически последовательного вывода формулы для Рп (Т) можно применить метод, который аналогичен использованному нами при получении формулы (10) (см. конец предыдущего раздела). Однако мы можем достичь того же результата, используя лишь (6) и (7); ниже иллюстрируется именно этот способ получения формулы для Рп (Т), поскольку он оказывается весьма эффективным при анализе более сложных моделей. Как и в предыдущем разделе, мы вычисляем вероятности приближенно, пренебрегая членами более высокого порядка малости. При этом, рассуждая в прежнем духе, мы вновь постулируем, что в течение очень малого интервала времени (Т, Т + h) число событий, состоящих в выходе требований из системы, не может быть больше одного. Это означает, что если в момент Т + h в системе находится п требований, то нами учитываются лишь а) вероятность того, что в момент Т в системе также находилось п требований и ни одно из них не покинуло систему в течение интервала (Т, Т -\- h), и б) вероятность того, что в момент Т в системе находилось п + 1 требований и в течение интервала (Т, Т + h) одно требование выбыло из системы (т. е. имел место один случай выхода). Действительно, при h ->• О вероятностью того, что в интервале (Т, Т + h) наблюдается несколько (более одного) случаев выхода, можно пренебречь как величиной более высокого порядка малости по сравнению с вероятностью того, что в течение указанного интервала не происходит ни одного случая выхода или имеет место единственный случай выхода. Тогда при М> п > 1 Рп (T+h)&(l- |ife) Рп (Т) + (nfc) Pn+i (T).
(9)
Первый член в правой части (9), т. е. величина (1 — [ah) Pn (Т), есть приближенно вычисленная вероятность того, что в интервале (Т, Т -\- h) не была завершена ни одна процедура обслуживания при п требованиях, находившихся в момент Т внутри системы. [Второй член в правой части соотношения (9) читатель сможет интерпретировать самостоятельно.] После перегруппировки слагаемых
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
291
в (9) получим pn(T + h)-Pn(T)
_
p m I и.р
(Т)
(Ю)
так что при h ->• 0 имеем 1) cLJ.
Рассуждая аналогичным образом, можно доказать, что ^=_ М ,Р М (Г)
при п = М.
(12)
Система линейных дифференциальных уравнений (11) и (12) имеет единственное решение
м Р0(Т) = 1—^\Рп(Т)
при и = 0.
(14)
71=1
Распределение, заданное соотношениями (13) и (14), иногда называют усеченным пуассоновским распределением. Если М-я. клиент обслуживается последним, то полное время у его пребывания в системе, включая время, в течение которого этот клиент обслуживался, имеет плотность распределения 2) (гамма-распределение). При этом
V"
'•I'
М
М
Хотя предположение об экспоненциальном характере распределения длительностей обслуживания и представляется с математической точки зрения наиболее удобным, не следует забывать о существовании и других видов распределений. В частности, для некоторых простых моделей массового обслуживания удается получить весьма *) Уравнение (11) описывает лишь частный и самый простейший случай, когда (г является константой, т. е. обслуживающий прибор работает с постоянной скоростью. При более общем подходе к рассмотрению процесса выхода требований ц может рассматриваться как функция п. Тогда вместо (11) имеет место уравнение
dPJdT = - \inPn (Т) + h+iPn+i (Т).
В зависимости от вида функции \ип = ц, (я) различают линейные (если [in = n\i) и нелинейные процессы выхода требований.— Прим. перев. 2 ) В данном случае полное время пребывания клиента в системе обслуживания вычисляется путем суммирования М независимых выборок из множества значений, принимаемых случайной величиной, которая характеризуется показательным распределением.
292
ГЛАВА 20
полезные математические результаты ъ предположении, что длительности обслуживания распределены по закону Эрланга [см. формулу (14) из предыдущего раздела]. Соответствующий пример приводится в приложении III. Модель самообслуживания. Предположим теперь, что в отличие от рассмотренного выше случая (когда система содержала единственный обслуживающий прибор) в момент 0 каждый из М клиентов приступает к самообслуживанию. Допустим, что длительности самообслуживания у каждого из клиентов распределены по уже известному нам экспоненциальному закону (4). Такое предположение в условиях самообслуживания представляется вполне логичным. Рассмотрим очень малый интервал времени (Т, T-\-h), где h > 0. Тогда, поскольку каждый клиент действует в процессе самообслуживания независимым образом, с помощью приближенной формулы (6) получаем *) из п клиентов 1 /, , „ . , м п Г Ни один Р\ « (1 — ufr)ч = 1 — nuh, |_ не покидает систему J ~ Один из п клиентов покидает систему, т. е. заканчивает самообслуживание
,, „ (17)ч
(18)
При этом, учитывая, что h -> 0, мы в процессе обоснования (18) можем ограничиться рассмотрением лишь таких событий, когда на интервале (Т, Т + h) либо ни один из п клиентов не успеваем закончить процедуру самообслуживания, либо заканчивает самообслуживание один из них, т. е. мы пренебрегаем вероятностями того, что в данном интервале самообслуживание заканчивают два или большее число клиентов, считая эти вероятности величинами более высокого порядка малости. Другими словами, если в момент T~\-h в системе находится п клиентов, то предполагается, что можно учитывать лишь а) вероятность того, что в момент Т в ней также было п клиентов и не наблюдалось ни одного случая их выхода из системы, и б) вероятность того, что в момент Т число клиентов внутри системы равнялось п + 1 и наблюдался случай выхода одного клиента из данной системы (при этом должно выполняться условие М > п ^ 0), т. е. Р„ (Т + h) » (1 - йцп) Рп (Т) + (п+\) vhPn+i (Т) (h — очень малая величина).
(19)
Перенесем Рп (Т) в левую часть (19), разделим обе части получаемого в результате соотношения на h и устремим h к нулю; после этого J ) При возведении в п-ю степень двучлена (1 — цй) членами, содержащими hh (k > 1), можно пренебречь как величинами более высокого порядка малости, поскольку h -*- 0.— Прим. перее.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
293
будем иметь i
(Т) при М > п > 0.
(20)
Рассуждая совершенно аналогично, получаем -
= — Mi^PM (Т) при п = М.
(21)
Нетрудно проверить, что решение системы уравнений (20) и (21) имеет вид Рп(Т)=СЪ(е-»т)п(1 - е-^)м~п для п= О, 1, 2, . . ., М (биномиальное распределение). (22) При этом Eln\T]= Me-»T, Var [га | Я = Ме~»т (1 - е-^. (23) Терминология и обозначения. Знакомясь с литературой по теории массового обслуживания, нетрудно заметить, что употребляемая в этой области терминология в определенной степени стандартизирована, а обозначения (которые часто называют обозначениями Кендалла) унифицированы. При этом для обозначения той или иной модели используют три символа: первый характеризует входной поток требований, второй — распределение длительностей обслуживания и третий — число приборов в обслуживающей системе. Приведем перечень общепринятых символов, характеризующих распределения вероятностей, которые ставятся в соответствие моделям массового обслуживания: М — экспоненциальное распределение продолжительностей интервалов между поступлениями требований или длительностей обслуживания (от определяющего слова «марковский») ; D — детерминированное (или регулярное) распределение длительностей интервалов между поступлениями требований или длительностей обслуживания; Еп — тг-фазное распределение Эрланга для длительностей интервалов между поступлениями требований или длительностей обслуживания. [Ряд авторов используют также символ Кп, обозначая им гамма-распределение (15).] GI — рекуррентный характер входного потока *) без каких-либо специальных предположений относительно функции распределения; G — общий вид распределения длительностей обслуживания (т. е. не делается никаких конкретизирующих предположений относительно функции распределения). Так, например, для модели с пуассоновским входным потоком, экспоненциальным распределением длительностей обслуживания и 1
) То есть потока требований, длительности интервалов между поступлениями которых статистически независимы и имеют одинаковое распределение.— Прим. пер ее.
294
ГЛАВА 20
единственным обслуживающим прибором символическая запись имеет вид M/Mli. Если бы входной поток был детерминированным, а прочие характеристики модели оставались прежними, символическое представление модели имело бы вид DIMli; если бы вместо одного обслуживающего прибора только что упомянутая система располагала S приборами, то в обозначениях Кендалла символическое представление модели приняло бы вид DIMIS. 20.5. ОДНОКАНАЛЬНАЯ МОДЕЛЬ С ПУАССОНОВСКИМ ВХОДНЫМ ПОТОКОМ И ЭКСПОНЕНЦИАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ ДЛИТЕЛЬНОСТЕЙ ОБСЛУЖИВАНИЯ
В большинстве систем массового обслуживания имеется несколько обслуживающих приборов, а дисциплина очереди, как правило, оказывается весьма сложной. Так, например, прежде чем направиться к какому-нибудь контрольно-расчетному прилавку в большом магазине самообслуживания, покупатель вначале посмотрит, сколько человек стоит в каждой очереди и какое количество различных продуктов находится на руках у стоящих. Кроме того, он попытается сообразить, какой из контрольно-расчетных прилавков находится ближе всего к нужному ему выходу, и мысленно отметит, какая из кассирш работает быстрее других. Аналогичными соображениями руководствуется и водитель, выбирающий один из пунктов сбора за проезд по платной автомагистрали с таким расчетом, чтобы затратить на всю процедуру минимальное время. Но иногда действительно имеет место строго соблюдаемая дисциплина «первым пришел — первым обслуживаешься». Такого характера очереди возникают, например, на бензозаправочных станциях, возле касс кинотеатров, в мастерских, где производится срочный ремонт обуви, и т. п. Как уже отмечалось, построение операционной модели для описания реальной ситуации всегда сопряжено с необходимостью принятия ряда аппроксимирующих предположений. В случае решения задачи массового обслуживания аппроксимации являются неизбежными независимо от того, какого типа модель при этом используется — математическая *), имитационная или комбинированная. Часто удается получить приближенное представление об операционных характеристиках сложной системы путем анализа некоторых «экстремальных» или предельных случаев. Один из таких приближенных методов заключается в следующем: система массового обслуживания, насчитывающая п обслуживающих приборов, рассматривается как «механическое» объединение п одноканальных систем, функционирующих независимо одна от другой. Пусть, например, обслуживающая система состоит из пяти приборов, а интенсивность входного потока 1
) Автор имеет в виду модель, предполагающую применение классических методов математического программирования. Принципы имитационного модеирования обсуждаются в гл. 21.— Прим. перев.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
295
равняется 20 человек/ч. Тогда приближенно данную систему можно рассматривать как совокупность пяти автономных систем с одним обслуживающим прибором, каждая из которых характеризуется входным потоком с интенсивностью 4 человек/ч. Этот метод является приближенным по двум причинам: во-первых, предполагается, что требование может попасть на вход любой из упомянутых одноканальных «подсистем» с одинаковой вероятностью (независимо от того, какова длина соответствующей очереди), и, во-вторых, постулируется, что, попав в одну из очередей, требование должно оставаться именно в этой первоначально выбранной очереди. Ожидаемое количество требований, находящихся во всех автономных подсистемах такого рода гипотетической системы, и среднее время пребывания в ней требования, как правило, превышают значения соответствующих операционных характеристик реальных многоканальных систем. Это объясняется тем, что если бы мы применили нашу гипотетическую систему на практике, то обнаружилось бы, что чаще, чем это можно предположить, один из обслуживающих приборов находился бы в незанятом состоянии, в то время как требования простаивали бы в очередях к другим приборам. Если же предположить, что в системе с несколькими обслуживающими приборами очередь является единой и характеризуется дисциплиной «первым пришел — первым обслуживаешься», то соответствующие аппроксимирующие оценки ожидаемого количества требований в системе и среднего времени, потраченного каждым требованием на ожидание обслуживания, окажутся заниженными по сравнению с фактическими значениями упомянутых показателей. Можно с удовлетворением отметить, что системы с одним обслуживающим прибором, как и многие многоканальные системы с единой очередью, характеризующейся дисциплиной «первым пришел — первым обслуживаешься», как правило, поддаются математическому описанию и количественному анализу. В данном разделе мы рассмотрим простейшую одноканальную систему; один из упрощенных вариантов многоканальных моделей будет проанализирован в разделе 20.6. Более сложные модели с одним обслуживающим прибором исследуются в приложении III. Описание модели. Простейшей однокаыальной моделью с вероятностными входным потоком и процедурой обслуживания является модель, характеризуемая показательным распределением как длительностей интервалов между поступлениями требований, так и длительностей обслуживания (т. е. модель типа Ml МП). Другими словами, предполагается, что Плотность распределения длительностей интервалов между поступлениями требований имеет вид Плотность распределения длительностей обслуживания
Ке~м,
(1)
296
ГЛАВА 20
Пусть в некоторый момент времени число находящихся в системе требований, включая уже обслуживаемые требования, равняется п. Предположим, что система начинает функционировать с момента t = 0, и определим р
(т\ = Г Вероятность того, что в момент Т ~| [ в системе находится п требований J
/„>
Вообще говоря, Рп (Т) зависит от количества требований i, находившихся в системе в момент 0; однако в (2) индекс i нами опущен. Пусть h> 0 есть интервал времени очень малой продолжительности. Если в момент Т -f- h количество требований в системе равняется /г, то мы будем считать, что количество требований, которое могло находиться в системе в момент Т, равняется либо п — 1, либо п, либо п -)- 1; всеми прочими вероятностями мы пренебрегаем как величинами более высокого порядка малости. Таким образом, при п >> 0 для малых значений h
Рп (T + h)& (Щ (1 - цй) P n _ t (Т) + (1 - Щ (1 - цЛ) Рп (Т) + + (Щ (ph) Рп (Т) + (1 - Щ (цЛ) Рп+1 (Т). (3) Первое слагаемое в правой части (3) соответствует возможности одного поступления при отсутствии выходов из системы в случае п — 1 требований внутри системы в момент Т. Второе и третье слагаемые отражают соответственно возможность отсутствия как поступлений, так и выходов и возможность одного поступления и одного выхода в случае нахождения внутри системы в момент Т п требований. Последний член в правой части соотношения (3) соответствует возможности одного выхода из системы при отсутствии поступлений в случае нахождения внутри системы в момент Т п требований. Как показывает символ да, выражение (3) является приближенным [точное выражение для Рп (Т — /г) содержало бы члены с коэффициентами /ift, где k ^ 2]. Перенесем Рп (Т) из правой части соотношения (3) в левую, разделим обе части получающегося в результате этого соотношения на h и устремим h к нулю. С помощью этих преобразований получим следующее выражение:
при п>0.
(4)
Уравнение (3) является точным, поскольку нами выполнен предельный переход h -> 0. Аналогично нетрудно получить уравнение
T)
для гс = 0.
(5)
Система линейных дифференциальных уравнений (4) и (5) имеет единственное решение, если заданы соответствующие начальные условия (т. е. количество требований t, находившихся в системе
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
297
в момент 0). Это решение называется неустановившимся, поскольку оно непосредственно зависит от Т х). Допустим, однако, что нами рассматриваются значения Рп (Т) при Т ->• оо. Если Рп (Т) стремится при этом к некоторому предельному значению (обозначим его через Рп) и если для данного предельного распределения Е [п] оказывается конечным, то говорят, что система стремится к состоянию (или достигает состояния) статистического равновесия. Назовем предельные значения Рп установившимися или стационарными вероятностями. Прилагательное «стационарный» отражает следующее свойство системы: если количество находящихся в ней требований определяется в произвольно выбранный момент t с помощью распределения Рп, то для любого h > О Рп является также вероятностью обнаружения в системе п требований в момент t + h. Значение Рп можно также интер претировать как долю времени произвольно большого периода, в течение которой в системе находится п требований. Если имеет место условие Р=£<1>
(6)
то стационарные вероятности Рп всегда существуют. Величину р часто называют траффик-интенсивностью. [Истолкование условия, представленного соотношением (6), не должно вызвать у читателя каких-либо затруднений.] Решение, соответствующее равновесному состоянию Рп (Т) = Рп при любом Г, легко найти из условия dPn/dT = 0, отражающего то обстоятельство, что Рп не зависит от Т. Таким образом, для определения Рп требуется лишь приравнять нулю производные, стоящие в левых частях уравнений (4) и (5). В результате будем иметь О = ЯР„_ ( - (К + ц) Рп + pPn+i О = —ХР0 + [nPi
при п = 1, 2, 3, . . ., при п = 0.
(7) (8)
Система уравнений в конечных разностях (7) и (8) легко решается методом математической индукции. Начав с рассмотрения (8), получаем
Л = Р 0 у = Л,р.
(9)
Затем переходим к (7), рассматривая последовательно значения п = 1, 2, 3, . . .; в результате будем иметь Рп = Pop". (10) *) Уравнения (4) и (5) иногда называют уравнениями переходных процессов (или, просто, переходов). Уравнения аналогичной структуры возникают при исследовании самых разнообразных явлений и встречаются в физике, химии, биологии и др. При этом под переходным процессом понимается некоторая последовательность событий, связанных с изменением состояния системы.— Прим. перев.
298
ГЛАВА 20
[Читателю предлагается проверить, действительно ли решение (10) удовлетворяет уравнениям (7).] С учетом (6)
>И = Т~=1' п=0
(11)
п=0
откуда следует, что Рп = i — р, так что п
Рп = (1 - Р) Р , п = О, 1, 2, . . . (геометрическое распределение *)),
причем
Е
Количество требований в системе
1
J
sjE[n]=
1-р
ц—
^_=^L
(12)
(13)
N
Обратите внимание на то, что распределение вероятностей (12) зависит только от траффик-интенсивности р = Я/ц. Поскольку р ( = 1 — РО) также представляет собой ту долю полного времени с начала функционирования системы, в течение которой прибор не простаивает, то эту величину называют иногда коэффициентом использования или коэффициентом загруженности прибора. Существенным является то, что такая интерпретация сохраняет силу даже в том случае, когда не вводится никаких конкретизирующих предположений ни относительно распределения длительностей интервалов между поступлениями, ни относительно распределения длительностей обслуживания (т. е. когда модель относится к типу GI/G/1). Если через Рп (Т \ i) обозначить решение уравнений (4) и (5) при условии, что в начальный момент времени t = 0 в очереди находилось i требований, то можно показать, что | Рп (Т | 0 - Рп |<- e-iU+n-21/Ш).
(I)
Следовательно, Рп (Т \ i) стремится к Рп не медленнее, чем при изменении по экспоненциальному закону. Заметим, что при К -*- ц коэффициент при Т в показателе стремится к нулю 2). Следовательно, интервал времени Т, в течение которого значение Рп (Т \ i) станет почти равным Рп, может быть весьма продолжительным; это свойство «медленного стремления к стационарному режиму» проявляется особенно заметно при больших значениях р и малых значениях i. J
) То есть вероятности являются членами геометрической прогрессии.— Прим. перев. Ц Действительно, lim (X + ц - УЩ.) = lim (~\/l - Vfl) 2 = 0. .
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
299
Операционные характеристики. Математическое ожидание длины очереди можно вычислить, учитывая, что
{
Число требований в системе,
если д = 0,
тт е. Число требовании в системе — л1, если п -^ >пО, (Щ
так что Е [Длина очереди] =
п=1
п=0
п=1
= В 1п] _(1-,Р 0 )= т £. р =1Г^Г).
(15)
Рассмотрим теперь интервалы времени, когда прибор не занят обслуживанием. Поскольку интервалы простоя обслуживающего прибора начинаются с моментов завершения обслуживания и заканчиваются при поступлении нового требования, продолжительности простоя приборов лмеют такое же распределение, как и длительности интервалов между поступлениями требований, т. е. характеризуются распределением с математическим ожиданием 1/Я. Пусть Т настолько велико, что мы можем оперировать средними значениями операционных характеристик без каких-либо опасений х). При этом продолжительность времени простоя прибора равняется ТРо = Т (1 — р), а число отдельных периодов времени, в течение которых прибор оказывается в пределах Т незанятым, равняется Т (1 — р)/(1А,) = = ЪТ (1 — р). Поскольку периоды обслуживания и периоды простоя являются строго чередующимися, то КТ (1 — р) определяет также число занятых периодов в течение полного периода Т, а рТ есть суммарная продолжительность периодов, когда прибор занят обслуживанием. Следовательно, Продолжительность периода,-! рТ _ 1 = = когда прибор занят J КТ (I— р) и.— А, '
а
[
' '
Число требований, обслуженных т в течение периода занятости = прибора J
[
Продолжительность-! . периода занятости = -т—— прибора 1 ~р
(17)
Формулы (16) и (17), вообще говоря, справедливы при любом распределении длительностей обслуживания (т. е. применимы и в случае модели M/G/1). г
) При малых значениях Т число событий может оказаться настолько малым, что применение методов теории вероятностей для анализа операционных характеристик станет недопустимым.— Прим. перев.
300
ГЛАВА 20
Рассмотрим теперь плотность распределения для продолжительности пребывания требования в системе обслуживания. Время, в течение которого требование находится в системе, складывается из продолжительности ожидания им обслуживания в очереди и длительности самой процедуры обслуживания. Теперь предположим, что система находится в состоянии статистического равновесия, так что каждое из вновь поступающих требований с вероятностью Рп, определяемой формулой (12), обнаруживает впереди себя п уже ожидающих обслуживания требований. Допустим, что для очереди принята дисциплина «первым пришел — первым обслуживаешься». Тогда полное время пребывания требования в системе представляет собой сумму п -\- 1 независимых выборок из множества значений, принимаемых случайной переменной, которая характеризуется экспоненциальным распределением, т. е. описывается гамма-распределением с плотностью 1):
,
у>0.
(18)
Следовательно, плотность распределения для времени пребывания в системе требования, поступившего в произвольно выбранный момент времени, определяется следующей формулой:
71=0
= ц(1 — р) e-n(i-p)«>
(экспоненциальное распределение),
(19)
причем
г Время пребывания-] 1 Е = [ в системе J = И = -Ц<Т=рГ И=Г '
Е
„ гВремя пребываниям в L очереди J~
,„_. (20)
гВремя пребывания-! |_ в системе J
г Время т j __ р _ Я. ^l обслуживания _|~ ц i_Р ~ ц(Н— Я) ' При фиксированном значении р средняя продолжительность пребывания требования в системе, так же как и средняя продолжительность его пребывания в очереди, обратно пропорциональна скорости обслуживания ц. Предположим теперь, что нас интересует лишь время, в течение которого требование вынуждено ожидать, находясь в очереди, т. е. исключим из рассмотрения как время обслуживания каждого из требований, так и те случаи, когда поступившее требование застает прибор незанятым, т. е. готовым к немедленному обслуживанию. Этот результат уже приводился нами в разд. 20.4 [см. формулу (15)].
МОДЕЛИ МАССОВОГО
ОБСЛУЖИВАНИЯ
301
Можно доказать, что условная вероятность для продолжительности пребывания в очереди тех клиентов, которым приходится тратить время на ожидание, определяется плотностью распределения (19) при любом распределении длительностей интервалов между поступлениями [т. е. формула (19) имеет место и для моделей типа GI/M/1]. Следовательно, математическое ожидание Е [w], определяемое формулой (20), представляет собой также условное математическое ожидание продолжительности пребывания требования в очереди при условии, что оно действительно вынуждено терять время на ожидание. Анализ на чувствительность. Основные операционные характеристики одноканальной системы массового обслуживания с дисциплиной очереди «первым пришел — первым обслуживаешься» приведены в таблице на рис. 20.3 как функции р и ц. Обратите внимание
к я о.
0,1 0,3 0,5 0,7 0,8 0,9 0,95 0,99
0,999
fQ т Я> Н
К М 5
0,9 0,7 0,5 0,3 0,2 0,1 0,05 0,01 0,001
О И
ф Н
1
& Ь4 О
ц
HOI:
g я g
OS ^„^
СИ
S
Я и в
«_ а н
М
iliT ф
Q
^
Рн О, О ^Г
О н g о.
0,11 0,43 1,00 2,33 4,00 9,00 19,00
99,00 999,00
и, = 10 i « * sя k
®"
tt a
и! 1 3 5 7 8 9 9,5 9,9 998,00 9,99
0,01 0,13 0,50 1,63 3,20 8,10 18,05 98,01
£е
К i И
0,11 0,14 0,20 0,33 0,50 1,00 2,00 10,00
100,00
0,01 0,04 0,10 0,23 0,40 0,90 1,90 9,90
99,90
ц — 20 1
Оч
1
И hrf
Я
и Я3
i ее д
1
Бч
^ я
продолжите; ность преб] ния требовс в системе продолжите, ность преб] ния требова в очереди
£
и S i cd ей 1
продолжите; ность npe6i ния требовс в системе продолжите; ность пребы! требования очереди
£
К ' О.
Вероятность тости обслу; щего npn6oj
,
да о М
0,06 2 0,07 6 0,10 10 0,17 14 0,25 16 18 0,50 19 1,00 19,8 5,00 19,98 50,00
0,01 0,02 0,05 0,12 0,20 0,45 0,95 4,95
49,95
К—количество требований, поступивших в систему за единицу времени; р,— скорость обслуживания (количество требований, обслуживаемых за единицу времени); р = Я/u.— траффик-интенсивность. Примечание. Е [Продолжительность периода занятости прибора] = Е [Полное время пребывания требования в системе]. Р и с . 20.3. Операционные характеристики системы типа М/М/1. на то, что при возрастании траффик-интенсивности р ожидаемые значения таких параметров, как число находящихся в системе требований, длина очереди, полное время пребывания требования в системе и чистое время его пребывания в очереди, также начинают быстро
302
ГЛАВА 20
возрастать. Хотя все перечисленные нами показатели при достаточно больших р < 1 могут принимать сколь угодно большие значения, может пройти весьма много времени, прежде чем система достигнет равновесного состояния. При заданной скорости обслуживания ц, когда траффик-интенсивность р незначительна, основная доля среднего времени пребывания требования в системе связана с самой процедурой обслуживания (средняя продолжительность процедуры обслуживания равняется 1/ji); однако при возрастании р, т. е. при увеличении интенсивности входного потока Я, большая часть времени пребывания требования в системе (в смысле его среднего значения) обусловлена ожидание г обслуживания в очереди. Обратимся к таблице на рис. 20.3. Пусть единицей времени является 1 ч (или 60 мин). Рассмотрим случай, когда р = 0,8. При этом прибор простаивает в среднем в течение 0,2 ч (т. е. каждые 12 из 60 мин), а среднее количество требований, находящихся в системе, равняется 4. При и. = 10, т. е. когда скорость обслуживания равняется 10 человек/ч (на каждое требование прибор расходует в среднем 6 мин своего рабочего времени), средняя продолжительность пребывания требования в системе равняется 0,5 ч (30 мин), а средняя продолжительность его пребывания непосредственно в очереди — 0,4 ч (или 24 мин). Если р = 0,8, но при этом значения как интенсивности входного потока, так и скорости обслуживания удваиваются (т. е. |л = = 20), средняя продолжительность пребывания требования в системе и средняя продолжительность его ожидания начала обслуживания уменьшаются в два раза. Задача комплектования штата. На примере следующей гипотетической ситуации мы попытаемся кратко продемонстрировать, каким образом в процессе принятия управляющих решений учитываются операционные характеристики обслуживающей системы, аналогичные операционным характеристикам, фигурирующим в таблице на рис. 20.3. Представим себе, что перед управляющим нотариальной конторой встала проблема комплектования штата секретарей-машинисток. Для простоты предположим, что выбор управляющего ограничен 2 вариантами: можно принять на работу либо двух опытных секретарей-машинисток, каждая из которых способна печатать и оформлять 20 документов в день, либо четырех неопытных машинисток, каждая из которых печатает и оформляет лишь 10 документов в день. В упомянутой нотариальной конторе в среднем печатается 36 документов в день. (Читателю рекомендуется выписать эти данные на отдельном листе бумаги, поскольку ими еще придется воспользоваться при обсуждении материала в конце настоящей главы.) Предположим, что управляющий нотариальной конторой решил воспользоваться приближенной моделью, описание которой дано выше. Совершенно очевидно, что если на работу будут приняты две более квалифицированные машинистки, то каждой из них придется печатать в среднем по 18 документов в день (X = 18), а если
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
303
в машбюро придут 4 менее квалифицированные машинистки, то каждой из них придется печатать в среднем 9 документов в день (Я = 9). Нетрудно убедиться, что в каждом случае траффик-интенсивность равняется 0,9 (р = 0,9). Согласно первой из формул (13), среднее количество документов, находящихся на исполнении у каждой из машинисток, равняется 9, т. е. в варианте с двумя машинистками суммарное количество документов, находящихся в машбюро, равняется 36 1). Средняя продолжительность пребывания документа у секретарей-машинисток при реализации первого варианта равняется V 2 [ = 1/(20—18)] рабочего дня, а при реализации второго варианта — одному [ = 1/(10—9)] рабочему дню [см. формулу (20)]. Нетрудно также вычислить средние продолжительности периодов, в течение которых каждая из машинисток будет занята печатаньем: средняя продолжительность той доли времени, в течение которого будет загружена работой каждая из опытных машинисток, равняется х /2 рабочего дня, тогда как средняя продолжительность доли времени, в течение которого будет загружена работой каждая из неопытных машинисток, составит полный рабочий день. В какой степени эта простая модель приближается к действительности? Почему средняя продолжительность задержки документа в реальных условиях окажется меньшей по сравнению со средней продолжительностью пребывания документа у машинисток, вычисленной по формуле (20)? Какие, на ваш взгляд, дополнительные соображения следует учесть в связи с решением дилеммы, возникшей перед управляющим нотариальной конторой? Конечная очередь. Пока мы не накладывали никаких ограничений па суммарное количество требований, которое может оказаться в обслуживающей системе в тот или иной момент времени. Предположим теперь, что в системе может быть не более М требований и, следовательно, в любой момент времени в очереди разрешается находиться не более, чем М — 1 требованиям. (В качестве примера, иллюстрирующего такого типа условие, можно привести бензозаправочную станцию с одной бензоколонкой, расположенной в узком переулке, выходящем на одну из центральных улиц города.) Если требование поступает в момент, когда в обслуживающей системе уже находится М объектов, то этому требованию отказывается в обслуживании и, таким образом, обслуживающая система его теряет. По этой причине такого вида модели иногда называют моделями массового обслуживания с вынужденными отказами. Существенная разница между предыдущей моделью и моделью с конечной длиной очереди заключается в том, что в последнем случае статистическое равновесие достигается при любом значении р = Я/и.. (Читателю предлагается доказать это утверждение.)
*) Эти оценки также, разумеется, следует понимать в смысле среднего значения.
304
ГЛАВА 20
Отвечающие установившемуся режиму уравнения в конечных разностях (7) и (8) при п = О, 1, . . ., М — 1 справедливы и в случае конечной очереди, а при п — М имеет место уравнение
О = ЯРМ_, - цРм.
(22)
Совместное решение уравнения (22) и упомянутых выше уравнений (7) и (8) при га = О, 1, . . ., М — 1 имеет следующий вид:
при (23) Само собой разумеется, что при и. > Я и М ->• оо выражения (23) сводятся к (12). С помощью весьма простых вычислений можно показать, что при Я ^= ц рКоличество ттребований голичество р е о в а н и --, L
в системе обслуживания обслуживания
J ~
M
1
+i)p^+Mp + 1
== J5 [п] == j^— —-—
1~Р
/ я *• i л \ „ МЧ-1
м+i
- J=
(24)
Заметим, что при Я < \л, среднее количество требований, находящихся в системе, оказывается меньшим по сравнению с соответствующим показателем, вычисленным для модели с неограниченной длиной очереди [т. е. с помощью формулы (13)]. Аналогичным образом можно доказать, что при Я = ц г Количество требований п _ = [ в системе обслуживанияJ
л_м ^ ' ~2~ п =
Некоторые тонкости необходимо учитывать как при определении времени нахождения требования в системе обслуживания, так и продолжительности его ожидания в очереди. Если требование поступает в тот момент, когда в системе уже находится М других требований, то оно не может присоединиться к очереди, и, следовательно, время его пребывания в системе в буквальном смысле равняется нулю. Поэтому среднее время пребывания в системе можно определить, либо учитывая все требования независимо от того, имелась для них возможность присоединиться к очереди или нет, либо принимая в расчет только те требования, которым вход был действительно разрешен. Мы примем второй вариант, поскольку в подавляющем большинстве случаев нас интересуют задержки в обслуживании только тех требований, которые имели возможность войти в систему. Тогда при условии, что требование, поступающее в некоторый произвольно выбранный момент времени, получает право на ожидание в очереди и что очередь характеризуется дисциплиной «первым пришел — первым обслуживаешься», для средней продолжительно-
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
305
сти пребывания данного требования в системе обслуживания получаем следующие выражения: г Продолжительность пребывания т _ „ [требования в системе обелyживaнияJ = ^ ~~
р
р)
— —тч 1-1(1— Р) ч
--ц(1-р *
при А,=И=щ
(26)
г Продолжительность пребывания 1_р, , [требования в системе обслуживания J= '^ ~" ^(27) С помощью более «тонких» методов анализа удается также получить формулы, определяющие операционные характеристики модели массового обслуживания с конечной очередью в условиях неустановившегося режима 1). Здесь эти формулы приводятся лишь с той целью, чтобы показать, насколько усложняется вид решения в случае, когда система функционирует в переходном режиме (т. е. еще не достигла состояния статистического равновесия). Обозначим через i количество требований, находящихся в системе в момент 0. Тогда при любых К и р, 2
-^
-(Я,+Ц)Т+2ТУм1со8[;я/^+1]п(п-г)/2
где Рп определяется соотношением (23). При Т -> оо фигурирующая в (I) сумма стремится к нулю. В случае М — 1, т. е. когда доступ в обслуживающую систему обеспечивается лишь при незанятом обслуживающем приборе, в момент 0 количество требований в системе равняется 0, формула (I) принимает более простой вид, а именно
J
) Эти формулы по сравнению с формулами для установившегося режима выглядят значительно более громоздкими, однако они вполне пригодны для нахождения численных значений различных операционных характеристик системы.— Прим. пер ев.
306
ГЛАВА 20
при любых А, и (г. Таким образом, при Т -У с» разница между значениями вероятностей в условиях переходного периода и их предельными значениями (т. е. значениями, отвечающими состоянию статистического равновесия) убывает по экспоненциальному закону. Случай произвольного распределения длительностей1 обслуживания. Другие варианты одноканальных моделей, в которых распределение продолжительностей интервалов между поступлениями требований и распределение длительностей интервалов обслуживания не являются экспоненциальными, рассматриваются в приложении III. Однако весьма несложным оказывается вычисление ожидаемого количества требований в системе массового обслуживания и средней продолжительности их пребывания в ней в том случае, когда входной поток требований характеризуется экспоненциальным распределением, а относительно вида распределения длительностей обслуживания не делается никаких специальных предположений (т. е. в случае, когда модель относится к типу M/G/1). Пусть т/ v^r™ T e j I b H O C T b "I И/ V = Var [обслуживания J = ) (* ~ ^г о где, как и ранее, 1/\л — среднее значение продолжительности одной процедуры обслуживания, a g (t) — плотность распределения длительностей обслуживания. Тогда г Количество требований n _ X 2 F+p 2 = LB системе обслуживания J Р~т~ 2(1— p) '
,9Q. ' '
Е [Длина очереди] = 2 (i'lp) •
(30)
Е [Прибор простаивает] s=-P0 = 1 — р>
(31)
где, как обычно, р = Я/ц < 1. Если предположить, что принята дисциплина очереди «первым пришел — первым обслуживаешься», то для средней продолжительности пребывания требования в системе обслуживания будет справедливо следующее соотношение: Продолжительность пребывания -i _ требования в системе обслуживания J ~~ __ _ г Продолжительность ожидания! ~~ 1 требования в очереди J "~ Длительность процедуры-] обслуживания J=
ir- к L p + 2(i-P) J* 1
1
Г
W+P2
И
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
307
Соотношения (29) и (32) часто называют формулами Поллачека — Хинчина. Нетрудно проверить, что если плотность распределения g (f) является экспоненциальной и, следовательно, V = 1/ца, то формулы (29), (30) и (32) преобразуются соответственно в формулы (13), (15) и (20). Эти формулы определяют также соответствующие математические ожидания в случае, когда скорость обслуживания постоянна, так как при этом V = 0. Другими словами, при У = 0 полученные выше формулы описывают модель типа MIDII, Обратите внимание на то, что средние значения всех указанных выше показателей являются линейными функциями V и зависят лишь от частоты поступления требований К, траффик-интенсивности р и дисперсии длительностей обслуживания V и не зависят ни от каких других параметров, характеризующих распределение продолжительностей интервалов между поступлениями и распределение длительностей обслуживания. Заметим далее, что в условиях статистического равновесия . _ Количество требовании в системе ., обслуживания т
Е
Продолжительность " пребывания требо= КЕ вания в системе „ L обслуживания
(33)
Соотношение (33), вообще говоря, имеет место и при более общих предположениях относительно режима функционирования системы массового обслуживания; в частности, оно выполняется и в случае многоканальной модели. Читателю предлагается дать интерпретацию соотношения (33) и тем самым обосновать его «корректность» с позиций здравого смысла. Чтобы лишний раз убедиться в правильности понимания приведенных выше формул, читателю рекомендуется вновь обратиться к примеру с «комплектованием штатов секретарей-машинисток», который рассматривался нами в одном из предыдущих подразделов данного раздела. Напомним читателю, что квалифицированная машинистка способна напечатать за день 20 документов, в то время как неопытная машинистка способна напечатать всего лишь 10 документов. Поскольку среднее количество документов, которое приходится печатать и оформлять машинисткам упомянутой выше нотариальной конторы, равняется 36, на каждую из опытных машинисток будет приходиться в среднем 18 документов в день, а на каждую из малоопытных — 9 документов в день. При экспоненциальном характере распределений продолжительностей интервалов между поступлениями заказов на исполнение и длительностей процедур печатания одного документа среднее количество документов, находящихся на исполнении у каждой из машинисток (как в первом, так и во втором варианте подбора «кадров»), равняется 9. Среднее время пребывания документа у сек-
308
ГЛАВА 20
ретаря-машинистки равняется V 2 рабочего дня в первом варианте (когда работают две высококвалифицированные машинистки) и 1 рабочему дню во втором варианте (когда работают четыре неопытные машинистки). Предположим теперь, что вместо экспоненциального распределения длительностей обслуживания имеет место условие V = 0 (т. е. на печатанье любого документа тратится одно и то же количество времени). Тогда, согласно формуле (29), среднее количество документов, находящихся на исполнении у каждой из машинисток, равняется лишь 4,95, а, согласно (32), средняя продолжительность времени, в течение которого документ находится у машинисток, в случае реализации первого варианта (когда в конторе работают две опытные машинистки) равняется 0,275 рабочего дня, а в случае реализации второго (когда в конторе работают четыре неопытные машинистки) — 0,55 рабочего дня. Таким образом, устранение разброса в длительностях обслуживания почти вдвое уменьшает средние значения упомянутых показателей по сравнению со случаем экспоненциального распределения. Предположим теперь, что имеет место совершенно иная ситуация, а именно допустим, что дисперсия оказывается вдвое большей по сравнению со случаем экспоненциального распределения, т. е. равняется 2 /4оо Д л я первого варианта (когда в конторе работают две опытные машинистки) и 2 /юо Для второго (когда в конторе работают четыре неопытные машинистки). Легко убедиться, что в этом случае среднее число документов у каждой машинистки конторы будет равняться 13,05, причем средняя продолжительность пребывания документа у машинисток при реализации первого варианта составит 0,725 рабочего дня, а при реализации второго — 1,45 рабочего дня. Таким образом, двукратное увеличение степени разброса длительностей печатания одного документа по сравнению со случаем экспоненциального распределения увеличивает средние значения указанных выше показателей лишь примерно на 50%. Читателю предлагается самостоятельно проанализировать случай, когда дисперсия оказывается в три раза большей по сравнению с дисперсией при экспоненциальном распределении длительностей обслуживания. Обрисуем в общих чертах способ получения формулы (29) с тем, чтобы проиллюстрировать возможность использования известной теоремы о том, что «математическое ожидание суммы случайных величин равняется сумме математических ожиданий этих величин». Чтобы упростить схему рассуждений, допустим, что система рассматривается лишь в те моменты времени, когда процедура обслуживания оказывается только что завершенной и соответствующее требование только что покинуло систему. Если система находится в состоянии равновесия, соотношение (29) имеет место и в любой другой произвольно выбранный момент времени; однако вывод формулы (29) без использования только что принятого нами пред-
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
309
положения относительно последовательности моментов наблюдения за состоянием системы был бы сопряжен с гораздо большими трудностями. Пусть п — число требований, находящихся в системе в момент Т, совпадающий с моментом, когда систему только что покинуло последнее обслуженное требование, а п' — число требований, находящихся в системе в момент 7", совпадающий с моментом, когда систему только что покинуло следующее обслуженное требование. Обозначим через / число требований, поступающих в систему за время с момента Т до момента Т'. Тогда, как нетрудно сообразить,
(I)
еслип>0.
Соотношение (I) можно записать в более удобном виде, введя в рассмотрение так называемую дельта-функцию Дирака, которую иногда называют единичной функцией Хевисайда: (
О
=1 [
при га = 0, при пФ\. ^
Действительно, с учетом (II) соотношение (I) принимает следующий вид: п' = п — б (п) + / при любом п ^ 0. (III) Прежде чем приступать к вычислению Е [га], вспомним, что количество поступлений / на заданном интервале обслуживания продолжительностью t имеет пуассоновское распределение со средним значением Kt. Следовательно, t = — =p, (IV) о где Е [j \ t] — условное математическое ожидание / при заданном t, а 8 (t) — плотность распределения длительностей обслуживания. Аналогичным образом находим
Е [/« 1 1] g (t) dt = [ K t + (to)2] g (t) dt =
[/•] = о
о 2
= -- \- A, j Var [ Дл ительность обслуживания] +
(V) Можно доказать (см. разд. 2 приложения III), что и, следовательно,
Р0 = 1 - р Е [б] = Е [б2] = р.
(VI)
310
ГЛАВА 20
Возведем теперь в квадрат обе части соотношения (III): Е ((п')*] = Е [пЦ + Е [&] + Е [/•] - 2Е [п8 (п)] + + 2Elnj] -2Е[д (n)jl Произведя необходимые преобразования, получим Е 1(п')*] = Е [/г2] + р + Е If] - 2Е [п] + 2Е [п] Е [j] - 2pE [;]. (VII) При этом нами было учтено, что Е [6] = Е [б2] == р и п8 (п) = п, а также использовано условие взаимонезависимости / и п. Поскольку в установившемся режиме Е [(тг')2] = Е [п2], мы можем, используя (IV), записать (VII) в следующем виде: ^в] =*№£=*>.
(VIII)
Подставляя (V) в (VIII), после некоторых упрощений получаем
Читателю предлагается еще раз проанализировать процедуру вывода формулы (IX) и уточнить, на каком этапе нами была использована теорема о том, что математическое ожидание суммы случайных величин равняется сумме математических ожиданий этих величин. При доказательстве (32) обычно вначале устанавливают соотношение (33), а затем Е [п] делят на К. Дисциплина очереди при наличии приоритета. Во многих реальных ситуациях дисциплина очереди не согласуется с правилом «первым пришел — первым обслуживаешься». Представим себе, к примеру, молодого администратора, только что вернувшегося в свое учреждение из служебной командировки. Не исключено, что он обнаружит на своем рабочем столе ряд телефонограмм, среди которых может оказаться и телефонограмма от какого-нибудь важного должностного лица, в подчинении которого данный молодой административный работник находится. Скорее всего, что в первую очередь он уделит внимание именно этой телефонограмме. Предположим, что требования, поступающие на вход системы обслуживания, можно подразделять на г различных категорий, каждой из которых приписывается приоритет k (k = 1, 2, . . ., г), выраженный соответствующим номером. Допустим, что приоритет падает с увеличением его номера, т. е. приоритет 1 оказывается наивысшим, а приоритет г — самым низким. Как только прибор заканчивает обслуживание того или иного требования, он немедленно переходит к обслуживанию следующего требования, отдавая при этом предпочтение тому из находящихся в очереди требований, приоритет которого оказывается наиболее высоким. (Если в очереди находится несколько требований с одинаковыми приоритетами,
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
311
очередность их обслуживания определяется правилом «первым пришел — первым обслуживаешься».) В некоторых случаях, кроме того, предполагается, что при поступлении в систему обслуживания требования с более высоким приоритетом по сравнению с приоритетом требования, которое в этот момент находится в процессе обслуживания, система бросает уже начатую процедуру обслуживания и переключается на обслуживание требования с более высоким приоритетом. Другими словами, предполагается использование дисциплины «нокаутирующих» приоритетов. Приведенные ниже результаты относятся к случаю «ненокаутирующих» приоритетов. Допустим, что поток требований, обладающих приоритетом k, является пуассоновским при значении k = 1, 2, . . ., г, причем соответствующие средние частоты поступлений равняются A,h. Предположим также, что каждый приоритет k (k = 1, 2, . . ., г) характеризуется распределением длительностей обслуживания с плотностью gk (t) совершенно произвольного вида и Г Длительность процедуры приоритет /<;! = L обслуживания v h
Определим
__ у ~
Г Длительность процедуры I обслуживания
(34)
приоритет Ал. J
ft fe
~~5=i ' "
°~
и будем предполагать, что о> < 1. (Это гарантирует возможность постепенного перехода системы в состояние статистического равновесия.) Рассмотрим систему в момент времени, следующий непосредственно за завершением очередной процедуры обслуживания. Тогда для вновь поступившего требования с приоритетом k среднее время ожидания в очереди определяется формулой г Продолжительность ожидания] в L очереди | приоритет k J ~~
(35)
Нетрудно убедиться в том, что при г = 1 выражение (35) сводится к (32). Поскольку Я й /2 Я/ есть вероятность того, что вновь поступившее требование обладает приоритетом k, среднее время пребывания в очереди произвольным образом выбранного требования
312
ГЛАВА 20
вычисляется по следующей формуле: , г Продолжительность п Е ожидания в очереди
S
, ft „ Г Продолжительность ожидания! L в очереди \ приоритет k J
(36) h=l
т. е. математическое ожидание продолжительности пребывания в очереди, ассоциированное с полным ансамблем требований, представляет собой сумму подансамблей требований, каждое из которых обладает приоритетом k (k — 1, 2, . . ., г). Последствия введения системы приоритетов при определении дисциплины очереди проиллюстрируем на следующем примере. Допустим вначале, что система обслуживания функционирует без учета приоритетов, и предположим, что входной поток характеризуется параметром Я, = 18, а средняя скорость обслуживания ц = 20. Тогда, согласно таблице на рис. 20.3, в случае, когда имеется в виду первый вариант состава секретарей-машинисток (задача комплектования штатов), средняя продолжительность ожидания в очереди для каждого поступившего в систему требования равняется 0,9. Пусть теперь имеет место другая ситуация, а именно предположим, что требования распадаются на две категории (первая категория обладает приоритетом 1, а вторая — приоритетом 2), характеризуемые соответственно параметрами A,t и Я 2 , причем Я 4 -f- Я 2 = = А, = 18. Будем считать, что указанная выше скорость обслуживания ц относится как к первой, так и ко второй категории требований, и допустим, что распределение длительностей обслуживания носит экспоненциальный характер. Тогда, как нетрудно убедиться с помощью (35) и (36), г Продолжительность ожидания п |_ в очереди | приоритет 1 J: Г 1 , 1 0,045 I—Я,1/20) 1 г Продолжительность ожидания п _ L в очереди | приоритет 2 J= р, Г Продолжительность ожидания 1 L в очереди [приоритет 1 J __ 1 — V20 — А,2/20 о ["Продолжительность ожидания"] [ в очереди_ | приоритет 1 J , Продолжительность ожидания т л ,_ J=U,45 в очереди
(37)
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
313
Таким образом, средняя продолжительность ожидания обслуживания, вычисленная для полной совокупности поступающих в систему требований, по-прежнему равняется 0,45, но при этом среднее время ожидания для требования с приоритетом 1 меньше 0,45, а среднее время ожидания для требования с приоритетом 2 больше 0,45. Более того, чем меньше значение K i t тем менее продолжительным оказывается ожидание обслуживания как для требований с приоритетом 1, так и для требований с приоритетом 2, хотя средняя продолжительность ожидания в очереди, вычисленная по суммарному ансамблю поступающих в систему требований, остается одной и той же. Так, например, предположим, что Я4 = Х а = 9; тогда с помощью (37) нетрудно убедиться, что среднее время ожидания обслуживания для требования с приоритетом 1 равняется 9/110 = = 0,0818, а для требования с приоритетом 2 составляет 0,8181. (Читателю предлагается проанализировать случай, когда Я 4 = 3, а также случай, когда Я 4 = 15.) В некоторых задачах продолжительность процедуры обслуживания зависит от номера (или, как говорят, от уровня) приоритета. Тогда, обеспечивая требованиям с более высокими уровнями приоритета ускоренное обслуживание, мы тем самым сокращаем среднее время ожидания в очереди, вычисленное по суммарному выходному потоку обслуженных требований. В качестве иллюстрации этого утверждения вновь обратимся к случаю, когда Я, = 18, a |д, = 20 (так что коэффициент загруженности обслуживающей системы при этом равняется 0,9, а среднее время ожидания в очереди 0,45). Перейдем теперь к схеме обслуживания с двумя уровнями приоритета и предположим, что A,t = А,2 = 9, a j^i = 30 и щ = 15, так что коэффициент загруженности о> = 9/30-|-9/15 = 0,9 (т. е. остается таким же, как и в схеме обслуживания при отсутствии приоритетов). С помощью (35) и (36) легко убедиться, что в этом случае средняя продолжительность пребывания в очереди требования с приоритетом 1 равняется 1/14 = 0,0714, а требования с приоритетом 2 — 10/14 = = 0,7142, т. е. меньше, чем в случае, когда и^ = (д,2 = ^ = 20. При этом средняя продолжительность пребывания в очереди, вычисленная на суммарном ансамбле обслуженных требований, равняется 0,3928, т. е. оказывается меньшей по сравнению с аналогичной операционной характеристикой системы без приоритетов, а также по сравнениюсо случаем, когда |^i = \л2 — 20. 20.6. МНОГОКАНАЛЬНАЯ МОДЕЛЬ С ПУАССОНОВСКИМ ВХОДНЫМ ПОТОКОМ И ЭКСПОНЕНЦИАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ ДЛИТЕЛЬНОСТЕЙ ОБСЛУЖИВАНИЯ
Каждому ясно, что в подавляющем большинстве случаев системы массового обслуживания являются многоканальными, и, следовательно, модели с S обслуживающими приборами (где S > 1) представляют несомненный интерес. В данном случае мы займемся
314
ГЛАВА 20
обобщением результатов, полученных в предыдущих разделах. Постулируемая при этом дисциплина очереди выглядит несколько упрощенной для большинства ситуаций, с которыми приходится сталкиваться в действительности. Тем не менее полученные здесь результаты можно рассматривать как весьма полезные, поскольку они по крайней мере позволяют в самом первом приближении оценить функциональные характеристики более сложных систем массового обслуживания. Пусть 5 = Число обслуживающих приборов. (1) Будем предполагать, что а) плотность распределения продолжительностей интервалов между поступлениями требований имеет вид / (t) = ke~M, б) плотность распределения длительностей обслуживания каждым из приборов имеет вид Z (*) = це-и*,
(2)
причем длительности обслуживания взаимонезависимы как для •отдельно взятого прибора, так и по системе в целом 1). Уравнения в конечных разностях, аналогичные приведенным в предыдущем разделе уравнениям (7) и (8) для случая одноканалъной системы массового обслуживания и определяющие значения Рп в условиях установившегося режима, имеют следующий вид: О = №n-i - (Я, + nji) Рп + (п + 1) цРп+i при S > п ^ 1, ,~ (д) О = КРп_, - (Ь + 5ц) Рп + 8цРп+1 при п ^ S. (Вывод этих уравнений читатель найдет в следующем разделе.) Решение системы уравнений (3) имеет вид
при S'
Рп = ^-Ро Рп=
С( оТ1—О ^-^-РО
П
РИ
где р = Я/fi, а
*.= „..
.
'
2^+-щг
,
(5)
5=0
а ) Другими словами, режим функционирования того или иного обслуживающего прибора не влияет на режим функционирования других обслуживающих приборов системы, причем длительность процедуры обслуживания каждым из приборов является случайной величиной.— Прим. перев.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
315
Установившийся режим функционирования системы массового обслуживания, характеризующийся соотношениями (4) и (5), возможен при условии Я, < \iS (или р < S). Характер процессов, протекающих при условии К > ц£, читатель должен проанализировать самостоятельно. [Нетрудно убедиться, что при 5 = 1 формулы (4) и (5) становятся эквивалентными формуле (12) из разд. 20.5.] В случае неограниченного количества обслуживающих приборов (например, в условиях самообслуживания) первая из формул (4) становится применимой для любого значения п. Следовательно, в этом случае Рп принимает пуассоновский вид, причем Е [п] = р. Для такой модели используют символическое обозначение М/М/оо. При S = оо пуассоновский характер Рп имеет место фактически при любом виде распределения длительностей обслуживания, т. е. и в случае MlGloo. Формулы (4) применимы и в том случае, когда действует ограничение на суммарное количество требований М (^S), которое может находиться в системе. При этом п ^ М, а РО определяется из условия м
(I)
%рп=1.
п=0
Отметим, кроме того, что формулы (4) остаются при этом справедливыми и в случае, когда К > [iS. Операционные характеристики. Когда Рп найдены, большинство операционных характеристик рассматриваемой нами модели вычисляются с помощью элементарных алгебраических операций. К числу весьма важных характеристик системы массового обслуживания относится вероятность того, что все приборы окажутся занятыми: г Полная загрузка т= L всех каналов (приборов)]
PV
~ 5!(ц5-Я)
»
PS
°~ Sl(l -p/S)
п
°'
Некоторые авторы называют величину, определяемую формулой (6), вероятностью задержки; на наш взгляд, более удачным является термин виртуальная задержка. Величина P[n^S-\-i] определяет долю времени, в течение которого требования фактически пребывают в системе. Введем в рассмотрение следующие величины:
ж=0
316
ГЛАВА 20
Тогда (6) можно записать в следующем виде:
^ _ г Полная загрузка 1 P(x=S\p) всех каналов J — Р(а;=5|р)+(1 — р/5)Р(*<5|р) "
'
Значения Р [Полная загрузка всех каналов] для ряда численных значений р = Я/ц и S приведены в таблице приложения IV. С учетом (8) получаем Р
Е [Длина очереди] = Р [Полная загрузка всех каналов].
5-р
_
(9) s-i г Количество обслуживаемых = ^[ требований J п^0
V г> -sс 2j Pn = i
Количество требований в системе обслуживания
' г Длина п _i LочередиJ
[
+Е
(10)
Количество -> обслуживаемых L требований J
(И)
Количество требований в системе обслуживания
(12)
г
Для рассматриваемой модели Продолжительность пребывания в системе обслуживания
и, следовательно, разделив обе части соотношения (12) на иметь
С
Продолжительность -i Р [Полная загрузка] L всех каналов J пребывания = в системе обслуживания J
будем 1
—
(13)
/хоч
В правой части (13) первое слагаемое представляет собой Е [Продолжительность ожидания в очереди], а второе — Е [Продолжительность процедуры обслуживания]. Важной особенностью данной системы является то, что ее выходной поток на интервале Т имеет пуассоновское распределение со средним значением Я71 обслуженных требований за единицу времени. Рассмотрим теперь крупномасштабную систему массового обслуживания, состоящую из групп последовательно включенных приборов, т, е. организованных таким образом, что выходной поток одной группы приборов оказывается входным для другой группы приборов. Если каждую из подобных групп приборов можно описать с помощью многоканальной модели рассмотренного выше типа, то средние
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
317
значения операционных характеристик системы легко вычислить, проанализировав вначале каждую из групп как совершенно автономную, а затем сложив полученные результаты в предположении, что частоты поступления требований Я, на входе каждой из групп одинаковы. Анализ на чувствительность. Обратимся снова к задаче комплектования штатов, описание которой дано в разд. 20.5. Напомним читателю, что к секретарям-машинисткам нотариальной конторы в среднем поступает 36 документов в день, при этом квалифицированная машинистка способна напечатать 20 документов в день, а неопытная — 10. В разд. 20.5 было показано, что если каждая из машинисток работает в полностью автономном и независимом режиме, то среднее количество документов, находящихся на исполнении у одной машинистки, равняется 9, причем среднее время нахождения документа у опытной машинистки равняется V 2 рабочего дня, а у неопытной — полному рабочему дню. При постоянной скорости обслуживания (в данном случае — печатания), когда дисперсия V = О, среднее количество документов, находящихся на исполнении у каждой из машинисток, равняется 4,95, при этом среднее время нахождения документа у опытной машинистки равняется 0,275 рабочего дня, а у неопытной машинистки — 0,55 рабочего дня. Предположим теперь, что работу каждой из машинисток нельзя считать полностью автономной и вместо этого вводится совершенно иное положение: обслуживающая система, т. е. все машинистки, рассматривается как единый механизм. Другими словами, предполагается, что поступающие для перепечатки документы ожидают своей очереди, находясь в общей папке; при этом, как только та или иная машинистка заканчивает печатание одного из документов, она берет из общей папки следующий документ и приступает к работе над ним. В этом случае, как это видно из приведенной на стр. 473 таблицы, ["Все машинистки за-"1 [ няты перепечаткой J
J 0,7877 при 5 = 4 и }х=10, \ 0,8526 при 8 = 2 и ц = 20
(Я, = 36).
(14)
Таким образом, учитывая (9) — (11), будем иметь [-Количество докумен-т Е тов, находящихся на = L перепечатке J 7,0887 + 3,6 = 10,6887 7,6741 + 1,8 = 9,4741
при 5^4 и ц=10, при 8 = 2 и ^ = 20,
(15)
318
ГЛАВА 20
а с помощью (13) получим
/
г Продолжительность -i Е пребывания докумен- = L тов на перепечатке J 0,1969 + 0,1 = 0,2969 при 5 = 4 и ц = 10, 0,2132 + 0,05 = 0,2632
при 5 = 2 и ц = 20,
Следует отметить, что, ? отя вероятность задержки документа в очереди на исполнение во втором варианте (когда работают четыре неопытные машинистки) меньше, чем в первом варианте (когда работают две высококвалифицированные машинистки), среднее количество документов, исполняемых в течение рабочего дня, и средняя продолжительность полного времени, в течение которого документ находится на перепечатке, оказываются в первом варианте меньшими по сравнению с аналогичными показателями для второго варианта. Объединение усилий машинисток существенно сокращает среднюю продолжительность пребывания каждого документа на перепечатке и среднее количество документов на перепечатке в произвольно выбранный момент времени. Среднее время пребывания документа на перепечатке фактически оказывается почти таким же, как и в случае, когда ц, = const. Кроме того, следует отметить, что, если суммарная скорость перепечатки документов равняется 8ц = 40, большой разницы между первым и вторым вариантами не наблюдается. Мы рассмотрели два режима функционирования системы массового обслуживания как при 5 = 2, так и при 5 = 4 ; первый режим характеризуется тем, что каждая из машинисток работает автономно, тогда как во втором режиме усилия всех 5 машинисток объединяются. Посмотрим теперь, к чему приводит промежуточный вариант, когда при 5 = 4 из машинисток образуют две обособленные обслуживающие группы. В этом случае для каждой группы К = 36/2 = 18 и при 5 = 2 ц = 10 р Г Все машинистки 1 = 0 8^26 [заняты перепечаткой J ' ' г, Г Количество документов 1 _ п / ^41 1в каждой группе J ' ' Е
(18)
[-Продолжительность пребывания 1 =0,4264 + 0,1 = 0,5264. (19) I документа на перепечатке J ' '
Итак, мы видим, что такие характеристики, как вероятность того, что все машинистки заняты и среднее количество документов, находящихся на перепечатке в каждой группе, совпадает с соответствующими характеристиками первого варианта, когда используются две высококвалифицированные машинистки. Однако в случае образования двух групп машинисток среднее количество документов
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
319
в системе в целом, т. е. у всех четырех машинисток, оказывается вдвое больше, чем в случае единой группы. Отметим также, чтосредняя продолжительность пребывания документа на перепечатке удваивается по сравнению со случаем S = 2 и ц = 20. Результаты проведенного выше сравнения различных вариантов и режимов функционирования систем массового обслуживания справедливы и для других значений К, \л и S. В частности, при заданных значениях Я, и fi/S P [Вероятность того, что все обслуживающие приборы заняты] возрастает при убывании S; то же самое происходит при этом и со средним количеством требований, ожидающих в очереди, и со средней продолжительностью ожидания начала обслуживания. Однако среднее количество требований, находящихся в системе, а также и среднее время пребывания требования в системе сокращаются при убывании S. В зависимости от характера решаемой практической задачи руководитель может варьировать значениями X, ц и S и в результате найти требуемый оптимальный вариант. Если целевая функция задачи имеет простую структуру, решение может быть получено в аналитическом виде, либо же оно может быть представлено с помощью таблиц и графиков, облегчающих процесс оптимизации. В ряде случаев приходится прибегать к помощи весьма сложных алгоритмов, наподобие тех, которые рассматривались нами в гл. 18. Дисциплина очереди на основе системы приоритетов. В конце разд. 20.5 было показано, каким образом введение в рассмотрение некоторой системы приоритетов отражается на средней продолжительности ожидания начала обслуживания требований разных категорий. Напомним читателю, что требования каждой из г категорий поступают в систему в соответствии с пуассоновским распределением. С приоритетом k (k = 1, 2, . . ., г) связана частота поступления Kk, причем наивысшим является приоритет 1, а самым низким — приоритет г. Здесь мы будем исходить из предположения, что распределение длительностей обслуживания для требований каждой из г категорий носит экспоненциальный характер при средней скорости обслуживания, равной fi. Как и в предыдущем случае, определим
Пусть о> < S, что гарантирует возможность асимптотического перехода системы в равновесное состояние. Тогда Продолжительность ожидания п __ в очереди | приоритет k ]~ __ S/p _ р ' (S — <*h-i)(S— aft) *
г Все обслуживающие-j L приборы заняты J •
.„. ' '
320
ГЛАВА 20
Среднее время пребывания в системе произвольным образом выбранного требования (т. е. средняя продолжительность пребывания в системе, вычисленная на суммарном ансамбле, содержащем требования всех категорий) остается таким же, как и в системе без приоритетов при средней частоте поступления Я = 2 ^jРассмотрим, например, случай, когда А, = 36, £ = 2 и р, = 20. Согласно (16), в системе без приоритетов средняя продолжительность ожидания в очереди равняется 0,2132. Предположим теперь, что имеют место два уровня приоритета, причем A,t = А,2 = 18. С помощью (21) легко убедиться, что средняя продолжительность ожидания в очереди требования с приоритетом 1 равняется 0,0387 (=0,8526/22), а требования с приоритетом 2 равняется 0,3875 (=0,8526/2,2). Чем меньше значение Я 4 , тем меньше будет средняя продолжительность ожидания для требований обеих категорий. 20.7. ПРОЦЕССЫ РОЖДЕНИЯ И ГИБЕЛИ
В данном разделе дается унифицированное описание аналитических процедур, которые были нами использованы при рассмотрении процессов частного вида, и одновременно демонстрируется способ построения модели, которая помогает также анализировать ситуации несколько иного характера. Описываемые этой моделью процессы называются процессами рождения и гибели. Для начала будем предполагать, что вероятности переходов с течением времени не меняются, т. е. будем постулировать, что рассматриваемый нами процесс является однородным во времени. Будем считать, что исследуемая система функционирует непрерывно, т. е. не имеет определенной стартовой точки, и в момент t характеризуется количеством находящихся в ней требований, которое мы обозначим через п (п = О, 1, 2, . . .). Нам, разумеется, нужно договориться относительно выбора на оси времени начала отсчета t. Пусть в качестве начала отсчета времени выбрана точка t = 0; обозначим одновременно через i количество требований, находящихся в системе в момент 0. Пусть, по определению, Pin (Т) есть вероятность того, что в момент Т система будет содержать п требований при условии, что (1) количество требований в системе равнялось i в момент 0. Поскольку процесс однороден во времени, величина Pin (h) при h > 0 определяет не только вероятность перехода на интервале (О, К), но и вероятность перехода на интервале (Т, Т-\-К) при произвольном значении Т, т. е. представляет собой вероятность того, что в момент Т-\- h в системе будет находиться п требований при условии, что в момент Т в данной системе находилось i требований. Нами постулируется, что вероятности Pin (Т) удовлетворяют известным уравнениям Колмогорова — Чэпмена для однородных
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
321
во времени марковских процессов. Эти уравнения имеют следующий вид: ^Pim(T)Pmn(h) A>0, (2) при любых значениях i и т. Соотношения (2) эквивалентны утверждению, что вероятность обнаружения в системе п требований в момент Т + h при условии, что в системе было i требований в момент Т, можно определить путем сложения произведений совместных вероятностей наличия в системе т требований в момент Т при наличии в ней i требований в момент 0 и вероятностей наличия в системе п требований в момент T+h, при условии, что в момент Т в системе находилось т требований. Так называемое марковское свойство процесса просто означает, что действительно существенной информацией для описания состояния системы в момент Т является лишь информация о количестве требований, находящихся в системе в этот момент (это число мы обозначили через т), а информация о всей предыстории протекания процесса до момента Т оказывается совершенно несущественной 1). В этом смысле система «не обладает памятью» (или, как иногда говорят, является системой «без последействия») и, следовательно, условие (2) является нетривиальным. [Можно привести примеры процессов, для которых условие (2) не выполняется.] Процесс рождения и гибели является частным случаем дискретного марковского процесса, определяемого уравнением (2). Предположим, что в течение очень малого интервала времени (Т, Т-\-К), причем h > 0, количество поступивших в систему требований, так же как и количество требований, обслуженных системой, не превышает единицы (т. е. равняется либо нулю, либо единице). Для этого случая мы получим Pm. m+i (h) ж (Ат/г) (1 — pmh) » Xm/i при m = О, 1, 2, . . . , Ртп, m-l(h) « (1—
так что Pmm (А) » 1 — Pm. m-1 W — Рт. m+i (Щ « 1 — (Ят + Цп.) h
при
т = 1, 2, ..., РОО (А) « 1 — POI (h) « 1 — AO/I
(4)
при т = О,
где А™ ^ 0 при любом значении т, а цт > 0 при т ^ 1; все другие вероятности Ртн (fy = 0. Другими словами ( при очень малых значе1 ) Это свойство можно обобщить и на случай процессов, непрерывных как в пространстве, так и во времени. Уравнения Колмогорова — Чэпмена для непрерывных марковских процессов см., например, в книге А. Т. Баруча-Рида «Элементы теории марковских процессов и их приложения», изд-во «Наука», 1969.— Прим. перее.
322
ГЛАВА 20
ниях h вероятность того, что количество требований в системе в течение интервала (Г, T-\-h) возрастет на единицу, равна приблизительно ^m/i, где т — количество требований, находящихся в системе в момент Т\ аналогично вероятность того, что в течение интервала (Т, Т + h) количество требований в системе уменьшится на единицу, равняется приблизительно [imh, где m — количество требований, находящихся в системе в момент Т. В принятом нами приближении вероятность того, что по истечении интервала (Т, Т + h) в системе по-прежнему будет находиться m требований (т. е. состояние системы не изменится), можно положить равной 1 — Kmh — \imh г). Величины А,т и цт можно интерпретировать как частоты появления требований, соответственно на входе и на выходе системы, когда количество требований, находящихся в системе, равняется т. Важно отметить, что никаких предположений относительно количества обслуживающих приборов и дисциплины очереди нами не делалось. Сформулированные выше постулаты имеют отношение лишь к вероятности «рождения» (поступления) и «гибели» (выхода из системы). Подставляя (3) и (4) в уравнение (2), для п > 1 получаем Pin (T + h)& Pi.n,, (Т) /Vi. n (h) + Pin (T) Pn. n (h) + + Pi, n+l (T) Pn+i, n (h) » Pi. n-i (T) Kn-ih + Pin (T) [1 -(X n + i*n) h] + (при малых значениях h). (5) Перенесем Pin (Т) в левую часть соотношения (5), разделим левую и правую части полученного при этом уравнения на h и устремим h к нулю. В результате будем иметь так называемую систему опережающих дифференциальных уравнений
- - = Wi. »-i (Т) - (я* + 1*») Pin (Т) + iWt. n+i (T).
(6)
Соотношение (6) является уже не приближенным, а точным, так как при h -> 0 члены, опущенные нами в (5), в процессе указанного предельного перехода обращаются в нуль. Уравнение (6) позволяет также описать случай, когда п = 0; для этого достаточно положить Я_! = 0 и Цо = 0. Итак, (6) представляет собой систему уравнений для п — О, 1, 2, . . . при начальном количестве требований в системе, равном г. Термин «опережающие уравнения» отражает то обстоятельство, что при их выводе рассматривалось положительное приращение времени в пределах интервала (Т, T-\-h), где h > 0, а в качестве приближенных формул для вероятностей переходов были использованы соотношения (3) и (4). Можно вывести также «запаздывающие уравнения», рассматривая переходы на интервале (Т-}- h, Т) 1
) Наше приближенное выражение опирается на предположение, что членами, содержащими hh (k > 2), можно пренебречь.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
323
при h > 0 [или, что то же самое, на интервале (Т, T-\-h) при h < 0] и используя аналоги соотношений (3) и (4) для Plm (h), построенные применительно к данному случаю. В получаемых таким путем дифференциальных уравнениях значение п в момент Т считается заданным, a i (т. е. количество требований, находящихся в системе в момент 0) варьируется, принимая значения i = О, 1, 2, . . . . Систематизация полученных ранее результатов. Попытаемся теперь показать, что из уравнений (6) вытекают (как частные случаи) уравнения для ряда моделей, анализ которых проведен нами в предыдущих разделах данной главы. Рассмотрим модель чистого рождения с пуассоновским входным потоком (описание модели приведено в разд. 20.3). Для чистого рождения kn = Я,, а (Ап = 0 при любых значениях п. В предположении, что в момент 0 i = 0, уравнение (6) переходит в уравнение (7)
При произвольном значении i в случае, когда ц„ = 0, а Яп = А, имеем Л
~^>~^
(8)
что согласуется с приведенными в разд. 20.3 формулами (10) и (XI) для i = 0. Рассмотрим теперь описанную в разд. 20.4 модель чистой гибели с единственным обслуживающим прибором и экспоненциальным распределением длительностей обслуживания при наличии в системе в момент О М требований. В этом случае Кп = 0 при любых значениях п, а }гп = [х при М ^ п ^ 1, так что (6) принимает вид
.п+1(Т) при п = М.
при М>«>1,
(9) (Ю)
Данная система уравнений имеет решение РМп (Т) = Рп (Т), определяемое формулой (13) из разд. 20.4. Пусть вместо предположения, что система располагает одним обслуживающим прибором, принято допущение, что в момент 0 может начаться обслуживание всех М требований (как, например, это имеет место в случае самообслуживания). Тогда |яп = n\i (М ^ п ^ 0), и, как легко убедиться, уравнения (6) приводят к тем же результатам, что и уравнения (20) и (21) из разд. 20.4. Рассмотрим, наконец, одноканальную модель с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания (описание модели дано в разд. 20.5). Можно показать, что при Кп = К для /г > 0 и цп = [л для п^\ уравнения (6) становятся эквивалентными системе уравнений (4) и (5), приведенной
324
ГЛАВА 20
в разд. 20.5. Напомним читателю, что фигурирующий в (6) индекс i, который обозначает количество требований в системе в момент О, был нами в упомянутых выше уравнениях (4) и (5) опущен, поскольку основное внимание в разд. 20.5 уделялось отысканию вероятностных характеристик процесса в условиях статистического равновесия. [При получении аналитического решения (6) для неустановившегося режима необходимо учесть начальные условия Pit (0) = 1 и Pin = О при i s£ тг.] Решение для установившегося режима. Фигурирующие в (6) вероятности переходов зависят как от г, так и от Т. Рассмотрим теперь асимптотический случай, когда Т ->• оо, и допустим, что в пределе система достигает состояния статистического равновесия. В этом предельном случае протекающие в системе процессы уже не зависят от численного значения i в момент 0, и, следовательно, индекс i в обозначениях для вероятностей состояния системы можно снова опустить. Как и в разд. 20.5, стационарные (т. е. соответствующие равновесному состоянию системы) значения Рп можно определить, приравняв нулю производные dPin/dT, фигурирующие в левой части (6). Тогда, опуская всюду индекс г, будем иметь следующую систему уравнений в конечных разностях: 0 = Kn-iPn-i-(bn + Hn)Pn + y>n+iPn+i при и>1, (11) 0 = — ХоРо + цЛ прига= 0. (12) Применив метод математической индукции и начав с решения (12), для цп > 0 при любых значениях п = 1, 2, . . ., получим — ^и-1. А.п-2
V
[Если существует такое N, для которого [iN = 0, а при п > N условие цп > 0 выполняется, и если в момент 0 i > N, то Рп при п < N тождественно равняются нулю, и выражение (13) после увеличения значений всех индексов на ./V по-прежнему является решением системы уравнений (11) и (12).] Значение Р0 определяется из условия
п=1
При этом, как и при рассмотрении всех прочих моделей, приведенных нами в связи с анализом задач массового обслуживания, постулируется, что ряд в правой части (14) обладает свойством абсолютной сходимости. Так, например, в случае одноканальной модели с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания (разд. 20.5) (15)
_
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
325
и, следовательно, Ро = 1 - р.
(16)
Легко доказать, что для сходимости ряда в правой части (14) достаточно, чтобы при больших п, скажем при п ^э N, выполнялось условие Хп ^ Фп+i (п ~ 1' 2, . . ., N), где г лежит в интервале, определяемом неравенством 1 >• г >. 0. В случае когда суммарное количество находящихся в системе требований не может превышать М (т. е. длина очереди конечна), для п ^ М в уравнениях (11) и (12) можно положить Кп = 0, так что, согласно (13), при п > М вероятности Рп = 0. Таким образом, в этом случае Ро легко вычисляется путем нахождения [по аналогии с (14)] суммы, содержащей конечное число слагаемых. Примеры. Попытаемся теперь продемонстрировать возможности, заложенные в уравнениях для процессов рождения и гибели. Пример 1. Предположим, что поток требований является пуассоновским с параметром Я,, причем будем считать, что каждое требование обслуживает себя в соответствии с экспоненциальным|распределением длительностей обслуживания с параметром ц. (Такую систему можно квалифицировать как систему с бесконечно большим количеством обслуживающих приборов и представить символически в виде М/М/-оо.) Таким образом, Яп = Я, и \лп — пц, [т. е. как \in в соотношении (17) из разд. 20.4]. Следовательно,
и мы имеем Р0 = е~р,
п -р
О
Рп—-¥— j— (пуассоновское распределение).
(18)
(Соотношение цп = пц может иметь место и в системе с одним обслуживающим прибором, если скорость обслуживания возрастает пропорционально количеству поступающих требований.) Пример 2. Пусть имеется один прибор, характеризующийся экспоненциальным распределением длительностей обслуживания, т. е. цп = fj, (п ^ 1). Однако допустим, что наблюдаются отказы требований присоединиться к очереди, причем наблюдается следующая закономерность: А,п =АУ(ге-|-1). Нетрудно убедиться, что при сформулированных выше предположениях мы также придем к формулам (17) и (18). Пример 3. Рассмотрим многоканальную модель, описание которой дано в разд. 20.6. В упомянутой модели Кп=К,
п^О.
(19)
Используя приведенную в разд. 20.4 формулу (17), мы убеждаемся, что частота завершения процедур обслуживания равна величине пц,, когда количество находящихся в системе требований удовлетворяет
326
ГЛАВА 20
условию п < S, и величине S\i при п > S, т. е. гец при S[n при Читатель может самостоятельно проверить, что полученные в разд. 20.6 уравнения в конечных разностях (3) согласуются с приведенными выше уравнениями (11) и (12), а формулы (4) и (5) из раздела 20.6 оказываются аналогичными соответственно формулам (13) и (14), полученным в предыдущем подразделе. Пример 4. До сих пор нами анализировались модели, в которых предполагалось, что источник требований обслуживания неисчерпаем. Рассмотрим теперь модель, в которой источник требований обладает ограниченной мощностью и, следовательно, частота поступлений новых требований уменьшается по мере увеличения количества требований в обслуживающей системе. С помощью такого рода модели можно, например, описывать ситуации, наблюдаемые на промышленном предприятии, располагающем некоторым фиксированным количеством агрегатов определенных типов (станков, энергосиловых установок и т. п.), которые время от времени выходят из строя и требуют ремонта. Пусть М — число агрегатов, a R — число специалистов по ремонту агрегатов данного типа. Допустим, что сроки возникновения неисправностей в каждом агрегате имеют экспоненциальное распределение, т. е. поломки возникают в средне. с частотой Я,, причем независимо от поведения других агрегатов. Предположим, кроме того, что ремонт каждого неисправного агрегата требует вмешательства только одного мастера-ремонтника. Наконец, будем считать, что распределение длительностей ремонта одного неисправного агрегата определенного типа является экспоненциальным, причем средняя скорость выполнения ремонтных работ \л одинакова у всех мастеров-ремонтников и не зависит от того, какой конкретно агрегат требует ремонта. Пусть в момент t число вышедших из строя агрегатов равняется п и, следовательно, число действующих агрегатов равняется М — п. Тогда вероятность того, что в течение очень малого интервала It, t + h] (h > 0) произойдет поломка одного из агрегатов, которые в момент t нормально функционировали, определяется следующей приближенной формулой (ее вывод осуществляется уже известным читателю способом): Один из М — п агрегатов-i выходит из строя в тече- да (М — п) К h. (21) ние интервала (t, t-\-h) J Аналогичным образом находим "В течение интервала" (t, t-\-h) заканчиваn\ih при Д>«>1 (22) ется ремонт одного из п неисправных агрегатов
[
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
327
Легко убедиться, что при М ^ п > R в правой части (22) будем иметь R^h. Следовательно, в обозначениях, используемых при описании процессов рождения и гибели, будем иметь
( (М — п) К при М > п > О, при га > М; ~tО при R ^га^ 1, { ге|л Л|а при М >га> Л. В этих обозначениях уравнения в конечных разностях (11) и (12) принимают следующий вид: О = —МЯРо+и,.?! при га = О, О = (М — га + 1) ЯР„_! — [(М — га) Я -f- гац] Рп + (га + 1) \иРп+1 при Л >га> 1, (24) О = (М — га+ 1) ЯРп.! — [(М — л) Я + #[*! ^п + -ЙИ^п+i при М ^га^ Л, а формула (13) с учетом того, что Я/[х = р, может быть представлена следующими эквивалентными соотношениями:
при R^-n^-0. ^ ^ при "
,„.-, 25 ( )
где CM = Ml/га! (М — га)!, как обычно, обозначает биномиальный коэффициент. При этом значение РО находится из естественного условия
S Л> = 1-
п=0
(26)
Простых формул для ожидаемого количества вышедших из строя агрегатов, к сожалению, не существует. Однако в каждом конкретном случае значение Е [га] легко вычисляется, если воспользоваться уже известными численными значениями Рп, найденными с помощью формулы (25). Вопросы интерпретации модели. Вероятностная структура каждой из рассмотренных выше моделей массового обслуживания описывалась нами с помощью распределения продолжительностей интервалов между поступлениями требований и распределения длшгльностей процедур обслуживания. Пока речь шла о системах с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания, никаких неясностей в интерпретации соответствующей модели не возникало. Однако в тех случаях, когда Хп является некоторой функцией га [одна из таких ситуаций упомянута нами в предыдущем подразделе (см. пример 2)], подобрать компактное аналитическое представление соответствующей функции
328
ГЛАВА 20
распределения оказывается далеко не простым делом, а в ряде случаев просто невозможным. Это объясняется сложным характером зависимости числа поступающих требований от состояния системы и режима ее функционирования. Аналогичные трудности возникают и в тех ситуациях, когда от состояния системы зависит \лп (как, например, это имеет место в примере 3, приведенном в предыдущем подразделе, когда скорость функционирования обслуживающего прибора зависит от количества требований, находящихся в обслуживающей системе). Таким образом, легко интерпретируется лишь процесс рождения и гибели частного характера, а именно процесс с пуассоновским входным потоком и показательным распределением длительностей процедур обслуживания. Следует отметить, что подобного рода трудности возникают и в связи с определением распределений вероятностей и вычислением математических ожиданий продолжительностей пребывания требований в обслуживающей системе (даже в тех случаях, когда имеет место дисциплина очереди «первым пришел — первым обслуживаешься»). 20.8. О ДРУГИХ МОДЕЛЯХ МАССОВОГО ОБСЛУЖИВАНИЯ
Почти все результаты, полученные в данной главе, имеют отношение к моделям массового обслуживания, в которых процесс поступления требований является пуассоновским, а длительности интервалов, расходуемых каждым прибором на обслуживание одного требования, имеют экспоненциальное распределение. Во всех рассмотренных нами моделях предполагалось, что имеет место лишь одна очередь с дисциплиной «первым пришел — первым обслуживаешься». (Ситуации с несколькими очередями анализировались нами исходя из предположения, что всю систему в целом можно представить в виде совокупности подсистем, функционирующих параллельно и независимо одна от другой.) Эти результаты не так трудно обобщить на случаи, когда условия задачи слегка видоизменены. Так, например, весьма просто удается учесть вероятность отказов (т. е. тенденцию клиентов-требований воздерживаться от присоединения к очереди по мере того, как ее длина возрастает), а также вероятность присоединения к очереди клиентов с ограниченным временем ожидания (т. е. имеющих склонность выбывать из системы обслуживания до того, как их успеют обслужить). (Для этого требуется лишь в весьма незначительной степени переопределить параметры Кп и ц„, фигурирующие в модели рождения и гибели, описание которой дано в разд. 20.7). В приложении III рассмотрен ряд примеров, в которых продолжительности интервалов между поступлениями требований и длительности обслуживания имеют распределения, отличные от экспоненциального. (Некоторые из иллюстрируемых при этом методов можно использовать также для анализа моделей с отказами как со стороны клиентов, так и со
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
стороны обслуживающей системы.) В принципе можно получить формулы, которые позволили бы учитывать различные, хотя, как правило, лишь весьма простые виды дисциплины очереди, такие, как обслуживание «со случайным выбором требований» и обслуживание по схеме «пришел последним — обслуживаешься первым». Однако эти вопросы в данной книге подробно не обсуждаются. Если иметь в виду конкретные практические приложения теории массового обслуживания, то случаи, когда модель представляет собой точную копию реального процесса, является скорее исключением, чем правилом. Поэтому математические модели следует использовать главным образом с целью достижения лучшего понимания особенностей решаемой задачи и ради определения степени чувствительности функциональной эффективности системы к вариациям содержания управляющих решений. Если предварительное исследование (основанное на применении того или иного приближенного метода) показывает, что отрицательные экономические последствия ошибочного управляющего решения оказываются весьма серьезными, то возникает необходимость в проведении более тщательного анализа задачи с применением имитационного моделирования исследуемых процессов на ЭВМ. КОНТРОЛЬНЫЕ УПРАЖНЕНИЯ
1. Приведите два-три примера задач массового обслуживания, научный анализ которых мог бы представить определенный интерес. Укажите, к какой из упомянутых в начале разд. 20.1 категорий можно было бы отнести названные вами задачи. Опишите характер управляющих решений, которые могли бы иметь место в результате научного анализа каждой из предложенных вами задач, и объясните, каким образом можно было бы отличить правильное решение от ошибочного. 2. Для каждого из приводимых ниже условий подберите несколько взятых из жизни примеров, которые иллюстрируют характер функционирования системы массового обслуживания. (Постарайтесь быть изобретательными и избегайте повторения ситуаций, уже рассмотренных нами в данной главе.) Рассмотрите следующие варианты: а) требования поступают в обслуживающую систему по одному; б) требования поступают в обслуживающую систему пачками; в) порядок поступлений известен заранее; г) поступления совершенно случайны; д) источник требований неисчерпаем; е) источник требований имеет ограниченную мощность; ж) в очередь становится каждое из поступивших требований; з) возможен отказ от присоединения к очереди со стороны некоторых из поступивших требований; и) имеет место дисциплина очереди «первым пришел — первым? обслуживаешься»;
.330
ГЛАВА 20
к) имеет место дисциплина очереди «пришел последним — обслуживаешься первым»; л) имеет место случайный порядок обслуживания; м) дисциплина очереди построена на определенной системе при•оритетов; н) присоединившиеся к очереди требования не покидают систему .до тех пор, пока их не обслужат; о) некоторые из требований могут покинуть систему, не дождавшись, пока их обслужат (т. е. ожидают обслуживание лишь ограниченное время); п) имеется единственная очередь; р) имеется несколько параллельных очередей; с) возможен переход из очереди в очередь; т) обслуживающие приборы функционируют параллельно; у) обслуживающие приборы расположены последовательно; ф) скорость обслуживания не зависит от длины очереди; х) скорость обслуживания зависит от длины очереди. 3. Рассмотрите две-три ситуации из числа тех, которые были :>вами названы при выполнении упражнения 2. а) Определите четыре-пять важных, с вашей точки зрения, операционных характеристик, которые необходимо измерить количественно, с тем, чтобы оценить степень эффективности соответствующих функциональных систем. б) Укажите также различные варианты организационных мер, из которых можно будет выбрать подходящий при проектировании более эффективных операционных систем (при этом обязательно укажите, что вы понимаете под эффективностью системы). 4. а) Рассмотрите экспоненциальное распределение (2), приведенное в разд. 20.3. Покажите, что для данного распределения математическое ожидание и дисперсия равняются соответственно 1А и 1АЛ б) Проверьте правильность выполнения математических операций, которые приводят к результатам (3) и (4) и, таким образом, устанавливают свойство экспоненциального распределения «не помнить о прошлом». в) Проверьте, действительно ли сумма п независимых выборок из показательного распределения (2) дает гамма-распределение (8). г) Проверьте окончательный результат, представленный соотношением (9), путем и-кратного применения формулы интегрирования т по частям к \ g (у) dy [где g (у) определяется формулой (8)]. д) Найдите с помощью (10) вероятность одного поступления в интервале, продолжительность которого Т = h. Примените затем метод разложения в ряд Тейлора и убедитесь в правильности приближенной формулы (7).
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
331
е) Покажите, что математическое ожидание и дисперсия имеют в случае пуассоновского распределения вид (11). ж) Убедитесь, что из (9) и (10) следует (12). Дайте истолкование соотношению (12). з) Покажите, что если в распределении Эрланга (14) произвести замену kn -> К, то в результате получится гамма-распределение (8). 5. Сравните графики, приведенные на рис. 20.2, а и 20.2, б, и проанализируйте, как изменяется форма и в какую сторону смещается положение максимума / (t) при изменении значений п и К. 6. Рассмотрите модель чистой гибели, описание которой дано в разд. 20.4. а) Выведите соотношение (12), используя доводы, аналогичные тем, которые приводились нами в связи с получением системы уравнений (11). б) Покажите, что Рп (Т) и Ро (Т), определяемые соответственно формулами (13) и (14), удовлетворяют системе дифференциальных уравнений (11) и (12). в) Проанализируйте асимптотическое поведение Рп (Т) при Т —»• -> °°; рассмотрите случаи, когда п = 1, 2, . . ., М, а также случай, когда п = 0. (Указание', рассмотрите частный случай, когда М = 2, а (л = 1, и начертите график Рп (Т) для каждого значения п.) 7. Рассмотрите модель самообслуживания, описание которой дано в разд. 20.4. а) Дайте подробное обоснование приближенных формул (17) и (18). б) Дайте подробное обоснование приближения, которое было нами использовано при записи соотношения (19), и покажите, как получается уравнение (20). в) Проверьте, действительно ли биномиальное распределение (22) удовлетворяет системе дифференциально-разностных уравнений (20) и (21). г) Проанализируйте асимптотическое поведение Рп (Т) при Т -»—v об (п = 0, 1 , 2 , . . ., М). (Указание: рассмотрите частный случай, когда М = 2, а ц = 1, и начертите график Рп (Т) для каждого значения п.) д) Положите М = 1. Сравните вероятности, определяемые формулами (13) и (14), с вероятностями, определяемыми формулой (22), при п = О, 1. 8. Рассмотрите одноканальную модель с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания (описание модели дано в разд. 20.5). а) Выполните все алгебраические операции, с помощью которых из (3) получается уравнение (4). Покажите также, каким образом получается уравнение (5). б) Придумайте ситуацию, в которой Рп (Т) стремится при Т-*- °° к некоторому предельному значению, а Е [п] не является конечным (т. е. асимптотически обращается в бесконечность). Поясните, почему
332
ГЛАВА 20
в данном случае термин «статистическое равновесие» оказывается неприменимым. (Указание: рассмотрите случай, когда К > ц.) в) Дайте истолкование условию (6). г) Убедитесь, действительно ли стационарные вероятности Рп, определяемые соотношением (10), удовлетворяют уравнениям в конечных разностях (7). д) Выполните все алгебраические действия, с помощью которых удается вывести формулы (13), для Е [и], Var Ы и Р [п ^ N}, имеющие место в случае геометрического распределения. е) Дайте подробное обоснование каждого из равенств (15) и проделайте все промежуточные алгебраические операции, позволяющие получить окончательное выражение для Е [Длина очереди]. ж) Выполните все алгебраические действия, связанные с выводом формулы (19). з) Выполните все алгебраические действия, связанные с получением формулы (21). 9. Рассмотрите гипотетическую задачу комплектования штатов, описание которой дано в разд. 20.5. В какой степени данная упрощенная модель аппроксимирует реальную ситуацию? Почему среднее значение задержки документа у машинистки в действительности скорее всего окажется меньшим по сравнению со средней задержкой, вычисленной по формуле (20)? Какие дополнительные соображения следовало бы, на ваш взгляд, принять во внимание при решении дилеммы управляющего нотариальной конторой? 10. Рассмотрите задачу комплектования штатов, описание которой дано в разд. 20.5. В каждом из указанных ниже случаев определите среднее количество документов, находящихся на перепечатке у всех машинисток вместе и у каждой из них в отдельности. Вычислите среднее время нахождения документа на перепечатке и среднюю продолжительность периодов, в течение которых машинистки занимаются собственно перепечаткой документов. Рассмотрите следующие варианты: а) 5 = 1, ц = 40. б) S = 10, ц = 4. 11. Предположим, что в задаче комплектования штатов (разд. 20.5) среднее количество документов, поступающих на перепечатку в течение рабочего дня, равняется 38. Для каждого из двух указанных в условии задачи вариантов определите среднее количество документов, находящихся на перепечатке у всех машинисток вместе и у каждой из них в отдельности. Вычислите среднее время нахождения документа на перепечатке и среднюю продолжительность периодов, в течение которых машинистки занимаются собственно перепечаткой документов. 12. Рассмотрите описанную в разд. 20.5 модель с конечной длиной очереди. а) Попытайтесь убедительным образом объяснить, почему статистическое равновесие достигается при любом значении траффикинтенсивности АУц.
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
333
б) Проверьте, что при К < \л и М ->• с» выражение (23) переходит в (12). в) Выведите формулу для Е [Количество требований в обслуживающей системе], используя для Рп формулу (23) при К ф (j,. Повторите упражнение, предположив, что К = р,. г) Положите р = 0,7; 0,8; 0,9; 0,95 и определите в каждом случае такое значение М, для которого полученное с помощью формулы (24) среднее количество требований в обслуживающей системе не превышает 0,01 значения аналогичной операционной характеристики, которое вычислено с помощью формулы (13). д) Определите предельное значение заданного формулой (24) среднего числа требований, находящихся в обслуживающей системе, при р-> оо. е) Положите М = 3. Вычислите Е [Количество требований в обслуживающей системе] для р = 1, 2, 5, 10. 13. Рассмотрите описанную в разд. 20.5 одноканальную модель с пуассоновским входным потоком и произвольным распределением длительностей процедуры обслуживания. а) Убедитесь, что, если распределение длительностей процедуры обслуживания является экспоненциальным, формулы (29), (30) и (32) принимают соответственно вид (13), (15) и (20). б) Положите ц = 10. Вычислите операционные характеристики, определяемые формулами (29), (30) и (32) для р = 0,7; 0,8; 0,9; 0,95 при V - 0; 0,01; 0,1; 1. 14. Рассмотрите одноканальную модель с дисциплиной, основанной на системе приоритетов, описание которой приведено в конце разд. 20.5. а) Проверьте, действительно ли при г = 1 выражение (35) принимает значение Е [Продолжительность ожидания в очереди], определяемое формулой (32). б) Проверьте, правильно ли выполнены вычислительные операции в (37). в) Положите в (37) ?ц = Ji2 — 9. Вычислите среднее время ожидания в очереди для требований с приоритетом 1 и для требований с приоритетом 2. Установите, что произойдет, если положить Xj = 3. Повторите упражнение, положив Kt = 15. (При этом следует помнить о том, что A,j + Я2 = 18.) г) Пусть KI = Я2 = 9, Hi = 30, \иг — 15, а длительности процедур обслуживания распределены по экспоненциальному закону. Определите средние длительности ожидания в очереди для требований с приоритетами 1 и 2. д) Предположите, что A,t = Я2 — 9, Ц! — \а2 = 20; пусть при 2 этом У! = 0, a У2 = 1/20 . Определите среднее время ожидания в очереди для требования с приоритетом 1 и среднее время ожидания в очереди для требования с приоритетом 2. е) Повторите п. д), предположив, что Fi = 1/202 (вместо FI = 0), а У а = О (вместо У г = 1/202).
334
ГЛАВА 20
ж) Положите АЧ. = А,2 = 9, [ii = 30, jj,a = 15; пусть при этом 2 Vi = О, a F2 = 1/15 . Определите среднее время ожидания в очереди для требований с приоритетами 1 и 2. з) Повторите п. ж), положив FI = 1/302 (вместо нуля), a F2 = О (вместо 1/152). и) Предположите, что имеется три уровня приоритетов (и соответственно три категории требований), причем KI = Я2 = Я3 = 6. Пусть для каждой из упомянутых категорий jj, = 20, а длительности процедур обслуживания распределены по экспоненциальному закону. Определите для каждой из трех категорий среднюю продолжительность ожидания в очереди. к) Повторите п. и), положив ^ = 33V3, Щ = М-з = 162/3 (вместо И = М-2 = Из — 20). л) Повторите п. и), положив [Л1 = 40, ji 2 = 20 и \LZ = 13V3 (вместо |^1 = (12 = М-з = 20). 15. Рассмотрите многоканальную модель, описание которой дано в разд. 20.6. а) Убедитесь, что вероятности Рп, определяемые формулами (4) и (5), действительно удовлетворяют уравнениям в конечных разностях (3). б) Проверьте, действительно ли при S = 1 формулы (4) и (5) становятся эквивалентными формуле (12) из разд. 20.5. в) Выполните все промежуточные алгебраические операции, связанные с доказательством того, что в случае неограниченного количества обслуживающих приборов (случай самообслуживания) вероятности Рп, определяемые соотношениями (4), принимают вид, соответствующий пуассоновскому распределению. (Указание: воспользуйтесь разложением ехр х в ряд Тейлора.) 16. Рассмотрите многоканальную модель, описание которой дано в разд. 20.6. Выполните все алгебраические действия, связанные с выводом: а) формулы (6); б) формулы (8); в) формулы (9); г) формулы (10). 17. Рассмотрите описанную в разд. 20.5 задачу комплектования штата секретарей-машинисток нотариальной конторы. Пусть машинистки перепечатывают поступающие документы, выбирая их из общей «очереди», причем частота поступления К = 38 документам в день. Вычислите Р [Все машинистки заняты перепечаткой], Е [Количество документов у машинисток], Е[Продолжительность пребывания документа у машинисток] при условии а) S - 4 и ii = 10; в) S = 1 и р = 40; б) S = 2 и (г = 20; г) 5 = 10 и ji = 4. 18. Рассмотрите многоканальную модель, в которой дисциплина очереди построена на основе системы приоритетов, описание которой дано в конце разд. 20.6. В каждом из указанных ниже случаев вычислите с помощью (21) среднюю продолжительность ожидания в очереди для требования каждой из k категорий: a) k = 2, Я,! = Я., = 18, }А = 10, S = 4;
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
335-
б) k = 2, Я,л = Я2 = 18, (1 = 40, 5 = 1; в) k = 2, Я,4 = Я,, = 18, ц = 4, 5 = 10; г) k = 3, V = Х 2 = Х 3 = 6, ц = 20, 5 = 2. 19. Рассмотрите процесс рождения и гибели, описание которого» приведено в разд. 20.7. а) Подставьте (3) и (4) в (2) и убедитесь, что в результате получите (5). б) Запишите уравнение (6) для п — 0. в) Рассмотрите случай чистого рождения при произвольном значении i и покажите, какой вид при этом принимает уравнение (6). [Для i — 0 уравнение (6) имеет вид (7).] Покажите, что (8) действительно удовлетворяет дифференциально-разностному уравнению (7). г) Покажите, что вероятности .РМп (Т) = Рп (Т), определяемые приведенной в разд. 20.4 формулой (13), являются решением системы уравнений (9) и (10), описывающих одноканальную модель чистой гибели. д) Проанализируйте модель чистой гибели, в которой все М требований приступают к самообслуживанию в момент 0. Убедитесь, что система дифференциальных уравнений (6) приводит к тем же результатам, что и система дифференциальных уравнений (20) и (21) из разд. 20.4. е) Рассмотрите приведенную в разд. 20.5 одноканальную модель с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания. Убедитесь, что система уравнений (6) в этом случае эквивалентна системе уравнений (4) и (5) из разд. 20.5. ж) Проверьте, действительно ли стационарные вероятности Рп, определяемые формулой (13), удовлетворяют уравнениям в конечных разностях (11) и (12). з) Объясните, почему Рп = 0 при п < N, где число N таково, что fXjy = 0, а (д,„ при п > N принимают отличные от нуля значения в предположении, что в момент 0 i > N. и) Докажите, что если существует такое N, что Кп ^ ?>n+t (1 > г > 0) при п ^ N, то ряд в правой части (14) сходится. 20. Рассмотрите процесс рождения и гибели, обсуждению которого посвящен разд. 20.7. а) Рассмотрите пример 2 и покажите, что соответствующие вероятности Рп определяются соотношениями (17) и (18). б) Рассмотрите пример 3 и покажите, что приведенные в разд. 20.6 уравнения в конечных разностях (3) согласуются с (11) и (12), а приведенные в разд. 20.6 формулы (4) и (5) согласуются с формулами (13) и (14) из разд. 20.7. в) Рассмотрите пример 4. Объясните, почему правая часть (22) при М ^ п ^ R становится равной R\\h. Убедитесь, что подстановка (23) в уравнения в конечных разностях (11) и (12) приводит к (24). Проверьте также, что формула (13) при удовлетворении условия (23) переходит в формулу (25).
336
ГЛАВА 20
21. Объясните, как вы понимаете следующие термины: операционные характеристики; входной поток требований; групповое поступление требований; требование, выбывающее из очереди до обслуживания; требование с ограниченным временем ожидания; дисциплина очереди; «первым пришел — первым обслуживаешься»; «пришел последним — обслуживаешься первым»; обслуживание по принципу случайного выбора; обслуживающие приборы (каналы); параллельное включение обслуживающих приборов; последовательное включение обслуживающих приборов; процесс рождения; процесс гибели; процесс восстановления; рекуррентные, или статистически независимые, события; абсолютно независимые поступления (требований); стационарный процесс; отсутствие памяти или отсутствие последействия; продолжительность интервала между последовательными поступлениями (требований); экспоненциальное распределение интервалов между последовательными поступлениями (пуассоновский входной поток); регулярные (строго периодические) поступления; длительность процедуры обслуживания; экспоненциальное распределение длительностей процедуры обслуживания; модель чистой гибели; средняя скорость обслуживания ^; модель самообслуживания; обозначения Кендалла; одноканальная модель, или модель с одним обслуживающим прибором; многоканальная модель, или модель с S обслуживающими приборами (S > 1); решение для неустановившегося режима; статистическое равновесие; стационарные вероятности; траффик-интенсивность р; коэффициент загруженности р; уравнения в конечных разностях; модель с конечной очередью; дисциплина очереди на основе системы приоритетов; процесс рождения и гибели; уравнения Колмогорова — Чэпмена;
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
337
модель чистого рождения; средняя частота поступлений Я; распределение Эрланга; однородный во времени марковский процесс. УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ И РАЗВИТИЕ ВЫЧИСЛИТЕЛЬНЫХ НАВЫКОВ
22. Пусть речь идет о товарных запасах некоторого изделия на складе одной торговой фирмы. Запасы этого изделия пополняются в соответствии со следующим правилом: «как только уровень запасов оказывается ниже единицы, оформляется заказ на дополнительную поставку десяти таких изделий». Предположим, что уровень запасов на текущий момент равняется трем, причем в любой момент времени от клиентуры фирмы может поступить заявка на этот товар в объеме, строго равном единице, а продолжительность интервалов между поступлениями таких заявок характеризуется экспоненциальным распределением со средней частотой, равной двум поступлениям в неделю. а) Каково распределение вероятностей для количества рассматриваемых изделий, запрашиваемых клиентурой фирмы в течение двухнедельного периода? (Требуется определить как математическую структуру этого распределения, так и значения соответствующих характеристических параметров.) б) Какова вероятность того, что в ближайшую неделю не будет иметь места пополнение запасов? Какова вероятность того, что пополнение запасов не будет иметь места в течение двух ближайших недель? (Приведите для упомянутых вероятностей формулы и оцените эти вероятности количественно.) 23. Рассмотрим производственно-технологический процесс, реализуемый линией из двух агрегатов А и Б. Выходной поток продукции, производимой первым агрегатом (А), является пуассоновским со средней нормой выработки, равной 10 изделиям в час. Второй агрегат (Б) функционирует в режиме экспоненциального распределения длительностей обработки каждого изделия, поступающего от агрегата А со средней скоростью 12 изделий в час. При скоплении на входе агрегата Б двух или более изделий, поступивших от агрегата А, в технологической линии возникает затор. а) Вычислите ту долю продолжительности всего технологического процесса, в течение которой на входе агрегата Б имеет место затор. б) Предположите, что при скоплении на входе агрегата Б двух или более изделий, подлежащих обработке данным агрегатом, агрегат А останавливается. Объясните, почему результаты, полученные в п. а), приводят к завышенным оценкам той доли продолжительности всего технологического процесса, в течение которой агрегат А вынужден простаивать? Дайте более правильную оценку вероятности
338
ГЛАВА 20
простоя по этой причине агрегата А. (Обязательно укажите тип используемой вами модели массового обслуживания.) 24. Рассмотрим одноканальную модель с пуассоновским входным потоком при средней частоте поступлений, равной 30 требованиям в час. В настоящее время система использует механизм, который тратит на обслуживание каждого требования ровно 1,5 мин. Предположим, что данный механизм можно заменить другим, который характеризуется экспоненциальным распределением длительностей обеспечиваемого им обслуживания. Какой должна быть средняя продолжительность процедуры обслуживания у механизма второго типа, если среднее время пребывания требования в системе должно остаться неизменным? Какой должна быть средняя продолжительность процедуры обслуживания у механизма второго типа, если не должно измениться среднее количество требований, находящихся в системе? 25. Введем показатель «уровень обслуживания», которое может быть обеспечено одноканальной системой; обозначим этот показатель через М. Пусть значение М = 1 соответствует минимальному уровню обслуншвания, а значения М > 1 — более тщательному и более продолжительному обслуживанию. Предположим, что длительности обслуживания характеризуются гамма-распределением [см. формулу (16) из разд. 20.4] при ц, = 1. Будем считать, что математическое ожидание и дисперсия времени обслуживания являются линейными функциями показателя уровня обслуживания М. Предположим, что при М = 1 средняя частота поступлений А, = 0,8, и допустим, что при М > 1 средняя частота поступлений требований на обслуживание уменьшается. Пусть продолжительности интервалов между поступлениями имеют экспоненциальное распределение. Для каждого из указанных ниже значений М определите частоту поступлений, при которой ожидаемое количество требований, находящихся в системе, будет таким же, как и при М = 1, К = 0,8: а) М = 2. б) М = 4. в) М = 8. 26. Администрация университета «Беспредметных наук» решает вопрос о дополнительном столе выдачи книг в центральной университетской библиотеке. Пока эта библиотека располагает лишь двумя столами выдачи книг. В среднем каждые 2 мин в библиотеку заглядывает один студент, при этом полное время его пребывания в библиотеке (складывающееся из продолжительности ожидания в очереди плюс длительность процедуры обслуживания) составляет в среднем 1 мин. В университете только что ввели систему совместного обучения, и, учитывая большой наплыв студенток, администрация прогнозирует заметное увеличение роста числа посещений библиотеки. Требуется определить наибольшую частоту посещений библиотеки, при которой три стола выдачи книг (с учетом одного
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
339
дополнительного) позволят сохранить полное время пребывания читателя в библиотеке равным в среднем 1 мин. При выполнении этого упражнения считайте, что в качестве вполне приемлемого приближения можно использовать многоканальную модель, описание которой приведено в разд. 20.6. 27. С целью экономии расходов на междугородные телефонные переговоры одна фирма решила арендовать три линии междугородной телефонной связи (МГТС) с тем, чтобы административные работники из ее подразделений, расположенных в различных городах, могли вести между собой необходимые деловые телефонные переговоры. Предположим, что стоимость аренды одной МГТС составляет с за час. Будем считать, что частота, с которой возникает необходимость использования линии МГТС, характеризуется пуассоновским распределением с Я = 10 вызовов в час, а длительности переговоров имеют экспоненциальное распределение со средним значением, равным 15 мин. Обозначим через со стоимость минуты ожидания административным работником соединения с вызванным им по телефону абонентом (т. е. ожидания момента, когда хотя бы одна из трех линий окажется незанятой). Пусть с = 1. Требуется определить диапазон значений ш, при которых решение арендовать упомянутые выше три линии МГТС будет оптимальным. 28. Отдел медстатучета поликлиники при одном университете показывает, что в среднем двум студентам в день предписывается госпитализация со средней продолжительностью постельного режима, равной 3 суткам. Предположим, что продолжительности интервалов между поступлениями больных студентов в больницу и длительности их пребывания на постельном режиме распределены по экспоненциальному закону. а) Каково распределение вероятностей для количества студентов, занимающих больничные койки? Каково соответствующее среднее количество лежачих больных? (Не забудьте указать, какую из рассмотренных в данной главе моделей вы использовали для получения ответов на поставленные выше вопросы.) б) Предположите, что по состоянию на утро одного из дней количество находящихся в больнице студентов равняется пяти. Каково ожидаемое количество госпитализированных студентов по состоянию на то же самое время следующего дня? по истечении 3 дней? 7 дней? 29. В каждом из указанных ниже случаев вычислите с помощью приведенных в разд. 20.7 формул (13) и (14) стационарные вероятности Рп. Рассмотрите следующие варианты: а) А,0 = 1, KI = 1/2, Я,2 = 1/4, Кп = 0 при п ^ 3, \лп = 1 при всех значениях п ^ 1; б) К0 = 1/4, Xi — 1/2, А, 2 = 1, Х„— О при п ^ 3; цп = 1 при всех значениях п^ 1; в) Кп = 1 при п = О, 1, 2 и Яп = 0 при п ^ 3; [Х4 = 1, и.2 = 2, Из = 4; 22*
340
ГЛАВА 20 г
) ^п = 1 при п = О, 1, 2 и Я71 = 0 при и ^ 3; fit = 4, (яа = 2,
Из = 1.
30. В мастерской «Скоросварка» работают три очень хрупких агрегата, каждый из которых выходит из строя в среднем через каждые 2.5 ч. Ремонт агрегата осуществляется одним мастеромремонтником и занимает в среднем 45 мин. Предположим, что данную ситуацию можно анализировать с помощью модели, описание которой дано в разд. 20.7 (пример 4). Для каждого из указанных ниже условий требуется вычислить стационарную вероятность того, что все три агрегата находятся в рабочем состоянии, а также ожидаемое количество агрегатов, которые не могут нормально функционировать из-за имеющихся неисправностей. а) Пусть мастерская располагает всего одним специалистом по ремонту агрегатов данного типа. б) Пусть мастерская располагает двумя специалистами по ремонту агрегатов данного типа. в) Назовите те стоимостные показатели, которые следует учитывать при выборе одного из упомянутых выше вариантов. Укажите, какие операционные характеристики системы требуется определить, чтобы оценить ожидаемые затраты в каждом из этих вариантов, а также выведите формулу, с помощью которой можно было бы вычислять ожидаемые затраты для вариантов, охарактеризованных в пп. а) и б).
УПРАЖНЕНИЯ ПОВЫШЕННОЙ ТРУДНОСТИ В упражнениях 31—36 за основу берется модель рождения и гибели, описание которой дано в разд. 20.7. В каждом из этих упражнений требуется надлежащим образом определить Кп и цп и вывести линейные уравнения в конечных разностях для вероятностей состояния системы в условиях установившегося режима. При выполнении некоторых из приведенных ниже упражнений возникнет необходимость соответствующего изменения логической схемы рассуждений, использованной нами при выводе уравнений в конечных разностях в разд. 20.7, для анализа систем, состояния которых описываются более сложным образом. 31. Рассмотрите одноканальную модель с экспоненциальными распределениями продолжительностей интервалов между поступлениями требований, с одной стороны, и длительностей процедур обслуживания — с другой. Вместе с тем предположите, что имеют место групповые поступления требований, т. е. с некоторой вероятностью дг на вход системы одновременно поступает г требований на обслуживание, причем г = 1, 2, . . ., R, где R — максимальное количество требований, которое может содержаться в одной такой группе. 32. Рассмотрите одноканальную модель с пуассоновским входным потоком и экспоненциальным распределением длительностей про-
МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
341
цедур обслуживания, которая обладает следующими особенностями: если в момент поступления требования на вход системы в ней уже находится п требований, вероятность того, что вновь поступившее требование присоединится к очереди, равняется гп (т. е. с вероятностью 1 — гп вновь поступившее требование откажется присоединиться к очереди). Пусть, кроме того, некоторые требования могут ожидать в очереди лишь ограниченное время, так что, если они, поступая в систему, обнаруживают в ней очередь из п других требований, то они могут покинуть систему, не дождавшись обслуживания, причем скорость этого ухода составляет gn. Таким образом, на относительно малом интервале (Т, Т -\- h), где h > 0, вероятность того, что требование покинет систему до того, как его успеют обслужить, равняется gnh. Помните также, что g0 = gi = 0. 33. Рассмотрите пример 4, описание которого дано в разд. 20.7, и предположите, что М = R. а) Проверьте, что формула (25) для Рп имеет место и в случае М = R^n^O. б) Покажите, каким образом Рп можно представить в виде биномиального распределения с параметром р. Попытайтесь получить для среднего числа временно выбывших из строя агрегатов формулу, которая в явном виде указывала бы на зависимость этой операционной характеристики от частоты поломок агрегатов и от темпов выполнения ремонтных работ. 34. Рассмотрите одноканальную модель с дисциплиной очереди, построенной по следующей простой схеме приоритетов. В систему обслуживания поступают требования двух категорий: с приоритетом 1 и с приоритетом 2. Входные потоки требований обеих категорий пуассоновские со средними частотами поступления X j и Х 2 соответственно. Требования с приоритетом 1 располагают по отношению к требованиям с приоритетом 2 правом абсолютного преимущества в обслуживании. Когда в системе появляется требование с приоритетом 1, обслуживание требования с приоритетом 2 прекращается (при этом предполагается, что в момент поступления требования с приоритетом 1 в системе нет требований с таким же приоритетом, и прибор немедленно приступает к обслуживанию требования с приоритетом 1). Вытесненное требование «дообслуживается» после того, как в системе не останется требований с приоритетом 1. Требования с приоритетом 1 обслуживаются со средней скоростью fii, а требования с приоритетом 2 — со средней скоростью (г235. Рассмотрите двухканальную модель с пуассоновским входным потоком со средней частотой поступления Я, и экспоненциальным выходным потоком. Пусть скорость обслуживания, реализуемая первым прибором, равняется [Xj, а скорость обслуживания, реализуемая вторым прибором,— [х2 (причем fXi =^= ц.2)- (Указание: при п = 0 и при п > 2 вероятности Рп следует интерпретировать обычным образом; при п = 1 величину POI следует понимать как вероятность того, что система находится в состоянии, когда первый прибор
342
ГЛАВА 20
простаивает, а второй — занят обслуживанием, а Р 10 следует понимать как вероятность того, что система находится в состоянии, когда обслуживанием занят первый прибор, а второй простаивает.) 36. Рассмотрите следующую систему массового обслуживания с двумя приборами, включаемыми последовательно. Пусть поступления в канал 1 характеризуются средней частотой К (при пуассоновском входном потоке). Средние скорости обслуживания в каналах 1 и 2 равняются соответственно u.t и ц 2 , причем длительности обслуживания как первым, так и вторым прибором имеют экспоненциальное распределение. Требования, обслуженные в канале 1, должны затем поступить на обслуживание в канал 2. Если канал 2 оказывается занятым, требование, уже обслуженное в канале 1, вынуждено ожидать возможности поступления в канал 2, оставаясь в канале 1 и закрывая тем самым доступ в этот канал другим требованиям, стоящим в очереди у входа в канал 1.
ГЛАВА 21
Имитационное моделирование операционных систем с помощью ЭВМ 21.1. КОГДА ДРУГИЕ МЕТОДЫ БЕСПОМОЩНЫ...
Все, кто терпеливо и настойчиво стремились овладеть изложенным выше материалом, столкнулись с большим количеством самых разнообразных оптимизационных моделей и методов их анализа. Нередко мне задавали вопрос: «Можно ли утверждать, что этот арсенал операционных приемов и математических методов позволяет охватить все представляющие практический интерес задачи организационного управления, решение которых основано на анализе количественных показателей?» Ответом на этот вопрос может быть лишь категорическое «Нет». Чтобы понять, «почему» это так, следует задуматься над характером задач, анализ которых с помощью рассмотренных выше методов действительно оказывается эффективным. По мере того как станут очевидными имеющиеся пробелы* читатель сможет более четко определить, почему многие из весьма важных оптимизационных задач пока не решаются упомянутыми методами и, следовательно, подлежат анализу совершенно иного рода. Ниже дается краткая характеристика как сильных, так и слабых сторон различных операционных методов оптимизации, в частности методов линейного и динамического программирования, теории управления запасами и теории массового обслуживания. Как уже отмечалось, модели линейного программирования наиболее успешно применяются при планировании усилий, связанных с реализацией комплексных проектов. Если плановый период имеет большую протяженность (например, 10 лет или более), соответствующая многошаговая модель линейного программирования, как правило, содержит лишь среднегодовые показатели. При этом влияние результатов оптимизации на показатели, характеризующие текущие операции на отрезках продолжительностью от 1 недели до 1 месяца, в явной форме не учитывается. Если же рассматривается плановый период значительно меньшей продолжительности (скажем, от 3 месяцев до 1 года), то соответствующая модель полностью абстрагируется от вариаций плановых показателей на временных отрезках продолжительностью от 1 рабочего дня до 1 недели. Таким образом, анализ, осуществляемый в рамках линейного программирования, обычно не позволяет определить правил, с помощью которых можно было бы перейти от рекомендуемого плана к процедурам его реализации на отрезках времени, меньших по сравнению с интервалами, которые рассматриваются моделью. Ограниченность анализа, основанного на использовании метода линейного программирования, обусловлена также отсутствием досто-
344
ГЛАВА 21
верной информации относительно будущего. Неопределенность прогнозов в той или иной степени свойственна всем задачам планирования. Но эта неопределенность во многих случаях либо не относится к существу такого рода задач, либо является частичной, т. е. отражает отсутствие информации лишь относительно некоторых из фигурирующих в модели параметров. В этих случаях для оценки влияния неопределенности на окончательное решение оказывается достаточным проанализировать модель на чувствительность (гл. 5). Однако возможны ситуации, когда в той или иной степени неопределенны все компоненты модели. В случае таких моделей обычный анализ на чувствительность, с помощью которого можно было бы оценить последствия, порождаемые неопределенностью, выглядит слишком грубым и приводит к громоздким вычислительным процедурам. Для иллюстрации рассмотрим фирму, выпускающую различного рода химическую продукцию. Представим себе, что этой фирме необходимо определить многошаговую стратегию в связи с разработкой, производством и сбытом новых химических продуктов. Предположим, что для выпуска каждого из этих продуктов необходимы значительные затраты на этапе выполнения научно-исследовательских работ, а также большие капиталовложения для организации его производства; при этом фактический объем коммерческого спроса на планируемые виды продукции точно не известен. Более того, прибыль, которая получается за счет выпускаемого химического продукта, имеющего хороший коммерческий спрос, должна будет пойти в основном на финансирование научно-исследовательских и опытно-конструкторских работ, связанных с организацией производства упомянутых новых видов химической продукции. Модель линейного программирования, позволяющая уловить элементы динамики рассматриваемой ситуации, но ориентированная на учет содержащейся в данной задаче неопределенности путем использования усредненных показателей, вряд ли способна привести к сколь-нибудь удовлетворительной стратегии. Модели динамического программирования, напротив, вполне пригодны для анализа мультивременных задач планирования в условиях неопределенности и, таким образом, подходят для построения оптимальных стратегий. Однако по сравнению с моделями линейного программирования динамические оптимизационные модели способны в реальных условиях описывать лишь чрезвычайно упрощенные операционные системы. Как было показано в гл. 10 и 17, если исключить случаи, когда исследуемая система характеризуется небольшим количеством переменных состояния, вычислительные процедуры при нахождении решений для моделей динамического программирования оказываются неимоверно трудоемкими. Ориентированные на использование математического аппарата вероятностные динамические модели, в частности модели управления запасами и модели массового обслуживания, также обладают аналогичным недостатком (гл. 19 и 20). Чтобы найти численное решение
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
345
для такого рода моделей, приходится не только ограничиваться случаями, когда операционная система обладает небольшой размерностью, но и вводить упрощающие предположения относительно самой схемы функционирования исследуемой системы. Так, например, с помощью характерных для теории массового обслуживания математических методов, которые аналогичны методам, изложенным в гл. 20 и приложении III, невозможно полностью адекватным образом проанализировать «поведение» очередей в ремонтных мастерских. Соответствующие стохастические модели могут служить лишь грубым приближением протекающих в действительности процессов формирования и обслуживания очередей. Итак, несмотря на то что математическое программирование и стохастическое моделирование имеют широкий диапазон применения, при рассмотрении многих важных задач организационного управления возникает необходимость обращаться к совершенно иным методам анализа. О некоторых классах нерешенных проблем. Постоянно возрастающее число публикаций по исследованию операций свидетельствует о непрерывном поиске новых путей преодоления упомянутых выше трудностей. Однако, можно утверждать, что операционные методы, изложенные в предыдущих главах, пока (и в обозримом будущем) не смогут обеспечить исчерпывающего анализа таких задач организационного управления, как 1) Формирование инвестиционной политики при перспективном планировании. Инвестиционная политика крупных фирма должна, в частности, учитывать финансовое обеспечение научно-исследовательских и опытно-конструкторских работ при создании новых видов продукции, возможности расширения рынка сбыта, критериальные оценки основных проектов, оценку степени риска при планировании тех или иных комплексов работ, источники финансирования (кредит, привлечение капитала продажей акций и т. д.), увеличение фонда заработной платы, размещение и сокращение финансовых активов, сравнительную оценку вариантов слияния с другой фирмой и приобретения последней и т. п. Полноценная операционная модель, с помощью которой можно было бы анализировать различные варианты инвестиционной политики, должна учитывать стохастическую природу и динамический характер инвестирования, а также предусматривать способ просеивания огромного количества стоящих перед фирмой альтернатив. 2) Выбор средств обслуживания (или оборудования) при текущем планировании. Несколько примеров такого рода уже обсуждалось в разд. 20.1. При этом рассматривались задачи определения количества контрольных прилавков в большом торговом центре, количества бензоколонок на бензозаправочной станции и количества лифтов в строящемся здании. Можно привести много других примеров, в которых рассматриваются вопросы распределения кадров, планировка заводских помещений, выбор мощности оборудования и т. д.
346
ГЛАВА 21
Типичными вопросами, возникающими в связи с решением задачи выбора средств обслуживания или оборудования, являются вопросы, начинающиеся словами «сколько», «каких размеров», «как разместить». 3. Разработка планов с обратной информационной связью и операционных предписаний. Примеры такого рода задач также многочисленны, хотя они не сразу могут прийти на ум тем, кто не имеет достаточного профессионального опыта. К важным задачам данного класса относится, например, задача выработки правил составления календарных планов на предприятиях с мелкосерийным производством, комбинатах по ремонту различных изделий, вычислительных центрах и т. д. Эти предписания, или операционные алгоритмы, должны учитывать гарантийные сроки выполнения заказов, потребности в обслуживании, наличные ресурсы, производственные мощности, темпы повышения квалификации рабочих (или приток дополнительной квалифицированной рабочей силы), уровень снабжения сырьем. По мере поступления информации о новых уже выполненных заказах предприятие сталкивается с задачей уточнения или полного пересмотра своих планов-графиков. Другой пример системы с обратной информационной связью относится к процедурам составления транспортных графиков. Так, например, транспортная компания, занимающаяся доставкой грузов морским путем, при составлении графика движения зафрахтованных судов на несколько месяцев вперед должна принимать в расчет потребности в доставляемых грузах в различных портах, грузоподъемности судов и скорости их передвижения, колебания в сроках доставки, обусловленные погодными факторами, а также транспортные задержки, связанные с ограниченной пропускной способностью некоторых из портов. Многие компании, владеющие большим количеством грузовых судов, оказываются вынужденными ежедневно по мере получения более точной информации относительно событий случайного характера пересматривать графики транспортировок. Аналогичные проблемы возникают при составлении графиков обследования и лечения больных в клиниках, а также при определении интервалов времени между последовательными переключениями светофоров на крупных городских автомагистралях. Почему описанные выше классы задач с трудом поддаются анализу? Причина заключается в необходимости одновременного учета факторов неопределенности, динамической взаимной обусловленности текущих решений и последующих событий, в комплексной взаимозависимости между управляемыми переменными исследуемой операционной системы, а в ряде случаев также и в том, что требуется рассматривать строго дискретную и четко определенную последовательность интервалов времени. Такого рода «глобальные» системные задачи обладают слишком большой размерностью и наличием слишком большого количества внутренних взаимосвязей, в силу чего их не удается решить методами математического программирования. Решения, принимаемые по вопросам, порождаемым перечислен-
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
347
ными выше проблемами, нередко приводят к затратам порядка нескольких сотен тысяч долларов и существенным образом влияют на будущие стоимостные характеристики функционирования системы и на эффективность деятельности фирмы в целом. Поэтому руководители такого рода фирм крайне заинтересованы в применении системного подхода к решению возникающих перед ними задач с тем, чтобы анализ организационно-управленческих ситуаций отличался более высоким качеством по сравнению с анализом, основанным на чистой интуиции или на опыте. Наиболее эффективным из существующих в настоящее время операционных методов, выходящих за рамки обычного математического программирования, является метод имитационного моделирования на ЭВМ. Имитационный подход. В настоящей главе наша основная цель заключается в том, чтобы дать описание метода имитационного моделирования и определить, какого рода задачи могут этим методом решаться. Мы не собираемся рассматривать вопросы, связанные с построением и анализом имитационных моделей (или схем) во всех подробностях. Эти вопросы излагаются в специальных работах, посвященных проблемам имитационного моделирования, а также в учебных пособиях, которые выпускаются фирмами-изготовителями ЭВМ и содержат описание специализированных языков для составления имитационных машинных программ. Короче говоря- при имитационном подходе прежде всего строится экспериментальная модель системы. Затем производится сравнительная оценка конкретных вариантов функционирования системы путем «проигрывания» различных ситуаций на рассматриваемой модели. Читатель, поразмыслив немного, наверняка припомнит случаи из своей жизни, когда ему приходилось сталкиваться с имитационными ситуациями. Так, например, у всякого, кто посещал парк «Диснейлэнд» и совершал лодочную прогулку по его «джунглям», создавалось впечатление, что он находится в настоящих джунглях. Более серьезными примерами могут служить демонстрации, организуемые в планетариях, и стенды-панорамы в зоологических музеях. Возможно, читателю приходилось также управлять автомобилем-макетом, у которого имеется рулевое управление, акселератор и тормозная педаль. А тем, кто служил в армии, хорошо известно, что полевые учения и маневры заключаются в основном в имитации боевых действий. Обычно представляется слишком неудобным и дорогостоящим решать задачи организационного управления путем имитации реальных действий, как, например, это делается в армейских условиях во время различного рода учений. Более предпочтительным является представление сложной функциональной системы с помощью логикоматематической модели, «заложенной» в ЭВМ. При этом факторы неопределенности, динамические характеристики и весь комплекс взаимосвязей между элементами исследуемой системы представляют в виде формул, хранящихся в памяти быстродействующей ЭВМ. Имитирование системы начинают с некоторого
348
ГЛАВА 21
вполне конкретного исходного состояния. В результате принимаемых решений, а также вследствие ряда контролируемых и неконтролируемых событий, среди которых могут быть и события случайного характера, система переходит в последующие моменты времени в другие состояния. Эволюционный процесс таким образом продолжается до тех пор, пока не наступит конечный момент планового периода. Отрезки времени внутри планового периода нередко оказываются четко определенными и образуют упорядоченную последовательность на достаточно большом периоде имитирования. Поэтому имитационный эксперимент сопряжен с огромным количеством вычислений, выполняемых ЭВМ с большой скоростью. Такое отражение в ЭВМ реального процесса длительностью в несколько лет за несколько минут называют сжатием времени. Предмет всеобщего увлечения. Многие специалисты по исследованию операций смотрят на машинное имитирование как на средство, к которому прибегают лишь в самых крайних случаях — отсюда и название настоящего раздела: «Когда другие методы беспомощны...» Это отношение объясняется двумя причинами. Первая из них связана с характером самих результатов имитирования. Когда модель содержит элементы неопределенности, каждый ответ, вытекающий из конкретного акта имитирования, необходимо рассматривать только как оценку, верную с точностью лишь до статистических погрешностей. Так, например, имитационная модель образования очереди дает лишь оценку ее средней длины и соответствующую вероятность задержки. Следовательно, делая выводы об относительных преимуществах различных пробных вариантов с учетом результатов имитационных тестов, необходимо проявлять осторожность при оценке флуктуации, сопровождающих исследуемый процесс. Вторая причина недоверия к имитационному методу определяется способом его практического использования. Если функциональная система настолько сложна, что для ее рассмотрения неприменимы такие методы операционных исследований, как линейное и динамическое программирование или обычный анализ в рамках теории вероятностей, то построение имитационной модели и последующий анализ результатов имитирования в этом случае скорее всего будут сопряжены со значительными трудностями. Многие из склонных к опрометчивым выводам операционистов не без досады убедились, что, как и, реальная действительность, «имитационный мир» оказывается труднопостижимым — имитационная модель приводит к такому количеству разнообразных исходов, что в результате получаемую информацию не так-то легко интерпретировать. Изложенные выше соображения позволяют также понять, почему метод имитационного моделирования удается реализовать только с помощью ЭВМ. Для получения статистической надежности, достаточной для обоснования управляющих решений, как правило, требуется многократное повторение имитационных тестов. Каждый сеанс
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
349
имитирования настолько сложен, что попытка осуществить имитирование вручную (при сколь-нибудь разумных затратах времени) скорее всего потерпела бы полный крах. Поэтому неудивительно, что имитационное моделирование на ЭВМ обычно представляет собой весьма дорогостоящий способ исследования больших систем. 21.2. ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ В ПЕРСПЕКТИВЕ
Как уже отмечалось в предыдущем разделе, многие из наиболее важных задач организационного управления столь сложны и характеризуются столь большой размерностью, что с помощью математического программирования и анализа в рамках обычной теории вероятностей решить их не удается. В таких случаях экспериментирование на реальном объекте исследования (которое, кстати, не всегда возможно) с целью анализа различных вариантов действий, как правило, обходится слишком дорого. Это указывает лишь на необходимость использования других методов решения такого рода задач, хотя из него непосредственно и не вытекает целесообразность использования машинного имитирования. В данном разделе будет показано, почему имитационное моделирование на ЭВМ является эффективным, а также будут обсуждены недостатки этого метода. В отличие от математического программирования имитационное моделирование пока не располагает хорошо структурированными принципами построения моделей. Каждый конкретный случай требует значительной специальной проработки. Используемые при этом языки моделирования являются той основой, на которой возможна выработка каких-либо общих принципов построения имитационных моделей. (Широко распространенными языками моделирования являются Симскрипт и GPSS г), о которых более подробно мы расскажем в разд. 21.8.) Отсутствие единой теории имитационного моделирования на ЭВМ есть одновременно «и благо, и зло». Положительным здесь является то, что имеется возможность строить имитационные модели любой степени сложности при огромном количестве динамических взаимосвязей, а также при отсутствии стационарности и наличии взаимно коррелированных стохастических элементов. Отрицательным же моментом является то, что по мере усложнения модели при анализе данных приходится все более полагаться на находящуюся в эмбриональном состоянии математическую статистику. Как отмечалось выше, именно в силу сложности используемой модели оценка степени адекватности модели оказывается весьма затруднительной. Если модель очень сложна, на ее воспроизведение и на поиск решения, определяющего приблизительно оптимальную стратегию, может потребоваться значительное количество машинного времени. Однако метод имитационного моделирования в настоящее время вызывает большой научный интерес и интенсивно разрабатывается. Поэтому *) GPSS — универсальный язык моделирования.— Прим. перев.
350
ГЛАВА 21
можно надеяться, что многие из существующих недостатков этого метода (как в концептуальном, так и в чисто прикладном плане) будут устранены в ближайшие годы. Целевая установка. При построении имитационной модели, предназначенной для углубленного анализа проблем организационного управления, преследуют по крайней мере одну из следующих целей: 1) Изучение действующей функциональной системы. Рассмотрим промышленную фирму, которая недавно зарегистрировала увеличение числа заказов на свою продукцию и отметила затем заметное ухудшение качества обслуживания своих клиентов в части соблюдения сроков выполнения этих заказов. У этой фирмы может появиться желание построить имитационную модель, с помощью которой можно было бы изучить, каким образом существующие процедуры определения сроков выполнения принимаемых заказов, календарного планирования производства и оформления заявок на поставку сырья порождают наблюдаемые задержки. 2) Анализ гипотетической функциональной системы. Обратимся к больнице, руководство которой рассматривает вопрос внедрения новой системы управления запасами медицинских препаратов. Руководство больницей может изъявить желание построить с использованием ретроспективных данных имитационную модель, чтобы проверить, каким будет средний уровень средств, связанных в запасах, и как часто будут возникать нехватки различных видов препаратов в случае, если будет реализован предлагаемый план. 3) Проектирование более совершенной функциональной системы. Рассмотрим предприятие с мелкосерийным производством, в котором станочные мощности распределены в соответствии с приоритетами, присвоенными выполняемым работам. У фирмы может появиться желание построить имитационную модель для нахождения эффективного способа определения системы приоритетов с тем, чтобы все работы могли выполняться без больших задержек и чтобы при этом коэффициент использования оборудования предприятия был достаточно высок. Перейдем теперь к описанию этапов построения и использования имитационной модели. Шаги практической реализации имитационного метода. Ниже приводится краткая характеристика каждого из основных видов работ, которые неббходимо выполнить с целью практической реализации метода имитационного моделирования: Шаг 1. Построение модели. Содержание данного этапа почти не отличается от содержания этапа построения операционной модели любого другого типа. Опасность при этом заключается в излишней детализации модели, которая может привести к слишком большим затратам машинного времени при выполнении соответствующего эксперимента. Лучший способ уберечься от такого рода опасности заключается в том, чтобы постоянно помнить о конкретной цели исследования. Например, если модель должна помочь в выборе одно-
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
351
го из двух вариантов размещения нового складского помещения, то, по-видимому, нет необходимости при построении имитационной модели делить плановый период на часы или дни: вполне достаточно использовать отрезки времени, продолжительность которых равняется 1 недели. Однако если с помощью модели нужно решить, сколько в новом складе должно быть погрузочно-разгрузочных платформ (например, одна или две), то, возможно, возникнет необходимость имитировать процесс функционирования упомянутого складского помещения, ориентируясь на отрезки времени продолжительностью от 5 до 15 мин. Шаг 2. Разработка проекта эксперимента. Операционист сможет уменьшить вероятность той или иной ошибки и, таким образом, потери времени, если он подробно разработает сопровождающие эксперимент процедуры до того, как модель будет «приведена в действие». Это означает, что операционисту необходимо тщательно продумать, какие функциональные характеристики имитируемой системы планируется измерять. Кроме того, следует определить, с помощью какого метода математической статистики будут учитываться флуктуации экспериментальных данных, полученных в результате этих измерений. Шаг 3. Разработка программного обеспечения. Весь имитационный эксперимент проводится на быстродействующей ЭВМ. Другими словами, все стадии эволюционного развития модели, так же как и генерирование случайных событий, протекают в ЭВМ. Если имитируемая система обладает очень простой структурой, то может оказаться, что при разработке соответствующего «вычислительного варианта» модели удобнее всего использовать один из стандартных языков программирования типа Фортран, PL/I или Алгол. Однако представляется более вероятным, что предпочтение будет отдано одному из языков моделирования, такому, как Симскрипт или GPSS, трансляторы с которых имеются для многих больших ЭВМ. В процессе практического применения метода имитационного моделирования операционист убедится, что перечисленные выше этапы не являются полностью независимыми и не выполняются в строго установленной последовательности. Так, например, если специалист по исследованию операций уже владеет языком моделирования, скажем GPSS, то он, возможно, захочет «сформулировать» имитационную модель сразу на этом языке. Более подробное описание каждого из этапов имитационного моделирования дается в последующих разделах. 21.3. ПРИМЕР ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ ФОНДОВОЙ БИРЖИ Мистер N хочет оценить степень оптимальности некоторой конкретной стратегии приобретения и продажи акций. Для упрощения схемы рассуждений предположим, что он приобретает или продает
352
ГЛАВА 21
только какие-нибудь одни акции. В рассматриваемый момент времени он обладает пакетом в 100 акций, каждая из которых оценивается на текущий момент в 10 долл. Для простоты, допустим также, что цена акции может ежедневно меняться только на 1 долл., так что, в частности, возможна последовательность цен 8, 9, 10, 11, 12 долл. Держатель акций совершает не более одной сделки в день и платит за каждую сделку комиссионные в размере 2% стоимости реализуемых акций (как в случае приобретения, так и в случае продажи); разумеется, в некоторые дни таких сделок может и не быть. Цена одной акции в «-Й день Возрастает Остается без изменения
Цена Одной акции в (п.— 1)-й день Возросла по сравнению с (я — 2)-м днем Осталась такой же, как п в (п — 2)-й день Упала по сравнению (га — 2)-м днем
с
/4
V4
1
/г
V4
v<
V2
1
J
V»
1
/2
/4
Падает
Р и с . 21.1. Вероятности изменения цен на акции.
Мистер N хочет проверить степень прибыльности следующей стратегии (которая была предложена одним из его маклеров): 1) обладая пакетом акций, необходимо продать его, как только цены на акции начинают падать; 2) в противном случае следует приобретать такие акции, как только цены на них начинают возрастать. Если мистер N обладает пакетом акций, то, согласно предписанию, он сохраняет его в течение всего периода, когда цены на акции либо не меняются, либо возрастают; если же мистер N не располагает акциями, то он воздерживается от их приобретения в течение периода, когда уровень цен на них либо остается без изменений, либо падает. Чтобы произвести оценку такой стратегии, мистер N должен, кроме того, сделать некоторое предположение относительно характера суточных флуктуации цен на акции. На основе анализа ретроспективных данных мистер N строит модель изменения цен, представленную на рис. 21.1. Проиллюстрируем эту таблицу, рассмотрев в ней вторую и третью строки. Если как в понедельник, так и во вторник цена одной акции равняется 10 долл., то, по мнению N, в среду цена одной акции будет равняться 11 долл. с вероятностью V 4 , 10 долл. с вероятностью V 2 и 9 долл. с вероятностью V 4 (см. вторую строку). Если же во вторник цена одной акции равняется 9 долл.,
353
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
то, как полагает N, в среду одна акция будет стоить 10 долл. с вероятностью 1 / 4 . 9 долл. с вероятностью V 4 и 8 долл. с вероятностью V 2 (см. третью строку). Заметим, что в случае, когда цена акции возрастает, N считает, что с вероятностью 1 / 2 она будет продолжать возрастать; аналогичные суждения он выносит и в тех случаях, когда цена акции не меняется или начинает, падать. Прежде чем начинать имитационный процесс (а для этого в рассматриваемой ситуации вполне можно обойтись без помощи ЭВМ), необходима генерация конкретных ситуаций, которые в соответствии с распределением вероятностей, приведенным в таблице на рис. 21.1, Цена одной акции в ге-й день Цена одной акции в (п — 1)-й день
Возрастает
Возросла по срав- Герб и решетка нению с (п — 2)-м днем Осталась такой же, как и в (п — 2)-й день
Два герба
Упала по сравнению с (п—- 2)-м днем
Два герба
Остается без изменения
Падает
Два герба
Две решетки
Герб и решетка Две решетки
Две решетки Герб и решетка
Р и с. 21.2. Стохастическое изменение цен, полученное бросания пары монет.
путем
отражали бы стохастический дрейф цен. Один из наиболее простых способов такого рода генерации заключается в бросании двух монет; при этом соответствие между случайными исходами при бросании монет и генерируемыми ситуациями можно представить с помощью таблицы, приведенной на рис. 21.2. Нетрудно убедиться, что при правилах соответствия, определяемых таблицей на рис. 21.2. генерируется распределение вероятностей, полностью совпадающее с распределением, которое постулировалось мистером N. Пусть имитируется период продолжительностью 20 дней, каждый из которых соответствующим образом занумерован (день 1, день 2, день 3 и т. д.). При этом пару монет нужно бросать 20 раз; результаты последовательного бросания монет представлены в таблице на рисунке 21.3. Для определения соответствующей последовательности цен на акции необходимо задать начальные условия, а именно цену одной акции в день 0, а также информацию относительно того, наблюдалась или не наблюдалась в этот день флуктуация цены по отношению к предшествующему дню. Согласно таблице, приведенной
ГЛАВА 21
354
я
1
a II b
J
чs
Я"
Направление изменения вчерашней цены
w CC
0
1
_
Г/Р 2 2P 3 2Г 4
2Г
5
2Г
6 Г/Р 7 8 9
2Г 2P 2Г
10
Г/Р
11
2Р
12 Г/Р 13 2Р 14 2Г 15 Г/Р 16
Г/Р
17 18
2Р Г/Р
19 20
Г/Р 2Р
й
as
я« 2QJ вО tt °
U ST
Л 3 ^^
«
_ Без изменения *) » » В сторону убывания В сторону возрастания Без изменения В сторону возрастания То же Без изменения В сторону убывания В сторону возрастания В сторону возрастания В сторону убывания То же Без изменения В сторону возрастания В сторону возрастания То же В сторону убывания То же То же
10*) 10 9 10 10
и 12 12 И 12 13 12 И
11 • 12 13 14 13 12 И 11
О б о з н а ч е н и я : Г/Р —герб и решетка, 2Г —два герба, 2Р —две решетки, *) — начальные условия. Р и с . 21.3. Имитирование изменения цен.
на рис. 21.3, цена одной акции в день 0 равнялась 10 долл. и совпадала с соответствующим показателем в предшествующий день. При таких начальных условиях и при выпадании после первого бросания герба и решетки цена одной акции в день 1 равняется 10 долл. (см. вторую строку таблицы на рис. 21.2). Тогда, поскольку цены в день 0 и в день 1 совпадают, в день 2 выпадание двух решеток означает, что цена одной акции в соответствии со второй строкой таблицы на рисунке 21.2 падает до 9 долл. Поскольку в день 2 наблюдалось понижение цены (по отношению к дню 1), выпадание (при третьем бросании монет) двух гербов указывает на то. что в день 3, согласно третьей строке таблицы на рис. 21.2, цена одной акции будет равняться 10 долл. (Читателю предлагается самостоятельно проверить данные, содержащиеся в таблице на рис. 21.3 для дней 5, 10, 15 и 20.) Теперь, используя конкретные данные об изменении цен в течение 20-дневного периода, мы можем проверить, насколько правильной является стратегия, предложенная маклером Y . Результаты имитирования подробно представлены в таблице, приведенной на рис. 21.4. (В эту таблицу для удобства ее использования перенесены также данные об изменении цен. указанные в таблице на рис. 21.3.) Решения, приведенные в третьем столбце, определяются непосредственно ценами на акции в предшествующие два дня и принятой стратегией поведения. Данные, содержащиеся в трех последних столбцах, получены в результате дополнительных вычислений.
355
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
Цена акции, День долл.
0
10
1 2 3 4 5
10 9 10 10 11
6 7 8 9 10
12 12 11 12 13
11 12 13 14 15
12 11 11 12 13
16 17 18 19 20
14 13 12 11 И
Решение
Продать Купить
Продать Купить Продать Купить
Продать
Количество Стоимость акций, имеющихся пакета акна руках ций, долл.
Наличные деньги, долл.
100
1000
100 0 86 86 86
1000 0 860 860 946
882,00 4,80 4,80 4,80
86 86 0 76 76
1032 1032 0 912 988
4,80 4,80 931,88 1,64 1,64
0 0 0 73 73
0 0 0 876 949
895,40 895,40 895,40 1,88 1,88
73 0 0 0 0
1022 0 0 0 0
1,88 931,90 931,90 931,90 931,90
Р и с . 21.4. Результаты имитации рассматриваемой стратегии за 20-дневный период.
Проиллюстрируем результаты, приведенные в таблице на рис. 21.4, рассмотрев ряд конкретных ситуаций. Так, например, в день 2 мистер N продает имеющиеся у него 100 акций по цене 9 долл.; однако он должен при этом уплатить 2% комиссионных, что составляет 18 долл. (0,02-9-100). Следовательно, в результате продажи акций он получает наличными 882 долл. (= 900 — 18). В день 3 он вновь приобретает пакет акций. При этом он снова должен уплатить 2% комиссионных, так что фактически каждая акция ему обходится в 10,20 долл. Поскольку сумма наличных денег у N равняется 882, он может приобрести лишь 86 акций, оставив себе наличными 4,80 долл. (= 882 — 86-10,20). Заметим, что сумма наличных денег у N в конце рассматриваемого периода (т. е. по истечении 20 дней) оказывается равной 931,90 долл. и меньше той суммы, которую он имел бы, если бы вместо того, чтобы придерживаться указанной стратегии, он продал свои 100 акций, имевшиеся у него в наличии, в день 0 и, таким образом, получил бы после уплаты комиссионных 980 долл.
356
ГЛАВА 21
Является ли рассмотренная нами стратегия (при всех принятых предположениях) выгодной? Читатель, вероятно, сразу же скажет: «Нет». Однако с выводами торопиться не следует. Предположим, что вместо произвольным образом выбранного нами периода имитирования (20 дней) был бы назначен период в 6 или 16 дней. К какому заключению пришел бы читатель в этих случаях? Или представим себе, что при том же 20-дневном периоде генерация ситуаций путем бросания монет производилась бы повторно. Можно ли утверждать, что окончательный результат, полученный с помощью упомянутой стратегии, по-прежнему казался бы неудовлетворительным? Пока можно лишь сказать, что выводы относительно степени «доброкачественности» рассматриваемой стратегии действительно частично зависят от статистического разброса имитационных данных, а также от продолжительности периода имитирования. При дальнейшем анализе модели читатель увидит, что заключительная оценка стратегии осложняется тем обстоятельством, что по мере увеличения длины имитируемого периода диапазон возможных исходов для N увеличивается. Более того, если даже при увеличении продолжительности рассматриваемого периода стратегия и приводит к росту ожидаемого выигрыша (т. е. ожидаемой суммы наличных денег, получаемых в результате игры на бирже), то вероятность х) разорения на промежуточных этапах все равно остается. Таким образом, мы видим, что даже такой простой пример имитационного моделирования порождает ряд весьма сложных вопросов относительно меры эффективности выбираемой стратегии и метода проектирования научно обоснованного эксперимента по проверке этой эффективности. Более того, если бы читателя попросили проиграть вручную данную модель для 20 других периодов имитирования, то он весьма скоро пришел бы к выводу, что осуществление всех процедур, связанных с бросанием монет, а также выполнение всех арифметических выкладок желательно поручить ЭВМ. 21.4. ПОСТРОЕНИЕ ИМИТАЦИОННОЙ МОДЕЛИ
Вернемся теперь к обсуждению этапов реализации метода машинного имитационного моделирования с более общих позиций. В настоящем разделе рассматриваются три аспекта процедуры построения модели: определение формирующих модель компонентов, проверка модели на адекватность и надежность, уточнение параметров модели и измерение ее основных характеристик. Компоненты модели. Структуру имитационной модели в большинстве случаев удобно описывать, определяя содержание фигурирующих в ней динамических процессов и результатов функционирования имитируемой системы. Динамические процессы в рассмотренной 1
) Имеющая по крайней мере в начале планового периода тенденцию к возрастанию.
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
357
выше имитационной модели фондовой биржи включают последовательные моменты заключения сделок мистером N, который придерживается определенного правила принятия решений, учитывая при этом факторы, определяющие изменения уровня цен на акции. Результаты рассматриваемой деятельности определяются количеством акций, которыми обладает N, суммой имеющихся у него наличных и его общим капиталом. Результаты функционирования реальной системы, как правило, атрибутированы (т. е. имеют вполне определенный физический смысл). Так, например, когда цена акции известна, пакет акций, которым располагает N, имеет денежное выражение. Кроме того, наблюдаются атрибутивные связи, устанавливающие способ суммирования результатов функционирования системы. Например, полный капитал мистера N состоит как из имеющихся у него наличных, так и из его пакета акций. В любой момент времени имитационная модель находится в некотором вполне определенном состоянии. Состояние системы характеризуется не только результатами, полученными к текущему моменту времени, но нередко включает в себя и некоторые ретроспективные данные. Так, например, состояние системы в начале любого дня при имитировании фондовой биржи описывается вчерашним уровнем цен на акции, направлением изменения позавчерашней цены на одну акцию, числом имеющихся у N акций и суммой наличных, которыми он располагает. Модель может учитывать также экзогенные события 1 ) , т. е. изменения, не обусловленные предысторией имитируемого процесса. Например, в случае имитационного моделирования фондовой биржи мистер N независимо от результатов применения выбранной им стратегии может в день 21 «ввести в игру» дополнительно 1000 долл. (за счет имеющихся у него сбережений). Зная состояние системы и ее динамику, можно определить «действия» и состояния системы во все последующие моменты времени. Имитационные модели, обладающие эволюционной структурой, часто называют каузальными 2). Отметим, что при построении каузальной модели необходимо знать, каким образом система функционирует в пределах каждого отрезка времени рассматриваемого периода. Например, в случае имитирования фондовой биржи каждый день прежде всего необходимо определить цену одной акции, после чего вырабатывается решение относительно целесообразности либо приобретения, либо продажи акций (либо принимается решение ничего не предпринимать). На практике цена акций на бирже может несколько раз меняться в течение дня, так что построенная нами модель представляет собой лишь грубое приближение к действительности. В модели предполагается х ) Некоторые авторы называют такого рода события спонтанными.— Прим, перев. 2 ) То есть они характеризуются детерминированными причинно-следственными связями, однозначным образом коррелированными во времени.—Прим. перев.
358
ГЛАВА 21
также, что если мистер N продает свои акции, то он в конце дня получает за них наличными; аналогичным образом, если мистер N покупает акции, то он оплачивает их наличными в конце того же дня. В действительности подобного рода биржевые сделки не всегда завершаются так быстро. Адекватность и надежность модели. Построив модель, операционист обязательно задается вопросом: «Насколько она реалистична?» Более правильным было бы спросить: «Позволяет ли модель разобраться в существе имитируемого процесса и можно ли с ее помощью прийти к надежным умозаключениям?» В конечном счете, поскольку имитационная модель может описывать реальные явления лишь приближенно, ее следует оценивать по возможности проведения на ее основе анализа управляющих решений, представляющих собой предмет конкретного операционного исследования. Определив цель имитационного эксперимента, операционист строит каждый элемент модели с надлежащей степенью детализации и точности. Здесь необходимо сделать предостережение. Опытные специалисты по имитационному моделированию утверждают, что даже для начинающего операциониста не представит труда построить модель из отдельных компонентов, каждый из которых будет соответствовать действительности, однако после «сшивания» отдельных частей получаемая в результате модель может вести себя не так, как имитируемая реальная ситуация. Поэтому не следует слепо предполагать, что имитационная модел4 как единое целое является в достаточной степени точной только потому, что каждая из составляющих ее частей, рассматриваемая изолированно от других, представляется вполне адекватной описываемому процессу. Это предостережение особенно важно по той причине, что цель имитационного моделирования заключается в воспроизведении поведения всей функциональной системы в целом, а не отдельных ее частей. Параметры и измеряемые характеристики модели. Абстрактное описание элементов имитационной модели — это только полдела. Необходимо еще собрать достаточно данных, которые описывали бы эти элементы полно и адекватно. Недостаток в такого рода данных может повлечь за собой необходимость пересмотра самого способа построения модели. Особую осторожность следует проявлять в тех случаях, когда используются данные, полученные путем экстраполяции, а также в тех случаях, когда измеряемые характеристики не стационарны. Необходимо также проявлять внимательность при имитировании явлений циклического (или периодического) характера. В тех случаях, когда такого рода явления действительно имеют место, при выборе переменных, подлежащих измерению в процессе эксперимента, следует быть весьма осмотрительным. Если, например, учитывать только «конечные значения», то может оказаться, что получаемое решение будет отличаться сильной чувствительностью к степени точности задания имитируемого планового периода.
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
359
21.5. ГЕНЕРАЦИЯ СЛУЧАЙНЫХ СОБЫТИЙ Применение имитационных моделей в большинстве случаев сопряжено с учетом случайных событий. Так, например, в имитационных моделях очередей к числу случайных переменных относятся время поступления заявки на обслуживание и время обслуживания; в моделях управления запасами такого рода переменными являются уровни спроса и сроки поставок; в моделях же, описывающих научно-исследовательские и опытно-конструкторские работы, случайными оказываются события, связанные с открытиями новых видов продукции. При имитировании такого типа процессов нередко приходится проигрывать процесс на модели тысячи и десятки тысяч раз с тем, чтобы адекватно отразить закономерности соответствующего распределения вероятностей. В настоящем разделе мы попытаемся разобраться, каким образом эти проигрывания выполняются на ЭВМ. Униформные *) случайные числа. Как будет показано ниже, основным строительным материалом при имитировании сложных процессов вероятностного характера являются случайные цифровые последовательности, получаемые методом стохастического генерирования. Ниже в качестве иллюстрации описывается ситуация, позволяющая понять смысл генерации последовательности униформных случайных чисел. Пусть у нас имеется десять бирок. Присвоим им номера О, 1, 2, ... . . ., 9 и положим их в шляпу. Тщательно перемешаем бирки, вынем одну из них наугад и запишем номер вынутой бирки. Положим вынутую бирку снова в шляпу и повторим описанную выше процедуру несколько раз подряд. В результате мы получим некоторую вполне конкретную последовательность униформных случайных цифр. Если в ходе эксперимента бирки не деформируются и не изнашиваются, а также если предположить, что перед тем, как вынуть очередную бирку, они тщательно перемешиваются, то любая (п-я) цифра получаемого ряда с равной вероятностью может оказаться нулем, единицей, двойкой и т. д. независимо от того, какие цифры в данном ряде ей предшествуют. При имитировании, как правило, используются случайные числа в общепринятой десятичной системе исчисления. Поэтому, если, например, необходимо генерировать десятичные дроби с четырьмя значащими цифрами после запятой, то в последовательности цифр, получаемой изложенным выше способом, можно брать по четыре смежные цифры, проставляя перед каждой из выделенных таким способом групп нуль и запятую. Рассмотрим в качестве иллюстрации последовательность 3, 5, 8, 0, 8, 3, 4, 2, 9, 2, 6, 1, . . .; из нее по указанному рецепту образуются следующие десятичные дроби: 0,3580; 0,8342; 0,9261; . . .. Пусть требуется предложить метод, с помощью которого можно было бы вводить в ЭВМ по несколько сот тысяч случайных чисел. 1) То есть полученные методом однородных статистических испытаний.— Прим. перев.
360
ГЛАВА 21
Не исключено, что читатель остановился бы на следующей процедуре: вначале проводится эксперимент, аналогичный только что описанному, а затем полученный ряд цифр записывается в память ЭВМ. Такой метод иногда действительно применяется. Фирма РЭНД, используя специальную электронную аппаратуру, построила таблицу, содержащую около миллиона случайных цифр. Эта таблица записана на магнитную ленту, так что блоки чисел можно ввести, когда это потребуется, в память быстродействующей ЭВМ. Несколько лет назад такого рода табличный метод считался неэффективным, поскольку из-за медленного ввода табличных данных в память ЭВМ на эту процедуру затрачивалось слишком много машинного времени. Однако последние достижения в области электроники и создание более совершенных методов программирования позволили эти недостатки по существу полностью устранить. Специалисты в области прикладной кибернетики разработали метод генерации цифровых последовательностей, удовлетворяющих многим из требований теории вероятностей. Так, например, если рассмотреть достаточно длинный ряд цифр, полученный таким вполне детерминистическим методом, то каждая цифра будет фигурировать в этом ряде приблизительно одинаковое число раз; чередования «нечетное число — четное число» будут в такой цифровой последовательности наблюдаться приблизительно столько же раз. сколько и чередования «нечетное число — нечетное число»; примерно одинаковыми будут частоты повторения различных пар чисел и т. д. Поскольку такой процесс формирования цифровых последовательностей не является строго вероятностным, его назвали псевдо-вероятностным методом генерации цифровых последовательностей. Языки машинного моделирования, наподобие тех, которые упоминались в разд. 21.8, непременно снабжаются встроенными псевдовероятностными генераторами цифровых последовательностей. Поэтому операционисту почти никогда не понадобится знать, какие математические формулы лежат в основе псевдо-вероятностного генерирования чисел. Если же читатель нуждается в укреплении своего доверия к процессу генерирования псевдослучайных числовых последовательностей, он может ознакомиться с приведенным ниже примером. В противном случае читателю рекомендуется сразу же перейти к обсуждению метода генерирования случайных переменных. Метод конгруэнции. Прежде всего необходимо ознакомиться с основной идеей модульного исчисления. Назовем два числа х и у конгруэнтными по модулю т, если (х — у) есть число, которое делится на т без остатка (т. е. является кратным т). Например, при т = 10 мы имеем 3 13 513 48 653
= 3 =3 =3 ЕЕ 3
(по модулю (по модулю (по модулю (по модулю
10), 10), 10), 10),
4 84 124 1 000 004
= = = =
4 4 4 4
(по модулю (по модулю (по модулю (по модулю
10), 10), 10), 10).
(1)
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
36]
Так, для нахождения числа, конгруэнтного, скажем, 857 по модулю 10, нужно вычислить целочисленный остаток от деления 857 па 10, который оказывается равным 7. Одним из весьма распространенных методов генерирования псевдослучайных чисел является так называемый метод мультипликативных конгруэнции. В общем случае формула, позволяющая генерировать случайные числа, имеет следующий вид: rn = arn_i
(по модулю т).
(2)
Задав соответствующим образом параметры а, т и стартовое значение г 0 , мы можем получить числовую последовательность, обладающую желаемыми статистическими свойствами. Заметим, что по законам модульного исчисления каждое гп должно представлять собой одно из чисел О, 1, 2, 3, . . ., т — 1. Само собой разумеется, что при выборе числовых значений а и г0 следует проявлять определенную осторожность. Так, например, если а = 1, то гп = г 0 при любом п. Если же г 0 = 0, то гп = 0 при любом п. Значения а и г 0 нужно выбрать таким образом, чтобы цикл (или период) числовой последовательности был наибольшим; другими словами, необходимо, чтобы первое совпадение гп и г 0 имело место при наибольшем значении п. С целью пояснения метода предположим, что мы намерены генерировать десятичные дроби щ, и2, . . . с десятью знаками после запятой. Можно доказать, что если положить ип ~ гп -10~10, где гп = 100003гп_! (по модулю 1010), г 0 = Любое нечетное число, которое не делится на 5,
\*-V
то период числовой последовательности будет равен 5-Ю 8 , т. е. равенство гп = г0 имеет место впервые при п = 5-Ю 8 , после чего числовая последовательность циклически повторяется. Если генерируются десятичные дроби с десятью значащими цифрами после нуля, указанное значение п определяет максимально возможное значение для продолжительности периода числовой последовательности, генерируемой с помощью формулы (2). (Существуют и другие значения параметра а, приводящие к данному максимальному циклу.) Читатель без труда может убедиться, что при указанном выше выборе г о возможность г„ = 0 исключена, и, следовательно, ип удовлетворяет условию 0 < ип < 1. Рассмотрим пример, представленный соотношениями (3). Пусть г 0 = 123456789. Тогда rj = 100003-123456789 =
= 12 346 049 270 367 =
(4) 10
= 6 049 270 367 (по модулю 10 ),
362
ГЛАВА 21
и, следовательно, ul = 0,6049270367, а = ЮО 003 -6049 270 367 = = 604 945 184 511 101 = 10 == 5 184 511 101 (по модулю 10 ),
(5)
откуда получаем и 2 = 0,5184511101. Значения ип (п — 1, 2, . . ., 20) приведены в таблице на рис. 21.5. Заметим, что последние цифры чисел ип образуют короткий цикл 7, 1, 3, 9, 7, 1. 3, 9, . . . . Следовательно, последние цифры приведенных в таблице чисел выглядят далеко не случайными. Несмотря на то, что формула (2) оказывается 1 0,60492 70367 вполне удовлетворительной для некоторых ви2 0,51845 11101 3 0,66636 33303 дов имитационных моделей, она обладает отрикорреляционными качествами. 4 0,33211 99909 цательными 5 0,99544 99727 в силу которых ее применение к динамическим 6 0,98361 99181 системам оказывается весьма опасным. Этот 7 0 ,94266 97543 недостаток нетрудно устранить путем переме8 0,80343 92629 шивания нескольких числовых последователь9 0,33660 77887 ностей, генерируемых при различных значе10 0,78869 33661 ниях г и (что также возможно) при различ0 11 0,70269 00983 ных значениях а. Так. например, можно исполь12 0,11790 02949 зовать чередование десяти полученных таким 13 0,38319 08847 образом числовых последовательностей. 14 0,23804 26541 Преимущество применения псевдо-вероят15 0,97953 79623 ностного генератора вместо упомянутой выше 16 0,73484 38869 таблицы случайных чисел, записанной на маг17 0,59322 16607 нитную пленку, заключается в том. что для 18 0,94573 49821 получения соответствующей цифровой последо19 0,33541 49463 20 0,50087 48389 вательности требуется лишь небольшое количество простых машинных команд. Поэтому при использовании данного метода расходуется Р и с . 21.5. Метод незначительный объем машинной памяти и отмультипликативных падает необходимость считывания записей конгруэнции с магнитной пленки. (о = 100 003, г0 = 123456789). Генерация случайных переменных. Перейдем теперь к объяснению метода, с помощью которого, используя последовательность униформных случайных чисел, можно генерировать сложные стохастические процессы. Ниже рассматриваются несколько таких методов, однако этот перечень ни в коем случае нельзя считать полным. Отметим к тому же, что примеры, иллюстрирующие предлагаемые методы, выбраны скорее исходя из удобства пояснения основных идей, нежели демонстрации эффективности вычислительных процедур. В реальных ситуациях, прежде чем выбрать тот или иной метод для проигрывания
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
363
конкретной модели, необходимо посоветоваться со специалистом в области прикладной кибернетики. Метод обратного преобразования. Ниже рассматривается наиболее простой и одновременно исключительно важный метод имитирования случайных выборок при произвольном распределении вероятностей для одной переменной. Обозначим функцию распределения случайной переменной через F (х), интерпретируя ее как вероятность того, что данная случайная переменная принимает значение, не превышающее х (т. е. ^х). Пусть, например, плотность распределения случайной переменной имеет экспоненциальный вид: / (t) = for», t > 0. (6) Тогда X
M
e- dt = l—e-**.
(7)
При этом 0 ^ F (х) ^ 1; допустим, что функция F (х) непрерывна и является строго возрастающей. Тогда при заданном значении и, которое удовлетворяет условию 0 < и < 1, существует единственное значение х, такое, что F (х) = и. Символически напишем х = = F~l (и), где F'1 есть обратная функция по отношению к F. Метод заключается в том, чтобы генерировать последовательность униформных случайных десятичных чисел ип (п = 1, 2, . . .) и с их помощью вычислять соответствующие значения хп. используя для этого формулу хп = F~l (ип). Корректность данного метода можно доказать следующим образом. Рассмотрим два произвольных числа иа и иь, удовлетворяющих условию 0 < иа < иъ < 1. Тогда вероятность того, что униформное случайное десятичное число и лежит в интервале иа ^ и :?С иь, равняется иь — иа. Поскольку функция F (х) непрерывна и является строго возрастающей, существует число ха. такое, что F (ха) = м п , и число хь, такое, что F (xb) = иь, где ха < хь. Применение метода обратного преобразования правомерно, если истинная вероятность того, что значение случайной переменной попадает в интервал между х„ и хь, равняется вероятности генерации иъ — иа. По построению эта истинная вероятность равняется F (хъ) — F (ха) = иь — и„, и, следовательно, данный метод действительно является математически вполне корректным. Чтобы увидеть этот метод в действии, обратимся снова к экспоненциальному распределению, представленному соотношениями (6) и (7). Обозначим через vn униформное десятичное случайное число. Положим vn = i- e-Kxn, (8) так что
ГЛАВА 21
364
t,o 0,5
о
-
/
х
г
о
о,5 if
i
Р и с. 21.6. Метод обратного преобразования для непрерывной и строго возрастающей функции F (х). (Рассматривается случай, когда F (х) = 1 — е~"*'х,Р~1 (v) = — In (I — v)/K при Я, = 1.) ч
где ип = 1 — vn и. следовательно, также представляет собой униформное десятичное случайное число. Таким образом, происходит генерация последовательности униформных десятичных случайных чисел MJ, u3, u3. . . ., и, с помощью (9) определяются х^, xz, x3, . . .., задающие экспоненциальное распределение случайной переменной х. Графическое представление рассматриваемого метода показано на рис. 21.6. Такой же подход применим и в том случае, когда распределение дискретно. Обозначив функцию меры вероятности через р (/) и предположив, что / = О, 1, 2, 3. . . ., будем иметь з=о
(10)
Тогда обратную функцию можно записать в виде
*„=/
для F (j - 1)< ип ^ F (j),
(11)
где по условию F (—1) — 0. Пусть, например, функция меры вероятности р (j) задана биномиальным распределением р (;) = C(pj (1 - />)"-'', j = О, 1, . . ., /с, (12) где 0 < р < 1, a k есть положительное целое число. Рассмотрим частный случай, когда k = 2, а р = 0,5; тогда р (0) = 1/4, р (1) = 1/2 и р (2) = 1/4, так что в силу (11) получаем О при 0<м п <0,25, 1 при 0,25<w n <0,75, (13) 2 при 0,75 О„<1.
{
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
365
1.00 0,75
O,2S
О
1
z
2
0
0,25
0,75 1,00
Р п с. 21.7. Метод обратного преобразования в случае дискретного распределения вероятностей. (Рассматривается случай, когда р (0) = 1 / 4 , р (1) = 1 / 2 , Р (2) = 1 / 4 .)
Поскольку ип есть униформное десятичное случайное число, то с вероятностью 1/i оно попадает в интервал от 0 до 0,25, с вероятностью V 2 — в интервал от 0,25 до 0,75 и с вероятностью V 4 — в интервал от 0,75 до 1. Графическое представление данного метода приведено на рис. 21.7. Аналитическое построение функций, обратных по отношению к непрерывным функциям распределения F (х), разумеется, не всегда можно осуществить (случай экспоненциального распределения является скорее исключением, нежели правилом). Однако метод обратных преобразований можно использовать и в такого рода ситуации, если прибегнуть к дискретной аппроксимации соответствующей непрерывной функции распределения (т. е. задаваясь значениями F (х) лишь для конечного набора х). Повышение степени точности аппроксимации может быть достигнуто за счет интерполяции в промежутках между выбираемыми значениями х. Для некоторых языков машинного имитационного моделирования (таких, как GPSS) достаточно лишь конкретизировать способ дискретной аппроксимации, и соответствующие случайные события будут генерироваться автоматически. Матричный (табличный) метод. Формула (11) легко может быть реализована на ЭВМ с помощью небольшого количества стандартных команд программы. Однако если диапазон возможных значений / велик, то на поиск значений j, удовлетворяющих неравенствам (11), потребуется слишком много машинного времени. Одна из разновидностей метода обратных преобразований, требующая значительно меньше машинного времени, предполагает использование определенного объема машинной памяти для записи весьма большого количества табличных данных. Поясним суть этого метода на примере биномиального распределения (13). Обратную функцию можно ввести в машинную память в виде О G(s)=<(l 2
для s = l , 2, . .., 25, для s = 26, 27, . . . , 75, для s = 76, 77, . . . , 100.
(14)
366
ГЛАВА 21
Пусть для заданного значения ип величина dn представляет собой число, образованное из двух первых цифр ип. Положим sn == dn -f- 1 и хп = G(sn). Так, например, если ип = 0,52896,. . ., то sn = = 52 + 1 = 53 и, следовательно, хп — G (53) = 1 [см. формулу (14)]. Если функция G (s) записана в памяти ЭВМ, то для нахождения хп требуется весьма незначительное количество вычислений. Метод сверток. Случайную величину иногда можно представить в виде суммы других случайных величин, характеризуемых независимыми распределениями вероятностей. При этом распределение вероятностей рассматриваемой случайной величины представляет собой свертку вспомогательных распределений вероятностей, каждую из которых легко генерировать. (В ряде случаев весьма удовлетворительная аппроксимация сложного распределения вероятностей достигается путем суммирования взвешенных значений независимых случайных величин. В связи с этим излагаемый метод называют также методом композиций.) Рассмотрим в качестве иллюстрации случайную переменную, плотность распределения которой определяется ? гамма-распределением h
~l ~
, где k — положительное целое число. (15)
- /(Кi— TU— » — 1)!
Упомянутая случайная переменная может быть представлена в виде суммы k независимых случайных переменных, каждая из которых описывается соответствующим экспоненциальным распределением [см. формулу (6)]. Таким образом, складывая k независимых величин хп, определяемых соотношением (9), мы получаем случайную величину с распределением вероятностей (15). Аналогичным образом случайную переменную с биномиальным распределением типа (12) можно представить в виде суммы k случайных Выборок, удовлетворяющих условию
с вероятностью р, [О с вероятностью 1—р. I О
f
•nr\'r\f\ftrr>T-rf\ftrpT
т/~1
Л
-п
\
*
Следовательно, случайную переменную с биномиальным распределением можно получить путем сложения k значений i; при этом каждое значение i определяется формулой М ( \0 при р<ц<1, ' где и — униформное десятичное случайное число. Метод эквивалентных преобразований. Случайную переменную иногда можно генерировать, опираясь на соответствие между распределением вероятностей, описывающим данную переменную, и распределением вероятностей вспомогательной случайной переменной.
вид
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
367
Рассмотрим, например, пуассоновское распределение,
имеющее
-W
- , / =0 , 1 , 2 , . . . ,
(18)
для которого среднее значение случайной переменной равняется А, Т1. Если иметь в виду модели массового обслуживания, рассмотрению которых посвящена гл. 20, то j можно интерпретировать как число клиентов, прибывающих на пункт обслуживания в течение периода Т, где интервалы времени между двумя последовательными прибытиями клиентов (поступлениями требований на обслуживание) независимы и распределены по экспоненциальному закону с плотностью распределения, характеризуемой формулой (9). Таким образом, значение случайной переменной, описываемой распределением Пуассона, можно генерировать, производя серию независимых случайных выборок значений переменной с экспоненциальной плотностью распределения [т. е. фактически с помощью формулы (9)]. Процедура случайных выборок прекращается, как только сумма ; + 1 значений рассматриваемой переменной начнет превышать Т. В результате мы приходим к распределению (18). Нормальное распределение. Функция F (х) в случае нормального распределения (характеризующегося нулевым средним значением и единичной дисперсией) имеет вид
/2 d / . .
(19)
—
Эта функция, к сожалению, не допускает обращения, которое позволило бы записать в аналитическом виде F'1 (и). Метод обратного преобразования, разумеется, применим и в этом случае, если воспользоваться соответствующим дискретным приближением и интерполяцией в интервалах между выбранными значениями случайной переменной. Однако существуют другие способы, с помощью которых можно генерировать значения случайной величины, распределенной по нормальному закону. Ниже изложены лишь некоторые из них. Один из способов основан на генерировании пары униформных случайных десятичных чисел и и v, которые приводят затем к паре независимых случайных переменных ж и г / , распределенных по нормальному закону (19). Если говорить более конкретно, задача сводится к вычислению х = ( — 2 In u)Vs cos 2яи, 1
у = (-2 In u) /! sin 2nv.
(20)
Вместо данного способа можно воспользоваться методом сверток, опираясь при этом на центральную предельную теорему. Такой подход основан на суммировании k случайных переменных, имеющих однородное распределение. Пусть, например, ц г (i = 1, 2, . . ., 12)
368
ГЛАВА 21
представляют собой случайным образом выбранные униформные десятичные числа. Вычислим 12 ж = 2 " г — 6. i=i
(21)
Распределение вероятностей для х таково, что среднее значение равняется нулю, а дисперсия равняется единице. Это распределение является близким к нормальному. Данное приближение оказывается неудовлетворительным для значений, превышающих среднее значение математического ожидания х более чем на три соответствующих среднеквадратичных отклонения . Третий метод состоит в том, чтобы воспользоваться формулой 0,323968
'
где и — униформное случайное десятичное дробное число. Коррелированные случайные величины. Существуют методы генерации случайных переменных, основанные на непосредственном использовании многомерного нормального распределения некоторых других совместных распределений вероятностей, а также на использовании последовательно коррелированных случайных величин. Изложение упомянутых методов в данной книге не представляется возможным. Однако описание этих методов можно найти в большинстве учебных пособий и монографий, посвященных имитационному моделированию на ЭВМ. 21.6. ПРИРАЩЕНИЕ ВРЕМЕНИ
Существуют два способа построения имитационных моделей динамических систем. Один из них. обладающий большей наглядностью. основан на разбиении имитируемого периода времени на некоторое хронологически упорядоченное множество отрезков. При этом с помощью стандартной машинной программы выполняются все вычислительные процедуры для t-то отрезка, после чего те же процедуры повторяются для (£-L-l)-ro отрезка и т. д. Если события t-то отрезка приводят к тем или иным последствиям, которые должны сказаться в будущем, ЭВМ сохраняет нужную информацию об этих событиях в своей памяти и обращается к ней при наступлении соответствующего отрезка имитируемого периода. Такой метод однородной градуировки времени (т. е. основанный на рассмотрении постоянных приращений на временной оси) уже демонстрировался нами в разд. 21.4 при имитировании биржевых сделок. Еще один пример такого рода приводится ниже. При решении некоторых имитационных задач отрезки внутри имитируемого периода необходимо выбирать весьма короткими. Однако при этом может иметь место множество отрезков, на которых
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
369
никаких действий не предпринимается. Для таких моделей используется другой метод, позволяющий ускорять процесс имитирования за счет неоднородной градуировки времени (т. е. рассмотрения переменных приращений по временной оси). Этот метод иллюстрируется с помощью второго из приведенных ниже примеров. Пошаговое приращение времени — модель управления запасами. Пусть требуется оценить операционные характеристики предлагаемой стратегии (т. е. некоторого конкретного правила) пополнения запасов. Допустим, что нам удалось определить распределение вероятностей для ежедневных уровней спроса; предположим, что уровни спроса в расчете на один день распределены равномерно и совершенно независимо. Если спрос превышает объем имеющихся в наличии запасов, неудовлетворенные заказы теряются. Будем постулировать, что в течение однодневного отрезка функционирования имитируемой системы наблюдается определенная последовательность событий, а именно вначале учитываются объемы заказов на пополнение, подлежащие реализации в данный период, осуществляются поставки продукции клиентуре и, наконец, производится оценка оставшегося объема запасов и оформляется (если это вытекает из стратегии пополнения запасов) дополнительный заказ на поставку. Заказ, оформленный в конце t-ro отрезка времени, исполняется в начале (t + Z/)-ro отрезка, где L является фиксированным и удовлетворяет условию L ^г 1. Для простоты изложения допустим, что правило пополнения запасов заключается в том, чтобы заказывать Q единиц продукции всякий раз, когда сумма имеющихся в наличии запасов и уже заказанной продукции меньше или равняется s, причем Q > s. Легко убедиться в том, что в силу неравенства Q > s в любой заданный момент времени не может быть более одного находящегося в процессе исполнения заказа. (Поскольку основное внимание мы уделяем здесь имитационному моделированию, а не теории управления запасами, вопрос о целесообразности такого правила пополнения запасов нами не затрагивается; отметим, однако, что предложенная выше модель является аппроксимацией модели, рассмотренной в разд. 19.6.) Имитационную модель данной системы управления запасами легко построить, продвигаясь шаг за шагом в положительном направлении по оси времени, рассматривая на каждом шаге фиксированное приращение времени, равное одному дню, и начиная имитирование со дня 1 (t = 1). Прежде чем начать имитирование, необходимо определить начальные условия для уровня имеющихся в наличии запасов, а также для объема находящегося в исполнении заказа и срока его исполнения. Необходимо также указать количество отрезков времени, составляющих в совокупности имитируемый период; всякий раз, когда будет использоваться понятие «ИМИТИРУЕМЫЙ ПЕРИОД» мы будем иметь в виду именно этот количественный показатель. Блок-схема рассматриваемого имитационного процесса приведена на рис. 21.8. Стартовым является блок 1. При этом можно выбрать,
370
ГЛАВА 21
Начальные условия
НАЛИЧНЫЙ ОБЪЕМ запасов"
НАЛИЧНЫЕ ОБЪЕМ ЗАПАСОВ
ОБЪЕМ ЗАКАЗА, НАХОДЯЩЕГОСЯ в процессе ИСПОЛНЕНИЯ
НАЛИЧНЫЙ ЕМ ЗАПАСОв
Ъ
®
^ОБЪСМ ЗАПАСОВ' + ОБЪЕМ ЗЯКДЭА,НА1!ОАЯЩ.еГОС. В ПРОЦЕССЕ ИСПОЛНЕНИЯ
НАЛИЧНЫЙ ОБЪЕМ ЗАПАСОВ
ОбЪЕМ ЗАКАЗА, НАХОДЯЩЕГОСЯ в процессе ИСПОЛНЕНИЯ
езков ИМИТИРУЕМОГО ПЕРИО-
ДА)?
Р и с . 21.8. Блок-схема функционирования имитационной модели управления запасами.
например, следующие начальные условия: ОБЪЕМ НАЛИЧНЫХ ЗАПАСОВ равняется Q; ОБЪЕМ ЗАКАЗА. НАХОДЯЩЕГОСЯ В ПРОЦЕССЕ ИСПОЛНЕНИЯ, равен нулю; СРОК ИСПОЛНЕНИЯ ЗАКАЗА равняется нулю *); 1 = 1. Совершенно очевидно, что на выходе блока 2 ответ будет отрицательным («Нет»), и мы переходим к блоку 4, генерируя для дня 1 коммерческий спрос в объеме д. При этом реализуется тот метод имитирования, о котором шла речь в предыдущем разделе. К концу дня 1 объем наличных запасов сокращается на д единиц, если q не превышает уровня запасов, имевшихся вначале (в последнем случае ОБЪЕМ НАЛИЧНЫХ ЗАПАСОВ становится нулевым); соответствующие вычислительные процедуры реализуются в блоке 5. J
) To есть для реализации несуществующего (нулевого) заказа времени не требуется.— Прим. перев.
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
371
В блоке 6 проводится анализ с целью выяснения того, нужно ли направлять заказ на пополнение запасов. В случае положительного ответа («Да») ОБЪЕМ ЗАКАЗА, НАХОДЯЩЕГОСЯ В ПРОЦЕССЕ ИСПОЛНЕНИЯ, становится равным Q, а СРОК ИСПОЛНЕНИЯ ЗАКАЗА — (1 + L), поскольку для стартового блока t = 1; эти результаты указаны в блоке 7. Если заказ на пополнение запасов не направляется, осуществляется переход непосредственно к блоку 8, для которого порядковый номер отрезка имитируемого периода времени возрастает на единицу; другими словами, стрелка имитационных «часов» перескакивает на следующее деление, с пометкой день 2. Если день 2 выходит за рамки ИМИТИРУЕМОГО ПЕРИОДА, имитационный процесс заканчивается. Если же предположить, что £ > 1 , то, продолжая имитирование, мы возвращаемся от блока 9 к блоку 2. В один из дней СРОК ИСПОЛНЕНИЯ ЗАКАЗА может оказаться равным t; тогда имитационный процесс образует новую ветвь от блока 2 к блоку 3, для которого ОБЪЕМ НАЛИЧНЫХ ЗАПАСОВ оказывается возросшим на Q единиц, а ОБЪЕМ ЗАКАЗА, НАХОДЯЩЕГОСЯ В ПРОЦЕССЕ ИСПОЛНЕНИЯ, остается нулевым. Рассмотренная нами блок-схема не содержит указаний относительно того, где осуществляется сбор статистических данных, определяющих операционные характеристики имитируемой системы. При составлении обеспечивающей данную модель программы, по-видимому, следует позаботиться о сохранении в памяти ЭВМ количественных показателей, характеризующих ОБЪЕМ НАЛИЧНЫХ ЗАПАСОВ в конце каждого из дней (см. блок 5), информации о числе случаев, когда спрос не был полностью удовлетворен, а также о числе случаев, когда возникали излишки запасов. В блоке 6 должны накапливаться данные о количестве дней, когда оформлялся новый заказ на пополнение запасов. Тогда, прежде чем завершить (блоком 10) рассматриваемый имитационный процесс, необходимо произвести статистическую обработку упомянутых выше данных с тем, чтобы получить ряд представляющих безусловный интерес рабочих характеристик системы (распределение частот различного рода событий, средние значения и среднеквадратичные отклонения фигурирующих в модели стохастических переменных и т. д.). Предположим теперь, что продукция относится к категории: «неходких» товаров, т. е. с большой вероятностью в любой день <7 = 0. В этом случае метод последовательного рассмотрения отрезков имитируемого периода может оказаться неэффективным, так как будут наблюдаться ситуации, когда для целого ряда следующих один за другим дней вычислительные процедуры в блоках 2, 5 и 6 окажутся совершенно идентичными. От такого рода излишних вычислений можно избавиться, если воспользоваться методом, иллюстрация которого приводится ниже. Приращения времени, индуцируемые прогнозируемыми исходами,— модель очереди. Пусть требуется исследовать операционные
372
ГЛАВА 21
характеристики следующей системы массового обслуживания (которую легко описать словесно, но трудно проанализировать математически). Предположим, что известно распределение вероятностей для продолжительности интервалов времени между двумя последовательными прибытиями клиентов на станцию обслуживания. Обслуживание осуществляют два клерка (А т В). Когда оба канала (обозначим их также через А и В) обслуживания заняты, прибывающие на станцию обслуживания клиенты становятся в общую очередь, характеризующуюся дисциплиной «первым пришел — первым обслуживаешься». Продолжительности обслуживания в каждой точке можно рассматривать как случайные переменные, значения которых определяются путем случайных выборок при заданном распределении вероятностей; однако будем считать, что распределения вероятностей для времени обслуживания в точках А и В различны. При этом ни одно из упомянутых выше распределений не является экспоненциальным. Предварительный анализ эволюции рассматриваемой системы во времени показывает, что ее динамика характеризуется событиями трех видов: прибытием клиента, началом обслуживания клиента, окончанием обслуживания клиента. Каждый тип событий порождает свою стандартную вычислительную программу. Имитационная модель, в которой используются переменные приращения времени, содержит также основную программу, имеющую список событий (исходов). Этот список при переходе от одной подпрограммы регистрации исходов к другой постоянно пополняется. В начале имитационного процесса список исходов обычно имеет нулевое наполнение; в последующие моменты времени в этом списке появляются данные, указывающие моменты наступления некоторых событий в будущем. Чтобы лучше разобраться в том, какую роль играет перечень событий, рассмотрим блок-схемы, приведенные на рис. 21.9. Пусть при имитировании имеют место следующие начальные условия: первый клиент прибывает в момент 0 (очередь, таким образом, в этот момент отсутствует), при этом оба клерка находятся в состоянии ожидания заявок на обслуживание. Основная программа начинается с подпрограммы, для которой стартовым является блок 1 (рис. 21.9). Используя одну из процедур, описанных в предыдущем разделе, ЭВМ выбирает значение интервала времени между двумя последовательными поступлениями заявок (см. блок 2). Информация об определенном таким образом времени поступления очередной заявки заносится в перечень событий. Являются ли обе точки обслуживания занятыми, выясняется в блоке 3. Поскольку в рассматриваемый момент времени на выходе блока 3 регистрируется отрицательный ответ («Нет»), то в основной программе происходит переключение через блок 4 на подпрограмму, для которой стартовым является блок 7 («Начинается обслуживание»). Чтобы не загромождать блоксхему, мы не вникаем в ее микроструктуру, в соответствии с которой
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
373
© <ести время бытия следующего клиента е список
Перейти /г, Hgm .нять? ли {следующей*——•(АиВ о/}-\ влон- схеме служи/ ванием ?
Внести в список время аканойслуживания
Перейти /г, предыдущей Ллон-схеме
Р и с . 21.9. Блок-схема
событий для модели массового обслуживания."
ЭВМ должна прослеживать, какой из клерков А или В приступает к обслуживанию прибывшего клиента (эта информация требуется при переходе в основной программе к подпрограмме, начинающейся блоком 7). Первая команда подпрограммы, для которой стартовым является блок 7, реализуется в блоке 8, где регистрируется тот факт, что «избранный» клерк занят обслуживанием. Затем с помощью распределения продолжительностей обслуживания для данного клерка в блоке 9 определяется момент окончания обслуживания с его стороны. Соответствующая информация поступает в список событий. После этого происходит переход к блоку 10, где реализуется команда «Указать очередное событие». Пока этим событием может быть либо прибытие следующего клиента, либо окончание обслуживания первого клиента. Допустим имеет место второе событие, при наступлении которого в основной программе происходит переключение на подпрограмму, начинающуюся блоком 11. Первая команда подпрограммы, начинающейся с блока 11 («Обслуживание заканчивается»), реализуется в блоке 12, где регистрируется, что точка обслуживания снова оказывается «свободной» (т. е. находится в состоянии ожидания очередного клиента). После этого в блоке 13 осуществляется проверка с тем, чтобы узнать, не является ли длина очереди нулевой. Нетрудно сообразить, что ответ будет положительным («Да»). Легко также убедиться, что после перехода
374
ГЛАВА 21
по основной программе к блоку 14 очередным событием будет прибытие следующего клиента. В последующие моменты имитируемого периода очередь окажется ненулевой (т. е. будет содержать некоторое число ожидающих обслуживания клиентов); тогда на выходе блока 13 ответ будет отрицательным («Нет»). В результате в блоке 15 число клиентов, ожидающих обслуживания, уменьшится на единицу, и произойдет переход к подпрограмме, для которой стартовым является блок 7 («Начинается обслуживание»). Читателю предлагается ответить на вопрос: что произойдет, если в один из последующих моментов времени после блока 10 придется перейти к подпрограмме, начинающейся с блока 1 ? Эволюция имитационного процесса обеспечивается как за счет переходов от одной подпрограммы регистрации событий к другой подобной подпрограмме, так и за счет реализации команды продвижения по оси времени к моменту, когда должно наступить очередное событие. Читатель, по-видимому, догадывается, что составление имитационной программы с временными приращениями, индуцируемыми прогнозируемыми исходами, требует большого мастерства. В частности, большой профессиональный опыт необходим при составлении эффективной программы обновления, вносящей пополнения и изменения в список будущих событий, которые генерируются соответствующими подпрограммами. Многие языки моделирования (некоторые из них упоминались в разд. 21.8) располагают программами обновления такого списка, так что для их использования необходимо лишь составить соответствующие подпрограммы регистрации событий. При описании имитационной модели массового обслуживания мы опустили целый ряд деталей. Прежде чем перейти к следующему разделу, посвященному проектированию имитационного эксперимента, на некоторых из этих деталей следует вкратце остановиться. Во-первых, заметим, что блок-схемы на рис. 21.9 не содержат предписания относительно завершения имитационного процесса. Такое предписание в моделирующей программе должно, разумеется, содержаться; оно может быть сформулировано либо с помощью ограничения, накладываемого на продолжительность имитируемого периода, либо с помощью ограничения числа поступивших заявок на обслуживание (т. е. числа клиентов). Во-вторых, следует подчеркнуть, что табулирование статистических данных, определяющих операционные характеристики системы сопряжено в силу неравномерных приращений по времени со значительными трудностями. Так, например, следует принимать в расчет не только частоты наступления событий, когда очередь состоит из п клиентов, но и показатель, характеризующий ассоциированную с этими событиями долю имитируемого периода. Наконец, напомним читателю, что начальные условия в приведенном выше примере были выбраны произвольным образом. Если система массового обслуживания имеет «тенденцию к перегрузкам», то продолжительность интервала времени, в течение которого длина очереди (на старте) равняется нулю, будет весьма незна-
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
375
1
чительной ). Определение реалистических начальных условий является одним из элементов проектирования имитационного эксперимента. 21.7. ПРОЕКТИРОВАНИЕ ИМИТАЦИОННОГО ЭКСПЕРИМЕНТА 2)
После построения имитационной модели перед операционистом встает исключительно сложная задача, связанная с разработкой схемы проигрывания модели и анализом получаемых экспериментальных данных. В частности, необходимо определить: начальные условия моделируемого процесса; блоки параметров, описывающие различные аспекты функционирования операционной системы; временные характеристики модели (число отрезков имитируемого периода и соответствующее машинное время); число прогонов имитационной модели при одних и тех же наборах описывающих систему параметров; переменные, значения которых подлежат измерению, и способы их измерения. Если указанные выше аспекты окажутся недостаточно продуманными, то для проверки степени соответствия между рассматриваемой моделью и поведением реальной системы потребуется слишком много машинного времени. При этом даже при больших затратах машинного времени и, таким образом, даже после накопления большого объема данных операционист может не получить достаточно точной информации для принятия управляющего решения. Как это ни покажется странным, вопросы статистической обработки данных, разрешение которых позволило бы усовершенствовать методы проектирования имитационных экспериментов, разработаны относительно слабо. Следует заметить, что специалисты по теории управления предпринимали попытки «приспособить» для анализа экспериментальных данных, получаемых в процессе имитационного моделирования на ЭВМ, обычные приемы статистической обработки информации. Эти приемы приводили в лучшем случае к посредственным результатам, так как в большинстве своем они строились не для целей анализа многомерных временных последовательностей стохастических параметров. В частности, многие из широко используемых методов статистической обработки данных строятся на предположении о том, что отдельные наблюдения случайных переменных являются взаимно некоррелированными и что все они описываются нормальными распределениями вероятностей с одинаковыми параметрами. Нам, по-видимому, не удастся сделать обзор всех «стандартных» методов статистической обработки информации, с помощью которых можно анализировать экспериментальные данные имитационного моделирования. Мы обсудим лишь некоторые из приемов проектиро*) По сравнению со средней продолжительностью обслуживания.— Прим. перев. *) Данный раздел требует знания методов математической статистики.
376
ГЛАВА 21
вания имитационных экспериментов, позволяющих использовать многие из методов, изложение которых можно найти в современных учебниках по статистической обработке экспериментальных данных. Кроме того, мы дадим краткий обзор некоторых методов статистического анализа, которые особенно хорошо подходят для проектирования машинного моделирования. В поисках «нормальности». Предположим, что нами построена модель массового обслуживания для анализа двух различных дисциплин формирования очереди. В качестве примера можно рассмотреть модель функционирования предприятия с мелкосерийным производством; при этом предположим, что возможны следующие варианты дисциплины очереди в ходе оформления заказов: 1) «первым пришел— первым обслуживаешься»; 2) обслуживание осуществляется по некоторой заданной схеме приоритетов. Допустим далее, что различие между указанными выше вариантами должно целиком определяться средними значениями времени ожидания требований, или заявок (исключая время обслуживания). Каким образом можно установить, в чем это различие выражается? Этот вопрос оказывается не таким простым, как может показаться на первый взгляд. Поскольку измеряются значения случайных переменных, необходимо учитывать их стохастические особенности и быть готовым к различного рода осложнениям. При каждом отдельно взятом проигрывании модели на ЭВМ времена ожидания последовательно поступающих заявок на обслуживание будут сериально коррелированными (иногда говорят, автокоррелированными); другими словами, вероятность того, что (ге-|-1)-й заявке на обслуживание придется ждать, если п-я заявка также находится в состоянии ожидания, больше, нежели в том случае, когда п-я заявка принимается на обслуживание немедленно. Величины же ожидания сами по себе могут зависеть от дисциплины очереди. Модель может быть неустойчивой и иметь тенденцию к увеличению продолжительностей ожидания. Но даже и в том случае, когда система достигнет состояния устойчивости (для чего может потребоваться большой промежуток времени имитирования), продолжительности ожидания могут и не иметь нормального распределения. Если пренебречь всеми этими соображениями и основываться просто на сравнении средних значений времени ожидания, полученных при прогонах имитационных моделей с дисциплиной очереди первого и второго типа, то можно прийти к ложным заключениям. Пусть теоретически удается доказать, что модель массового обслуживания является стабильной, а влияние на исследуемый процесс начальных условий в конечном счете исчезает. Тогда можно показать, что даже при автокоррелированных значениях времени ожидания заявок на обслуживание среднее значение продолжительностей ожидания, определенное на достаточно большом промежутке времени, оказывается приблизительно таким же, как и в случае равновесного распределения.
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
377
Рассмотрим этот вопрос более тщательно. Пусть значения xt (t = 1, 2, . . ., q) представляют собой результаты q последовательных измерений значений случайной переменной во время одного и того же сеанса имитирования. Определим интегральное по времени среднее значение х следующим образом:
Обозначим через ц так называемое среднее по ансамблю значение х, найденное с помощью равновесного распределения. Тогда для достаточно большого q мы получаем Е Ы « ц. (2) Кроме того, можно показать, что выборочное распределение х является в определенном приближении нормальным. Для данного распределения оценка дисперсии может быть получена следующим образом. Если предположить, что мы имеем дело с ковариационностационарным процессом (ковариация между xt и xt+h зависит лишь от k и не зависит от t), а соответствующие автокорреляции при возрастании k стремятся к нулю, то прежде всего можно будет вычислить автокорреляции по формуле g-ft
где М выбирается таким образом, чтобы выполнялось условие М <С q(К сожалению, оценку, которая позволила бы судить о том, насколько q должно превышать М, получить не так-то легко. Поэтому мы не останавливаемся здесь на этом вопросе, отсылая читателя к литературе по математической статистике, где соответствующий материал содержится в разделах под названием автокорреляция и спектральный анализ.) Формула для оценки дисперсии х имеет следующий вид:
Заметим, что если временные ряды не являются автокоррелированными, то члены, содержащие rk (k = 1, 2, . . ., М). из соотношения (4) выпадают. При наличии же положительной автокорреляции разброс значений х по сравнению со случаем бескорреляционных измерений (наблюдений) оказывается большим. Теперь мы можем перейти к рассмотрению двух получивших широкое распространение методов статистического анализа. Один из них основан на продолжительном имитировании исследуемогопроцесса для каждого варианта дисциплины очереди (в течение каж-
378
ГЛАВА 21
дого сеанса имитирования производится Т последовательных наблюдений). После этого можно воспользоваться соотношениями (1) — (4), положив q = Т. Если Т выбирается достаточно большим, статистическое распределение (х — \i)/V~Vx является в некотором приближении нормальным и приводит к нулевому среднему значению и единичной дисперсии. Это позволяет выполнить стандартные процедуры статистической обработки данных при анализе гипотетической схемы функционирования исследуемой системы, а также определить доверительные интервалы для ц и провести анализ модели одним из современных методов, а именно методом Байеса. Чтобы выяснить, каким образом сказывается на среднем времени ожидания выбор дисциплины очереди, можно прибегнуть к помощи обычной математической статистики. Она позволяет определить разницу между средними значениями переменных, каждая из которых характеризуется «своим» нормальным распределением; при этом может наблюдаться также разница в расчетных значениях дисперсии. Другой метод заключается в реализации п независимых прогонов модели, т. е. в тг-кратном повторении одного и того же цикла имитирования. Пусть мы хотим получить в сумме Т наблюдений при тгкратном прогоне модели и предположим, что число наблюдений при каждом таком прогоне равняется Tin (допустим, что Tin представляет •собой целое число). Тогда для каждого р-го прогона по формуле (1) при q = Tin вычисляется интегральное по времени среднее х р , после чего находится суммарное среднее
В силу центральной предельной теоремы относительно среднего значения переменных, имеющих независимые и идентичные распределения, при достаточно больших значениях п выборочное распределение х (для любого Tin) оказывается в известном приближении нормальным. При возрастании значений Tin степень точности аппроксимации повышается, поскольку выборочные распределения самих хр для каждого значения р близки к нормальному. Более того, из (2) следует, что при достаточно больших значениях Tin
Е га « и,.
(6)
Чтобы определить компактность выборочного распределения х, вычислим соответствующую дисперсию (в смысле нормированного среднеквадратичного отклонения х от хр): - 1
S <*р-*>2
.Е±! F-_ = ± п п— 1
J
(7)
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
При этом снова для
достаточно
(х — (-О/К V- имеет приблизительно
379
больших п и Т величина нормальное распределение с
нулевым средним значением и единичной дисперсией. Следовательно, в данном случае можно провести статистический анализ такого же типа, как и в случае продолжительного мультитестового имитирования. Несмотря на то что приведенные выше соображения связаны со сравнением двух вариантов а) модели обслуживания частного вида (обслуживание клиентов предприятием с мелкосерийным производством), изложенные нами методы статистического анализа применимы для исследования моделей более широкого класса. Короче говоря, если допустить, что имитируемая система достигает в пределе состояния равновесия, то при многих с практической точки зрения разумных условиях усреднение данных хронологически упорядоченного ряда наблюдений представляется вполне правомерным. Когда число наблюдений становится достаточно большим, интегральное по времени среднее в вероятностном смысле сходится к среднему по ансамблю, соответствующему равновесному распределению. (Вопросы вероятностной сходимости подробно излагаются в учебных пособиях по стохастическим процессам, в частности в тех разделах, где рассматриваются так называемые эргодические теоремы.) Кроме того, следует отметить, что для многих широко используемых условий в постановке задачи интегральное по времени среднее имеет в определенном приближении нормальное распределение. (Вопросы аппроксимации с помощью нормальных распределений можно найти во многих современных учебниках по статистике; эти вопросы обсуждаются в связи с доказательством центральной предельной теоремы для коррелированных случайных переменных.) Таким образом, во многих случаях, когда производится многократный прогон модели и затем либо используется суммарное среднее для множества индивидуальных интегральных по времени средних, либо берется интегральное по времени среднее для одного достаточно длинного прогона, обработку данных можно осуществлять, опираясь на закономерности нормального распределения вероятностей. Сравнение относительных преимуществ упомянутых выше методов, а также обсуждение других методов статистической обработки данных выходят за рамки настоящей книги. (При рассмотрении этих вопросов весьма существенную роль играют начальные условия имитационного процесса и свойства стабильности V-.) Объем выборки. Пусть число прогонов модели достаточно велико, или же допустим, что сеанс имитирования достаточно продолжителен. Тогда для аппроксимации выборочного распределения вычисленных средних значений тех или иных показателей имитируемого процесса !) Рассмотренные варианты различаются по признаку «дисциплина очереди».
380
ГЛАВА 21
можно воспользоваться нормальной функцией распределения. Не исключено, что для повышения степени точности анализа при выработке управляющего решения понадобятся дополнительные «проигрывания» модели или возникнет необходимость в увеличении периода имитирования. Метод определения требуемого объема выборки при имитировании ничем не отличается от метода определения объема выборки при решении обычных статистических задач. Таким образом, обсуждение этого вопроса можно найти в любом учебнике по статистическому анализу. Следует, однако, подчеркнуть, что точность статистических оценок зависит от числа наблюдений. Как в случае одного продолжительного прогона, когда используются соотношения (1) — (4) при <7 = Т, так и в случае n-кратного прогона модели, когда используются соотношения (5) — (7) при q = Tin, истинная дисперсия выборочного распределения для расчетного среднего обратно пропорциональна суммарному числу наблюдений Т, причем коэффициент пропорциональности не зависит от Т. Следовательно, чтобы уменьшить среднеквадратичное отклонение выборочного распределения х или х по отношению к их среднему значению, скажем, в 10 раз, суммарное число наблюдений необходимо увеличить в 100 раз (т. е. Т -*- 100Т1). Рассмотрим наиболее общий случай. Пусть требуется уменьшить среднеквадратичное отклонение от среднего в / раз. Для этого число наблюдений должно быть увеличено в /2 раз. В начале имитационного процесса требуемое число наблюдений определить обычно не удается, так как коэффициенты при ИТ в выражениях для истинной дисперсии выборочных распределений х и х не известны. Поэтому, как правило, эксперимент проводят в два этапа. На первом этапе число наблюдений выбирается относительно небольшим; в результате осуществляется количественная оценка коэффициента при 1/Т. Располагая такой оценкой, можно определить, сколько дополнительных наблюдений требуется на втором этапе имитирования, чтобы была достигнута требуемая точность. В практических приложениях при определении числа наблюдений, обеспечивающих достаточно удовлетворительную точность, могут возникнуть некоторые затруднения. Как уже отмечалось ранее, эти затруднения чаще всего бывают обусловлены наличием положительной автокорреляции. Ниже обсуждается ряд приемов, которые позволяют справиться с тем осложнением, что автокоррелированным процессам свойствен большой разброс статистических оценок. Метод редуцированной дисперсии. Существует несколько способов повышения точности оценок среднего по ансамблю при заданном числе статистических наблюдений. Их описание можно найти в учебных пособиях по имитационному моделированию, где они рассматриваются в разделе «Метод Монте-Карло» или «Метод редуцированной дисперсии». Эти способы при решении имитационных задач организационного управления широкого распространения пока не
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
381
получили. Мы приведем лишь пару примеров, которые позволяют разобраться в существе дела. Чтобы упростить изложение, обратимся вновь к примеру предприятия с мелкосерийным производством. Предположим для определенности, что имеет место дисциплина очереди «первым пришел — первым обслуживаешься» и что требуется произвести оценку среднего времени ожидания заявки на обслуживание. Вначале рассмотрим прием, который иногда называют методом случайного регулирования (или методом конкомитантной информации). Поясним этот метод на одном очень простом примере. Из элементарных рассуждений вытекает, что продолжительности интервалов между двумя последовательными поступлениями заявок на обслуживание и времена ожидания заявок являются отрицательно коррелированными величинами, т. е. грубо говоря, чем больше времени проходит с момента поступления предыдущей заявки, тем меньше время ожидания последующей. Следовательно, при том или ином прогоне имитационной модели может оказаться, что наблюдаемое среднее для разности времен поступления заявок превышает истинное среднее. Эта информация может быть затем учтена путем внесения положительных поправок к наблюдаемому среднему значению времени ожидания. Аналогичным образом допустим, что наблюдаемое среднее для разницы времен поступления заявок меньше истинного среднего. В этом случае производится «отрицательная» коррекция наблюдаемого среднего значения времени ожидания. Таким образом, рассматриваемый метод заключается в вычислении и учете либо положительных, либо отрицательных поправок в соответствии с результатами предыдущих прогонов модели. В некоторых частных случаях входные данные позволяют определить истинное среднее для разности времен поступления заявок, которое обозначим через 1А. Пусть в этом случае xt есть время ожидания заявки t, a yt есть разность времен поступления заявок (t — 1) и t. Будем измерять . (8) Рассмотрим соответствующее интегральное по времени среднее т
s
Т
~~
*=i
Т
_ _ , -
••
)
(9
Заметим, что математическое ожидание z совпадает с математическим ожиданием х, поскольку у представляет собой несмещенную оценку 1Д. Следовательно, z может рассматриваться как состоятельная оценка среднего времени ожидания. Однако, если xt и г/( отрицательно коррелированы в достаточно большой степени, z будет обладать дисперсией, меньшей по сравнению с дисперсией х. Выборочная
382
ГЛАВА 21
оценка z может быть получена путем нахождения разности значений 2, относящихся к различным прогонам модели, или путем подстановки xt ->- zt в приведенных выше соотношениях (1), (3) и (4). Более сложный метод по сравнению с только что рассмотренным заключается в том, чтобы вычислять zt = xt + a (yt — 1Д), где а подбирается таким образом, чтобы дисперсия z была незначительной. В идеальном случае можно подобрать такое значение а, для которого) Var (z) = Var (x) (1 — р2), где р определяет корреляцию между х и у. Прежде чем перейти к изучению других методов, необходимо еще раз напомнить читателю о том, что рассмотренный нами пример позволяет лишь проиллюстрировать саму идею метода стохастического регулирования. Чтобы применить этот метод к анализу реальных систем массового обслуживания, стохастическое регулированиедолжно учитывать вариации выборочных значений значительно большего числа параметров системы. К числу методов редуцированной дисперсии относится и так называемый метод отрицательных корреляций. Цель заключается в том, чтобы для двух изолированных сеансов имитирования ввести отрицательную корреляцию, за счет которой дисперсия для комбинированного эксперимента оказалась бы меньшей по сравнению со случаем независимых опытов. (Эту идею нетрудно обобщить и на случай нескольких экспериментов.) Предположим, что в примере предприятия с мелкосерийным производством продолжительности интервалов времени между последовательными поступлениями заявок на обслуживание определены методом обратного преобразования (разд. 21.5). Пусть ut (t = 1, 2, . . . . . ., 772) представляют собой случайные униформные десятичные числа, с помощью которых генерируются продолжительности интервалов между последовательными поступлениями заявок (обозначим их через yt) при первом прогоне модели. Тогда, если при втором прогоне использовать значения 1 — Ut, которые также являются случайными униформными десятичными числами, полученные в результате этих двух прогонов интегральные по времени выборочные средние будут отрицательно коррелированными. Доказательство этого утверждения предоставляется читателю. Заметим, что суммарное число наблюдений для двух упомянутых прогонов равняется Т. Получим ли мы в результате усреднения по двум изолированным отрицательно коррелированным прогонам меньший статистический разброс значений по сравнению со случаем, когда усреднение производится по результатам Т автокоррелированных наблюдений при одном прогоне? Ответ на этот вопрос зависит от того, в какой степени взаимно дополнительные случайные числа ut и 1 — ut обусловливают отрицательную корреляцию. Следовательно, все зависит от характера самой имитационной модели и от конкретных значений фигурирующих в модели параметров.
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
383
Целесообразность использования метода редуцированной дисперсии определяется главным образом следующими соображениями: необходимо убедиться, что этот метод действительно приводит к уменьшению дисперсии статистических оценок и что при этом экономически оправдан дополнительный расход машинного времени. Многомерный анализ. Приведенные нами рассуждения носили сугубо концептуальный характер: в рассмотренных примерах речь шла об измерении единственной операционной характеристики системы — среднего времени ожидания — и проводилось сравнение только двух вариантов модели, отличающихся друг от друга лишь дисциплиной очереди. В практических приложениях метода имитационного моделирования, как правило, приходится иметь дело с несколькими операционными характеристиками исследуемой системы и рассматривать целый ряд подлежащих оценке вариантов. В литературе по вопросам математической статистики многомерный анализ не представляет собой ничего нового. Однако как методика проектирования эксперимента, так и методы анализа имитационных данных в случае, когда последние представляют собой многомерные временные последовательности, находятся еще в самой начальной стадии разработки. Причина такого запаздывания заключается в том, что имитационный анализ стал практически возможным лишь недавно в результате развития электронной вычислительной техники. Используя уже описанные ранее методы получения данных, обладающих нормальным распределением вероятностей, мы по крайней мере частично обеспечиваем себя инструментом многомерного статистического анализа. Однако разработка имитационного эксперимента, в процессе которого было бы правомерно использовать, скажем, факторный анализ или метод мультипараметрической регрессии, все еще оказывается сопряженной с определенными трудностями. Разработка эффективного математического аппарата, ориентированного на многомерный анализ и многоаспектное экспериментирование, ведется в двух направлениях. Один из наиболее перспективных методов, находящихся в стадии разработки, известен под названием спектрального анализа. Он нацелен на исследование природы сериальной корреляции и периодичности (цикличности) временных последовательностей. Другой фронт исследований ориентируется на поиск методов определения оптимальных значений управляемых переменных; к числу таких методов относится метод чувствительных поверхностей, а также метод стохастической аппроксимации. Изложение этих методов можно найти в специальной литературе по математической статистике. 21.8.
ЯЗЫКИ ПРОГРАММИРОВАНИЯ
Операционисту, не являющемуся одновременно специалистом в области программирования для ЭВМ, транслировать выбранную им имитационную модель в соответствующую машинную программу
384
ГЛАВА 21
никогда не придется. Тем не менее знать содержание основных этапов отображения модели на машинные программы представляется совершенно необходимым. Для проигрывания простых типовых моделей можно использовать так называемые специальные стандартные программы, которые требуют от операциониста лишь задания определенного количества входной информации. Наиболее показательными примерами таких программ являются моделирующие программы управления запасами. Существует несколько специальных стандартных программ, проверяющих стратегию управления запасами с точки зрения их эффективности. Чтобы использовать такого рода программы, необходимо задать конкретные предписания (которые формулируются, например, следующим образом: «при снижении уровня запасов до 4 единиц заказать 10 дополнительных единиц») или располагать формулой для определения этих предписаний при известном уровне спроса. При этом в качестве входной информации необходимо представить также либо ретроспективные данные относительно спроса, либо распределение вероятностей для уровней спроса. При наличии всей указанной выше информации машинная программа обеспечивает имитирование функциональной системы для любого заданного операционистом числа интервалов времени, а также вычисляет такие статистические характеристики системы, как средний уровень запасов, количество оформляемых заказов и т. д. Однако гораздо чаще модель требует специального программного обеспечения. Если модель относится к числу лишь умеренно сложных, применяется нечасто и программируется специалистами, не имеющими большого опыта работы с имитационными моделями, то, по-видимому, наиболее легкий способ решения задачи — использовать такие языки, как Фортран, PL/I или Алгол. Эти языки хорошо известны всем программистам, занимающимся программированием, связанным с решением научных проблем; при этом программисту для выполнения трансляции на машинный язык требуется знать лишь подробное описание исследуемой модели. Однако языки типа Фортран, PL/I и Алгол обладают существенным недостатком. Программист, использующий один из таких языков, вынужден заново составлять подпрограммы для ряда вычислительных процедур, которые используются почти во всех имитационных процессах. Другими словами, программисту, как говорится, вновь приходится изобретать велосипед. Так, например, во многих случаях имитационная модель предполагает генерирование случайных переменных, и, следовательно, для каждой такой переменной требуется своя подпрограмма. Кроме того, поскольку представляется желательным накапливать статистические данные по ряду характеристик операционной системы, необходимо составить подпрограммы, реализующие соответствующие вычислительные процедуры. Наконец, значительные трудозатраты возникают в связи с разработкой компактного способа представления выходных имитационных данных.
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
385
Даже в случае не очень сложных моделей требуется тщательная проработка вопросов размещения информации внутри машинной памяти, составления основной программы, обеспечивающей правильное следование событий и продвижение имитационного процесса по оси времени. Чтобы облегчить задачу программного обеспечения имитационного моделирования, разработан ряд специализированных машинных языков. При использовании специализированных программ требуется лишь задать функции распределения вероятностей, после чего генерация случайных событий по заданному закону распределения осуществляется автоматически. Некоторые из программ обеспечивают сбор статистических данных по тем или иным исследуемым характеристикам операционной системы и выдачу результатов имитирования в определенной, заранее установленной форме. С помощью тех же программ осуществляется упорядочение событий и регистрация во времени каждого перехода системы из одного состояния в другое. Почему же программы, обладающие такими преимуществами, не используются во всех случаях имитационного моделирования? Имеется несколько весьма веских причин, не позволяющих пока ориентироваться только на специализированные программы. Одна из причин заключается в том, что языки специализированных программ в некоторой степени отличаются от языков типа Фортран, PL/I или Алгол, и, следовательно, программист сталкивается с необходимостью освоения новых элементов языка и самого метода программирования. Одним из наиболее эффективных моделирующих языков является Симскрипт. Чтобы овладеть этим языком, необходимо знать Фортран. Симскрипт, обладая значительной гибкостью, весьма сложен в обращении. К числу языков примитивного типа относится универсальный язык моделирования GPSS. Это совершенно автономный (замкнутый) язык, легко поддающийся изучению, но, естественно, обладающий ограниченными возможностями. Язык моделирования иногда не используется и по другой причине: он может отсутствовать в арсенале математического обеспечения выбранной ЭВМ. В настоящее время этот фактор редко бывает решающим, поскольку программами, написанными на моделирующих языках Симскрипт и GPSS, обеспечены многие из современных ЭВМ; кроме того, программы упомянутого типа можно получить в ряде специализированных центров по обслуживанию ЭВМ. С третьей причиной отказа от моделирующих языков мы сталкиваемся тогда, когда имитационная модель бывает очень сложной и ориентируется на частое многократное использование. Имитационное моделирование с применением моделирующих языков сопряжено в таких случаях с существенными затратами. Это обусловлено тем, что выполнение имитационной программы, составленной на языке моделирования, потребует много времени и будет поглощать большой объем машинной памяти. В результате постановка серии эксперимен-
386
ГЛАВА 21
тов может оказаться экономически невыгодной; возможна и такая ситуация, когда модель в буквальном смысле слова не поместится в памяти ЭВМ. Однако вполне реально, что по мере дальнейшего технического совершенствования моделирующих языков, а также по мере накопления опыта в области практического применения методов имитационного моделирования на ЭВМ языки моделирования найдут широкое применение и при решении задач организационного управления. 21.9. ЗАДАЧИ БЛИЖАЙШЕГО БУДУЩЕГО
До сих пор рассматривались лишь такие имитационные модели, которые в определенной степени аппроксимируют реальные ситуации. Их назначение — имитирование условий функционирования операционных систем с целью определения последствий принятия тех или иных управляющих решений. К данному классу моделей тесно примыкают имитационные модели, с помощью которых пытаются решать задачи поиска цели и целенаправленного поведения. В этих моделях обнаруживаются элементы так называемого искусственного интеллекта. К числу широко известных примеров машинных программ, в которых заложены элементы искусственного интеллекта, относятся программы игры в шахматы и шашки. Имели место случаи, когда такого рода программы находили применение и в связи с решением задач организационного управления. Среди этих приложений можно выделить самостоятельную группу, в которой основным объектом исследования являются бихевиориальные качества руководителя. Мерой эффективности модели бихевиориальной ориентации является ее способность генерировать решения, согласующиеся с управляющими решениями, которые вырабатывает личность, чье поведение модель имитирует. Другая группа моделей нацелена на решение сложных комбинаторных задач, аналогичных задачам, рассмотренным в гл. 13. Методы, в которых используются модели данного класса, иногда называют эвристическими. В частности, ряд моделей эвристического характера был разработан в связи с решением комплексных задач календарного планирования. Приведенный ниже пример поможет читателю уловить основную идею метода эвристического программирования. Пусть с помощью имитационной модели пытаются построить такой график размещения заказов на предприятии с мелкосерийным производством, при котором имеющееся оборудование используется с максимальной эффективностью. Машинное имитирование начинается с пробного размещения нескольких заказов. Затем определяется следующий заказ, подлежащий включению в разрабатываемый график, и рассматриваются различные ограничения, определяются даты исполнения и подбирается оборудование требуемой производительности. В результате такого анализа ЭВМ может пересмотреть график
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
387
размещения некоторых предыдущих заказов. Короче говоря, в машинной модели заложена стратегия «продвижения вперед с учетом ретроспективных данных». Такая модель является самообучающейся. Она опирается на метод «проб и ошибок» и после серии последовательных тестов приводит к одному из допустимых графиков размещения заказов. Если формирующие стратегию предписания разработаны достаточно тщательно, этот график, как правило, оказывается вполне удовлетворительным. Нередко получаемый график является почти оптимальным; при этом степень оптимальности оценивается с учетом конкретного критерия эффективности, который по построению содержит элементы эвристики, заложенные в самой стратегии. Методы имитационного моделирования на ЭВМ находят также применение в операционных играх. Широкое распространение получили так называемые деловые игры, в которых принимают участие несколько команд игроков; при этом каждая команда представляет «свою фирму». Участвующая в игре команда принимает решения относительно цен, объемов производства, организации рекламы и т. д. ЭВМ выполняет двойную задачу: она ведет учет всех шагов участвующих в игре сторон и одновременно оценивает экономические последствия принятия тех или иных управляющих решений играющих фирм. В последнее время деловые игры нашли широкое применение в области подготовки кадров административных работников. Они используются также при анализе динамических характеристик больших систем, функционирующих в условиях конкуренции с другими функциональными системами, каждая из которых придерживается своей «стратегии поведения». КОНТРОЛЬНЫЕ
УПРАЖНЕНИЯ
1. Сформулируйте две-три задачи организационного управления, которые, с вашей точки зрения, не могут быть решены обычными методами математического программирования, рассмотренными в предыдущих главах. Выделите в этих задачах ситуации, в которых предполагается оптимизация некоторой целевой функции при наличии ограничений или в условиях неопределенности. Объясните, почему решение указанных вами задач сопряжено с большими трудностями. 2. Рассмотрите пример имитационного моделирования, приведенный в разд. 21.3 (задача мистера N). Повторите описанный в этом разделе имитационный эксперимент в рамках 20-дневного интервала при тех же начальных условиях (см. таблицу на рис. 21.3). Результаты вычислений представьте в виде таблицы, аналогичной таблицам на рис. 21.3 и 21.4. Определите сумму денег, которая окажется у N в наличии в конце имитируемого периода (т. е. по истечении 20-дневного срока). Если в 20-й день мистер N будет располагать пакетом
388
ГЛАВА 21
акций, оцените его суммарный капитал, предположив, что в конце 20-го дня акции будут проданы. (Указание: если задача решается на групповом практическом занятии по исследованию операций, то запишите результаты, полученные другими его участниками, и вычислите среднее значение и среднеквадратичное отклонение от среднего значения для суммы наличных денег, которой N будет располагать в конце 5, 10, 15 и 20-го дней.) 3. Рассмотрим пример имитационного моделирования, приведенный в разд. 21.3 (задача мистера N). Испытайте следующую стратегию: 1) если N обладает пакетом акций, то он реализует его, как только будет зарегистрировано падение цен на акции в течение 2 дней подряд; 2) если N не обладает пакетом акций, то он покупает акции, как только будет зарегистрирован рост цен на акции в течение 2 дней подряд. а) Воспользуйтесь данными, приведенными в таблице на рис. 21.3, и постройте с их помощью таблицу, аналогичную таблице на рисунке 21.4. Определите сумму денег, которой N будет располагать в конце 20-го дня; если в 20-й день N располагает пакетом акций, оцените его суммарный наличный капитал, предположив, что в конце 20-го дня он реализует все имеющиеся у него акции. б) Продлите период имитирования еще на 20 дней. Вычислите суммарный наличный капитал мистера N в конце 40-го дня. (Указание: если данная задача решается на групповом практическом занятии по исследованию операций, соберите результаты, полученные другими его участниками, и вычислите среднее значение и среднеквадратичное отклонение от среднего значения для суммарного наличного капитала N в 30-й и 40-й дни.) 4. Предложите один-два способа генерирования униформных случайных чисел. Подумайте, можно ли предложенные вами способы модифицировать таким образом, чтобы они позволили генерировать дискретные величины с другими распределениями вероятностей. 5. Обратитесь к рассмотренному в разд. 21.5 методу мультипликативных конгруэнции, который позволяет генерировать случайные числа. В каждом из приведенных ниже пунктов воспользуйтесь методом взятия по модулю 10 и определите длину периода (цикла), положив а) а = 2, г„ = 1, 3 и 5. б) а = 3, г0 = 1, 2 и 5. 6. В каждом из приведенных ниже пунктов воспользуйтесь методом обратного преобразования (разд. 21.5) и выведите формулы [аналогичные формулам (9) — (13)], с помощью которых можно было бы определить значение хп при заданном ип: а)
'\ '
Г(Ь— а)"1 при Г( I о в остальных случаях,
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
389
где а и Ъ — вещественные числа, причем а < Ъ. б)
[t I—t [О
в)
для 0 < £ < 1 , для l-
С
'О для 0,5я для 0<я<0,4 Р(х)=\ х—0,2 для 0,4<ж<0,8 | 2х— 1 для 0,8
ДЛЯ X > 1
г) Имеет место биномиальное распределение [см. формулу (12)] при k = 2 и р = 0,1. д) Имеет место биномиальное распределение [см. формулу (12)] при k = 3 и р = 0,5. 7. Какие изменения было бы необходимо внести в формулировку метода обратного преобразования (разд. 21.5), если бы мы захотели воспользоваться им в случае, когда функция F (х) является непрерывной и неубывающей (т. е. не обязательно строго возрастающей)? 8. В каждом из приведенных ниже пунктов требуется объяснить, каким образом может быть применен матричный метод, изложенный в разд. 21.5: а) Пусть имеет место биномиальное распределение [см. формулу (12)], где k = 2, р = 0,1. б) Пусть имеет место биномиальное распределение [см. формулу (12)] при k = 3, р = 0,5. в) Пусть имеет место следующее распределение вероятностей: р (0) = 0,3; р (2) = 0,25; р (5) = 0,15; р (60) = 0,3. 9. а) Объясните, как с помощью метода сверток (разд. 21.5) можно генерировать треугольное распределение, приведенное в п. б) упражнения 6. б) Рассмотрите метод эквивалентных преобразований (разд. 21.5) и объясните, почему этот метод пригоден для генерирования переменных, обладающих пуассоновским распределением. 10. Рассмотрите приведенную в разд. 21.5 формулу (21), с помощью которой генерируются случайные переменные, характеризующиеся нормальным распределением. Объясните, почему выражение (21), содержащее сумму 12 униформных случайных десятичных чисел, генерирует случайную переменную с нулевым средним значением и единичной дисперсией. 11. а) Предложите несколько способов генерирования геометрического распределения вероятностей, т. е. распределения вида Р (/) = Р (1 — Р) 3 ' 7 = 0> 1' 2, . . ., где 0 < р <. I . (Пояснение: через р обозначена вероятность выпадания герба при бросании
390
ГЛАВА 21
монеты, возможно, не обладающей полной симметрией; р (/) следует интерпретировать как вероятность того, что герб выпадет впервые при /-м бросании монеты.) б) Предложите несколько способов генерирования отрицательно биномиального распределения вероятностей, т. е. распределения р (/) = Cfc+j-ip* (1 - p)j, j = 0, 1,2, . . ., где 0 < р < 1. (Пояснение: через р обозначена вероятность выпадения герба при бросании монеты, возможно, не обладающей полной симметрией; при этом под р (]) следует подразумевать вероятность того, что &-е выпадение герба произойдет при (k + /)-м бросании монеты.) 12. Рассмотрим приведенную в разд. 21.6 имитационную модель управления запасами. Пусть Q — 2, s = I, Z/ = 2. Предположим, что уровни спроса характеризуются следующим распределением вероятностей: р (1) = р (3) =0,5. Проимитируйте данную систему управления запасами на 20-дневном интервале времени, приняв относительно блока 1 следующие допущения: Объем наличных запасов = 2; Объем заказа, находящегося в процессе исполнения = 0; Срок исполнения = 0; t = 1. (Указание: для генерации объема спроса на каждый день рассматриваемого периода воспользуйтесь методом бросания монеты.) 13. Рассмотрим имитационную модель управления запасами, приведенную в разд. 21.6. а) Покажите, какой вид приняла бы блок-схема, приведенная на рис. 21.8, если бы продолжительность исполнения заказа L являлась случайной величиной. б) Покажите, как усложнилась бы модель, если бы выполнялось условие Q ^ s; если бы избыток спроса (по отношению к уровню запасов) прибавлялся к спросу в последующий интервал имитируемого периода. в) Предположите, что вероятностный механизм формирования спроса можно описать, зная распределение вероятностей для продолжительности интервала времени между двумя последовательными прибытиями клиентов и распределение вероятностей для объема спроса, ассоциированного с каждым клиентом. Постройте для имитационного процесса, моделирующего такую операционную систему, блок-схему, в которой приращения времени индуцировались бы прогнозируемыми исходами. 14. Для задачи, рассмотренной в разд. 21.3 (задача мистера N), постройте блок-схему с постоянными приращениями по оси времени. 15. Объясните, каким образом для задачи, рассмотренной в разделе 21.3 (задача мистера N)> может быть построена имитационная модель, в которой приращения по оси времени индуцируются прогнозируемыми исходами. Попытайтесь построить соответствующую блок-схему. 16. Рассмотрим модель массового обслуживания, приведенную в разд. 21.6. Предположим, что продолжительность интервала времени между последовательными поступлениями клиентов на обслужи-
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ЭВМ
391
ванне с одинаковой вероятностью (V 2 ) может равняться либо 2, либо 3. Пусть время обслуживания клиента клерком А с одинаковой вероятностью оказывается равным либо 1, либо 2, а время обслуживания клиента клерком В с одинаковой вероятностью оказывается равным либо 1, либо 4. Допустим, что в момент времени t = 0 прибывает первый клиент, причем в этот момент ни один из клерков не занят обслуживанием. Проимитируйте функционирование данной операционной системы на отрезке времени, равном 1 ч. (Указание: случайные события рекомендуем генерировать путем бросания монеты. Если задача решается на групповом практическом занятии по исследованию операций, то соберите полученные другими его участниками следующие статистические данные: 1) число клиентов, стоящих в очереди в ожидании обслуживания в моменты времени t = 30, 45 и 60 мин после начала процесса, 2) число клиентов, обслуженных в течение 1 ч; 3) среднее время пребывания клиента на пункте обслуживания (т. е. суммарное время ожидания и собственно обслуживания). Вычислите для перечисленных операционных характеристик соответствующие средние значения и среднеквадратичные отклонения от этих значений.) 17. Рассмотрим имитационную модель, приведенную в разд. 1.6 (задача фирмы «Беспосадочный полет»). Для каждого из указанных ниже условий требуется нарисовать блок-схему, показывающую, каким образом можно имитировать функционирование системы с двумя авиалиниями. Требуется также определить, какие статистические данные следует при этом накапливать (оформляя их, например, в виде таблицы). Выполните это упражнение, воспользовавшись а) методом пошагового приращения времени; б) методом приращений времени, индуцируемых прогнозируемыми исходами. 18. Объясните, как вы понимаете следующие термины: имитирование с помощью ЭВМ; подпрограмма, формирующая имитирование «вручную»; список событий; сжатие времени; сериальная корреляция (автокорправило принятия управляющего реляция); решения; интегральное по времени среднее; состояние имитируемой системы; среднее по ансамблю; экзогенные события (исходы); ковариационно-стационарный; каузальная структура; униформные (однородные) слуметод эквивалентных преобразочайные числа; ваний; генератор псевдослучайных равномерное приращение времечисел: ни; метод мультипликативных конприращения времени, индуцируегруэнций; мые прогнозируемыми исхода- модульное исчисление; ми; конгруэнтный по модулю т; основная программа; метод обратного преобразовасписок событий (исходов); ния;
392
ГЛАВА 21
табличный (матричный) метод; метод сверток; спектральный анализ; метод Монте-Карло; метод стохастического контроля (метод конкомитантной информации);
метод отрицательных корреляций; искусственный интеллект; эвристическое программирование; операционные (деловые) игры.
УПРАЖНЕНИЯ НА ПОСТРОЕНИЕ МОДЕЛЕЙ
19. Для каждой из указанных в пп. а) — и) задач предложите способ построения имитационной модели. Выделите фигурирующие в этих задачах элементы стохастического характера и объясните, каким образом вы попытались бы определить распределения вероятностей, которые используются в имитационных экспериментах в качестве исходных данных. Укажите операционные характеристики, подлежащие измерению. Перечислите числовые стохастические показатели, накапливаемые в ходе эксперимента, и определите степень их важности для решения соответствующей задачи организационного управления. Попытайтесь в каждом случае построить блоксхему, с помощью которой можно было бы в миниатюре описать исследуемую операционную систему. Рассмотрите следующие задачи организационного управления: а) Определение числа контрольно-расчетных прилавков на выходе большого продовольственного магазина (каким образом можно оценить эффективность контрольно-расчетных прилавков в случае, когда покупатель может приобрести в данном магазине пять или более видов товаров?). б) Определение числа и способов размещения бензоколонок на автозаправочных станциях. в) Определение числа и геометрических характеристик взлетнопосадочных полос в аэропорту. г) Определение численности операторов на центральной телефонной станции. д) Оптимизация размещения и режима функционирования светофоров в заданном секторе города. е) Определение числа и конфигурации причалов в морском порту. ж) Определение числа и способов размещения классных комнат, лабораторий и вспомогательных помещений в школьном здании. з) Размещение оборудования в предприятии с мелкосерийным производством. и) Проектирование университетского вычислительного центра.
ГЛАВА 22
Внедрение результатов операционного исследования 22.1. ТЕКУЩЕЕ ПОЛОЖЕНИЕ
За последние годы в развитии теоретических основ исследования операций произошли значительные сдвиги. Еще более ощутимые успехи были достигнуты в плане практического использования результатов операционных исследований как в производственнокоммерческой, так и в административно-государственной сферах деятельности. В начале 60-х годов от специалиста в области исследования операций требовалось не только безупречное знание предмета, но и умение «показать товар лицом». Этически выдержанная и одновременно убедительная агитация в пользу исследования операций была в то время необходимой, так как далеко не все были тогда достаточно убеждены, что с помощью исследования операций можно добиться положительного экономического эффекта. Многие административные работники относили операционные исследования к категории чисто абстрактных. Недаром операционные подразделения ряда крупных фирм организационно входили в состав так называемых «отделов перспективных исследований». В последнее время ситуация кореннвш образом изменилась. Теперь лишь в редких случаях операционисту приходится отстаивать свое право на существование. В наши дни руководители фирм буквально гордятся тем, что для анализа сложных задач организационного управления они располагают специально разработанными для этой цели математическими моделями, рассчитанными на применение электронной вычислительной техники. (Многие руководители фирм охраняют используемые ими модели как составную часть их «секретного арсенала»). Короче говоря, среди административных работников крупных фирм в настоящее время весьма редко встречаются люди, которые сомневаются в экономической эффективности операционных исследований, т. е. теперь почти ни у кого не возникает сомнений относительно целесообразности использования методов исследования операций при решении сложных организационноуправленческих проблем. Перед современными руководителями возникают вопросы иного характера: В какой сфере деятельности применение методов исследования операций экономически наиболее выгодно? Правильно ли определен уровень финансирования операционных исследований? Каковы наиболее эффективные способы практического использования результатов исследования операций? Другими словами, -современный руководитель пытается понять, как извлечь из исследования операций максимальную прибыль.
394
ГЛАВА 22
В этой главе обсуждается практический аспект именно этой стороны вопроса и приводятся некоторые соображения относительно самой процедуры внедрения результатов операционного • исследования. Названия их разделов начинаются с «как». Это, однако, не означает, что мы предлагаем здесь безупречные рецепты, гарантирующие фирме прибыль всякий раз, когда она внедряет очередной операционный проект. Цель, которую мы преследуем в данной главе, сводится лишь к тому, чтобы показать, какие меры необходимо принять, чтобы сделать такой инструмент, как исследование операций, более эффективным. При этом мы апеллируем главным образом не к специалистам в области прикладной математики, а к потенциальным операционистам-практикам. Читателю вскоре станет ясно, что для успешного применения методов исследования операций прежде всего необходимо объединение усилий обладающих здравым смыслом административных работников и операционистов-профессионалов. Представители администрации и операционисты должны, в частности, сообща вырабатывать решения относительно содержания операционного проекта, целей операционного исследования, объема соответствующих трудозатрат и плана-графика научно-исследовательских и экспериментальных работ. Именно этим вопросам и посвящена данная глава. У читателя может возникнуть вопрос: почему в последнее время внедрять результаты операционных исследований стало значительно проще? Если принять во внимание тот факт, что большая часть наиболее эффективных математических методов из числа используемых в операционных исследованиях была известна более 15 лет назад, ответ на этот вопрос может оказаться далеко не очевидным. Причины наблюдающегося прогресса в области практического использования методов исследования операций частично были изложены в гл. 1 (разд. 1.7). Однако приведенное в упомянутом разделе объяснение ни в коем случае нельзя считать исчерпывающим. В равной степени важным является и то, что в последнее время электронное вычислительное оборудование стало значительно более доступным для широкого круга пользователей, а армия программистов для ЭВМ стала гораздо более многочисленной. Повышение качества математического обеспечения ЭВМ, без которого решение «крупномасштабных» задач оптимизации и имитационного моделирования было бы весьма затруднительным, а также разработка вычислительных комплексов, функционирующих в режиме разделения времени, облегчили задачу проектирования операционных систем и в значительной степени устранили трудности, связанные с нахождением численных решений для исследуемых оптимизационных моделей. Следует указать и еще на один фактор, способствующий повышению эффективности внедрения операционных проектов в практику различного рода организаций, а именно значительное увеличение численности квалифицированных специалистов в области исследования операций.
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
395
22.2. КАК ПОСТАВИТЬ ИССЛЕДОВАНИЕ ОПЕРАЦИЙ НА СЛУЖБУ РУКОВОДИТЕЛЮ
Руководитель, которому уже приходилось использовать в своей деятельности методы исследования операций, в отличие от руководителя, сталкивающегося с исследованием операций впервые, как правило, более глубоко осознает свою ответственность за разработку операционного проекта. По вполне понятным причинам неопытные руководители к попыткам привлечь их к операционным исследованиям обычно относятся очень сдержанно. Такое положение вещей является совершенно ненормальным и может дорого обойтись фирме даже в том случае, если операционный проект оказывается в конце концов внедренным. По существу руководители подразделений обязаны нести ответственность как за правильность выбора подлежащих анализу задач, так и за «адекватность» контроля на стадии внедрения операционного проекта. Опыт показывает, что уклонение руководителя от упомянутых выше обязанностей наносит фирме существенный ущерб и может быть даже причиной «провала» операционного проекта, несмотря на опыт коллектива операционистов и его искренние усилия добиться успеха. В этом разделе будут изложены некоторые рекомендации для руководителя организации, придерживаясь которых он сможет направлять ход операционных исследований таким образом, чтобы они принесли пользу всей организации в целом. На достижение каких результатов может рассчитывать руководитель? С помощью исследования операций удается осуществлять глобальный анализ многих сложных задач организационного управления. Те, кому придется использовать методы исследования операций на практике, не преминут убедиться в том, что эти методы в силу их внутренней структуры требуют системного подхода к изучению возникающих проблем и внимательного отношения к различного рода нюансам. (В части требовательности к дисциплине анализа ни один другой подход к решению сложных управленческих задач даже не претендовал на близкое «соседство» с исследованием операций.) Совместное использование современных математических методов и колоссальной производительности ЭВМ позволяет проводить тщательное исследование всех возможных вариантов решений. Квалифицированно выполненный операционный анализ не оставляет у руководителя ни малейших сомнений в том, что исследованы все разумные варианты действий, делая кристально ясными их относительные преимущества и возможные последствия их применения. Центральным компонентом полноценного операционного исследования является всесторонний анализ на чувствительность. Тщательное исследование альтернативных вариантов решений есть основное средство, позволяющее руководителю убедиться в правильности понимания структуры математической модели, принятых допущений и используемых в модели данных. Более того, те выгоды,
396
ГЛАВА 22
которые удается извлечь благодаря применению математической модели, ориентированной на решение задачи планирования, в значительной степени определяются результатами именно такого рода анализа. Руководитель почти никогда не стремится получить ответ в виде простого набора «цифр». Принимающим управляющие решения чаще всего хочется оценить количественно степень риска, связанную с тем или иным вариантом действий, и определить, каким образом следует видоизменить решение с тем, чтобы повысить уровень прибыли, а также выявить перспективы дальнейших исследований (связанных, например, с созданием новых видов продукции, проникновением на новые рынки сбыта, определением мест дислокации новых промышленных предприятий и т. д.). Анализ на чувствительность нередко показывает, что неопределенность, ассоциированная с тем элементом модели, который вначале считался ключевым, на самом деле не оказывает существенного влияния на выбор управляющего решения, в то время как другой фактор, которому ранее не придавали большого значения, является действительно решающим. Чтобы определить, удовлетворяет ли операционный проект оптимальным требованиям, его следует оценить с различных точек зрения. В частности, необходимо убедиться, что исходные данные и принятые допущения легко представить в форме, которая понятна лицам, не являющимся специалистами в области математического моделирования. Кроме того, требуется уточнить, насколько просто можно изложить окончательный результат исследования и сопутствующие ему детали в виде обычного административного отчета. Наконец, следует определить разумные пределы, в которых целесообразно оставаться при проведении повторного анализа, предполагающего варьирование исходных данных или принимаемых предположений. Такого рода проверку руководителю лучше всего осуществлять, задавая операционисту вопросы и оценивая содержание получаемых ответов. Полностью разработанная модель должна обеспечить ответы на все «почему» и «что, если», возникающие у руководителя; при этом выдача ответов не должна быть сопряжена с дополнительными трудоемкими вычислительными процедурами. (Поспешим, однако, заметить, что требовать быстрых ответов на вопросы руководителя на начальной стадии исследования было бы несправедливо. Руководители различных отделов фирмы должны задавать вопросы в ходе всех стадий разработки и реализации операционного проекта, пытаясь каждый раз проанализировать, насколько стереотипными и соразмерными с имеющимся аналитическим обеспечением оказываются процедуры, связанные с выдачей соответствующих решений.) Другой показатель степени качественности операционного проекта определяется тем, насколько результаты проводимого анализа позволяют сформировать полноценную стратегию поведения (в отличие от:единичного решения). Так, например, исследование, ориентированное на разработку долгосрочного плана расширения производственных мощностей, не должно сводиться лишь к частным решениям
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
397
относительно закупок оборудования и прогнозированию объемов производства в пределах рассматриваемого периода; в результате такого исследования должны быть получены рекомендации относительно решений, принимаемых немедленно, представлены соображения по поводу того, когда следует принимать очередные решения (при наличии исходных данных), а также определены обстоятельства, при которых будущие решения подлежат уточнению, а возможно, и полному пересмотру. Более того, даже рекомендации относительно первоначального управляющего решения должны выдаваться с таким расчетом, что, если изменятся исходные параметры системы или будут сняты некоторые из ограничений, то могут оказаться более приемлемыми другие варианты действий. С какими ограничивающими факторами должен считаться руководитель? На этот вопрос мы частично ответили в разд. 1.3. Здесь рассмотрим ряд дополнительных соображений. Во-первых, при использовании математической модели, ориентированной на сокращение затрат, экономия в процентном выражении может оказаться относительно небольшой. Однако' если эти «проценты» подсчитать для случая больших исходных затрат, то можно убедиться, что получаемая экономия в абсолютном выражении во много раз превышает затраты на проведение операционного исследования. Что касается моделей планирования, то иногда они позволяют обнаружить ошибки в процедурах оперативного управления; в таких случаях экономический эффект оказывается весьм? существенным. Чаще же всего увеличение прибыли происходит за счет того, что административные органы начинают глубже понимать спектр возникающих перед организацией проблем и, следовательно, приобретают более обостренное чутье, помогающее принимать правильные решения и осуществлять эффективное управление в условиях неопределенности и коммерческой конкуренции. Представляется невозможным определить в денежном выражении ту дополнительную прибыль, которая может быть получена за счет операционного исследования; тем не менее эта прибыль вполне реальна, и у руководства фирмы это не вызывает никаких сомнений. В преобладающем числе случаев успешного практического использования операционных методов положительный экономический эффект достигается именно за счет изменений в процедурах выработки решений на различных уровнях управления фирмой. Во-вторых, несмотря на то что операционная модель рассчитана на использование математических методов оптимизации, получаемое в итоге решение не следует рассматривать как полностью гарантирующее оптимум в реальных условиях. Как уже неоднократно нами подчеркивалось, модель по своей сути есть лишь приближение к действительности, и, следовательно, оптимальное решение для приближенного представления реальных процессов «вовсе не должно быть окончательным» решением практической задачи организационного управления. Важно, однако, не то, чтобы предлагаемое решение
ГЛАВА 22
было оптимальным, а то, чтобы это решение позволяло произвести более обоснованный выбор среди различных вариантов действий. В-третьих, помогая решать задачи одного класса, исследование операций и, в частности, сам процесс моделирования могут породить ряд других проблем. Так, например, из анализа может вытекать необходимость в более совершенной системе сбора и обработки информации или, скажем, в изменении стратегии поведения. Кроме того, процесс непрерывного обновления используемой модели сам по себе ставит перед руководством фирмы целый ряд новых проблем. При каких обстоятельствах руководителю следует приступать к разработке операционного проекта? Важно видеть разницу между одноразовой или редко встречающейся задачей организационного управления и постоянно повторяющимися процедурами управленческого анализа (например, связанного с разработкой годового плана, составлением плана-графика по трудозатратам и использованию оборудования, пополнением запасов и т. п.). При анализе специфической задачи организационного управления решение относительно целесообразности проведения операционного исследования зависит от важности рассматриваемой задачи с экономической и стратегической точек зрения, от наличия резерва времени, необходимого для решения задачи, а также от степени адекватности и фактического наличия необходимой исходной информации. Трудно и рискованно проводить операционное исследование' в условиях нехватки времени. Поэтому руководителю следует обращаться к исследованию операций лишь в том случае, когда ставка представляется значительной, а сроком, к которому необходимо завершить проект, не является вчерашний день. При этом еще до начала исследования нужно располагать определенной информацией, необходимой для операционного анализа. Наконец, важно, чтобы при выборе решения руководство фирмы исходило не из какихлибо политических мотивов или соображений, диктуемых личными отношениями, а стремилось главным образом к получению чисто экономического эффекта. (В противном случае экономический анализ играл бы лишь второстепенную роль.) При рассмотрении задач планирования вопрос об использовании операционных методов также решается в зависимости от важности экономического и стратегического аспектов и наличия необходимой для проведения анализа информации. Вместе с тем операционные исследования, ориентированные на оптимизацию планирования, отличаются от исследований сугубо специфических проблем главным образом тем. что модели планирования подлежат совершенствованию и апробированию на временных интервалах значительно большей протяженности. Как будет отмечено ниже, в процессе выполнения операционного проекта важную роль играет постоянный контроль за ходом исследования; однако большой трагедии не произойдет, если срок окончания работ, связанных с построением модели плани-
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
399
рования, будет отодвинут на 1—2 недели. (Именно так это обычно и бывает!) Решение относительно разработки аналитической модели для оптимизации процедур текущего управления требует более убедительной аргументации. Многие фирмы располагают удачно построенными моделями такого типа, предназначенными для управления запасами, составления оптимальных графиков передвижения и фрахтования грузовых судов и календарного планирования мелкосерийного производства. Процент дополнительных доходов, получаемых за счет операционных исследований, в таких случаях часто оказывается трудно определимым; усилия, связанные с разработкой операционного проекта, варьируются в весьма широких пределах, а процесс внедрения проекта протекает болезненно. Поэтому эффект, получаемый за счет такого рода операционных исследований, как правило, оценивается той дополнительной прибылью, которая может быть получена на относительно большом интервале времени. Иногда руководство фирмы ошибается в оценке степени пригодности исходной информации для проведения операционного исследования. Практика применения статистических методов при проектировании поисковых экспериментов в сфере производства, осуществлении контроля за непрерывным производственным процессом и за состоянием оборудования, а также в ходе проверки отчетности в случае, когда последняя сопряжена с громоздкими вычислениями, показывает, что математические методы могут быть весьма эффективными при анализе выборочных данных, определенных с точностью до среднеквадратичного отклонения и ошибок измерения.(Отсутствие точности или ограниченный объем данных сами по себе не аннулируют возможность применения математических методов. Даже при полном отсутствии ретроспективных данных руководящие должностные лица могут предоставить операционистам сведения, приобретенные опытным путем и изложенные в статистических терминах. Таким образом, было бы неправильным отказываться от использования операционных методов только потому, что фактические данные оказываются несколько несовершенными. Исследование операций иногда пугает руководящих работников по той причине, что они считают своих сотрудников недостаточно квалифицированными в области прикладной математики. Для этих опасений, возможно, и имеются определенные основания, однако они могут быть порождены также неполным или даже ошибочным представлением о том уровне квалификации, который действительно необходим для проведения операционного исследования. Более того, во многих случаях руководящие работники высокого ранга просто недооценивают способности своих специалистов освоить методику проведения исследования операций. Нередко операционные исследования успешно применялись такими категориями специалистов, как бухгалтеры, инженеры, экономисты и бизнесмены, которые получили образование много
400
ГЛАВА 22
лет назад. Их осведомленность в делах фирмы, полученная за счет личного опыта, с избытком компенсирует то, что на начальной стадии проекта они еще недостаточно знакомы с методами исследования операций. Кроме того, широкое распространение стандартных программ для ЭВМ позволило устранить значительную долю трудностей при переходе от этапа построения модели и подготовки исходных фактических данных к этапу получения численного решения и анализа модели на чувствительность. Наконец, несмотря на то что используемый при исследовании операций математический аппарат может оказаться далеко не простым, само решение удается легко интерпретировать и внедрить в практическую деятельность организации. (Показательными в этом отношении являются примеры разработок операционных' систем управления запасами. Вычислительные процедуры, связанные с определением сроков оформления дополнительных заказов на поставку и объемов пополнения запасов, могут в ряде случаев оказаться весьма громоздкими; тем не менее получаемая в результате стратегия допускает простую формулировку и, следовательно, легко поддается усвоению.) Как руководителю удается получить то, за что он платит? Пожалуй, наибольшая ответственность, ложащаяся на руководителя в процессе контроля за ходом исследования операций, связана с определением правильного соотношения между «чисто поисковыми» и «опытно-конструкторскими» компонентами проекта. Проблема оценки степени выгодности операционного исследования для фирмы всегда является центральной. Так, например, многим фирмам путем внедрения научных методов управления удается снизить затраты, связанные с хранением запасов, не менее чем на 25%. Однако сокращение аналогичных затрат в условиях функционирования той или иной конкретной фирмы может быть оценено лишь после того, как начнется разработка операционного проекта и будет проведен ряд пробных испытаний. Аналогично при использовании моделей линейного программирования для составления текущих графиков многим нефтеочистительным заводам средней мощности удается снизить производственные затраты на 1000 долл. в день; однако оценку экономического эффекта в каждом конкретном случае можно произвести лишь после построения предварительной модели и ее экспериментальной обкатки. Таким образом, администрация фирмы должна рассматривать начальные этапы операционного исследования как чисто поисковые. Было бы все же ошибочным рассматривать сугубо исследовательским весь проект в целом. Фирмы, достигшие наилучших результатов в области использования методов исследования операций, планируют вначале каждый операционный проект как проект совершенствования текущих процедур. Руководители подразделений, имеющие отношение к операционному исследованию, как правило, настаивают на том, чтобы операционный проект был завершен как можно скорее, и бдительно следят за тем, чтобы исследование приносило практи-
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
401
ческуго пользу и имело непосредственное отношение к поставленной задаче организационного управления. Общепринятая схема управления предусматривает формулировку целей, распределение ответственности между функциональными единицами, разработку и корректировку календарного плана выполнения различных видов работ и составление административных отчетов. Исследование операций, как правило, наталкивается на ряд трудностей и происходит с неминуемыми задержками. Таким образом, следует быть готовым к любым неожиданностям. Неизбежность возникновения непредвиденных обстоятельств и является тем самым фактором, который обусловливает необходимость тщательного контроля за ходом операционного исследования. В большинстве случаев для проведения исследования операций требуется от 2 до 3 человеко-лет, а выполнение операционного проекта занимает от 3 до 9 месяцев. Совершенно естественно, что если проект является важным и сложным, то значения упомянутых показателей будут более высокими. Экономические выгоды, получаемые за счет хорошо продуманного и правильно организованного исследования, должны превысить затраты на разработку операционного проекта и использование его результатов. 22.3. КАК РУКОВОДИТЬ РАЗРАБОТКОЙ ОПЕРАЦИОННОГО ПРОЕКТА
В данном разделе приводится эскизное описание тех элементов, ИР которых складывается правильно организованное операционное исследование, проводимое для решения конкретных задач организационного управления. Нами затрагивается ряд факторов, которые уже упоминались выше. При этом все вопросы рассматриваются в контексте обсуждения методов руководства операционным проектом специфического характера. Участие руководителя в организации и разработке проекта операционной системы. Как высшие руководители, так и руководители оперативного плана должны осознать свою роль в разработке проекта операционной системы. Поскольку при проведении исследования операций, как правило, затрагиваются интересы различных подразделений фирмы, разработка проекта системы нуждается в искренней поддержке высшего руководства и требует определенного его вмешательства в деятельность отдельных подразделений. Более того, высшие руководители должны следить за тем, чтобы в проекте на первом месте фигурировали первостепенные интересы фирмы и чтобы в процессе исследования не сложилась такая ситуация, когда в большей мере преследуются интересы лишь отдельных функциональных групп и ущемляются интересы фирмы в целом. Представители оперативного (текущего) управления должны принимать активное участие в определении целей проекта, в его организации и разработке. Трудно и неразумно внедрять уже созданную
402
ГЛАВА 22
операционную систему в те подразделения, оперативное руководство которых не принимало непосредственного участия в проектировании системы. Любому руководителю, располагающему хотя бы относительно небольшим опытом административной деятельности, хорошо известно, что иногда даже самый мудрый план настолько хитро саботируется некоторыми из недоброжелательно настроенных сотрудников фирмы, что его составитель выглядит круглым дураком. Но речь идет не только о возникающих конфликтах между отдельными личностями. В тех случаях, когда звенья оперативного управления активно не участвуют в исследовании, возникает значительная вероятность того, что предлагаемые методы руководства не будут достаточно понятными администрации фирмы и достаточно гибкими для того, чтобы справиться с неизбежными критическими ситуациями. Таким образом, если низовые звенья управления не участвуют в разработке операционного проекта (и, следовательно, не убеждены в его полезности), то это чревато различного рода неприятностями и осложнениями, даже в тех случаях, когда высшее руководство фирмы оказывает операционистам самое решительное содействие. Планирование операционного проекта и осуществление контроля за его исполнением. Необходимость постоянного слежения за ходом разработки операционного проекта ранее серьезно недооценивалась. Успех же проектирования операционного проекта определяется, в частности, рядом факторов, которые перечисляются ниже. Разработчики проекта в самом начале должны определить, при решении каких вопросов потребуются экспертные заключения представителей управленческого аппарата. При этом необходимо разработать конкретные планы проведения соответствующих консультаций, для чего в свою очередь могут понадобиться некоторые предварительные исследования. Необходимо помнить, что управляющие решения принимает человек, а отнюдь не ЭВМ. Техническая часть проекта должна выполняться исключительно тщательно, так как в противном случае последствия могут оказаться плачевными. Вместе с тем следует иметь в виду, что математическая часть исследования, вероятнее всего требует лишь незначительной доли общих трудозатрат по разработке и внедрению операционного проекта. Требования к информационному обеспечению проекта должны быть составлены как можно быстрее, причем к сбору необходимых данных следует приступать сразу же, с тем чтобы избежать задержек в разработке проекта. Эта часть операционного исследования нередко выполняется на низком уровне даже в тех случаях, когда реализацией проекта системы руководят опытные специалисты. Как руководители фирмы, так и администраторы-исполнители должны быть подготовлены к любым временным трудностям, которые могут возникнуть в процессе апробирования и внедрения новой системы управления. Так, например, при внедрении научных мето-
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
403
дов управления запасами в первые месяцы суммарные затраты, г как правило, возрастают ). Если руководителей фирмы надлежащим образом не «предостеречь», то они. наблюдая это, вероятнее всего, придут в ужас. Разработчики операционного проекта должны тщательным образом документировать все, что касается структуры модели и принимаемых предположений, а также регистрировать входные данные и источники их поступления. При разработке больших проектов фигурирующие в модели допущения по истечении нескольких месяцев легко забываются. Кроме того, после анализа предварительных результатов и по мере поступления обновленных данных модель с неизбежностью видоизменяется. Таким образом, исключительно важно, чтобы каждый пересмотр разработчиками проекта тех или иных компонентов модели тщательно документировался. Оценка степени правдоподобия. Нет смысла говорить о степени правдоподобия операционной модели. Руководитель либо признает операционное представление рассматриваемой задачи полностью правильным, либо считает полученные результаты совершенно ошибочными. Ниже приводятся некоторые соображения относительно методики построения модели, которая с полным на то основанием способна завоевать доверие руководителей. Разработчики проекта должны с самого начала иметь в виду, что экономическая рентабельность операционного исследования никогда не является автоматически доказуемой или самоочевидной. И, что еще хуже, надежная сравнительная оценка «старой» и «новой» систем всегда представляется крайне затруднительной. Это объясняется двумя причинами. Во-первых, могут отсутствовать (по крайней мере в таком виде, который был бы удобен для табличного представления и строгого системного анализа) данные о функционировании системы в прошлом. Поэтому разработчикам операционного проекта при всем их энтузиазме и стремлении как можно быстрее спроектировать и внедрить свою разработку, не следует пренебрегать работой по созданию системы сбора информации, позволяющей правильно оценить тот экономический эффект, который достигается в результате внедрения новых методов управления. В тех же случаях, когда ретроспективные данные оказываются недостаточными, группа операционистов должна приступить к сбору текущей информации задолго до того, как ею будут разработаны новые процедуры. Создатели новой системы должны также признать необходимость в разработке управляемого эксперимента, который позволяет оцепить экономический эффект. Если разработчики проекта не уделят всем этим вопросам должного внимания, они сами не смогут представить убедительного, т. е. подтвержденного фактами, доказательства того, что проектируемая ими система совершеннее существующей. Читателю предлагается подумать, почему так происходит.
404
ГЛАВА 22
Во-вторых, лишь в исключительных случаях удается провести строго параллельное сравнение старой и новой систем управления, процедурно-технологические схемы функционирования которых неодинаковы. Нет никакой гарантии в том, что методы управления, выглядевшие весьма привлекательными в условиях прошлого года, в такой же степени оправдают себя при реализации функций управления в текущем году. Более того, поскольку управляющие решения, принимаемые в тот или иной момент времени, способны определенным путем повлиять на режим функционирования фирмы в будущем, может оказаться тщетной любая попытка точно взвесить тот эффект, который достигается за счет внедрения операционного проекта на большом интервале времени. Таким образом, очень трудно безошибочно оценить эффективность операционного подхода ретроспективно, так же как почти невозможно определить, насколько прибыль, обеспечиваемая в результате внедрения операционного проекта, отличается от прибыли, которую можно было бы получить при сохранении прежней системы управления. Администраторы и специалисты в области исследования операций должны с самого начала отдавать себе отчет в том, что они ограничены в возможности предоставлять неопровержимые доказательства фактической полезности операционного подхода: трудно утверждать, что улучшение качества функционирования организации достигнуто именно благодаря исследованию операций. Важно, однако, помнить, что такого же рода трудности возникают и при оценке эффективности решения задачи другими путями. Из изложенных выше соображений вытекает, что проблема правдоподобия (или адекватности) операционной модели подлежит анализу в течение всего срока разработки проекта; этот вопрос не следует предавать забвению до самого завершения операционного исследования. У многих административных работников возникают сомнения относительно правомерности использования при моделировании тех или иных данных, реалистичности принимаемых допущений, правильности оценки экономических последствий получаемых решений, а также способа учета огромного количества второстепенных соображений относительно существа решаемой задачи. Если операционист отвлечется от упомянутых аспектов анализа, то это может привести к ложному впечатлению, что «мозг» неодушевленного электронного устройства способен усвоить саму суть сложной задачи организационного управления. Психологическую подоплеку формирования доверия к математической модели поясним •с помощью следующей аналогии, которая поможет также разрешить сомнения административных работников относительно надежности используемых операционных методов. Допустим, что читателю вручили телефонный справочник незнакомого ему города и сказали, что в нем можно безошибочно найти номер телефона любого жителя данного города. Читатель сразу же сообразит, что такое утверждение является явным преувеличением.
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
405
Действительно, телефонные аппараты устанавливаются и снимаются ежедневно; таким образом, утверждение, что телефонный справочник содержит все номера городских телефонов, является лишь приближенным. В этом смысле полный перечень телефонных номеров представляет собой «модель». Нас интересует фактически лишь следующее: пригодна ли эта приближенная модель для использования. Каким образом это можно выяснить? Вероятнее всего, читатель попытается сначала найти уже известный ему телефонный номер. Убедившись, что в справочнике этот номер указан правильно, читатель может выбрать какого-нибудь жителя данного города, номер телефона которого ему не известен, отыскать в справочнике соответствующий номер и проверить, является ли он правильным, позвонив по нему и попросив к телефону абонента, указанного в справочнике. Если несколько таких попыток окажутся успешными, читатель может выразить готовность начать пользоваться справочником. Вероятнее всего, он будет продолжать пользоваться справочником, пока не обнаружит возрастания частоты появления неправильных номеров. В этом случае он направит телефонной компании жалобу или снова станет пользоваться услугами справочного бюро. Посмотрим теперь, какие цели преследует телефонная компания, обслуживающая данный населенный пункт. Существует много допустимых систем (или, если хотите, моделей) организации обслуживания абонентов. Компания убедилась, что экономически наиболее оправданным является выпуск однотомного справочника, содержащего все номера установленных в данном городе телефонов. Такими справочниками снабжаются все без исключения абоненты. У компании нет никаких сомнений в том, что каждый отдельно взятый индивидуум использует лишь незначительную часть содержащихся в справочнике телефонных номеров; при этом качество функционирования системы оценивается по степени надежности информации, содержащейся в каждой малой части телефонного справочника. Рассмотренная выше аналогия позволяет уяснить положение проектировщика той или иной операционной системы. Действительно, административный работник вначале проверяет степень надежности операционной модели, формулируя вопросы, ответы на которые он либо уже знает, либо имеет о них определенное интуитивное представление. Доверие руководителя к модели начинает постепенно складываться в том случае, если получаемые им ответы просты, понятны и правильны. Руководитель станет полагаться на операционную модель в том и только в том случае, если его доверие к ней не будет поколеблено теми или иными совершенно очевидными ошибками модели. Разработчики операционного проекта должны попытаться заранее предвидеть характер возможных вопросов со стороны административных работников и определить, на основе какой информации будут выдаваться соответствующие ответы. Достижению этой цели
406
ГЛАВА 22
способствует обсуждение формы административных отчетов и сводок количественных показателей, составляемых при участии руководящих работников фирмы. Машинный анализ должен предусматривать не только выдачу итоговых отчетов, аналогичных обычным сводкам по каждому из подразделений фирмы, но и детальный ретроспективный анализ, объясняющий причины получения тех или иных суммарных показателей. Многие из выходных данных могут рассматриваться лишь эпизодически, но именно в те моменты времени, когда в этом возникает острая необходимость. Аналогия с телефонным справочником не должна заходить слишком далеко, поскольку практически неоправданно и невозможно учитывать все показатели, к которым может обратиться тот или иной административный работник. Однако нужно заметить, что начинающие операционисты неизменно допускают серьезную ошибку, предусматривая выдачу слишком малого объема ретроспективной информации, игнорируя вопросы документирования выходных данных и уделяя незначительное внимание анализу показателей, относящихся к прошлой деятельности фирмы. В итоге всякий раз, когда руководителю требуется информация, которая позволила бы оценить результаты применения операционного моделирования, он бывает вынужден возвращаться к своим прежним методам и повторять все вычислительные процедуры, обеспечивающие выдачу нужной информации. Это, естественно, ставит его в затруднительное положение и вызывает раздражение. Мы затронули проблемы, в которых основное внимание уделяется требованиям, предъявляемым к методике и результатам операционного анализа. Разработчики операционного проекта, разумеется, должны использовать и другие средства, повышающие эффективность . делового сотрудничества с управленческим аппаратом фирмы. Эти средства хорошо известны руководителям профессиональных операционных групп; идеальной является ситуация, когда поддерживается своего рода прямой диалог между руководителями, которым надлежит в конечном итоге судить о степени успешности операционного исследования, и разработчиками проекта. Иными словами, непременным условием анализа является участие руководящего состава фирмы в организации и разработке операционной системы. Важность проявления гибкости и ответственности при внедрении операционной системы. Добиться существенного усовершенствования системы управления крупной организацией независимо от того, создается новая система на базе ЭВМ или предусматривается лишь перераспределение обязанностей между различными категориями должностных лиц, удается, как правило, ценой больших усилий. Если исключить специфику, связанную с выбором путей привлечения персонала фирмы к основанному на использовании ЭВМ системному анализу, то проблемы, возникающие при внедрении новой системы управления, оказываются приблизительно одинаковыми для всех операционных проектов. При осуществлении организа-
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
407
ционных мер по изменению структуры управления фирмы жизненно необходимы поддержка ее руководителей и соответствующая подготовка исполнительского аппарата; здесь, кроме того, играет исключительно важную роль и планирование необходимых организационных мероприятий, причем процесс внедрения новой системы должен контролироваться и направляться в нужное русло, а при возникновении тех или иных затруднений надлежащим образом корректироваться. К сожалению, нет других в равной степени эффективных путей приобретения навыков квалифицированного внедрения операционных проектов, кроме чисто практических. Целесообразно остановиться более подробно еще на одной проблеме. Трудности, возникающие при внедрении новшеств в систему управления, чем-то напоминают те трудности, с которыми пришлось столкнуться в далеком прошлом в связи с механизацией производственных процессов на предприятиях кустарного типа. Действительно, результаты исследования операций, в особенности те из них, которые затрагивают оперативное управление производственными процессами, нередко в корне меняют сам характер деятельности руководителя. Так, например, в результате разработки компьютеризованной модели календарного планирования поставок готовых изделий или, скажем, календарного планирования закупок у фирмпоставщиков может возникнуть такая ситуация, когда руководителю не потребуется большого опыта в части использования процедур принятия управляющих решений, а его деятельность будет сводиться лишь к тому, чтобы снабжать совершенно сырой информацией электронную вычислительную машину. Операционный подход к решению управленческих задач может привести к тому, что отдельные работники окажутся лишенными удовлетворения, которое им ранее давала работа, так как при новой системе их деятельность станет рутинной, не требующей игры воображения, или потеряет ореол таинственности и не будет вызывать у них ощущения полезности их вклада. Вряд ли высшее руководство фирмы откажется из-за этого от той выгоды, которую оно получит в результате внедрения новой системы. Тем не менее разработчики операционного проекта должны быть готовыми к любой реакции сотрудников фирмы на предлагаемые ими новшества. Они должны отдавать себе полный отчет в том, что внедрение операционного проекта будет встречено враждебно. Поэтому им следует продумать меры, которые необходимо принять на том этапе, когда проект уже будет внедрен, с тем чтобы не допустить отрицательных или даже разрушительных последствий такого рода враждебности. Системность в проектировании. Если результаты операционного проекта после первоначального анализа и апробации подлежат повторному использованию, то окончательный успех исследования зависит от того, насколько живучей оказывается предлагаемая модель. В первые годы коммерческих приложений операционных методов многим фирмам удавалось достичь в этой связи ощутимых
408
положительных результатов, которые, однако, носили чисто временный характер. Позднее обнаруживалось, что затраченные фирмами усилия оказывались напрасными либо из-за изменения производственно-коммерческих условий, либо из-за текучести операционных кадров. Теперь опытные руководители фирм прекрасно понимают, что для сохранения значимости результатов операционного исследования и постоянного обновления этих результатов требуется надежная системная основа. Этот вывод вряд ли заслуживал ,бы специального упоминания, если бы сплошь и рядом не наблюдалось явление, которое большинство административных работников продолжают считать парадоксальным. Действительно, весьма типичной является ситуация, когда операционист, невзирая на имеющийся у него большой опыт построения моделей и несмотря на его умение анализировать сложные задачи организационного управления, как правило, оказывается плохо подготовленным к выполнению требований системного подхода, а нередко просто проявляет к этим требованиям полное безразличие. Поэтому те фирмы, у которых имеется опыт создания операционных систем, вводят в состав группы разработчиков операционного проекта специалистов в области именно системного анализа с тем, чтобы обеспечить построение процедур, гарантирующих поддержание используемой модели в рабочем состоянии. 22.4. КАК РУКОВОДИТЬ ПОДРАЗДЕЛЕНИЕМ. ВЫПОЛНЯЮЩИМ ОПЕРАЦИОННОЕ ИССЛЕДОВАНИЕ
Выдерживая стиль настоящей главы, мы затронем в этом разделе лишь некоторые моменты, которые имеют самое непосредственное отношение к проблеме рентабельности операционно-исследовательской деятельности крупной производственно-коммерческой организации. К вопросу о размещении операционного подразделения и определении его количественного состава. Место, которое должна занимать группа операционистов в рамках крупной организации, более уже не является предметом серьезных дискуссий. Никаких строгих рецептов (даже применительно к предприятиям промышленного типа) не существует: разработчики технической части операционного проекта могут успешно работать под руководством управляющего производством, управляющего плановым отделом, вице-президента фирмы, управляющего отделом перспективных исследований и т. д. В наши дни при решении вопроса о подчинении операционной группы доминирующими оказываются соображения, учитывающие особенности программного обеспечения проводимого исследования. Структурно разветвленные фирмы с децентрализованным управлением нередко осуществляют операционно-исследовательскую деятельность как на общефирменном уровне, так и на уровнях отдельных подразделений.
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
409
Количественный состав операционной группы отнюдь не является тем показателем, по которому можно судить о ее продуктивности. Небольшая группа (состоящая, например, из пяти-шести талантливых специалистов в области исследования операций) может внести в производственно-коммерческие усилия фирмы гораздо больший вклад, чем более многочисленная (состоящая, скажем, из 20 человек) группа, если в нее входят лишь два-три специалиста высокой квалификации. В исследовании операций количество является очень плс•хим заменителем качества. Об ответственности каждого члена организации. Руководители фирмы ожидают от операционной группы проявления высокой степени интеллектуальной добросовестности. Это должно выражаться не только тем, что качество выполняемой группой работы будет отвечать надлежащим профессиональным стандартам, а ее заключения отличаться абсолютной беспристрастностью. Руководитель операционно-исследовательского подразделения не должен ставить перед своими подчиненными непосильных задач. Стремясь угодить руководству фирмы, многие операционные группы берутся за разработку настолько большого числа проектов, что им не удается их практически выполнить в приемлемые сроки. В результате все потенциальные пользователи операционных разработок оказываются неудовлетворенными. Подразделение операционистов должно располагать системно продуманным способом выбора проектов, подлежащих разработке, а также уметь правильно распределить в процессе исследования свои немногочисленные людские ресурсы. Все это позволит операционной группе оптимальным образом удовлетворять потребности фирмы в целом. Сотрудничество с пользователями. В предыдущих разделах подчеркивалась важность участия руководителей линейных подразделений фирмы в управлении ходом разработки операционного проекта. Обсудим это положение с точки зрения специалистов, выполняющих техническую часть проекта, т. е. с точки зрения самой операционной группы. Операционная группа должна быть постоянно осведомлена о том, как руководителям фирмы удается извлечь выгоду из используемой ими модели. В большинстве случаев при построении математической модели предполагается, что в процессе ее практического применения будут учитываться некоторые соображения качественного характера как относительно конкретных показателей, так и относительно используемых в модели допущений. В конечном счете принимать управляющие решения и нести ответственность за их последствия приходится руководителям. Поэтому именно им следует заниматься оценкой степени правдоподобия различного рода допущений и взвешивать риск, связанный с различными курсами действий. Операционист ни в коем случае не должен исходить из того, что его модель идентична реальности. Всякий, кто стал бы так считать, оказался бы в своего рода ловушке.
410
ГЛАВА 22
Пока операционная группа фирмы еще только завоевывает репутацию, ее деловое сотрудничество с будущими пользователями разрабатываемой системы может оказаться далеко не идеальным. Организация-заказчик, возможно, будет довольна самим фактом успешного завершения проекта и может даже заплатить за проведенное исследование. Тем не менее фирма-пользователь может уклониться от немедленного оказания операционистам других видов помощи, которая часто заключается в организации сбора требуемой информации и в тщательном разборе руководителями фирмы промежуточных результатов операционного исследования. Поэтому дальнейшая работа операционной группы может затормозиться в ожидании более существенной помощи подразделений организации-заказчика. В тех же случаях, когда операционная группа продвинулась в своих исследованиях настолько далеко, что у нее появилась возможность выбора одного проекта из ряда заслуживающих внимания, основным критерием такого выбора должна быть готовность организации-пользователя выделить часть рабочего времени своих сотрудников для нужд осуществляемой операционной группой разработки. Надежным показателем степени заинтересованности фирмы в проводимом исследовании является то количество человеко-дней, которое она согласна потратить на оказание помощи операционной группе. 22.5. ВЗГЛЯД В БУДУЩЕЕ
Исследование операций прогрессирует настолько быстрыми темпами, что представляется рискованным строить даже самые краткосрочные прогнозы относительно развития этой области. Однако в настоящее время проводятся интенсивные исследования в ряде областей науки и техники, которые окажут решающее влияние на расширение возможностей исследования операций в самые ближайшие годы. Достижения в области теории. В части приложения методов исследования операций к решению задач организационного управления особенно важными являются следующие два направления научных исследований. Первое из них ориентировано на разработку эффективных математических методов анализа «сверхкрупномасштабных» задач, к которым, в частности, относятся методы анализа моделей линейного программирования, содержащих большое число (порядка нескольких тысяч) ограничений. Второе направление исследований нацелено на разработку практических методов решения реальных задач комбинаторного типа (гл. 13). Получат дальнейшее развитие, разумеется, и многие другие разделы теории исследования операций, в частности методы построения алгоритмов решения для нелинейных оптимизационных моделей, методы моделирования мультиноменклатурных систем управления запасами, алгоритмы генерирования стохастических процессов для
ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
411
имитационных экспериментов. Более глубоко будут проработаны вопросы применения операционных методов в сфере производства п сбыта, рекламы, обучения и т. д. Кроме того, ожидается значительный прогресс в области распространения методов исследования операций за пределы производственно-сбытовой сферы. Технический прогресс. Хотя крупные достижения в области теории часто достигаются независимо от успехов в совершенствовании аппаратных средств ЭВМ, использование результатов исследований при решении практических задач существенным образом определяется именно положением дел в области электронной вычислительной техники. (Так, например, методы линейного моделирования не имели широкого практического применения до тех пор, пока не были разработаны удобные для использования машинные программы соответствующего назначения. То же самое можно сказать и об имитационных моделях.) Если же говорить о дальнейших перспективах применения исследования операций, то наиболее значительным достижением в области электронной вычислительной техники, по-видимому, является создание машинных комплексов, работающих в режиме «разделения времени». Разделение времени уже теперь позволяет сократить трудозатраты, связанные с построением и отладкой модели. (Использование этого режима функционирования ЭВМ заметно сокращает время между последовательными пробными прогонами модели.) Особенно же важно отметить, что возможность использования ЭВМ в режиме разделения времени стимулирует работы по созданию новых типов моделей и позволяет вести эффективный поиск решения самых разнообразных задач организационного управления. Фирмы, стоящие в авангарде применения научных методов управления, разрабатывают детальные модели планирования своей финансовой деятельности и постоянно осуществляют экономический анализ возможных вариантов своих действий. Разделение времени позволяет теперь руководству фирмы выполнять анализ решения на чувствительность в оперативном режиме. Возможность буквально за секунды выполнить сотни тысяч вычислительных операций и сразу же получить требуемый результат представляет собой важнейшее достижение, которое обеспечит дальнейшие успехи теории принятия решений. Наличие ЭВМ, работающих в режиме разделения времени, с неизбежностью приведет к созданию операционных систем для принятия управляющих решений, связанных с календарным планированием и ежедневным определением оптимального варианта размещения дефицитных запасов, а также контролем за производственными процессами. Темпы создания и сроки принятия на вооружение такого рода систем зависят от возможностей приобретения электронного вычислительного оборудования, способного функционировать в режиме разделения времени, и от наличия внешнего математического обеспечения, которое соответствовало бы характеру решаемых производственно-сбытовых задач указанного класса.
412
ГЛАВА 22
Управление и психология. Прошло то время, когда операционист считал возможным строить математическую модель, полностью пренебрегая бихевиористическими характеристиками людей, которым с ней придется работать, и игнорируя особенности социальной среды, в которой придется функционировать исследуемой системе. Опытным специалистам в области исследования операций хорошо известно, что внедрение любой операционной разработки порождает во всех звеньях организации-пользователя большое психологическое напряжение. Чтобы ускорить процесс внедрения современных научно-технических достижений в сферу организационного управления, операционисты и психологи должны совместными усилиями решить проблему «совместимости» административного работника и ЭВМ. Это создает предпосылки для более эффективного применения методов исследования операций в процессе управления сложными функциональными системами.
ПРИЛОЖЕНИЕ II
Стохастические модели управления запасами с периодическим контролем II.1. ВВЕДЕНИЕ В данном приложении рассматриваются динамические однопродуктовые модели управления запасами, в которых решения о пополнении запаса допускаются только через фиксированные промежутки времени, скажем раз каждые 10 дней или каждый понедельник. (Вспомним, что в динамической стохастической модели, рассмотренной в разд. 19.6, пополнение запаса допускалось в любой момент времени.) Имеются две существенные причины для изучения моделей с периодическим, или дискретным, контролем. Во-первых, модели этого вида легче поддаются строгому анализу, нежели модели с непрерывным контролем. Во-вторых, теоретические результаты, получение которых часто не требует допущения о стационарности, приводят к формулам, позволяющим выполнять практические вычисления. Оба эти достоинства будут наглядно продемонстрированы ниже. В любом случае практического применения, когда предполагается стационарность и плановый период бесконечен, при выборе типа модели (с непрерывным или периодическим контролем) прежде всего учитывается степень ее адекватности реальной действительности. (Как будет показано в разд. II.6, соответствующие количественные оценки, связанные с обеспечением приближенной оптимальной стратегии, при использовании модели с периодическим контролем столь же просты, как и вычисления, приведенные в разд. 19.6). Читатель уже знаком с несколькими примерами моделей управления запасами с периодическим контролем. Раздел 8.3 был посвящен модели с детерминированным спросом и периодическим контролем при конечном плановом периоде. В разд. 12.5 анализ был обобщен на случай бесконечного планового периода, а в разд. 17.4, 18.3 ж 18.4 — на условия вероятностного опроса. В гл. 9 было показано, что если приемлемы некоторые конкретные допущения относительно характера затрат, то можно определить форму оптимальной стратегии при детерминированном спросе, упростив тем самым вычислительную процедуру, связанную с отысканием оптимального решения. Ниже будут рассмотрены аналогичные упрощения для случая стохастического спроса. II.2. ВРЕМЕННЫЕ СООТНОШЕНИЯ И НЕУДОВЛЕТВОРЕННЫЙ СПРОС
Пусть плановый период включает конечное число временных интервалов (отрезков времени). Предположим, что целочисленная величина К определяет запаздывание поставки (т. е. партия изделий,
414
ПРИЛОЖЕНИЕ II
заказанная на отрезке t, поступает на отрезке t + ^)- Предположим далее, что в пределах любого отрезка t операции осуществляются в такой последовательности: а) принятие решения о заказе партии изделий; б) поставка по любому заказу, срок оформления которого приходится на отрезок t — А,; в) определение спроса потребителя. Пусть pt (q) есть вероятность того, что на отрезке t спрос составит величину q (где q ^г 0). Допустим, наконец, что спрос на отрезке t является целочисленным и не зависит от спроса на всех предыдущих отрезках. В ряде случаев можно принять значение А, = 0, что соответствует немедленной поставке. Отметим при этом следующее различие между моделями с непрерывным и периодическим контролем. Когда для модели с непрерывным контролем, описанной в разд. 19.6, значение запаздывания L = 0, анализ упрощается до определения оптимального размера партии, приведенного в разд. 19.5, поскольку в этой ситуации нет надобности в принятии мер, компенсирующих неопределенность спроса на любом отрезке времени. Однако для модели с периодическим контролем даже в случае, когда Я, = 0, случайный спрос на одном отрезке возникает прежде, чем появляется очередная возможность разместить заказ на пополнение запаса. В общем случае значение X в модели с периодическим контролем соответствует значению L = Я, + 1 в модели с непрерывным контролем. Примем следующие обозначения: Ч — уровень наличного запаса на начало отрезка t; h — уровень наличного запаса плюс количество, заказанное на начало отрезка t до принятия очередного решения о пополнении запаса (размещении нового заказа); xt — количество, заказанное на отрезке t; kt = it + Xt-ъ — уровень наличного запаса после любой поставки, но до очередного определения спроса; yt =E ]t -{- xt — уровень наличного запаса плюс количество, заказанное на отрезке t после принятия решения о пополнении запаса, но до очередного определения спроса. Тогда П . _ \{t РИ ^ = 0, 7 г== ' № + *<-*,+ • ••+**-! На рис. II.1 приведены временные соотношения между всеми этими величинами. Если К = 0, то ] t = i f , откуда kt = yt есть общий объем запасов, которые имеются в наличии для удовлетворения спроса на отрезке t. Следовательно, решение xt оказывает непосредственное влияние на значение kt.
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
415
"Интервал i Наличные запасы fff
if
Заказ
Поставка
Спрос
Ч
t Jt
у* Наличные запасы плюс заказанное количество
Р и с . II.1. Последовательность событий и количественные характеристики для процесса управления запасами.
Если же К > 0, то возникает иная ситуация, ибо в этом случае xt не будет влиять на объем запасов до начала отрезка t + л, когда поступает заказанная партия. По определению ki+^ = i ( + ji -f- xt, но значение it+^ отчасти зависит от уровней спроса qt,
Vt — (?« + ••• + 0).
(2)
Читатель сможет самостоятельно истолковать эти соотношения, пользуясь определениями величин it+к, h и Mt- Когда величина /с;+х отрицательна, на отрезке t -f- ^ накапливается соответствующий объем неудовлетворенного спроса, куда, однако, не входит спрос, возникший на самом отрезке t -f- Я,. Читатель долн\ен четко уяснить себе, что из выражения (2) следует, что значение ki+^ полностью определяется принятым на отрезке t решением о пополнении запаса и общим, или кумулятивным, спросом на К последовательных отрезках, начиная с отрезка t. При известных распределениях вероятностей pt (q) нетрудно определить распределение вероятностей кумулятивного спроса за ^ последовательных отрезков. Положим Pt.t+b-i (Q) — вероятность того, что кумулятивный спрос (qt + . . . + qt+i,-i) равен Q
(3)
416
ПРИЛОЖЕНИЕ II
Тогда в силу соотношения (2) величина pt, t+K-i (Q) также представляет собой вероятность того, что значение kt+-h равно (yt — Q). Вероятность pt.t+b.-i(Q) можно вычислять с помощью рекуррентного соотношения свертки Q
Pt.u+i(Q)= 5=0 S pu+l(q)pt.u(Q-q),
9 = 0,1, ....
(4)
где pt, t = pt, и формула (4) последовательно применяется при и = = t, . . ., t + К — 1. Для многих широко используемых законов распределения вероятностей можно вывести формулы, позволяющие определять pt, t+x-i(Q), не прибегая к численным рекуррентным вычислениям по формуле (4). Так, например, если pt (q) характеризуется пуассоновским распределением с математическим ожиданием Е [qt] = mt, т. е. )=b-$2L,
pt(q
5=0 , 1 , 2 , . . . ,
(5)
то распределение кумулятивного спроса также является пуассоновским с математическим ожиданием "М — mt -f- . . . -f- иги-х-ь т- е9 =0,1,2,...
(6)
Важный частный случай (3) и (4) возникает тогда, когда pt (q) имеет одинаковое распределение при всех t: и, следовательно,
Pt (q} =p(q),
p»-(9)=pf,< + b-i(9)= g=0 2 pMp^W-q),
(7)
(8)
рк (Q) называется h-кратной сверткой р (д). Рассмотрим в качестве примера случай, когда р (q} подчиняется отрицательно биномиальному закону распределения р (q) = CTrI\+h (I - рУр",
Q = О, 1, 2, . . .,
(9)
при Е [q] = rpl(l — р), 1 > р > 0, где г — положительное целое. Тогда можно показать, что ^-кратная свертка является также отрицательно биномиальным распределением r
ь (Q) = c£:U (1 - pf p°, Q = о, i, 2, . . .,
Р
(Ю)
где E [ Q ] = Я,гр/(1 -р}. В качестве другого примера ^.-кратной свертки (8) возьмем следующее распределение вероятностей: р (2) = 0, 2, р (3) = 0,8. (И)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
417
В этом случае формула ^-кратной свертки (8) имеет вид 2
Р (0=2 />()>(-), g=0
(12)
откуда следует, что
р2 (4) = р (2) р (2) = 0,04, р2 (5) = р (2) р (3) + р (3) р (2) = 0,32,
(13)
2
Р (6) = Р (3) р (3) = 0,64. Аналогично при Я, = 3 имеем Р 3 (0=1]Р()Р 2 (?-)• 9=0
(14)
и, следовательно, р3 (6) = р (2) р2 (4) = 0,008, р3 (7) = р (2) р" (5) + р (3) р2 (4) = 0,096, р3 (8) = р (2) р2 (6) + Р (3) р2 (5) = 0,384, р3 (9) = р (3) р2 (6) = 0,512. Случай с потерей заказов. Предположим теперь, что К > О, но все невыполненные в срок заказы полностью теряются. Тогда формула для kt+i. становится сложной. Чтобы выяснить причину усложнения, рассмотрим случай, когда К = 2. Покажем, в частности, что ki+z = max (kt+l — gt+i, 0) + xt = = max [max (kt — qt, 0) + #j-i —
(16)
что не всегда совпадает со значением, определяемым по формуле (2). Отметим, в частности, что kt+z зависит не просто от г/ 4 , а от отдельных компонентов (it + xt-z, X t - i , xt), и не от кумулятивного спроса, а от спроса на каждом отрезке, т. е. от gt, qt+i- В результате распределение вероятностей kt+^ при заданном значении yt не связано непосредственно с величиной pt, t+K-i ((?)• Для устранения трудностей, возникающих при анализе более сложных ситуаций, в дальнейшем будем считать, что все не выполненные в срок заказы откладываются для последующего удовлетворения. Если штрафные потери относительно велики, полученная при указанном допущении стратегия будет близка к оптимальной для случая, когда неудовлетворенные заказы на самом деле теряются. (При К = 0 найти решение при потере сбыта почти так же просто, как и в случае сохранения спроса. Соответствующие результаты будут приведены ниже.)
418
ПРИЛОЖЕНИЕ II
II. 3. МОДЕЛЬ С КОНЕЧНЫМ ПЛАНОВЫМ ПЕРИОДОМ
Предположим, что в качестве целевой функции принята дисконтированная сумма ожидаемых на каждом отрезке затрат всех видов. Пусть, в частности, ct (х) — стоимость заказанного на отрезке t количества х, (1) и предположим, что соответствующие расходы действительно имеют место при поставке этого заказа на отрезке t + А- Пусть также Ht (u, q) — затраты на содержание запасов и штрафные потери на отрезке t в том случае, когда для (2) удовлетворения спроса q на этом отрезке имеется в наличии лишь k требуемых изделий. Так, например, функция Ht (k, q) может иметь следующий вид: . „\ _ / ht (k — q) при k — q > О, ' q) ~ \n лt((q (q — k) при k — q <. 0.
(3)
Важным частным случаем (3) является случай, когда обе функции в правой части (3) линейны. Заметим, что при отрицательной величине k (указывающей на наличие портфеля невыполненных заказов еще до появления спроса q) разность g — fc, по которой оцениваются штрафные потери, представляет собой сумму спроса и невыполненных заказов. Следовательно, штрафные потери возникают на каждом отрезке, на котором не удовлетворяется хотя бы единица спроса. Вспомним, что при А, = 0 имеем kt = yt, откуда следует, что Ожидаемые затраты' на содержание запасов и штрафные потери на отрезке t при yt = y
g=0
Вспомним также, что при X >» О
&н-я = yt — >
(5)
Q = it + • • • + gt+K-i,
откуда видно, что значение yt непосредственно влияет на затраты, связанные с хранением запасов, и штрафные потери на отрезке t + А,. Следовательно, -Ожидаемые затратып на содержание запа- _ _ сов на отрезке t-}-}, ~ * ^' ~ при yt = y J
S S #m (y-Q, ч) РШ (q) PI. t+b-i (Q), *->o,
Q=0 ?=0
(6)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
419
Согласно (6), величина Lt (у) определяется путем вычисления условного математического ожидания Ht+к (У —• (?> ) по отношению к q для каждой разности (у — Q) и безусловного математического ожидания по отношению к Q. Если величина Ht (k, q) имеет вид (3), то (6) приводится к виду
Lt(y) = __
_
J Q=0
Q>y
/—y)Pt.t+K((n
П
РИ
при г/<0.
nt+K(Q—y)pt.M(Q), T
e
Заметим, что здесь Q = qt + . . . + ?н-х-1 + 9л-х> - - случайная величина q в выражении (6), представляющая спрос на отрезке t + К, учтена в величине Q в выражении (7), а второй нижний индекс свертки распределения вероятностей соответственно увеличен на единицу. Если все величины pt (q) одинаковы, то pt, t+к (Q) в (7) соответствует (К + 1)-кратной свертке, которую будем 4 обозначать через р^+ (Q). Предположим далее, что решения о пополнении запаса принимаются на отрезках 1, 2, . . ., Т, откуда следует, что сама система управления запасами должна функционировать до конца отрезка Т + X. [Заметим, что функцию LT (у) необходимо определить таким образом, чтобы она отражала состояние запаса на конец отрезка Т -\- К в случае сохранения запаса каких-либо изделий, или при наличии портфеля невыполненных заказов.] Поскольку нужно выбрать оптимальные решения на отрезках 1, 2, . . ., Г, то удобно условиться, что Т обозначает продолжительность всего планового периода (вместо Т + Я,); именно это и предполагается нами в дальнейшем. Задача минимизации сводится к отысканию оптимального размера заказа xt (jt) для каждого отрезка и каждого возможного значения /(, либо, что то же самое, к определению оптимального значения yt (jt) ^ it- Предполагая, что в используемых ниже обозначениях в явном виде включены зависимости у^ от jt и jt+\ от yt, мы получим следующее выражение для ожидаемого значения затрат при выбранном наборе стратегий yt при t = 1, 2, . . ., Т7 и начальном уровне запасов /':
{Д
- 1 [ct (yt - Jt) + Lt (yt)}\ ,
(8)
где усреднение производится по всем возможным последовательностям значений спроса, а величина а — обычный коэффициент дисконтирования на одном отрезке (1 ^ а > 0). Отметим, что в выражении (8) затраты на отрезках 1, 2, . . ., К — 1 на самом деле не учитываются, что вполне закономерно, ибо на эти затраты нельзя оказать
420
ПРИЛОЖЕНИЕ II
никакого влияния. Отметим также, что в этом выражении имеется постоянный множитель сс\ который можно с целью упрощения опустить, что в дальнейшем и делается. Рекуррентное соотношение динамического программирования, с помощью которого находятся оптимальные стратегии, минимизирующие выражение (8), имеет вид оо
t(y~j) + Lt (y) + a, 2
8=0
1t+i(y—q)pt(q}\
при t = i, 2, ...,Т,
(9)
Функции / ( (;') вычисляются обычным путем для каждого возможного значения /, начиная с t ~ Т, Т — 1, . . . , 1. (На практике диапазон изменения q ограничивается таким значением q* < оо, при котором функция кумулятивного спроса q* близка к 1. Аналогичным образом на интервал изменения значения ;' накладывается ограничение, определяемое характером реальной ситуации.) Численные решения для такого рода рекуррентного соотношения легко определяются на быстродействующей ЭВМ. Неявные обозначения, принятые в (8), скрывают от нас следующие детали. При любом заданном наборе правил пополнения запасов и /1 случайный спрос определяет распределение вероятностей величин jt при Т ^ t > 1, а последние в свою очередь определяют распределение вероятностей величин yt при Т ^ г / > 1 . Математическое ожидание (8) берется по этим индуцированным распределениям, так что минимизация осуществляется в действительности на заданном наборе правил пополнения. Пример единовременного штрафа. В разд. 19.4 (стр. 217) был рассмотрен следующий пример модели принятия решений на одном отрезке:
= 4, 8,
при z = 0,
ГО
(10)
~ \_K-\-c-x при х > О, я я/2 О
{
при при г/ = 4, 5, 6, 7 при у>8,
где К ^ 0, с ^ 0 и я > 0. Предположим, что А, = 0' и что распределения спроса и функции затрат стационарны, ее = 1 и Т = 2. Читателю следует применить соотношение (9) и сопоставить полученные результаты с данными, приведенными в таблице на рис. II. 2 (при этом рекомендуется
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
/С = У1 (/)
/<о
8
1
8 8 8 8 8 8 8 8
2 3 4 5 6 7 8
4,5 iI
/1 (/) 13,5+ +(3-/) 20,5 19,5 18,5 17,5 16,5 15,5 14,5 9
К=1 и я = £
Я = 12 #2 (/)
/
8 8 8 4 5 6 8 8
421
/2 (/)
г/1 (/)
/1 (/)
Ы/)
/2 (/)
12
/
10
/
5
11,5 10,5
1
10 10 9,5 7,5 7,5 6,75 5,75 3,75
1 2 4 4 5 6 8 8
5 5 4,5 2,5 2,5 2,5 2 0
9,5 6 6 6 5,5 0
2 4 4 5 8 8 8
Р и с . И.2. Модель с единовременным штрафом.
обратиться к вычислениям, приведенным в разд. 19.4, для проверки стратегий на отрезке 2). Рекуррентное соотношение (9) можно использовать и применительно к условиям других задач управления запасами, основанным на иных допущениях, для чего в некоторых случаях это соотношение целесообразно слегка модифицировать. Так, например, можно принять, что величина 1 — а. представляет собой вероятность того, что хранящийся товар полностью устаревает. Если вероятность сохранения ценности изделия меняется во времени, то вместо а можно использовать величину at. (На самом деле значение at может отражать совместное влияние и степени сохранения ценности изделия и коэффициента дисконтирования.) В другом случае на значения yt и xt = yt — jt в подлежащем минимизации выражении (9) можно наложить определенные ограничения. Наконец, в ряде ситуаций, скажем при допущении, что в любой момент времени может откладываться выполнение только одного заказа, выражение (9) модифицируется таким образом, чтобы в нем учитывался случайный характер срока поставки, т. е. допускается вероятностное изменение значения Я. Отметим, что оптимизация (9) имела смысл минимизации ожидаемых затрат. Предположим теперь, что каждое изделие, приобретенное потребителями фирмы, приносит доход, равный г, который поступает в распоряжение фирмы в момент поставки изделия потребителю. Если а = 1, то этот доход при решении оптимизационной задачи можно не учитывать, поскольку стратегия, минимизирующая затраты, одновременно максимизирует прибыль при условии, что весь
422
ПРИЛОЖЕНИЕ II
спрос в конечном счете удовлетворяется (включая спрос, не удовлетворенный на конец отрезка Т + К). Однако при а. < 1 неудовлетворенный спрос уменьшает приведенное значение поступающих доходов, поскольку выплата г денежных единиц задерживается до получения потребителем заказанных им изделий. Для учета этого фактора примем, что величина L* (у) представляет собой ожидаемые затраты на содержание запаса и штрафные потери, но не включает дохода, а затем определим Lt(y) = L1(v) + (i-a)r S (Q-y)pt.t+b(Q). Q>V
(I)
[Предположим при этом, что LT (у) включает затраты на отрезке Т + А, + 1> связанные с выполнением любых отсроченных заказов, имевшихся в портфеле фирмы на отрезке Т -\- К.] Допустим, что неудовлетворенные заказы теряются. Если К = О и, следовательно, jt — it, то соответствующее рекуррентное соотношение динамического программирования, аналогичное (9), имеет вид q=0
Это соотношение с вычислительной точки зрения не сложнее (9). Случай потери заказов при К > 1 формально описывается рекуррентным соотношением оо
/t (k, xt-к-ц, ..., xt-i) = min [a*-ct (x) + 2 Ht (k, q) pt (q) + x^Q
q=0
k q=0 ft+i (Xt-Ы, Xf-b+2,
...,X)].
(Ill)
Читателю рекомендуется записать рекуррентное соотношение при А*= 1 и сравнить его с (II). II.4. ВИД И ПОЛНОЕ ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНЫХ СТРАТЕГИЙ
Введем в модель, рассмотренную в предыдущем разделе, следующие предположения относительно функций затрат: П
И
- v(х\ = { ° Р х = °> * ' I Kt + ctx при х > 0 и .fff ^ a.Kt+i, (1) Z,f (г/) выпукла и (ct — acf+1) г/ + Lt (у) -^ оо при | у \ ->• оо, (2)
где /f( ^= 0, ct ^ 0 и ст+1 = 0. Предположим, например, что Lt (у) определяется выражением (7) из предыдущего раздела, а
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
423
[йн-х (j) + Ян->, (—;')] есть выпуклая функция при любом значении ;'. Тогда функция Lt (у) также выпукла и удовлетворяет условиям (2), если (ct — act+l) у + Lt (у) -»- оо при \ у \ -+ оо. Пусть по определению стратегия управления запасами принадлежит к классу (s, S), если для любого отрезка t при / > st,
yt (f) = j
и xt (]) = 0
Vt (/) = St
и xt (/) = St — j при / < s(.
(3)
Тогда можно показать, что справедлива следующая теорема. О п т и м а л ь н о с т ь (s, S)-c т р а т е г и и . Для модели, описываемой рекуррентным соотношением динамического программирования (9) из разд. II.3, для которой выполняются условия (1) и (2), существует оптимальная (s, £)-стратегия. Кроме того, если Kt = 0 при любом значении t, то st — St. Важным следствием этой теоремы является возможность полного описания оптимальной стратегии на любом отрезке путем задания всего двух параметров (s, S) без точного определения уровня запаса на начальном отрезке (t = 1). Теорема остается в силе и тогда, когда условие (2) о выпуклости Lt (у) ослабляется и заменяется условием, что функция — [(ct — a.ct+i) у + Lt (у)] унимодальна (разд. 14.3). Определение оптимальной стратегии. Зная, что оптимальная стратегия принадлежит к классу (s, S) [или, как говорят, имеет (s, £)-структуру], можно существенно упростить процесс оптимизации, описываемый рекуррентным соотношением (9), приведенным в предыдущем разделе. Здесь мы будем предполагать, что St ^ О при всех значениях t и что Kt > 0 но крайней мере при одном значении t. (Случай, когда Kt = 0 при всех значениях t, рассматривается ниже.) Для начала предположим, что значение / произвольно мало, и, следовательно, оптимальное значение yt (j) = St. Тогда анализ рекуррентного соотношения (9) показывает, что St есть минимизирующее значение у в смысле g=0
(4)
*gt(St).
Если известно, что стратегия обладает (s, 5)-структурой, можно утверждать, что 'gt(St) + K '' W = 1 Lt Г.(7) / Л+ ^L « „ V / w (у _ g) ^(?)
g
при 7 < s (> при J>Sft
(5)
ПРИЛОЖЕНИЕ II
424
Таким образом, st есть наименьшее из чисел, условию
удовлетворяющих
оо
Lt («/) + « 2 //+1 («.' — 8) Р* (9) < £* (5/) + Я( - с(*„ д=0
(6)
или, как мы убеждаемся после выполнения очевидных элементарных преобразований выражения (6), s( есть наименьшее из чисел, для которых gt (st) < gt (St) + Kt, (7) где, как и в (4), 00
gt(y)=cty+Lt(y) + a.^ft+i(y — q ) p t ( q ) . g=0
(8)
В результате получаем следующий алгоритм определения оптимальной стратегии на отрезке t. Шаг 1. Вычислить gt (у) по формуле (8) для всех представляющих интерес значений у и принять, что St^0 удовлетворяет условию gt (у) = gt (St). Шаг 2. Взять в качестве st наименьшее из чисел, удовлетворяющих условию gt (st) ^ gt (St) + Kt. (Заметим, что st может принимать отрицательные значения.) Шаг 3. Вычислить ft (/) по формуле (5). Таким образом, для каждого отрезка t алгоритм сводится к выполнению единственной операции отыскания минимума на шаге 1, которая заменяет выполнение операции минимизации для каждого j при использовании рекуррентного соотношения (9), описывающего общую модель управления запасами (см. предыдущий раздел). Вычислительная процедура по указанному алгоритму начинается с t = Т, где /r+i = 0, и продолжается при t = Т — 1, Т — 2, . . . . . ., 1. Примеры использования алгоритма приведены ниже. Если Kt — 0 при всех значениях t, шаг 2 можно опустить, так как при этом st = St. Далее, если все параметры функции затрат и все распределения спроса стационарны, то St 2? St+i- Приняв еще одно дополнительное допущение относительно условия окончания операций в соответствии с этим алгоритмом, можно существенно упростить шаг 1, что будет показано в разд. 11.5. Примеры. Нижеследующие примеры служат двум целям: они иллюстрируют работу алгоритма и дают представление о результатах реализации оптимальных стратегий в условиях, когда Kt > О и плановый период является конечным. Допустим, что Kt и ct стационарны, и предположим, что функция затрат на содержание запасов и штрафных потерь также стационарна и имеет вид
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
425
где с -} h > 0. Положим далее Я. = 0
и
(10)
pt (q) = p (q),
т. е. спрос также стационарен, а
, _
h-(y-q)p(q)+^n-(q~y)p(q)
j 9=0 о
.9=0
приу>0,
9>0
при г/<0.
n-(q — y)p(q)
В условиях, когда, согласно принятым нами предположениям, Kt и ct стационарны, представляется более удобным определить в уравнении динамического программирования дискретную переменную, указывающую на порядковый номер рекуррентного шага как «число отрезков до конца планового периода». Это приводит к рекуррентному соотношению, аналогичному (9) из разд. П.З, а именно к соотношению 9=0 FoO') = 0.
Чтобы читатель не забывал о том, что в данном рекуррентном соотношении отсчет времени ведется в обратном направлении, вместо / ( нами используется символ Fn. Положим для начала £ = 24, с = 1, /i = 2, я = 10, а = 1, Г= 0 (13) и допустим, что спрос детерминирован: Тогда
Р (3) = 1. (3-,)
(14) при><3.
При любом ге на шаге 1, согласно приведенному выше алгоритму, требуется вычислить значение функции g=0
которая с учетом (14) принимает следующий вид: Gn (У) =cy+L(y) + Fn м (у - 3).
(16)
(17)
Чтобы читатель не забывал о том, что отсчет времени ведется в обратном направлении, мы по аналогии с (12), вместо gt используем символ G п.
ПРИЛОЖЕНИЕ II
426
Положим для примера п = 1. Тогда с помощью (12), (13), (15) и (17) будем иметь GI (6) = 6 + 2 (6 - 3) + 0 = 12, GI (0) = 0 + 10 (3) + 0 = 30, (18) GI (-2) = -2 + 10 [3 - (-2)] + 0 = 48. Значения G\ (у) для других значений аргумента приведены в таблице на рис. II. 3. В соответствии с данными, указанными во втором столбце этой таблицы, S = 3, так как GI (3) = 3 есть минимальное значение Gt (у). Переходя к шагу 2, легко убедиться в том, что s4 = 1 есть наименьшее значение st, при котором Gi (s4) < Gi (3) + К = 27, (19) поскольку GJ (1) = 21, a G t (0) = 30. При любом п на шаге 3 требуется вычислить
{
при j<sn
Gn(Sn) + K — cj L(i) + a^Fn.i(i~q)p(q)
?=о Нетрудно убедиться, что при п = 1 27— /
при;>*„.
(20)
при j
10 (3-у) + 0 при 1<;<3, при 3
(21)
Значения функции FI (/) при различных / приведены в таблице на рис. П.З. Возвращаясь к шагу 1, находим при п = 2 в соответствии с (17) значения G2 (у). Так, например, G2 (6) = 12 +
FI (3) = 12 +
0 = 12,
G2 (0) =30 + ^i (-3) = 30 + 30 = 60, G2 (-2) = 48 + FI (-5) = 48 + 32 = 80.
(22)
Все значения функции G2 (у) приведены в таблице на рис. П.З, откуда видно, что 52 = 6. Переходя к шагу 2, убеждаемся, что s2 = 3 есть наименьшее значение s2, при котором G2 (s2) < G2 (6) + К = 36, (23) поскольку G2 (3) = 30, а б?2 (2) = 40. Получаемые при этом значения РЪ 0) указаны в таблице на рис. П.З. Значения Gn (у) и Fn (у) при п = 3, 4, . . ., 7 также указаны в таблице на рис. П.З. Отметим, что функции Gn (у) и Fn (/) не являют-
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
В
<а
_3 —2 —1 0 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15
Оптимальные стратегии
57 48 39 30 21 12 3 6 9 12 15 18 21 24 27 30 33 36 39
N
^ 30 29 28 27 20 10 0 2 4 6 8 10 12 14 16 18 20 22 24
(1, 3)
90 80 70 60 50 40 30 26 19 12 17 22 27 32 37 42 47 52 57
ьГ
39 38 37 36 35 34 27 22 14 6 10 14 18 22 26 30 34 38 42
09
99 89 79 69 59 49 39 41 43 39 37 32 27 34 41 48 55 62 69
Si
••^
Sj
«?
•С
Ю
54 114 53 104 52 94 51 84 50 74 47 64 36 54 37 56 38 56 33 48 30 52 24 56 18 54 24 54 30 51 36 48 42 57 48 66 54 75
75 74 73 72 71 62 51 52 51 42 45 48 45 44 40 36 44 52 60
С
135 125 115 105 95 85 75 77 71 63
67 69 63 69 75 75 77 76 75
:
^
ьГ
90 89 88 87 86 83 72 73 66 57 60 61 54 59 64 63 64 62 60
3
•"^
ц? ft? 150 105 140 104 130 103 120 102 НО 101 100 98 90 87 92 88 92 87 84 78 88 81 84 76 78 69 84 74 88 77 84 72 92 79 100 86 102 87
(3, 6) (2, 9) (2,6) (2, 12) (2,9) (2,6)
(2, 9)
427
"^^
^ t«3
165 155 145 135 125 115 105 107 107 99 103 105 99 105 103 99 107 ИЗ
111
С 126 125
124 123 122 ИЗ 102 103 102 93 96 97 90 95 92 87 94 99 96
(2,9) (2,6) (2, 12)
4, с = 1, А = 2, я = 10, о = 1, р(3) = 1, Я, = Р и с . П.З. Детерминированная модель.
ся выпуклыми. Так, например, имеют место локальные минимумы Gk (у) и F k (]) при значениях у и j, равных 3, 6 и 12. Заметим также, что Fn (;') убывает при ]•<. sn и, как и следовало ожидать, возрастает при достаточно большом значении /, так как при этом существенно увеличиваются затраты на содержание запасов. Однако следует учесть, что Fn (j) не всегда убывает при Sn ^ j ^ sn. Для примера: Ft (3) = 51, в то время как Fk (4) = 52, хотя стратегия (2,9) является оптимальной при п = 4. Таким образом, хотя при оптимальной стратегии нужно заказывать (9 — /4), если / 4 < 2, экономически будет менее выгодно начинать с уровня у'4 = 4, нежели с уровня ;4 = 3. В такой ситуации выгоднее избавиться от одной единицы запаса при условии, что связанные с этим затраты не превышают 1 (=52—51).
428
ПРИЛОЖЕНИЕ II
Соответствующие оптимальные значения (sn, Sn) приведены в нижней строке таблицы на рис. П.З. Отметим, что на некоторых отрезках существует более одной оптимальной стратегии. Действительно, можно показать, что при больших значениях п сохраняется несколько оптимальных стратегий. В частности, при k = О, 1, 2, . . . оптимальными являются стратегии (2, 9) и (2, 6) при п = 5 + 3£, (2, 9) при п = 6 + 3k, (24) (2, 9), (2, 6) и (2, 12) при п = 7 + 3/с, где п — число отрезков до конца планового периода. Несмотря на неоднозначность решений при определенных конечных плановых периодах, нетрудно показать, что при бесконечном плановом периоде единственной оптимальной стратегией является (2,9). Если остаточная стоимость l) x изделий из запасов составляет dt -х, то (s, 5)-стратегию можно модифицировать следующим образом. При ]'t < s( следует заказывать (St— • /,) изделий, где (st, St) определяются из (4) и (7). В противном случае нужно считать, что у принимает значение, минимизирующее следующее выражение: min[dt(f — y) + Lt(y) + a 2 /m(j/— l) Pt(q)] = ft (I), J>st- (I) v^i g=0 В примере, приведенном в таблице на рис. П.З, при a,t = 0 модернизированная стратегия приводит к такому же значению (s,, St). В качестве второго примера рассмотрим случай, когда исходные данные оказываются такими же, как и в (13), но будем на этот раз считать, что а == 1, 0,9; 0,8 и Л = О, 1, 2, предполагая, что,. стационарное распределение спроса теперь имеет такой вид: р (2) = 0,2, р (3) = 0,8. (25) Я
[Вспомним, что величины /7 +* (Q) вычисляются по приведенным в разд. II. 2 формулам (13) и (15)]. Получаемые в результате однозначные оптимальные стратегии приведены в таблице на рис. II. 4. Отметим, что mis n , Sn, wnDn = Sn — sn не являются монотонными. Обратим внимание также и на то, что при уменьшении а как sn, так и Sn уменьшаются, в связи с чем наблюдается тенденция откладывать решение о размещении заказа на более поздний срок и уменьшать размер заказываемой партии. Иными словами, чем меньше значение а, тем сильнее ощущается тенденция отодвигать затраты на пополнение запасов на более поздний срок. Наконец, отметим, что при возрастании К увеличивается как sn, так и Sn. г ) То есть стоимость реализации запасов по пониженным ценам в случае возникновения излишков.— Прим. персе.
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
А, = 0 а=1 « п . •?„, #п
1 2 3 4 5 6 7 8 9 10
1, 3, 2 3, 6, 3 2, 8, 6 2, 11,9 2, 6, 4 2, 9, 7 2, 9, 7 2, 9, 7 2, 9, 7 2, 9, 7
а=1
а = 0,9
а = 0,8
%, ^71!
Sn, "Л!
071
Яд
1, 2, 2, 1, 2, 2, 2, 2, 2, 2,
3, 6, 8, 6, 6, 8, 6, 8, 8, 8,
429
2 4 6 5 4 6 4 6 6 6
1, 2, 2, 1, 2, 1, 2, 2, 2, 2,
3, 6, 8, 6, 6, 6, 6, 6, 6, 6,
2 4 6 5 4 5 4 4 4 4
Я=1 "П-1>
^= 2
"П-1,
s
A.-I
n-2, ^П-2,
Dn-2
_
3, 5, 5, 4, 5, 5, 4, 5, 5,
6, 9, 11, 13, 9, 11, 12, 9, 11,
_ 3 4 6 9 4 6 8 4 6
6, 8, 8, 7, 7, 8, 7, 7,
— 9, 11, 14, 16, 12, 14, 14, 14,
3 3 6 9 5 6 7 7
Примечание. Dn = Sn — s n , re — число отрезков до конца планового периода. Количественные показатели: ./£ = 24, с = 1, ft = 2, я = 10, ) = 0,8. Р и с . II. 4. Стохастические модели.
В качестве последнего примера вновь рассмотрим задачу с теми же исходными данными, что и (13), но положив h = 4 и сохранив допущение (14) о детерминированном спросе. Применив рассматриваемый алгоритм, нетрудно убедиться в том, что оптимальными стратегиями (sn, Sn) являются
(1, 3) (1, 6) (1, 9) при п = 1, 3, 5, 7, . . ., (2, 6) при п = 2, 4, 6, 8, . . .,
(26)
где п — число отрезков до конца планового периода. Обратим внимание на то, что при нечетном п не только возникает неоднозначность в выборе оптимальной стратегии, но и наблюдаются устойчивые колебания значений sn между 1 и 2. Следовательно, когда до конца планового периода остается п отрезков и на текущем отрезке /„ = 1, заказ размещается, если п четное, и не размещается, если п нечетное. Как будет показано ниже, (2, 6) становится единственной оптимальной стратегией, если плановый период имеет бесконечную протяженность. Предположим, что при любом п в (26) принимается Sn = 6. Рассмотрим случай, когда уровень запаса на начальном отрезке равен 1. Тогда при немедленном размещении заказа, т. е. когда
430
ПРИЛОЖЕНИЕ II
s = 2, получающаяся последовательность размеров заказываемых партий имеет вид (5, 0, 6, 0, 6, 0, 6, . . .), а последовательность уровней запаса на концах отрезков — (3, 0, 3, 0, . . .) независимо от того, чему равно значение s (1 или 2) на оставшихся отрезках. Таким образом, соответствующая последовательность затрат на пополнение запаса такова: К + 5с + 3/г, О, К + 6с + ЗА, О, К + 6с + З/i, О, ... (П) (на начальном отрезке s = 2). Если на начальном отрезке принять s = 1, то получится следующая последовательность размеров заказываемых партий: (О, 8, 0, 6, 0, 6, . . .); при этом последовательность уровней запаса на концах отрезков будет ( — 2, 3, 0, 3, 0, . . .) независимо от того, чему равно значение s (1 или 2) на оставшихся отрезках. Поэтому последовательность затрат, связанных с пополнением запаса, имеет в этом случае вид 2р, К + 8с + ЗА, О, (К + 6с + 3h, О, К + 6с + 3h, . . . (HI) (на начальном отрезке s = 1). Рассмотрим экономические показатели примера, для которогооптимальна стратегия (26). Этими показателями являются К = 24, с = 1 , / £ = 4 и я = 10. Суммируя соответствующим путем затраты, представленные в (II) и (III), приходим к следующему выводу: если продолжительность планового периода Т содержит четное число отрезков, то выгоднее размещать заказ на начальном отрезке (s = 2), нежели откладывать его на один отрезок (s = 1). Если же Т содержит нечетное число отрезков, то такая стратегия невыгодна. Предположим теперь, что плановый период бесконечен, и введем коэффициент дисконтирования а. Тогда, используя в качестве стационарной стратегии (s. S) = (2, 6), мы приходим к следующей дисконтированной сумме всех видов затрат: (IV)
_
а применив стратегию (s, S) — (1, 6), будем иметь ИДЭ [1} = 2р + а(К + 8с + Щ+ «2^+^
.
(V)
п р и а = 1,
(VI)
Таким образом, при заданных значениях параметров
откуда следует, что стратегия (s, S) = (2, 6) является более эффективной.
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
431
Доказательство оптимальности (s, $)-стратегии. Доказательство того, что при указанных выше допущениях (1) и (2) (s, ^-стратегия оптимальна, важно в двух отношениях. Ясно, что такое доказательство нужно для подтверждения справедливости самой теоремы. Однако этот вопрос представляет интерес лишь для математиков, так что одной только этой причины явно недостаточно, чтобы подобного рода доказательство было включено в учебное пособие по исследованию операций. Вместе с тем доказательство теоремы об оптимальности (s, 5)-стратегии является ярким примером использования так называемого индуктивного метода рассуждений, применение которого к рекуррентным соотношениям динамического программирования иногда приводит к очень поучительным выводам относительно вида оптимальной стратегии. Доказательство теоремы об оптимальности (s, ^-стратегии приводится здесь именно в силу второй причины. Случай, когда все Kt = 0. доказан полностью, а для более общего случая указаны лишь идея и схема доказательства. Приступая к доказательству упомянутой теоремы методом индукции, предположим, что при заданном t функция g (£) в(8)является выпуклой, т. е. gt (У + 1) - gt (У) > gt (У) -gt(y- 1) (27) [при любых целочисленных значениях у, и
gt (у} ->• °° при | у | -v оо. Как и на шаге 1, будем считать, что St является значением у, минимизирующим gt (у). Предположения относительно характера функции gt (у) и условие Kt = 0 позволяют на шаге 2 убедиться, что st = St и что при j < st оптимальная стратегия заключается в размещении заказа на St — j изделий, а в противном случае — в отказе от размещения заказа. Итак постулат о выпуклости функции gt (у) и условие Kt = 0 позволяют пока лишь сделать вывод, что оптимальная стратегия принадлежит к классу (sj, St) при st = St. В дальнейшем доказательство сводится к тому, чтобы установить выпуклость функции gt -1 (У) и показать, что при | у \ —>- оо функция gt-\ (У) ->- °°Рассмотрим сначала случай / ^ st — 1. При этом с помощью (5) и с учетом равенства st = St имеем 1i(j) = gt (st) — ctj = — ct (st — /) +
+ ^ (st) + a 2 /m (st - q) pt (q). q=0
(28)
В силу (5) выражение (28) справедливо и при / = st. Следовательно, согласно (28), при ;^5 г — 1 будет справедливо соотношение / * ( / + ! ) - ft (J) = ~ct = ft (J) -it (I- 1).
(29)
432
ПРИЛОЖЕНИЕ П
откуда вытекает, что функция / ( (;) выпукла при указанных выше целочисленных значениях /'. Рассмотрим далее случай, когда j ^ st. При этом с помощью (5) и с учетом предположения о выпуклости gt (у) получим
it a +i)-/ ( о) = gt а + 1) - е* (/) - ct > >gt(j)-gt(i-i)-ct.
(30)
Если ]'^> st, то после упрощения правой части соотношения (30) будем иметь
/* (/ + 1) - ft (i) > ft (i) -h (i- i).
(3i)
Если же / = s f , то, поскольку у — st = St минимизирует функцию gt (j/). gt (st +V-gt (st) ~ct>-ct= itl(st) - ft (st - i).} (32) Таким образом, из (29)— (32) следует, что функция"^ (/) выпукла при всех целочисленных значениях /. Из доказательства выпуклости / ( (у) вытекает, что функция a f t (] — (?) Pt -i (?) выпукла при любом q. Поскольку сумма выпуклых функций есть также выпуклая' функция, мы можем сделать вывод, что функция со
gt-i (У) = ct-i (у) + Lt-i (у) + a S ft (У — q) Pt-i (д) =0
(33)
7
является выпуклой. Далее, поскольку в силу допущения (2) [сг _4 — — act] у -{- Lt-i (у)] -*- оо при (у) -v оо, можно показать, что gt+i (У) -> оо при \у\ ->• оо также стремится к бесконечности. Доказательство методом индукции выпуклости gt (у) при всех значениях t и того, что при | г/| —»- оо функция gt (у) —>• оо, можно будет считать полным, если показать, что при t — Т (конец планового периода) функция gt (У) = СтУ -f LT (у) (34) выпукла и gT (у) -> оо при | у | -> оо. Но в силу (2) это действительно имеет место. Точно такой же индуктивный метод рассуждений можно использовать и в случае, когда все Kt ^ 0. Правда, для этого нужно предварительно обобщить (27), предположив, что функция gt (у) в (7) при целочисленном значении у удовлетворяет условию так называемой Kt-выпуклости: [gt (y}
gt (У + а) - gt (У) + Kt>^ ~8t(y- b)], (35) где а и b — произвольные положительные целые числа. Для применения метода индукции требуется, чтобы свойство (35) выполнялось при любом заданном t. Можно доказать, что из (35) следует, что оптимальная стратегия на отрезке t принадлежит к классу (st, St)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
433
и определяется на шагах 1 и 2 рассмотренного выше алгоритма. Для завершения доказательства необходимо установить, что функция gt+i (у) обладает свойством Kt _ г выпуклости. II.5.
СЛУЧАЙ НУЛЕВЫХ НАКЛАДНЫХ РАСХОДОВ
Предположим, что модель, описанная нами в предыдущем разделе, имеет еще более частный вид, а именно исключим из рассмотрения накладные расходы Kt, так что c t ( x ) =ct-x (s>0), (1) где ct ^ 0. Допустим далее, что если какое-либо из изделий сохраняется в запасе до конца планового периода, то его можно реализовать по остаточной стоимости ст+1 за изделие, а если какие-либо заказы оказались к этому моменту еще невыполненными, то поставки данного изделия в счет этих заказов производятся по той же цене cT+i за изделие. Заметим, что здесь принимается cT+i ^ 0. Следовательно, приведенное в разд. П.З общее рекуррентное соотношение динамического программирования (9) будет выглядеть иначе, так как мы полагаем /т+1 (Т) = —Cr+iJ-
(2)
Теорема об оптимальности (s, <5)-стратегии остается справедливой и при этих новых допущениях. Во многих случаях, когда K:t = О (при любом значении t), можно найти оптимальное значение st — St гораздо более простым способом, чем описанный в предыдущем разделе. В сущности этот способ сводится к нахождению решений для последовательности статических (или однопериодных) моделей, рассмотренных в разд. 19.4. Разумеется, допущение (2) может приводить к значениям (st. St), отличным от значений, получаемых при условии / г+1 = 0, особенно на отрезках, близких к концу планового периода. (Объяснение причины возникновения такого рода ситуаций возлагается на читателя.) Однако если плановый период Т достаточно велик, то условие (2) обычно оказывает пренебрежимо малое влияние на стратегию заказов на текущем отрезке, особенно тогда, когда а
434
ПРИЛОЖЕНИЕ II
Если
то
_ y~t < yt+i
при всех t = 1, 2, . . ., Т — 1,
(4)
(5)
st = St= ~yt-
Величину yt часто называют оптимальным критическим числом для отрезка t. Справедливость (5) можно обосновать следующими соображениями. Предположим, что последовательность оптимальных критических чисел (st = St) такова, что st ^ st+i при любом t ^ Т — 1. Тогда дополнительные затраты на закупку (st — у) изделий на отрезке if вместо (st — 1 — ;') изделий составят всего (ct — acf+1), поскольку дополнительная единица в противном случае все равно будет закуплена на отрезке t -\- 1, независимо от уровня спроса на отрезке t при условии, что st+i^st. Следовательно, если st^.st+i при всех t ^ Т — 1, оптимизацию можно выполнить при £= 1, 2, . . . , Т — 1 на отдельных независимых отрезках, где минимизируется приращение затрат на закупку изделий в сумме с ожидаемыми затратами на содержание запасов и штрафными потерями. (Заметим, что наше рассуждение становится неправомерным при s( > s i+ j. В этом случае дополнительное изделие, заказанное на отрезке t, возможно, и не удастся поставить заказчику на отрезке £ + 1, поскольку эта возможность будет зависеть от уровня спроса на отрезке t.) При t = Т допущение (2) оправдывает использование в качестве оценки затрат, связанных с реализацией заказа, выражения (с т — асг+1). В предыдущем абзаце, в сущности, было показано, что если условие st ^ st+\ при всех t ^ Т — 1 действительно является оптимальным, то минимизация (3) дает значение st. Однако более удобным было бы доказательство утверждения, что если неравенства (4) выполняются, то условие (5) является оптимальным. Этот результат более подробно обсуждается ниже. Предположим, что затраты на содержание запаса и штрафные потери линейны, так что
I — Q)pt, t+i,(Q) + Zj n ti-K'(Q — y)pt, m() при г/>0, ^Q=0
приг/<0.
nt+}.-(Q — y)pt,t+K(Q)
Тоща yt есть наименьшее из целых чисел, удовлетворяющих условию ~Jt
+Л Г Q=0
"
+л
(линейные затраты—нестационарный случай).
(7)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
435
Как ведет себя yt при возрастании ni+^ и при_возрасташш ht+),? Как влияет покупная цена изделий на значение г/ ( ? Если, кроме того, все экономические показатели и распределения вероятностей стационарны, то (7) сводится к следующему соотношешло:
V 1 (0>- я Г, (линейные затраты — стацио(8) Я Q_O нарный случай). Какова тенденция изменения yt при возрастании Я? Отвечая на этот вопрос, читателю следует оценить, что произойдет, если вероятность в левой части (8) аппроксимировать статистической функцией нормального распределения. Предположим, что а — 1. Какое влияние оказывает покупная цена с на yl Насколько рациональна при этом такая стратегия, скажем, на последнем отрезке конечного планового периода? Таким образом, алгоритм отыскания оптимальных критических чисел можно сформулировать следующим образом: Шаг 1. Вычислить yt (t = 1, 2, . . ., Т) по формуле (3). Шаг 2. Проверить, выполняется ли условие yt ^ yt+i при всех t = i, 2, . . . , Т — 1. Если выполняется, то принять st = St = yt. В противном случае применить алгоритм, рассмотренный в разд. II. 4. Во многих важных случаях указанное выше неравенство (т. е. Ht ^ yt+i при любом t= 1, 2, . . ., Т — 1) действительно выполняется на шаге 2. Так, например, это всегда имеет место, если постулировать полную стационарность (8); при этом все yt одинаковы. Следовательно, как только уровень запасов падает ниже значения у, определяемого (8), всегда следует заказывать столько изделий, сколько их требовалось на предшествующем отрезке. Более того, в этом случае значение у, найденное с помощью (8), является также оптимальным и при бесконечном плановом периоде и при любых значениях а в интервале 1 ^ а ^ 0. Этот вопрос будет подробнее рассмотрен в следующем разделе. Если предположить, что распределение вероятностей спроса и покупная цена ct стационарны, а штрафные потери ni+^ в (7) возрастают во времени по отношению к ht+^, то yt ^ yt+1 при любом значении t. Объяснение этого факта возлагается на читателя. Какое количество изделий выгодно при этом заказывать на каждом отрезке? Как указывалось выше, шаг 1 не сложнее задачи отыскания оптимума для статической модели, описание которой дано в разд. 19.4. В сущности при Я = 0 и а = 0 оба метода идентичны. В конце разд. II. 3 указывалось, что при Я = 0 задачу с потерей заказов можно также решить с помощью простого рекуррентного соотношения динамического программирования. Предполагая далее,
436
ПРИЛОЖЕНИЕ II
что KI = 0 при любом значении t, приходим к выводу, что стратегия, основанная на использовании критического числа, является оптимальной. Если Lt (у) определяется формулой (6) и yt есть наименьшее из целых чисел, удовлетворяющих условию "t
pt (ч) ^> г-*- (мгновенная поставка — линейSо п\ч1^ ^_hг-—a,c „ ные затраты — случаи с потеv
nt
t
т. (I)
t+i
д=
рей заказов),
то yt есть оптимальное критическое число при условии, что выполняется (4). Докажем теперь справедливость алгоритма оптимального критического числа. В частности, положим, что yt есть такое значение у, для которого min [(ct — act+i) y + Lt (у)] =
= (ct - cccm) yt + Lt(yt)
при t = 1, 2, . . . , Т
(II)
Мы видим, что если yt ^ z/f+i, t — 1. 2, . . . , Т — 1,то st = St = yt. Доказательство можно провести методом индукции. Примем вначале t = Т. Тогда в силу допущений (1) и (2) будем иметь (HI)
9=0
У^З
где как обычно, / т (;) — ожидаемые затраты, соответствующие оптимальной стратегии, когда начальный уровень запасов на отрезке Т равен /. Если стратегия критического числа оптимальна в смысле (III), то ST = ST есть (оптимальное) значение у, найденное из условия минимизации min [ст • у + LT (у) — аст+i , у], (IV) у что согласуется с (II). Следовательно, ут = ST = ST, как и утверждается в формулировке алгоритма. Следовательно,
CT • (Ут — У) -i- LT (ут) — ос 2
ст+1 • (ут — q) Рт (q)
при / < г/т, (V)
при 7>z/r-
(q) Пусть по определению + i
•(/) = —сг/' + йт(Ы-
y
T
— q) рт (q),
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
437
Если у т определяется из условия минимизации (IV), легко убедиться, что _ d
r (i) = /т (/) при ; < #j-
d
Следовательно,
T (/) г (/)
П
Р
И
/ > У т-
min [ Сг _! (у - /) + LT-! (у) + а V йт (у - ?) р т _ 4 (д)] < V&3
в=0
(VIII)
00
< min [сг-i (г/ — /) + LT-i (у) + а У, /Г (у — q) pT-i (q)] s= (IX) y^i 9=0 = /r-i(y), (X) где, как обычно, fT_i (/') — ожидаемые затраты, соответствующие оптимальной стратегии в случае, когда начальный уровень запасов на отрезке Т — 1 равен /. Подставив (VI) в (VIII), убеждаемся, что при достаточно малом / в (V) минимизирующее значение у можно найти из условия минимизации min[cT-iy + LT-i(y) — cu:T(y]. (XI) у Согласно предположению, ут-\_ есть решение (IX). Далее, в силу принятого нами допущения ут_^ ^ ут, откуда вытекает, что г/ г _ 4 — q ^ Ут при q ^ 0. В итоге d
T (Ут-i — q) = /г (Ут-i — ?)
при g > 0.
(XII)
Теперь оправдано представление (VIII) и (IX) в виде оо
Сг-i (г/г-1 — У) + LT-I (ут-i) + « S 1т (УТ-I ~ q) PT-I (?) < g=0
оо
< min [сг-i (г/ — j) + LT-i(y) + a Ц /Г (г/ — g)p r _! (q)], У=гз
9=0
(XIII)
откуда следует, что yT-i есть оптимальное значение у в правой части (XIII) при достаточно малом значении /. Итак, поскольку стратегия критического числа оптимальна, будем иметь г/ г _! = = s r _ j = iSy-i, что и требовалось доказать. Справедливость алгоритма в целом устанавливается с помощью аналогичных рассуждений при t— Т — 2, Т — 3, . . . , 1. II.6. МОДЕЛЬ С БЕСКОНЕЧНЫМ ПЛАНОВЫМ ПЕРИОДОМ Примем здесь те же допущения относительно функций затрат, что и в разд. II. 4. Однако при этом будем считать, что экономические параметры модели и распределения спроса стационарны на бесконечном плановом периоде. Пусть, в частности, выполняются следую-
438
ПРИЛОЖЕНИЕ II
щие условия: ГО при х = 0, c(x) = \t. . „ где Я>0 и с>0, 4 ' [К + сх при ж>0 L (i/) есть выпуклая функция, с (1 — а) у + L (у) -+- оо при | у | -> оо
(1) ' (2) (3) v
Можно доказать справедливость следующей теоремы. Оптимальность стационарной ( s ,^ - с т р а т е г и и . Если задана модель, описываемая рекуррентным соотношением (9) из разд. II. 3, в которой экономические параметры удовлетворяют условиям (1), (2) и (3) при 1 ^ а ^ 0, то существует оптимальная (s, 5)-стратегия, при которой st = s и St = S при любом значении t на бесконечном плановом периоде. Кроме того, если при любом значении t выполняется условие Kt = К = О, то s = S. [Эта теорема остается справедливой и в том случае, когда условие (2) ослабляется и заменяется лишь требованием унимодальности — [с (1 — а) у + L (у)] (см. в разд. 14.3).] Схема вычисления оптимальной (s, 5")-стратегии оказывается весьма сложной (за исключением случая, когда все Kt = 0). Эта схема изложена в следующем разделе. В данном же разделе проводится анализ чувствительности (s, ^-стратегий к изменению значений экономических показателей и к вариациям распределений вероятностей спроса. Приводятся также метод вычисления оптимальных значений (s = S) в случае, когда Kt — О при всех значениях t, и метод определения (s, ^-стратегии, близкой к оптимальной, который основан на аппроксимации нормальным распределением. При а <С 1 существует однозначное решение функционального уравнения динамического программирования 9=0
которое получается в результате надлежащего обобщения приведенного в разд. П.З рекуррентного соотношения (9) на случай бесконечного планового периода. Если предположить, что сформулированная выше теорема справедлива и в данном случае, т. е. оптимальная стратегия имеет вид (s, S), то функция / (;') должна удовлетворять в случае оптимальной (s, 5)-стратегии следующим соотношениям: оо
-j) + L(S) + a S f(S-g)P(q)
при
S /(/-g)p(g) g=0
при />*.
j<s, (И)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
439
При а = 1 аналогичное экстремальное уравнение имеет вид y^j
g=0
где g — ожидаемые затраты на одном отрезке при оптимальном выборе стратегии. Предполагая, что теорема справедлива и в этом случае, получаем, что g (j) и g должны в случае (s, ^-стратегии удовлетворять условию при
g(j)+~g =
| и \п т _ . 9=0
Анализ на чувствительность. Пусть а = 1, а ожидаемые затраты на содержание запасов в сумме со штрафными потерями имеют вид у
Q=0
^ '
Q>V
при
(4)
1/<0.
Поскольку весь спрос в конечном счете удовлетворяется, ct = с и ее = 1, то значение с не влияет на оптимальность стратегии, и, следовательно, эту величину можно из дальнейшего рассмотрения исключить. Далее, один из параметров затрат, скажем h, можно пронормировать, т. е. принять h = 1,
(5)
поскольку стратегия, оптимальная при затратах (К, h, я), остается оптимальной и при любых затратах, кратных указанным выше, например при затратах (2К, 2h, 2л). В широком диапазоне значений экономических показателей и распределений спроса наблюдаются следующие закономерности: s, S, (S — s) возрастают при увеличении К; S, (S — s) возрастают при убывании s и возрастании К; (6) s возрастает, a (S — s) убывает при возрастании я; s возрастает при увеличении Е [q]. В качестве примера в таблице на рис. 11.5 показано, что S не обязательно возрастает при росте я или Е [q], a (S — s) не обязательно увеличивается при уменьшении Е [q]. Второй пример, приведенный в таблице на рис. II.6, показывает, что (S — s) не всегда возрастает с увеличением Е [q]. Обратите внимание на то, что при увеличении значения Е [q] с 22 до 23 имеет место некоторое уменьшение
ПРИЛОЖЕНИЕ II
440
(S — s), а при увеличении значения Е [q] от 61 до 63 значение (S — s) резко убывает. То обстоятельство, что значение (S — s) существенно уменьшается при достаточно большом возрастании Е [q], свидетельствует о значительном различии между рассматриваемыми в данном приложении моделями с периодическим контролем и моделями с непрерывным контролем, изучению которых посвящена гл. 19. В случае непрерывного контроля по мере роста математического ожидания нормы спроса размер заказа (S — s) всегда увеличивается, а интервал между Пуассоновское распределение # = 64, А = 1, я = 9, Я =0 Пуассоновское распределение я =4
я = 99
E[q]
s,S,S~s s, S, S — s
49
35, 100, 65 56, 116, 60
64
46,131,85 72, 83, 11
Р и с . II.5. Анализ на чувствительность.
Е(д] 21 22 23
24 59 61 63 64
S,
S, S — s
16, 65 , 49 17, 68 , 51
18, 19, 52, 53, 55, 56,
52 , 54 , 126 , 131 , 73 , 74 ,
34 35 74 78 18 18
Р и с. II.6. Вариации значений S — s.
последовательными заказами уменьшается. В случае же периодического контроля по мере роста Е [q] вероятность того, что заказ на пополнение запаса будет размещаться на каждом отрезке, становится в конце концов близкой к 1. Следовательно, поведение системы таково, что как бы выполняется условие К = 0, т. е. s = S. В рассматриваемом ниже частном случае оптимальное значение (S — s) в точности совпадает с величиной ЭВРП, определяемой по формуле (8) из разд. 19.5 для детерминированной модели экономически выгодных размеров заказываемых партий. Предположим, что а = 1, А, = 0 и что р (q) совпадает с плотностью экспоненциального распределения, т. е. qm
р (q) = me~
при q > О, Е [q] = 1/m.
(I)
Пусть одновременно L (у) имеет такую же структуру, что и (4), и отличается от (4) лишь заменой суммирования интегрированием. Тогда оптимальные значения s и S определяются следующими соот-
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
441
ношениями:
s-,=-/t
[q]
e
-sm _
Я-
Случай JL = 0. Если К = 0, тогда процедура выисления s = S будет аналогичной вычислениям, приведенным в разд. П.5. В частном случае, когда L (у) задается приведенной выше формулой (4), величина у = s = S является наименьшим целым числом, удовлетворяющим соотношению
Q=o
i
Если L (у) относится к более широкому классу функций, то величину у можно найти как
12
52
365
0,01 0,9992 0,9998 0,9999 0,05 0,9959 0,9991 0,9999 0,15 0,9884 0,9973 0,9996 0,20 0,9849 0,9965 0,9995 0,25 0,9816 0,9957 0,9994 0,30 0,9784 0,9950 0,9993
min [(1 — ее) су-г L (у)](8) v Случай К > 0. Полный алгоритм эффективного вычисления стратегий при бесконечном плановом периоде кратко описан в еле- р и с. II.7. Значения дующем разделе. Однако в целом ряде реаль- коэффициентов дисконных ситуаций можно применить очень прос- тирования. той приближенный метод оптимизации. Предположим, что ожидаемые затраты на содержание запасов и ожидаемые штрафные потери имеют вид (4). Пусть также а = 1, что (как это видно из таблицы на рис. П.7) является вполне приемлемым допущением в большинстве случаев применения модели. В этой таблице приведены значения а при различных значениях годовой нормы процента для условий, когда год разбивается на 12, 52 и 365 отрезков контроля. Излагаемый метод основан на аппроксимации истинного распределения нормальным. Он аналогичен методу, использованному для модели с непрерывным контролем, описание которого дано в разд. 19.5. Пусть Е [g] = M, Var [q] = V (9) и, следовательно, E[qt+...+qt^] = (K + i)M,
Var[gi+...
| = (X+1)F. (10)
Определим
(11) откуда
(12)
442
ПРИЛОЖЕНИЕ II
Обозначим нормированную статистическую функцию нормального распределения вероятностей через и
PN(u)= J
(13)
*e~^dt,
— 00
а нормированную интегральную функцию потерь, соответствующую нормальному распределению, — через
(14) Значения Р N (и) и I N (и) приведены в таблице на рис. 19.6. Приближенный алгоритм оптимизации формулируется следующим образом: Шаг 1. Вычислить ЭВРП = (2KMIh)ll\ (15) Шаг 2. Вычислить _ V
N
'
и найти такое значение us, для которого (17)
IN Ы = Ry.
Шаг 3. Если М < 0,8888 K/h, то принять, что (s, 5)-стратегия определяется значением s, вычисленным с помощью (12), и значением S = s -\- ЭВРП. В противном случае перейти к шагу 4. Шаг 4. Вычислить и найти такое значение vs, для которого Определить
PN (У.) = Я-
(19)
ws == min (w s f s ).
(20)
и найти (s, ^-стратегию с помощью следующих формул:
* = (К + 1) М + ws /(Я, + 1) Г,' 5 = (^ + 1) М + min [и,У(К + 1)У + ЭВРП, v.Yfr
(21) + VV].
(22) Обоснование шагов 1 и 2 сопряжено с использованием слишком сложного математического аппарата и выходит за рамки данной книги. Отметим лишь, что оно основано на анализе поведения функции ожидаемых затрат при возрастании значений К и л. Проверка на шаге 3 (М < 0,8888 K/h) позволяет установить, выполняется
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
443
ли неравенство ЭВРП/М > 1,5 отрезка. Если ЭВРП/М ^ 1,5, то на шаге 4 по формулам (18) и (19) вычисляется стратегия, являющаяся близкой к оптимальной стратегии критического числа, определяемой (7). Приближенное значение s, найденное по формуле (21), является наименьшим пробным значением s, определяемым по us из (17) и vs из (19). Аналогично приближенное значение S, найденное по формуле (22), является наименьшим из пробных значений S, определяемых, с одной стороны, по us и ЭВРП и, с другой — по vs. Ряд примеров применения такого приближенного алгоритма приведен в таблице на рис. П. 8 (использованные при этом числовые данные позволяют сравнить полученные результаты с результатами, приведенными в таблице на рис. 19.7, которые отражают применение такого же метода в случае модели с непрерывным контролем). Проиллюстрируем «работу» алгоритма, взяв в качестве исходных данные случая 1, представленного в таблице на рис. II. 8, а именно h = 1, л = 9, К = 32, Я, = О, М = 9, 7 = 9. (23) В соответствии с шагом 1 ЭВРП = ' \ / - - = 24.
(24)
Тогда на шаге 2 получаем - = 0,889.
(25)
И, следовательно, с учетом данных таблицы на рис. 19.6 имеем и. = -0,75. (26) Поскольку 9 < 0,8888 (32/1), ЭВРП = S — s = 24, s = 9 — 0,75 V9 « 7, 5=31. (27) Как видно из таблицы на рис. П. 8, оптимальной является стратегия (7, 28). Предположим теперь, что М = V = 36. Тогда ЭВРП = 48, Як = 0,889, и. = -0,75. (28) Поскольку 36 > 0,8888 (32/1), вычислим R = 0,9, vs = 1,3. (29) Следовательно, ws = min (-0,75, 1,3) = -0,75. (30) Таким образом, s = 36 —0,75-6 »33, S = 36 + min [-0,75-6 + 48; 1,3-6] « 44, (31) что является точной оптимальной стратегией при пуассоновском распределении.
Случай
Приближение с помощью нормальПараметры, зна- ного распределечения которых ния варьируются
s
S
S —s
7
31
я = 99
12
Я = 64
s
S
S —s
24
7
28
21
36
24
13
33
20
5
39
34
6
37
31
я = 99 Я = 64
11
45
34
12
42
30
Л/ = 16
13
45
32
14
37
23
Я= 4
45
69
24
1 45
68
23
F = 90 (отрицательно биномиальное)
11
35
24
10
33
23
—
103
148
45
105
148
43
я=9
82
127
45
82
128
46
# = 32
105
137
32
107
137
30
я =9 Я = 32
86
118
32
85
117
32
Ж =8
56
88
32
58
90
32
А, = 0
24
69
45
25
65
40
F = 16 (пуассоновское)
91
136
45
92
131
39
—
1
2
Оптимальные значения
Исходный вариант значений параметров модели: Случай 1: й = 1, я = 99, ЛГ = 64, с = 0, А. = 4, отрицательно биномиальное распределение, Л/ = 16, F = 48 Случай 2: Л = 1, я = 9, ^ = 32, с = 0, А = 0, пуассоновское распределение, М = 9, F = 9 Р и с . II.8. Приближенно оптимальные (s, £)-стратегии.
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
445
Если существует лишь конечное число возможных значений /, то для решения функциональных уравнений (I) и (III), приведенных в начале данного раздела, можно использовать целый ряд методов последовательных приближений, а также метод линейного программирования, описанный в гл. 18. Поскольку в разд. 18.3—18.5 модель управления запасами исследуется как раз этими методами, мы здесь никаких дополнительных иллюстраций не приводим. Подчеркнем лишь, что такого рода методы оказываются эффективными в тех случаях, когда функция затрат на приобретение с (у — j), функция ожидаемых затрат на содержание запасов и штрафных потерь L (у) не удовлетворяют условиям модели, рассмотренной в разд. П.4. Если теорема о (s, 5)-форме оптимальной стратегии выполняется, то можно преобразовать оптимизационную модель таким образом, чтобы учесть ее конкретную структуру при применении методов последовательных приближений и линейного программирования. Другой метод оптимизации описан в следующем разделе. II.7. АНАЛИЗ МОДЕЛИ С ПОМОЩЬЮ МАРКОВСКИХ ЦЕПЕЙ
Марковские цепи были введены нами в рассмотрение в гл. 18 как средство анализа стохастических динамических моделей. Здесь будет показано, как этот инструмент можно использовать для описания поведения системы управления запасами, функционирующей в соответствии со стационарной стратегией вида (s, S). Прежде чем принимать какие-либо допущения относительно структуры затрат, рассмотрим метод отыскания оптимальных стратегий. Вспомним, что yt есть уровень наличного запаса плюс объем заказа, размещенного на отрезке t после принятия соответствующего решения, но до определения объема спроса. При заданной конкретной (s, 6')-стратегии, не обязательно оптимальной, распределение вероятностей спроса индуцирует распределение вероятностей yt. В частности, закон вероятностей перехода имеет вид ж
_( Ut — qt, если qt<.yt—s, \ S в противном случае,
где S ^ yt ^? s в соответствии с (s, 6")-стратегией. Предполагая, что распределение уровней спроса является стационарным, получим соответствующую матрицу вероятностей перехода на одном отрезке, показанную на рис. II.9. Для удобства изложения состояние у = S представлено последней строкой и последним столбцом. Отметим две важные особенности этой матрицы. Во-первых, вероятности перехода, являющиеся элементами матрицы, не зависят от величин s и S по отдельности, а зависят лишь от их разности, т. е. от D = S — s.
(2)
ПРИЛОЖЕНИЕ II
446
Во-вторых, эти вероятности не зависят от К. Пусть г (у) есть стационарная вероятность у.
(3)
Тогда значения г (у) при у = s, s + 1, . . . , S однозначно определяются D + 1 линейными уравнениями п р и £ > г > 1 , (4)
9=1
(5)
2=0
Интерпретация уравнений (4), по-видимому, не вызовет у читателя особых затруднений. [Стационарное уравнение для г (S] опущено, так как оно является линейно зависимым от системы уравнений (4).] S-2 S-1
р(а) p(i) •••
S-2
р(о)
• • •
...
^(q}
"<»*)
•
s •f
p(D-i)
р(1)
р(2)
...
р(о)
Eop(q)
P(D)
p(o)+z. f№
Р и с . II.9. Матрица марковского перехода для (s, 5)-стратегии. Система уравнений (4) и (5) решается просто, о чем нетрудно догадаться, обратив внимание на «треугольную» структуру первых (S — 1) строк и столбцов матрицы, изображенной на рис. П. 9. Прежде всего вычислим по рекуррентным формулам величины
/g\
р(*)+
V;
при z = l, 2, ...,
D
и для любого z рассмотрим величину (z).
(7)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
447
Тогда
В качестве проверки подставим величины, определяемые соотношениями (8), в (4), выбрав лишь несколько значений z, например z = 1, 2 и 3. Можно показать, что • Среднее число отрезковт между последователь- I . ными пополнениями "•" V /> запасов J (9) [-Вероятность пополнения-i . запаса на произвольно = . . L взятом отрезке J Для иллюстрации работы алгоритма рассмотрим пример, когда p(q) = 1/3 при q = 0, 1, 2. (10) В этом случае при z = О, 1, 2 и 3 1
,„ /л\
3
,„,
1+1 (1\
1
т (2)=
„ //I \ _ 3
1 1 /1\ о. ^ М \ Т+"3" \ Т j ' "3 IT)
j
, т (6)-
3 \ 2 /
=
3
9
....
(11)
>
_15 й.
—|
3 Предположим, что Z) = 2, и, следовательно,
М(2) = 1 + |- + 1=|,
1 + М(2)=Н.
(12)
Тогда e _x
д
_ / __ 2 — 27/Г-Т'
/о
о—
9 / 8
-
3
-
3/2
4
Рассмотрим теперь случай, когда Z) = 3. Легко убедиться, что при этом ,.
_
=
,
-
= ,
= .
(14)
448
ПРИЛОЖЕНИЕ II
Рекуррентное соотношение (6) и формулы для стационарных вероятностей (8) можно также получить с помощью метода, применяемого при анализе так называемых процессов восстановления. Этот метод весьма поучителен, так как он позволяет нам найти содержательную интерпретацию величин т (z) и М (г), фигурирующих в соотношениях (6) я (7), а также глубже понять вероятностное поведение (s, 5)-стратегии пополнения запасов. Предположим, что на текущем отрезке размещен заказ на пополнение запасов, и, следовательно, у = S. Тогда следующее пополнение не произойдет, пока совокупный спрос не превысит D. Ожидаемое число отрезков, через которое произойдет это событие, можно найти следующим образом. Пусть Qt
есть совокупный спрос для t последовательных отрезков,
(I) т. е. Qt = и обозначим через М (z) — ожидаемое число отрезков, на которых совокупный спрос остается меньшим или равным z. (II) Для вычисления М (z) введем индикаторную функцию 1, '0
если(?,<; z, в противном случае,
так что М (z) = E[ S It (2)] = 2 E [It (z)] = S P* (z), t=i 1=1 f=i
(III)
где Р1 (2) — статистическая функция распределения f-кратной свертки р (q). Пусть т (z) — ожидаемое число отрезков, на которых совокупный спрос равняется z, и, следовательно, М (z) = т (0) + т (1) + • • • + т (z) = М (z — 1) + т (z).
(IV)
Тогда, учитывая (IV), имеем т (2) = § Р1 (г) - S Р1 (z-1) = f, р* (г), t=i (=1 *=i
(V)
причем m.(z) удовлетворяет так называемому уравнению восстановления оо
т (z) = р (z) + S р (z - g)то().
(VI)
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
449
Поскольку оо
оо
оо
2
т (z) = S р* (z) = p (Z) + 2 Р* (2) = p (z) + S S Р (2-9) Р'-Ч?) t=l
t=2
t=2 g=0
= p(z)-r S P(z-g) 1}р*(д) = Р(*)+1>Р(*-д)т(д), (VII) 9=0
(=1
5=0
нетрудно убедиться, что уравнение восстановления (VI) можно решить рекуррентным способом с помощью (6), начав с z = 0. Поскольку очередное пополнение запаса происходит на отрезке, следующем непосредственно после того, как совокупный спрос превысит D, г Ожидаемое число отрезков меж дут последовательными пополнениями \ = i-\-M(D]. (VIII) L запаса J Следовательно, доля времени, в течение которого система остается в состояниях S — 1,5 — 2, . . ., S — z на этом интервале, составляет
(IX) ?
=0
откуда следует, что при 1<2
(X)
D
г(5) + Дг(5— z) = l,
(XI)
в итоге получаем Операционные характеристики стратегии. При заданном стационарном распределении г (у) легко найти распределения вероятностей других характеристик системы управления запасами. Так, например, положим v (;') — стационарная вероятность того, что уровень наличных запасов плюс объем заказа на начало отрезка t до принятия решения об очередном заказе в сумме равняются /. Тогда
\ + M(D)
~
ПРИ
450
ПРИЛОЖЕНИЕ II
В качестве другого примера рассмотрим величину w (i), представляющую собой определенную на большом интервале долю отрезков, в течение которых уровень наличных запасов на начало отрезка равен i. Тогда и K+i р*+1 ( 5 _i)+ ^P (S-l-x)m (z)
- +M(D)
= S.S-l, S-2, (16)
Отметим, что w (i) зависит от А,. Поскольку весь спрос в конечном счете удовлетворяется, имеем Г Ожидаемое количество, заказанное"] I на любом отрезке J — -МЗЬ Ожидаемый размер закупленной партии при условии ,Л_ I ~~ что имело место пополнение запаса
= Я 1?Н1 + М (£>)]• Оптимизация. При заданных для модели (II. 6) допущениях относительно затрат [см. соотношения (1) и (2) в разд. II. 6] целевая функция принимает следующий простой вид: +2L(S-z)r(S-z),
'
(18)
z=0
т. е. представляет собой ожидаемые затраты на одном отрезке планового периода. Усредненные затраты на закупку изделий, отнесенные к одному отрезку, являются постоянными (равными сЕ [д]) и поэтому из подлежащей минимизации функции затрат исключены [т. е. в выражении (18) не фигурируют]. Для полноты изложения опишем алгоритм отыскания оптимума целевой функции (18) с помощью поиска по D и S. Другим привлекательным вариантом вычислительной схемы является решение задачи оптимизации методом, изложенным в гл. 18, где используется особое свойство (s, 5)-структуры оптимальной стратегии. В зависимости от постановки задачи можно применить метод отыскания оптимального решения, основанный как на использовании процедуры последовательных приближений, так и на использовании аппарата линейного программирования. Для нахождения оптимальной (s, .^-стратегии необходимо минимизировать (18) по D и S.' Общий алгоритм оптимизации формулируется при этом следующим образом: Шаг 1. Вычислить нижнюю и верхнюю оценки s и S, определив тем самым нижнюю и верхнюю оценки оптимального значения D. Шаг 2. Для каждого значения Z?, лежащего между нижней и верхней оценками, найденными на шаге 1, вычислить стационарное
МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ С ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
451
распределение г (v) и найти соответствующее оптимальное значеD ние 5, минимизировав 2 L (S — z) r (S — г). 2=0
Шаг 3. Для каждой из пар D и S, полученных на шаге 2, вычислить соответствующие значения (18) и выбрать ту пару значений (D, S), которая минимизирует (18). Более подробное описание данного алгоритма приводится ниже. Однако здесь нужно отметить следующее: если функция L (у) имеет вид (4) из разд. П. 6, т. е. представляет собой простую линейную форму, оптимальным значением S на шаге 2 будет наименьшее из чисел, удовлетворяющих условию
г=0
где u; (i) определяется соотношением (16). Таким образом, система не обладает портфелем невыполненных заказов, по крайней мере, в течение доли планового периода, равной л/ (я + К), или, что то же самое, оказывается вынужденной откладывать удовлетворение спроса своей клиентуры в течение доли планового периода, не превышающей h/(n + К). Причина, по которой все возможные значения D необходимо «протестировать» в соответствии с шагом 2 рассмотренного выше алгоритма, заключается в том, что по мере возрастания D соответствующие значения целевой функции могут указать на наличие «локальных минимумов» (т. е. локальных экстремальных точек, не совпадающих с глобальным экстремумом функции). Полученные выше формулы легко обобщить на случай дисконтированных стационарных затрат, когда а < 1. Если говорить конкретно, то следует указать, что для такого рода обобщения требуется лишь вычислить
р(*-д)т(9)] при
вместо (6) и к
л
D i
•
VA /1.7 rr
•
. \
i о
\
/TT\
где G (y) = (1 - a) cy + L (y)
(III)
452
ПРИЛОЖЕНИЕ II
вместо (18). Заметим, что при а = 1 выражения (I) и (6), так же как (II) и (18;, идентичны. Аналогом (19) является соотношение
i=0
где w (z) вычислены по формуле (16) с помощью значений, полученных по формуле (I). Пусть (s, S) и (s, S) представляют собой соответственно нижние и верхние граничные значения на шаге 1, так что нижней границей для D является S — s, а верхней S — s. Эти граничные значения определяются следующим образом: S — наименьшее из целых чисел, при котором G (у) принимает минимальное значение; (V) S — наименьшее из целых чисел, удовлетворяющих условию S > S, для которого G (S + 1) ^ G (S) + аК; (VI) s — наименьшее из целых чисел, для которого G (s) ^ G (S) -f- К; '_ ~ (VII) s — наименьшее из целых чисел, для которого G (Г)< G (S) + (1 - а) К. (VIII) D
Поскольку ^ L (S — z) r (S — z) есть выпуклая функция, опе2=0
рация минимизации на шаге 2 может быть выполнена весьма быстро. Для указанной суммы локальный минимум является также и глобальным минимумом, так что при заданном D в качестве требуемого значения S может быть взято наименьшее из целых чисел, удовлетворяющих условию D
D
z=0
z=0
— z ) r ( S — z).
(IX)
При a < 1 в ряде случаев на шаге 2 приходится давать S определенные D приращения, обеспечивающие минимизацию 2 L (S — z) r (5 — г), 2= 0
и учитывать их на шаге 3. Эти дополнительные вычисления гарантируют получение стратегии в (s, 5')-форме; при этом найденная стратегия оптимальна при любом значении суммы начального объема наличных запасов и объема заказа.
ПРИЛОЖЕНИЕ III
Некоторые специальные методы анализа моделей массового обслуживания
III.1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
В данном приложении представлен ряд дополнительных результатов исследования некоторых простых моделей массового обслуживания и, что гораздо важнее, изложены математические методы, с помощью которых анализ такого рода моделей оказывается более эффективным. Прежде всего мы ознакомим читателя с двумя важными понятиями, которые весьма часто используются при исследовании систем массового обслуживания, а именно с понятиями производящей функции и преобразования Лапласа — Стилтьеса. Рассмотрим случайную переменную, принимающую одно из значений ; = О, 1, 2, . . . с вероятностью Р]. Определим производящую функцию данного распределения вероятностей с помощью следующего соотношения: Р- (8) = Р0 + SPt + 52Р2 -1- . . . = 5
3=0
s'Pj,
(1)
где переменная s удовлетворяет условию 1 ^ s 2г —1 и не имеет определенной интерпретации. Заметим, что
Р* (1) = 1, Р* (0) = Р0, ^=2/^-, j=o
(2) (3)
и, следовательно,
j=0
Нетрудно убедиться, что d»P* dsn
= п\Рп
при s = 0.
(5)
Таким образом, зная Р* (s), мы можем вычислить математическое ожидание рассматриваемой случайной переменной с помощью (4), а также, используя (5), вычислить PJ для любого значения / = = 0, 1, 2, . . . .
454
ПРИЛОЖЕНИЕ III
С помощью элементарных алгебраических выкладок можно показать, что если Pj = (l — р) р'
(геометрическое распределение;
1;>р>0),
(6)
то
Аналогично нетрудно убедиться, что при PJ = —~
(пуассоновское распределение)
(8)
будем иметь
при P7-=C?ip'(l—/?)"-' получим а при
Л гр* /„\ (S) _ — е-,-х+^в. ,
(Ц\ \v/
(биномиальное распределение; 1>р>0) Р* (S) = [(1 - р) + ps]",
(отрицательно биномиальное распределение; 1 > р > 0) производящая функция будет иметь вид
•
(10) (11)
(12) 3
«>
Совершенно очевидно, что при т = 1 распределение (12) представляет собой не что иное, как геометрическое распределение, в котором р = 1 — р. Легко показать, что «.-кратное дифференцирование любого из выражений (7), (9), (11) или (13) по s при s — 0 дает п\Рп, что, естественно, согласуется с (5). Рассмотрим теперь неотрицательную случайную переменную х и обозначим соответствующую функцию распределения через G (t) = Р (х < tl
(14)
Определим преобразование Лапласа — Стилтьеса функции G (f) с помощью следующего соотношения: e-stdG(t),
(15)
где s — вещественное число, принадлежащее ограниченному интервалу в окрестности нуля, скажем, интервалу S>s> — S; при этом
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
455
s также не имеет конкретной физической интерпретации. Функцию G* (s) иногда называют производящей функцией моментов, поскольку
= о. Рассмотрим для примера i G (t) = \ \ie-»-wdw (экспоненциальное распределение). о Тогда G*(s) = -^— . V
(16)
(17)
(18)
'
Если х и у представляют собой независимые случайные переменные, то изображение по Лапласу — Стилтьесу функции распределения суммы этих переменных равняется произведению соответствующих изображений, найденных для распределений вероятностей упомянутых случайных переменных в отдельности. Так, например, если рассмотреть t ,, . u (ш#У " е~ ^ш р ,'—тг-. dw (гамма-распределение), (19) (т —1)\
J
представляющую собой функцию распределения суммы М независимых и идентично распределенных (по экспоненциальному закону) случайных переменных, то 4
'
\ \L-\-S
Если же в (19) произвести подстановку \л-^>- Мц,, что приводит к распределению Эрланга
•""*..
(24
для которого
(22) то
"М-
(23)
Функцию распределения при фиксированном времени обслуживания можно рассматривать как предельный случай (21) при М —>-<х>; в чтом случае G* (s) = е~8^.
456
ПРИЛОЖЕНИЕ III
В двух последующих разделах анализируется одноканальная система массового обслуживания в случаях, когда отсутствует предположение об экспоненциальном характере распределения либо продолжителыюстей интервалов между поступлениями, либо длительностей процедур обслуживания. Модель, не содержащая специальных постулатов относительно характера распределения событий как па входе, так и на выходе системы массового обслуживания, рассматривается в заключительном разделе данного приложения. Производящая функция и преобразование Лапласа — Стилтьеса занимают центральное место в арсенале математических средств, позволяющих исследовать наиболее важные операционные характеристики стационарных случайных процессов. При выводе конкретных формул для вероятностных характеристик модели в условиях установившегося режима поведение каждой из рассматриваемых ниже систем массового обслуживания будет описываться с помощью цепей Маркова. Поэтому желающим освежить в памяти основные моменты теории марковских процессов рекомендуется еще раз просмотреть те разделы гл. 18, где приводятся примеры марковских цепей и демонстрируются методы вычисления стационарных вероятностей состояния стохастической системы. III.2. МОДЕЛЬ ТИПА
M/G/1
Одноканальная модель с экспоненциальным распределением продолжительностей интервалов между поступлениями требований и распределением длительностей обслуживания самого общего характера (в символической записи — модель М/G/l) рассматривалась нами в разд. 20.5. Приведенные в упомянутом разделе формулы (29) — (32) позволяют вычислять средние значения ряда операционных характеристик, которые определяются на достаточно большом отрезке времени. Читателю рекомендуется вновь просмотреть соответствующий материал разд. 20.5, включая приведенное в конце этого раздела доказательство формул (29) — (30) [см. (I) — (IX)]. Отметим, что в ходе упомянутого выше доказательства рассматривались лишь те моменты времени, когда очередная процедура обслуживания оказывалась только что завершенной и соответствующее требование как раз покидало систему. Эти моменты времени называются точками регенерации (или восстановления), так как для предсказания последующей эволюции системы в этом случае требуется лишь указать количество требований, находящихся в такие моменты внутри обслуживающей системы, и нет необходимости в подробном знакомстве с предысторией развития процессов в исследуемой системе. Поэтому вероятностное поведение системы в точках регенерации может быть описано с помощью так называемых вложенных цепей Маркова. Прилагательное «вложенные» отражает здесь то обстоятельство, что состояние системы рассматривается только
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
457
в моменты регенерации. Важным является следующее обстоятельство: можно строго доказать, что в случае систем типа M/G/i. вероятности Рп, соответствующие точкам регенерации, определяют одновременно ту долю неограниченного периода времени, в течение которой система находится в указанном состоянии (т. е. состоянии, характеризуемом числом и). Стационарные вероятности Рп относятся к состояниям системы именно в моменты регенерации. Используя обозначения, введенные нами в конце разд. 20.5, будем по-прежнему считать, что h есть число требований, находящихся в системе сразу же после завершения очередной процедуры обслуживания, скажем, в момент Т, an' — число требований, находящихся в системе сразу же после завершения следующей по порядку процедуры обслуживания, скажем, в момент Т'. Пусть / есть число поступлений в интервале (Т, Т'). Тогда, как мы уже установили в разд. 20.5, ( /, ~\ п — 1 + /,
если п = 0, если
гс>0.
^ '
Если Г — Т = h, то C3i /)У е~№
P [ j поступлений | Интервал (Т, T + h)] = Л^_£—
(2)
при условии, что входной поток является пуассоновским со средней частотой поступлений А, (или, как говорят, с параметром Я). (Следует обратить внимание на то, каким образом здесь используется свойство пуассоновского процесса, именуемое отсутствием последействия или отсутствием памяти.) Следовательно, безусловная вероятность Г
l
e
Р [j поступлений] = \ -——- dG (h) == kj, t)
о
(3)
!'
где G (h) — функция распределения длительностей процедур обслуживания. Как будет показано ниже, для некоторых G (h) (например, в случае гамма-распределения) значения kj легко вычислить с помощью обычных приемов математического анализа. Если же приходится сталкиваться с такими распределениями G (h), для которых аналитическое представление интеграла (3) оказывается либо слишком сложным, либо вообще невозможным, для вычисления kj можно применить хорошо известные численные методы интегрирования. Состояния вложенной цепи Маркова характеризуются числом требований в системе в момент регенерации. Следовательно, при заданном п вероятность обнаружения в системе п' требований, где п' удовлетворяет условию (1), определяется вероятностью / поступлений, заданной соотношением (3), и получаемая в результате маркой-
ПРИЛОЖЕНИЕ III
458
екая цепь записывается в виде следующей матрицы: п' требований в момент Т': О 1 2 3 ... 0 k0 ki kz k3 . . . - I 1 k0 ki kz As ... 2 0 k0 ki га требований z 0 0 в момент Т:
k ...
•
•
(4)
•
(Г и Т' представляют собой точки регенерации). Анализ стационарного процесса. Пусть Рг — стационарная вероятность того, что в момент регенерации в системе окажется г требований. Чтобы гарантировать возможность существования стационарного распределения, будем предполагать, что р = КЕ [Длительность процедуры обслуживания] < 1 (5) Тогда при заданной матрице (4) значения Рг должны удовлетворять следующим уравнениям стационарного процесса:
(6)
... PT+ikQ = P0kr
г = P0kr
r+l
5=1
Из (6) методом последовательных подстановок получаем следующие рекуррентные соотношения: Po(l-feo)
(7) r-i
Обратите внимание на то, что для вычисления с помощью (7) численного значения Рг фактически требуется знать лишь значение Р0, т. е. вероятность того, что обслуживающий прибор оказывается неза-
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
459
пятым. Ниже будет показано, что Р0 = 1 — р, где р определяется соотношением (5).
(8)
Для доказательства (8), а также с целью структуризованного описания распределения вероятностей Рт выведем формулу для соответствующей производящей функции. .Рассмотрим последнее из соотношений (6). Умножим левую и правую части (6) на /, в результате чего получим г+1 3=1
Определим производящую функцию К* (s) с помощью соотношения IX
К* (s) =2 s^i- Тогда, просуммировав обе части соотношения, (9) з=о по г (г — О, 1,2, . . .), будем иметь оо Г+1
р* (s) = РОК* (s) + 2- .S s оо
со
P*(s) = P0K*(s)+ ~
_2 5з'-^;- .S slkit
(10)
так что
(производящая функция распределения вероятностей для количества требований в системе обслуживания). Таким образом, нам удалось выразить Р* (s) через производящую функцию величин kj. Функцию К* (s) в свою очередь можно выразить через изображение G (t) по Лапласу — Стилтьесу:
j=0
j=0
-W-'»hdG(h),
(12)
ПРИЛОЖЕНИЕ III
460
Отметим, что из (12) вытекает соотношение dK*(s) _ d~s
. dG*(z) dz~
(13) !=*,(!-S)
и, следовательно, при s = 1 с помощью (13) будем иметь г Количество поступлений Длительность ~ т? за интервал, соответстпроцедуры об=р (14) I вующий одной процеду- =Е Ц] = КЕ служивания Lpe обслуживания поскольку, согласно приведенному в предыдущем разделе соотношению (16), d(z)
2=0
Для нахождения Р0 вычислим предел функции Р* (s), определяемой соотношением (11), при s -> 1. В результате, применив правило Лопиталя, получим = Иш
= Urn
(1)
(15)
С учетом (14) соотношение (15) можно привести к виду (16) -~-. 1 —р *• ' откуда следует, что вероятность обнаружения прибора в состоянии простоя равняется р 0 = 1 — р, что нам и требовалось доказать. Аналогичным образом можно вывести формулу для преобразования Лапласа — Стилтьеса в случае, когда в качестве исходных берутся функции распределения продолжительностей интервалов пребывания требований в системе обслуживания и длительностей ожидания в очереди. Будем считать, что имеет место дисциплина очереди «первым пришел — первым обслуживаешься». Обозначим через U (t) функцию распределения длительностей интервалов пребывания в системе требования, которое покидает систему. Тогда количество требований, которое остается в очереди в момент выхода из системы данного требования, равняется количеству требований, поступивших в систему в течение интервала, равного полному времени пребывания в системе обслуживания рассматриваемого требования. Следовательно, одновременно с (6) имеет место следующая формула для Рг:
^-dU(h),
(17)
так что
= U*[K(l-s)]. г= 0
О
(18)
МЕТОДЫ А Н А Л И З А МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
461
Положив v == К (1 — s), с учетом (5) и (12) мы можем записать (11) в виде (изображение по Лапласу — Стилтьесу распределения продолжителъностей пребывания требования в системе обслуживания). (Соотношение (19) иногда называют уравнением Поллачека — Хинчина; с помощью этого уравнения нетрудно получить формулы (32) из разд. 20.5]. Заметим, что, продифференцировав левую и правую части соотношения (18) по s и положив s = l , мы получим [-Количество требований -\ г Продолжительность пре- -i Е\ в системе обслуживания I = КЕ \ бывания требования в , (20) L J L системе обслуживания -1 что и утверждалось в разд. 20.5 [см. выражение (33)]. Продолжительность пребывания требования в системе обслуживания складывается из продолжительности его ожидания в очереди и длительности процедуры его обслуживания. Пусть W (t) есть функция распределения продолжительностей ожидания требования в очереди; тогда мы можем написать U* (и) = W* (v)-G* (v).
(21)
Таким образом, с помощью (19) будем иметь •(v)
(22) v
'
(изображение по Лапласу—Стилтьесу) распределения продолжительностей ожидания требования в очереди). Примеры. Эффективность использования в ходе выполнения вычислительных процедур производящей функции (И) и изображений по Лапласу — Стилтьесу (19) и (22) зависит от степени сложности самой операции отображения, что в свою очередь определяется структурой исследуемого распределения вероятностей. Пусть, например, распределение длительностей процедуры обслуживания имеет вид « , yif-i -дм G (t) = \ ^ (М_ .у dw о
/гамма-распределение; \ средняя длительность 1 , \обслуживания = М/|д, /
(23)
и, следовательно, согласно приведенной в предыдущем разделе формуле (20),
462
ПРИЛОЖЕНИЕ III
Тогда из (12) следует Положив
мы можем записать (25) в виде
• и, следовательно, с учетом приведенной в предыдущем формулы (13) будем иметь kj = Cii+u.1pi(i-p)M
<27> разделе (28)
(отрицательно биномиальное распределение). При этом
(29) Тогда (11) после несложных алгебраических преобразований принимает вид
Если в (23) положить 71/ = 1 (что эквивалентно переходу к экспоненциальному распределению), формула (30) после некоторых упрощений приобретает следующий вид:
и, следовательно, Р г = (1 — р) рг
(геометрическое распределение;,
(32)
что согласуется с формулой (12) из разд. 20.5. При М = 1, кроме того, с помощью (19) находим (
~ Р . ' ; \ М. + Р /
т. е. получаем изображение по Лапласу — Стилтьесу для экспоненциального распределения со средним значением [л (1 — р). Следовательно, плотность распределения длительностей интервалов ожи-
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
дания в очереди имеет вид р. (1 — р) е-М-М при t > 0, что согласуется с формулой (25) из разд. 20.5.
463
(34)
Если длительности процедур обслуживания характеризуются распределением Эрланга [см. (21) в разд. III. 1], то в (24) — (26) и (30) следует произвести подстановку |я — В случае, когда длительности процедур обслуживания детерминированы, т. е. 1/ji = const (что можно с формальной точки зрения рассматривать как предельный случай распределения Эрланга при М —»- оо ) , мы будем иметь kj—
ре
(пуассоновское распределение),
л
где р = К/ц, и, следовательно, К* (8) = e-PU-s). В этом случае
(I) (П)
(производящая функция распределения вероятностей для количества требований в системе типа M/D/i). Можно показать, что из (III) вытекает
о =^l — P. P 0 При этом G*(s)=e-'№
(изображение по Лапласу — Стилтьесу функции распределения в случае, когда 1 /р. = const), и, следовательно, (22) принимает вид
(V)
W*(v) = - "~
(VI)
-.л!" *
(изображение по Лапласу — Стилтьесу
распределения продолжительностей ожидания требований очереди в системе типа M/D/1). Нетрудно убедиться, что из (VI) следует
i=0
где [\it] представляет собой целочисленную часть
ПРИЛОЖЕНИЕ III
464
Для полноты изложения покажем теперь, как вычисляются стационарные вероятности в случае, когда 1/u, = const, а число обслуживающих приборов равняется S (т. е. когда мы имеем дело с системой MID IS). Рассмотрим состояние системы в моменты времени t, t + 1/u,, t + 2/u,, ..., где t может быть любым; в частности, можно выбрать t = 0. Если в момент Т в системе находится j требований, причем 7 ^ S, то все эти требования будут полностью обслужены к моменту Т + 1/U- Следовательно, количество требований i, находящихся в системе обслуживания в момент Т + 1/u., просто совпадает с количеством поступлений в течение интервала (Т, Г+1/u), которое определяется пуассоновским распределением с параметром р. Если вместо указанного выше условия в момент Т имеет место неравенство / > S, то количество требований в системе к моменту Т + 1/u. составит / — S плюс количество поступлений на интервале (Т, Т н 1/ц). В результате получаем следующую матрицу для марковских переходов, описывающую поведение системы в моменты времени, разделенные интервалом, продолжительность которого равняется 1/ц: Число требований в системе в момент О 1 2 ... S S+ l S+2 0
1
Число требований в системе в момент Т:
2
k0
S
Ад
fcj
/C2 . . .
+1 +2
0
йо
0
0
fts-1 ^S ^Sf 1 k0 . . . fes-2 ^S-l ^S
2S
0
0
0 ...
ki fc2 ...
kg
feg
&S+1
"•S+a
^S+l ^S+2
/«i ...
АО
"-j
(VIII)
"-2
где, как и в (I), (IX)
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
465
Численный метод отыскания стационарных вероятностей для матрицы марковских переходов может быть применен для нахождения Рт. К сожалению, анализ многоканальной модели в том случае, когда не сделано никаких специальных предположений о виде распределения продолжительностей пребывания требований в системе (т. е. анализ модели типа M/G/S), оказывается слишком трудоемким, и его описание здесь не представляется возможным. III.3. МОДЕЛЬ ТИПА GI/M/i
*•)
Метод анализа модели GI/M/i, как и в предыдущем случае, основывается на рассмотрении состояния системы только в моменты регенерации. Однако в противоположность определению, принятому в разд. III.2, мы будем понимать под точками регенерации моменты времени, совпадающие с моментами поступлений новых требований. Конкретизируя схему рассуждений, обозначим через п число требований, находящихся в системе непосредственно перед поступлением нового требования в момент Т, а через п' — число требований, находящихся в системе обслуживания непосредственно перед поступлением нового требования в момент 7" (где Т' >• Т). Пусть j есть число требований, обслуженных системой в течение интервала (Т, Т ' ) , включая требование, поступившее в момент Т при условии, что процедура обслуживания этого требования в момент 7" оказывается полностью завершенной. Ясно, что п' = п + 1 - J, (1) причем имеет место неравенство п -{- 1 ^ п' ~^>. 0. Если длительность интервала между упомянутыми поступлениями равняется h, то Р [/ завершенных процедур обслуживания | Интервал (Т, T-\-h)] =
(2) при условии, что длительности процедур обслуживания имеют экспоненциальное распределение с параметром ц. Следует обратить внимание на то, каким образом нами было учтено одно из свойств экспоненциального распределения, а именно отсутствие памяти. Следовательно, безусловная вероятность Р [j завершенных процедур обслуживания] = оо
f (uifer е~^
= \
.,
, п ,,,
,
di<(h) = kj,
. ,
;-
,0,
(3)
г ) То есть, согласно приведенным выше обозначениям Кендалла, модель с экспоненциальным распределением продолжительностей процедур обслуживания и с входным потоком, характеризующимся плотностью распределения, относительно которой не сделано никаких специальных предположений (другими словами, считается, что входной поток является рекуррентным, т. е. поступления требований статистически независимы и имеют одинаковое распределение).— Прим. перев.
ПРИЛОЖЕНИЕ III
466
где F (h) — функция распределения для длительностей интервалов между поступлениями. Для описания модели с помощью вложенных цепей Маркова будем считать, что состояния системы характеризуются числом находящихся в системе требований непосредственно перед прибытием очередного требования. Тогда при заданном п вероятность обнаружения в системе п' требований [где п' удовлетворяет условию (1)] определяется вероятностью того, что число полностью завершенных процедур обслуживания равняется /; эта вероятность имеет вид (3) и, следовательно, марковская цепь в матричной записи выглядит следующим образом: п' требований непосредственно перед поступлением нового требования в момент Т': О 1 2 3 4 ...
0
1 п требований непосредственно 2 перед поступлением нового тре- 3 бования в момент Т:
1-So
i-Si i-S. \
/C0
0 0 0 /c0 0 0
fci
fta fei fc0 0
^^^
(4)
(Т и Т' — точки регенерации)
где
(5)
Анализ стационарного процесса. Пусть РГ — стационарная вероятность того, что непосредственно перед поступлением в систему обслуживания (в момент регенерации) нового требования число находящихся в системе требований равняется г. Чтобы гарантировать существование для данной системы установившегося режима функционирования, предположим, что J_ __ г. Г Продолжительность интервала"! „ ^ j /g\ Р L между поступлениями J Тогда при условии, что имеет место (4), вероятности Рг должны удовлетворять следующим уравнениям для стационарного процесса: оо
р —V р. ъ. ^j JT j^-^_J/V( j
ЛГ т
i=0
i=0
(8)
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
467
Легко показать, что решение (7) имеет вид Рт = csr,
(9)
где с > 0, а параметр s должен быть подобран таким образом, чтобы одновременно удовлетворялись и (7) и (8). Для нахождения s подставим (9) в (7), в результате чего получим 00
csr = У1 csiJrT~lki,
(10)
г=0
и, следовательно, оО
оо
г=0
г=0
Таким образом, параметр s должен удовлетворять уравнению s = К* (s), (12) где К* (s) — производящая функция kj. Поскольку оо
j=0
оо
.
„-мл
s)},
(13)
О
то, следовательно, (12) принимает вид s = F* [ц (1 - s)].
(14)
Задача, таким образом, сводится к вычислению изображения по Лапласу — Стилтьесу функции F (h), представляющей собой распределение продолжительностей интервалов между последовательными поступлениями требований. Можно доказать, что всегда существует единственное решение s0 уравнения (14), причем такое, что выполняется условие 1 > s0 > 0. Для нахождения с можно воспользоваться (8) или, что эквивалентно, учесть условие нормировки
1=0
откуда получаем с = 1 — «0. Таким образом, Рт = (1 -в„К, г = 0, 1, 2, . . ., [геометрическое распределение со средним значением s0/(l — s0)]. (16) Заметим, что Р0 = 1 — s0. При условии что вновь поступившее требование обнаруживает перед собой п требований, уже находящихся в системе обслуживания, продолжительность времени, которое требование вынуждено провести в системе, включая время его собственного обслуживания,
468
ПРИЛОЖЕНИЕ III
описывается функцией распределения
(17)
*,,
поскольку продолжительности процедур обслуживания лены по экспоненциальному закону. Следовательно,
распреде-
U(t)= 2 U(t\n)Pn = n=0
0
= 1 — e-n(i-»o)t (экспоненциальное распределение со средним значением 1/|я(1 — s0)).
(18)
Рассмотрим вероятность того, что в любой момент t в системе обслуживания окажется г требований; можно показать, что при Т -> оо эта вероятность стремится к следующему пределу:
р? = ppr-i = p(i -«о) «г1, г = 1, 2, . . ., •
/? [Количество требований в системе] = р/(1 — s0), где р определяется соотношением (6). Итак, нами получен весьма важный результат: Р* = Рг лишь при sfl = р, что, как будет показано ниже, имеет место только при пуассоновском входном потоке. При непуассоновском распределении продолжительностей интервалов между поступлениями требований доля неограниченного периода, в течение которой в системе находится г требований (а именно Р*), не равняется отношению числа точек регенерации, в которых количество поступающих в систему требований равняется г, к суммарному числу точек регенерации для всего этого неограниченного периода (т. е. Рг). Следовательно, в этом отношении система GI/M/1 весьма существенно отличается от системы M/GH. Примеры. Допустим, что распределение продолжительностей интервалов между поступлениями требований на обслуживание имеет вид
{ Тогда
M
~^
-f—т^ 1)!
(М
z
~^
dz
значение равняется
/I
(гамма-распределение; среднее М/К).
(Af-1)!
""-~
(отрицательно биномиальное распределение;
(20)
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
469
^ТТГ-
<>
где 22
Следовательно,
<23> Если в (20) М ~ 1, что приводит к экспоненциальному распределению, то s0 = р является решением (12), и стационарное распределение (14), так же как и распределение продолжительностей пребывания требований в системе (16), согласуется с результатами, полученными в разд. 20.5. Если требуется рассмотреть модель, в которой входной поток характеризуется распределением Эрланга, то в соотношениях (20) — (22) К следует заменить на МК, а в формуле (23) необходимо произвести подстановку р —>• Мр. В случае постоянных значений продолжительностей интервалов между поступлениями (т. е. в случае D/M/1) будем иметь К* (s) = е-Ч->/Р. III.4. МОДЕЛЬ ТИПА
(I)
GI/M/S
Метод получения формул, определяющих стационарные вероятности для модели типа GI/M/S 1) представляет собой обобщение процедуры анализа, описание которой дано в предыдущем разделе. В частности, этот метод предполагает рассмотрение точек регенерации, совпадающих с поступлениями новых заявок на обслуживание. Подробное описание анализа модели типа GIIMIS сопряжено с громоздкими математическими выкладками, и мы даем здесь лишь окончательные формулы, которые приводятся ради полноты изложения. Как и в выражении (14) из разд. III. 3, обозначим через s0 однозначно определенное на отрезке 1 > s0 > 0 решение уравнения
s = F* [ц5 (1 - s)],
(1)
где F* — изображение по Лапласу — Стилтьесу функции распределения продолжительностей интервалов между поступлениями, a S — число обслуживающих приборов (или каналов). Определим и *) Согласно приведенным выше обозначениям Кендалла, моделью типа GI/MIS называется многоканальная модель с распределением общего вида для продолжительностей интервалов между поступлениями требований и экспоненциальным распределением длительностей процедур обслуживания.— Прим. пер ев.
470
ПРИЛОЖЕНИЕ III
вычислим
; = 0, 1, 2, .... 5, ;
_
-
.
(2) ,- _ л
о
•'о — —
• i_^* > 7 — *i * _
D
^ 2
Чтобы гарантировать существование стационарного режима, предположим, что ^<^iS, где 1А, — среднее значение продолжительности интервала между последовательными поступлениями требований на обслуживание. Тогда можно доказать, что
Заметим, что при г ^э S распределение Рт является геометрическим. Используя подход, аналогичный уже продемонстрированному нами в предыдущем разделе [см. (17) и (18) в III.3], удается вывести следующие формулы: _ г Продолжительность ~i . W (с) = г [ожидания в очереди] ~
SM(1
Me~ ~' 1— s0
„ г Продолжительность i __ М [ожидания в очереди J ~ 5ц (1 — «0)а '
o)f
/~\ ^'
,о\ ' '
При Т -> оо вероятность того, что в системе обслуживания в момент Т окажется г требований, стремится к пределу:
при г = 1, 2, . . . . 5-1,
при г = 5, 5 + 1, . . . .
(9)
МЕТОДЫ АНАЛИЗА МОДЕЛЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ III. 5. МОДЕЛЬ ТИПА
471
GI/G/i
Основной принцип, из которого исходят при анализе модели GI/G/i l), заключается в следующем: в процессе исследования операционных характеристик системы следует оперировать непосредственно с распределением продолжительностей ожидания в очереди. Обозначим через F (К) и G (К) функцию распределения продолжительностей интервалов между последовательными поступлениями требований и функцию распределения длительностей процедуры обслуживания соответственно. Чтобы гарантировать существование предельного распределения, введем ограничение р = К/ц < 1. Пусть система начинает функционировать в момент t = О, совпадающий с моментом поступления в систему первого требования на обслуживание. Примем следующие обозначения: W? — продолжительность ожидания в очереди для требования г; sr — длительность процедуры обслуживания для требования г; аг — продолжительность интервала между поступлениями в систему требований г и г -f- 1. Поскольку до момента t = О очередь отсутствует, 0 при £ < 0 , Для величин wr можно записать следующее рекуррентное соотношение: ( 0 если • KV + ST-, r+1 \ wr-}-sr — ar, если ar<^Wr + sr. [Истолкование соотношения (2) возлагается на читателя.] Тогда для t > О Wr+i (t) = Р (wr+i ^t} = P [wr+i = 0] + Р [0 < wr+i ^ t], Wr+i (t) = P [wr + (sr - a r )<0] + P [0 < WT + (sr - ar) ^ t], (3) Wr+i (t) = P(wr + (sr - ar) ^ t]. Отметим, что sr и аг характеризуются взаимонезависимыми распределениями вероятностей, а распределение (sr — аг) не зависит от г. Пусть оо
K ( t ) = P[sr— a r <>— оо. (4) о В каждом конкретном случае интеграл в правой части (4) может быть !) Согласно приведенным выше обозначениям Кендалла, моделью типа G//G/1 называется одноканальная модель, в которой отсутствуют какие-либо специальные предположения как относительно распределения продолжительностей интервалов между поступлениями требований на обслуживание, так и относительно распределения длительностей обслуживания.— Прим. персе.
472
ПРИЛОЖЕНИЕ III
вычислен с помощью одного из приемов численного интегрирования 1). Тогда с учетом (3) и (4) будем иметь
Wni(t)=\
K(t — h)dWr(h),
<>0.
(5)
Начиная с (1), мы можем в принципе вычислить с помощью (5) Wr (t) для любого значения г (г = 2, 3, . . .). Если р <; 1, функция Wr (t) при г->- оо стремится к некоторому предельному значению W (t); при этом W (t) удовлетворяет так называемому интегральному уравнению Винера—Хопфа
г>0.
(6)
Один из способов вычисления W(t) заключается в непосредственном использовании уравнения (5), позволяющего рекуррентным способом отыскать Wr (t) для достаточно больших значений г. При любом значении t удовлетворяется неравенство WT+i (t) ^ Wr (t), т. е. ряд Wi, W2, WB, • • • является монотонно сходящимся. [Другой метод вычисления W (t) состоит в использовании дискретных аппроксимаций на ограниченном множестве значений t; например, можно ограничиться выбором на оси времени только М точек (t = Z 4 ; t2', t-л, • • •', tM)]. Тогда задача сведется к решению системы линейных уравнений относительно W (£,) (i = 1, 2, . . ., М), в результате чего можно определить приближенное значение W (t). Для ряда моделей частного характера (например, в случае, когда продолжительности интервалов между поступлениями и длительности процедуры обслуживания описываются распределением Эрланга, т. е. когда имеют место EnIEmli) удается найти аналитическое решение (6). Операционные характеристики. Зная функцию W (t), нетрудно вычислить ^Продолжительность ожидания в очереди]; тогда ожидаемое количество требований, находящихся в системе обслуживания непосредственно перед очередным поступлением, можно получить путем простого умножения ^Продолжительность ожидания в очереди] на (д,. Можно также показать, что при неограниченном периоде функционирования системы массового обслуживания предельная вероятность обнаружения прибора, находящегося на простое, равняется 1 — р. Заметим, что эта вероятность может отличаться от значения, определяемого соотношением (16) для модели из разд. III.3. В этой модели 1 — s0 есть вероятность того, что прибор окажется незанятым в момент регенерации, когда наблюдается поступление нового требования; значения 1 — р и 1 — sa, как нетрудно догадаться, совпадают лишь при s0 = р, т. е. только в случае пуассоновского входного потока. х ) В ряде случаев, когда функции G (t) и F (t) имеют достаточно простую структуру (см. примеры, приведенные в предыдущих разделах данного приложения и в гл. 20), К (t) можно представить и в аналитическом виде.— Прим, перев.
ПРИЛОЖЕНИЕ IV
Таблицы
р
1
0,1
0,1000
0,15
0,1500
0,0104
0,2
0,2000
0,0181
0,25
0,2500
0,0277
0,3
0,3000
0,0391
0,35
0,3500
0,0521
0,4
0,4000
0,0666
0,45
0,4500
0,0826
0,0113
0,5
0,5000
0,1000
0,0151
0,55
0,5500
0,1186
0,0195
0,6
0,6000
0,1384
0,0246
0,65
0,6500
0,1594
0,0304
0,7
0,7000
0,1814
0,0369
0,75
0,7500
0,2045
0,0441
0,8
0,8000
0,2285
0,0520
0,85
0,8500 0,9000 0,9500
0,2535 0,2793 0,3059
0,0606 0,0700 0,0801 0,0909
0,9 0,95 1,00
2
0,3333
3
р = Я/ц —траффик-интенсивность; ц — средняя скорость -средняя частота поступлений; S — число приборов.
4
0,0117 0,0143 0,0171 0,0204
обслуживания;
ПРИЛОЖЕНИЕ IV
474
р 1,0 1,2
1,4 1,6 1,8 2,0 .2,2 2,4 2,6 .2,8 3,0 3,2 3,4 3,6 3,8
4
5
6
7
8
2
3
0,3333 0,4499 0,5764 0,7111 0,8526
0,0909 0,1411 0,2033 0,2737 0,3547
0,0204 0,0370 0,0603 0,0153 0,0906 0,0258 0,1285 0,0404 0,0111
0,4444 0,5421 0,6471 0,7588 0,8766
0,1739 0,2267 0,2870 0,3544 0,4286
0,0597 0,0839 0,1135 0,1486 0,1895
0,0180 0,0274 0,0399 0,0125 0,0558 0,0187 0,0754 0,0270
0,5094 0,5964 0,6893 0,7877 0,8914
0,2361 0,2885 0,3466 0,4103 0,4795
0,0991 0,1271 0,1595 0,1965 0,2382
0,0376 0,0508 0,0669 0,0862 0,1088
0,0129 0,0184 0,0256 0,0346 0,0127 0,0456 0,0175
0,5541 0,6337 0,7183 0,8077 0,9016
0,2847 0,3359 0,3919 0,4525 0,5177
0,1351 0,1650 0,1988 0,2365 0,2783
0,0590 0,0749 0,0935 0,1150 0,1395
9
10
0,0237 0,0313 0,0407 0,0518 0,0650
0,0121 0,0164 0,0217 0,0282
5,0
0,5875 0,3241 0,1672 0,0805
0,0361
р = Я,/ц — траффик-ннтенсивность; — средняя скорость обслуживания;
Я—средняя частота S — число приборов.
4,0 4,2 4,4 4,6 4,8
поступлении;
ТАБЛИЦЫ
р
6
7
8
5,0 5,2 5,4 5,6 5,8
0,5875 0,6616 0,7401 0,8227 0,9094
0,3241 0,3740 0,4279 0,4859 0,5479
0,1672 0,1982 0,2827 0,2706 0,3120
0,6138 0,6836 0,7572 0,8345 0,9155
0,3569 0,1959 0,1012 0,4055 0,2275 0,1204 0,4576 0,2622 0,1420 0,5133 0,2999 0,1660 0,5725 0,3408 0,1925
6,0 6,2 6,4 6,6 6,8
9
10
0,0805 0,0361 0,0983 0,0455 0,1186 0,0565 0,1415 0,0694 0,1673 0,0843
475
И
12
13
14
15
,0150 ,0196 0,0252 ,0105 0,0319 0,0137 0,0398 0,0176 0,0492 0,0600 0,0725 0,0868 0,1029
0,0224 0,0281 0,0349 0,0428 0,0520
0,0124 0,0158 0,0199 0,0248 0,0112
0,3849 0,2217 0,1211 0,4322 0,2536 0,1413 0,4827 0,2882 0,1637 0,5363 0,3256 0,1884 0,5932 0,3659 0,2154
0,0626 0,0746 0,0883 0,1036 0,1208
0,0306 0,0373 0,0451 0,0541 0,0644
0,0141 0,0177 0,0219 0,0100 0,0268 0,0126 0,0326 0,0156
8,0 8,2 8,4 8,6 8,8
0,6533 0,4091 0,7165 0,4552 0,7828 0,5042 0,8522 0,5561 0,9246 0,6110
0,2449 0,2769 0,3114 0,3484 0,3881
0,1398 0,1608 0,1838 0,2090 0,2364
0,0759 0,0890 0,1036 0,1198 0,1377
0,0392 0,0469 0,0556 0,0655 0,0767
0,0193 0,0235 0,0284 0,0342 0,0407
9,0 9,2 9,4 9,6 9,8
0,6687 0,7293 0,7927 0,8590 0,9281
0,4304 0,4754 0,5231 0,5734 0,6264
0,2660 0,2979 0,3322 0,3688 0,4078
0,1575 0,1790 0,2025 0,2280 0,2556
0,0891 0,1030 0,1184 0,1353 0,1538
0,0482 0,0567 0,0662 0,0769 0,0888
7,0 7,2 7,4 7,6
7,8
10,0
0,6353 0,7015 0,7711 0,8441 0,9204
0,6821 0,4493 0,2852 0,1741 0,1020
р = Х/ц —траффик-интенсивность; [х —средняя скорость \.— средняя частота поступлений; S — число приборов.
обслуживания:
Литература Литература к главе 16 КНИГИ 1. Pratt. J. W., Raiffa H., Schlaifer R., Introduction to Statistical Decision Theory, McGraw-Hill, 1965. 2. Raiffa H., Decision Analysis-Introductory Lectures on Choices Under Uncertainty, Addison-Wesley, 1968. СТАТЬИ 1. Bowman E. H., Consistency and Optimality in Managerial Decision Making, Management Science, 9, 310—321 (1962). 2. Bracken J., Soland R. M., Statistical Decision Analysis of Stochastic Linear Programming Problems, Naval Research Logistics Quarterly, 13, 205-225 (1966). 3. Charnes A., Kirby M., RaikeW., Chance-Constrained Generalized Networks, Operations, Research, 14, 1113—1120 (1966). 4. Charnes A., Kirby M., Some Special P-Models in Chance-Constrained Programming, Management Science, 14, 183—195, (1967). 5. Charnes A., Cooper W. W., Chance-Constrained Programming, Management Science, 6, 73—79 (1959). 6. Charnes A., Cooper W. W., Deterministic Equivalents for Optimizing and Satisficing Under Chance Constraints, Operations Research, 11, 18—39 (1963). 7. Charnes A., Cooper W. W., Thompson G. L., Critical Path Analyses via Chance Constrained and Stochastic Programming, Operations Research, 12, 460—470 (1964). 8. Charnes A., Dreze J., Miller M., Decision and Horizon Rules for Stochastic Planning Problems: A Linear Example, Econometrica, 34, 307—330 (1966). 9. Cocks K. D., Discrete Stochastic Programming, Management Sciences, 15, 72—79 (1968). 10. Elmaghraby S. E., An Approach to Linear Programming Under Uncertainty, Operations Research, 7, 208—216 (1959). 11. Elmaghraby S. E., Allocation under Uncertainty when the Demand has Continuous d. f., Management Science, 6, 270—294 (1960). 12. Evers W. H., A New Model for Stochastic Linear Programming, Management Science, 13, 680-693 (1967). 13. Freund R. J., The Introduction of Risk into a Programming Problem, Econometrica, 24, 253—263 (1956). 14. Geojfrion A.M., Stochastic Programming with Aspiration or Fractile Criteria, Management Science, 13, 672—679 (1967). 15. Hartley H. O., Wortham A. W., A Statistical Theory for Pert Critical Path Analysis, Management Science, 12, B-469-B-481 (1966). 16. Hespos R. P., Strassmann P. A., Stochastic Decision Trees for the Analysis of Investment Decisions, Management Science, 11, B-244-B-259 (1965). 17. Hillier F. S., Chance-Constrained Programming with 0—1 or Bounded Continuous Decision Variables, Management Science, 14, 34—57 (1967). 18. Kataoka S., A Stochastic Programming Model, Econometrica, 31, 181—196 (1963). 19. Madansky A., Inequalities for Stochastic Linear Programming Problems, Management Science, 6, 197—204 (I960). 20. Madansky A., Methods of Solution of Linear Programs Under Uncertainty, Operations Research, 10, 463—471 (1962).
ЛИТЕРАТУРА
477
21. Mangasarian 0. L., Nonlinear Programming Problems with Stochastic Objective Functions, Management Science, 10, 353—359 (1964). 22. Mangasarian 0. L., Rosen J. В., Inequalities for Stochastic Nonlinear Programming Problems, Operations Research, 12, 143—154 (1964). 23. Miller B. L., Wagner H. M., Chance Constrained Programming with Joint Constraints, Operations Research, 13, 930—945 (1965). 24. Naslund В., A Model of Capital Budgeting Under Risk, /. of Business, 39, 257-271 (1966). 25. Naslund В., Whinston A., A Model of Multi-Period Investiment Under Uncertainty, Management Science, 8, 184—200 (1962). 26. Radner R., The Application of Linear Programming to Team Decision Problems, Management Science, 5, 143—150 (1959). 27. SenguptaJ. K., Safety-First Rules Under Chance-Canstrained Linear Programming, Operations Research, 17, 112—132 (1969). 28. Symonds G. H., Stochastic Scheduling by the Horizon Method, Management Science, 8, 138-167 (1962). 29. Symonds G. H., Deterministic Solutions for a Class of Chance-Constrained Programming Problems, Operations Research, 15, 495—512 (1967). 30. Symonds G. H., Chance-Constrained Equivalents of Some Stochastic Programming Problems, Operations Research 16, 1152—1160 (1968). 31. Szwarc W., The Transportation Problem with Stochastic Demand, Management Science, 11, 33—50 (1964). 32. Thompson G. L., CPM and DCPM Under Risk, Naval Research Logistics Quarterly, 15, 233—239 (1968). 33. van de Panne C., Optimal Strategy Decisions for Dynamic Linear Decision Rules in Feedback Form, Econometrica, 33, 307—320 (1965). 34. van de Panne C., Popp W., Minimum-Cost Cattle Feed Under Probabilistic Protein Constraints, Management Science, 9, 405—430 (1963). 35. van Slyke R., Wets R., Programming Under Uncertainty and Stochastic Optimal Control, SI AM J. on Control, 4, 179—193 (1966). 36. Veinott A. P., Jr., Commentary on Part Two, pp. 313—321 in Mathematical Studies in Management Science, Arthur F. Veinott, Jr. (ed.), Macmillan Co., 1965. 37. Walkup D. W., Wets R. J. В., Stochastic Programs with Recourse, SIAM J. on Applied Mathematics, 15, 1299—1314 (1967). 38. Wets R. J. В., Programming Under Uncertainty: The Equivalent Convex Program, SIAM J. on Applied Mathematics, 14, 89—105 (1966). 39. Wets R. J. В., Programming Under Uncertainty: The Solution Set, SIAM J. on Applied Mathematics, 14, 1143—1151 (1966). 40. Williams A. C., A Stochastic Transportation Problem, Operations Research, 11, 759—770 (1963). 41. Williams A. C., On Stochastic Linear Programming, SIAM J. on Applied Mathematics, 13, 927—940 (1965). 42. Williams A. C., Approximation Formulas for Stochastic Linear Programming, SIAM J. on Applied Mathematics, 14, 668—677 (1966).
Литература к главе 17 КНИГИ 1. Bellman R. E., Dreyfus S. E., Applied Dynamic Programming, Princeton University Press, 1962; русский перевод: Беллман Р., Дрейфус С., Прикладные задачи динамического программирования, перевод с англ., изд-во «Наука», 1965. 2. Howard R. A., Dynamic Programming and Markov Processes, The Massachusetts Institute of Technology Press, 1960; русский перевод: Ховарид Р., Дина-
478
3. 4. 5. 6.
ЛИТЕРАТУРА
мическое программирование и марковские процессы, перев. с англ., изд-во> «Советское радио», 1964. Jorgenson D. W., McCall J. J., Radner R., Optimal Replacement Policy, Rand McNally, 1967. Kemeny J. G., Snell J. L., Finite Markov Chains, D. Van Nostrand C., 1960. Martin J. J., Bayesian Decision Problems and Markov Chains, Wiley, 1967. Sengupta S. S., Operations Research in Sellers Competition, Wiley, 1968.
СТАТЬИ 1. Bellman R., KalabaR.' On /cth Best Policies, SIAM J. on Applied Mathematics, 8, 582-588 (1960). 2. Delfausse J., Saltzman S., Values for Optimum Reject Allowances, Naval Research Logistics Quarterly, 13, 147—157 (1966). 3. Derman C., Lieberman G. J., A. Markovian Decision Model for a Joint Replacement and Stocking Problem, Management Science, 13, 609—617 (1967). 4. Derman C., Klein M., Some Remarks on Finite Horizon Markovian Decision Models, Operations Research, 13, 272—278 (1965). 5. Eppen G. D., A Dynamic Analysis of a Class of Deteriorating Systems, Management Science, 12, 223—240 (1965). 6. Eppen G. D., Fama E. F., Solutions for Cash-Balance and Simple DynamicPortfolio Problems, /. of Business, 41, 94—112 (1968). 7. GaverD. P., Jr., Models for Appraising Investments Yielding Stochastic Returns, Management Science, 11, 815—830 (1965). 8. Greenberg H. J., The Use of Branching in Dynamic Programming for Parametric Analysis, Operations Research, 15, 976—977 (1967). 9. Greenberg H. J., Dynamic Programming with Linear Uncertainty, Operations Research, 16, 675—678 (1968). 10. Kao R. C., Note on Program Uncertainty in the Dynamic Programming Model, Econometrica, 30, 336—342 (1962). 11. Karp R. M., Held M., Finite-State Processes and Dynamic Programming, SI AM J. on Applied Mathematics, 15, 693—718 (1967). 12. Klein M., Inspection — Maintenance — Replacement Schedules under Markovian Deterioration, Management Science, 9, 25—32 (1962). 13. Klein M., Markovian Decision Models for Reject Allowance Problems, Management Science, 12, 349—358 (1966). 14. Kolesar P., Minimum Cost Replacement under Markovian Deterioration, Management Science, 12, 694—706 (1966). 15. Kolesar P., Randomized Replacement Rules which Maximize the Expected Cycle Length of Equipment Subject to Markovian Deterioration, Management Science, 13, 867—876 (1967). 16. Levitan R. E., The Optimum Reject Allowance Problem, Management Science, 6, 172—186 (I960). 17. Lieberman G. J., Lifo vs. Fifo in Inventory Depletion Management, Management Science, 5, 102—105 (1958). 18. Lippman S. A., Planning-Horizon Theorems for Knapsack and Renewal Problems with a Denumerable Number of Activities, Operations Research, 17, 163—174 (1969). 19. MacQueen J., Miller G., Jr., Optimal Persistence Policies, Operations Research, 8, 362—380 (1960). 20. Marschak T. A ., Yahav J. A., The Sequential Selection of Approaches to a Task, Management Science, 12, 627—647 (1966). 21. McCall J. J., The Economics of Information and Optimal Stopping Rules, /. of Business, 38, 300—317 (1965). 22. McCall J. J., Maintenance Policies for Stochastically Failing Equipment: A Survey, Management Science, 11, 493—524 (1965).
ЛИТЕРАТУРА
479>
23. McGuire С. В., Some Team Models of a Sales Organization, Management Science, 7, 101 — 130 (1961). 24. McNaughton R., Scheduling with Deadlines and Loss Functions, Management Science, 6, 1 — 12 (1959). 25. Mitten L. G., Composition Principles for Synthesis of Optimal Multi-Stage Processes, Operations Research, 12, 610—619 (1964). 26. Pierskalla W. P., Optimal Issuing Policies in Inventory Management — I, Management Science, 13, 395—412 (1967). 27. Pierskalla W. P., Inventory Depletion Management with Stochastic Field Life Functions, Management Science, 13, 877—886 (1967). 28. Randolph P., An Optimal Stopping Rule, Operations Research, 15, 562—564 (1967). 29. RootJ. G.,'Scheduling with Deadlines and Loss Functions on k Parallel Machines, Management Science, 11, 460—475 (1965). 30. Shapiro J. P., Wagner H. M., A Finite Renewal Algorithm for the Knapsack and Turnpike Models, Operations Research, 15, 319—341 (1967). 31. Taylor H. M., Markovian Sequential Replacement Processes, Annals Mathematical Statistics, 36, 1677—1694 (1965). 32. Taylor H. M., Optimal Stopping in a Markov Process, Annals Mathematical Statistics, 39, 1333—1344 (1968). 33. Thompson G. L., Optimal Maintenance Policy and Sale Date of a Machine, Management Science, 14, 543—550 (1968). 34. White L. S., Markovian Decision Models for the Evaluation of a Large Class of Continuous Sampling Inspection Plans, Management Science, 36, 1408— 1420 (1965). 35. White L. S., The Analysis of a Simple Class of Multistage Inspection Plans, Management Science, 12, 685—693 (1966). 36. White L. S., Bayes' Markovian Decision Models for a Multiperiod Reject Allowance Problem, Operations Research, 15, 857—865 (1967). 37. White L. S., Shortest Route Models for the Allocation of Inspection Effort on a Production Line, Management Science, 15, 249—259 (1969). 38. Williams A. C., Nassar J. I., Financial Measurement of Capital Investments, Management Science, 12, 851—864 (1966). 39. Ying, Ch., Learning by Doing — An Adaptive Approach to Multiperiod Decisions, Operations Research, 15, 797—812 (1967).
Литература к главе 18 СТАТЬИ 1. Blackwell D., Discrete Dynamic Programming, Annals Mathematical Statistics, 33, 719—726 (1962). 2. Blackwell D., Discounted Dynamic Programming, Annals Mathematical Statistics, 36, 226—235 (1965). 3. Brown В., On the Iterative Method of Dynamic Programming on a Finite Space Discrete Time Markov Process, Annals Mathematical Statistics, 36, 1279—1285 (1965). 4. Crabill Т. В., Sufficient Conditions for Positive Recurrence and Recurrence of Specially Structured Markov Chains, Operations Research, 16, 858—867 (1968). 5. de Cani J. S., A Dynamic Programming Algorithm for Embedded Markov Chains when the Planning Horizon Is at Infinity, Management Science, 10, 716—733 (1964). 6. de Ghellinck G. Т., Eppen G. D., Linear Programming Solutions for Separable Markovian Decision Problems, Management Science, 13, 371—394 (1967). 7. Denardo E. V., Contraction Mappings in the Theory Underlying Dynamic Programming, SIAM Review, 9, 165—177 (1967).
480
ЛИТЕРАТУРА
8. Denardo E. V., Separable Markovian Decision Problems, Management Science, 14, 451—462 (1968). 9. Denardo E. V., Computing a Bias-Optimal Policy in a Discrete-Time Markov Decision Problem, Operations Research, 17 (1969). 10. Denardo E. V., Fox В., Multichain Markov Renewal Programs, SIAM J. on Applied Mathematics, 16, 468—487 (1968). 11. Derman C., On Sequential Decisions and Markov Chains, Management Science, 9, 16-24 (1962). 12. Derman C., Optimal Replacement and Maintenance under Markovian Deterioration with Probability Bounds on Failure, Management Science, 9, 478—481 (1963). 13. Derman C., Markovian Sequential Control Processes — Denumerable State Space, Journal of Mathematical Analysis and Applications, 10, 295—302 (1965). 14. Derman C., Denumerable State Markovian Decision Processes — Average Cost Criterion, Annals Mathematical Statistics, 37, 1545—1554 (1966). 15. Derman C., Strauch R. E., A Note on Memoryless Rules for Controlling Sequential Decision Processes, Annals Mathematical Statistics, 37, 276—279 (1966). 16. Derman C., Veinott A. F., Jr., A Solution to a Countable System of Equations Arising in Markovian Decision Processes, Annals Mathematical Statistics, 38, 582—585 (1967). 17. Fisher L., On Recurrent Denumerable Decision Processes, Annals Mathematical Statistics, 39, 424—432 (1968). 18. Fisher L., Ross S. M., An Example in Denumerable Decision Processes Annals Mathematical Statistics, 39, 674—675 (1968). 19. Fox В., Markov Renewal Programming by Linear Fractional Programming, SIAM J. on Applied Mathematics, 14, 1418—1432 (1966). 20. Hoffman A. J., Karp R. M., On Nonterminating Stochastic Games, Management Science, 12, 359—370 (1966). 21. Jewell W. S., Markov-Renewal Programming. I: Formulation, Finite Return Models, Operations Research, 11, 938—948 (1963). 22. Jewell W. S., Markov-Renewal Programming II: Infinite Return Models, Example, Operations Research, 11, 949—971 (1963). 23. MacQueen J., A Test for Suboptimal Actions in Markovian Decision Problems, Operations Research, 15, 559—561 (1967). 24. Manne A, S., Linear Programming and Sequential Decision, Management Science, 6, 259—267 (1960). 25. Miller B. L., Finite State Continuous Time Markov Decision Processes with a Finite Planning Horizon, SIAM J. on Control, 6, 266—280 (1968). 26. Ross S., Non-discounted Denumerable Markovian Decision Models, Annals Mathematical Statistics, 39, 412—423 (1968). 27. Shapiro J. F., Turnpike Planning Horizons for a Markovian Decision Model, Management Science, 14, 292—300 (1968). 28. Smallwood R. D., Optimum Policy Regions for Markov Processes with Discounting, Operations Research, 14, 658—669 (1966). 29. Strauch R., Negative Dynamic Programming, Annals Mathematical Statistics, 37, 871-890 (1966). 30. Veinott A. P., Jr., On Finding Optimal Policies in Discrete Dynamic Programming with no Discounting, Annals Mathematical Statistics, 37, 1284—1294 (1966). 31. Wagner H. M., On the Optimality of Pure Strategies, Management Science, 6, 268—269 (1960). 32. Wolfe P., Dantzig G. В., Lienar Programming in a Markov Chain, Operations Research, 10, 702—710 (1962).
ЛИТЕРАТУРА
481
Литература к главе 19 и приложению II КНИГИ 1. Arrow К. /., Karlin S., Scarf H. E. (eds.), Studies in Applied Probability and Management Science, Stanford University Press, 1962. 2. Buchan J., Koenigsberg E., Scientific Inventory Management, Prentice-Hall, 1963. 3. Buff a E. S., Modem Production Management, Wiley, 1965. 4. Buff a E. S., Production-Inventory Systems: Planning and Control, Irvin, 1968. 5. Hadley G., Whitin Т. M., Analysis of Inventory Systems, Prentice-Hall, 1963; русский перевод: Хедли Дж., Уайтин Т., Анализ систем управления запасами, -изд-во «Наука», 1969. 6. Holt С. С., Modigliani F., Muth J. P., Simon H. A., Planning Production, Inventories, and Work Force, Prentice-Hall, 1960. 7. Naddor E., Inventory Systems, Wiley, 1966. 8. Starr M. K., Miller D. W., Inventory Control: Theory and Practice, PrenticeHall, 1962. 9. Wagner H. M., Statistical Management of Inventory Systems, Wiley, 1962. 10. Whitin Т. М., The Theory of Inventory Management, Second Edition, Princeton University Press, 1957. СТАТЬИ 1. Arrow K. J., Harris Т., Marschak /., Optimal Inventory Policy, Econometrica, 19, 250—272. 2. Beckmann M. J., An Inventory Model for Arbitrary Interval and Quantity Distributions of Demand, Management Science, 8, 35—57 (1961). 3. Beckmann M. J., Production Smoothing and Inventory Control, Operations Research, 9, 456—467 (1961). 4. Bee.be J. H., Beightler C. S., Stark J. P., Stochastic Optimization of Production Planning, Operations Research, 16, 799—818 (1968). 5. Beesack P. R., A Finite Horizon Dynamic Inventory Model with a Stockout Constraint, Management Science, 13, 618—630 (1967). 6. Bellam R., Glicksberg /., Gross 0., Oa the Optimal Inventory Equation, Management Science, 2, 83—104 (1955). 7. Bessler S. A., Veinott A. F., Jr., Optimal Policy for a Dynamic Multi-Echelon Inventory Model, Naval Research Logistics Quarterly, 13, 355—389 (1966). 8. Boylan E. S., Existence and Uniqueness Theorems for the Optimal Inventory Equation, SIAM J. on Applied Mathematics, 14, 961—969 (1966). 9. Boylan E. S., Multiple (s, S) Policies and the rc-Period Inventory Problem, Management Science, 14, 196—204 (1967). 10. Chang Y. S., Niland P., A Model for Measuring Stock Depletion Costs, Operations Research, 15, 427—447 (1967). 11. Clark A. J., Scarf H. E., Optimal Policies for a Multi-Echelon Inventory Problem, Management Science, 6, 475—490 (1960). 12. d'Epenoux F., A Probabilistic Production and Inventory Problem, Management Science, 10, 98—108 (1963). 13. Dvoretzky A., Kiefer J., Wolfowitz J., The Inventory Problem. I: Case of Known Distributions of Demand, Econometrica, 20, 450—466 (1952). 14. Evans R. V., Inventory Control of a Multiproduct System with a Limited Production Resource, Naval Research Logistics Quarterly, 14, 173—184 (1967). 15. Falkner С. Н., Jointly Optimal Inventory and Maintenance Policies for Stochastically Failing Equipment, Operations Research, 16, 587—601 (1968). 16. Fenske R. W., Non-Stocking Criterion, Management Science, 14, B-705— B-714 (1968).
482
ЛИТЕРАТУРА
17. Fromovitz S., A Class of One-Period Inventory Models, Operations Research 13, 779-799 (1965). 18. Fukuda Y., Optimal Disposal Policies, Naval Research Logistics Quarterly, 8, 221—227 (1961). 19. Gaver D. P., Operating Characteristics of a Simple Production-Inventory Control Model, Operations Research, 9, 635—649 (1961). 20. Geisler M. A., A Test of a Statistical Method for Computing Selected Inventory Model Characteristics by Simulation, Management Science, 10, 709—715 (1964). 21. Geisler M. A., The Sizes of Simulation Samples Required to Compute Certain Inventory Characteristics with Stated Precision and Confidence, Management Science, 10, 261-286 (1964). 22. Greenberg H., Stock Level Distributions for (s, S) Inventory Problems, Naval Research Logistics Quarterly, 11, 343—349 (1964). 23. Greenberg H., Time Dependent Solutions for the (s, S) Inventory Problem, Operations Research, 12, 725—735 (1964). 24. Hurter A. P., Kaminsky F. C., An Application of Regenerative Stochastic Processes to a Problem in Inventory Control, Operations Research, 15, 467— 472 (1967). 25. Iglehart D. L., Optimality of (s, S) Policies in the Infinite Horizon Dynamic Inventory Problem, Management Science, 9, 259—267 (1963). 26. Iglehart D. L., The Dynamic Inventory Problem with Unkown Demand Distribution, Management Science, 10, 429—440 (1964). 27. Iglehart D. L., Karlin S., Optimal Policy for Dynamic Inventory Process with Nonstationary Stochastic Demands, pp. 127—147 в книге Studies in Applied Probability and Management Science, K. J. Arrow, S. Karlin, and H. E. Scarf (eds.), Stanford University Press, 1962. 28. Ignall E., Optimal Continuous Review Policies for Two Product Inventory Systems with Joint Setup Costs, Management Science, 15, 278—283 (1969). 29. Ignall E., Veinott A. F., Jr., Optimality of Myopic Inventory Policies for Several Substitute Products, Management Science, 15, 284—304 (1969). 30. Johnson E. L., Optimality and Computation of (s, S) Policies in the Multi-Item Infinite Horizon Inventory Problem, Management Science, 13, 475—491 (1967). 31. Johnson E. L., On (s-S) Policies, Management Science, 15, 80—101 (1968). 32. Karlin S., Dynamic Inventory Policy with Varying Stochastic Demands, Management Science, 6, 231—258 (1960). 33. Karlin S., Optimal Policy for Dynamic Inventory Process to Stochastic Demands Subject to Seasonal Variations, SI AM J. on Applied Mathematics, 8, 611-629 (1960). 34. Kriebel С. Н., Team Decision Models of an Inventory Supply Organization, Naval Research Logistics Quarterly, 12, 139—154 (1965). 35. Kunreuther H., Scheduling Short-Run Changes in Production to Minimize Long-Run Expected Costs, Management Science, 12, 541—554 (1966). 36. Love Л. F., A Two-Station Stochastic Inventory Model with Exact Methods of Computing Optimal Policies, Naval Research Logistics Quarterly, 14, 185— 217 (1967). 37. Maxwell W. L., The Scheduling of Economic Lot Sizes, Naval Research Logistics Quarterly, 11, 89—124 (1964). 38. Modigliani P., Hohn F. E., Production Planning over Time and the Nature of Expectation and Planning Horizon, Econometrica, 23, 46—65 (1955). 39. Murray G. R., Jr., Silver E. A., A Bayesian Analysis of the Style Goods Inventory Problem, Management Science, 12, 785—797 (1966). 40. Neuts M. F., An Inventory Model with an Optional Time Lag, SIAM J. on Applied Mathematics, 12, 179—185 (1964). 41. Resh M., Naor P., An Inventory Problem with Discrete Time Review and Replenishment by Batches of Fixed Size, Management Science, 10, 109—118 (1963). 42. Roberts D. M., Approximations to Optimal Policies in a Dynamic Inventory Model, pp. 207—229 в книге Studies in Applied Probability and Management
ЛИТЕРАТУРА
43.
44. 45. 46. 47. 48. 49. 50. 51. 52. 53.
483
Science, К. J. Arrow, S. Karlin, and H. E. Scarf (eds.), Stanford University Press, 1962. Scarf H. E., The Optimality of (S, s) Policies in the Dynamic Inventory Problem, pp. 196—202 в книге Mathematical Methods in the Social Sciences, K. J. Arrow, S. Karlin, and P. Suppes (eds.), Stanford University Press, 1960. Schrady D. A., A Deterministic Inventory Model for Reparable Items, Naval Research Logistics Quarterly, 14, 391—398 (1967). Veinott A. P., Jr., Optimal Policy for a Multi-Product, Dynamic, Nonstationary Inventory Problem, Management Science, 12, 206—222. Veinott A. F., Jr., Optimal Policy in a Dynamic, Single Product, Non-Stationary Inventory Model with Several Demand Classes, Operations Research, 13, 761-778 (1965). Veinott A. P., Jr., The Optimal Inventory Policy for Batch Ordering, Operations Research, 13, 424—432 (1965). Veinott A. P., Jr., The Status of Mathematical Inventory Theory, Management Science, 12, 745—777 (1966). Veinott A. P., Jr., On the Optimality of (s, S) Inventory Policies: New Conditions and a New Proof, SI AM J. on Applied Mathematics, 14, 1067—1083 (1966). Veinott A. F., Jr., Wagner H. M., Computing Optimal (s, S) Inventory Policies, Management Science, 11, 525—552 (1965). Wagner H. M., O'Hagan M., Lundh В., An Empirical Study of Exactly and Approximately Optimal Inventory Policies, Management Science, 11, 690— 723 (1965). Wright G. P., Optimal Policies for a Multi-Product Inventory System with Negotiable Lead Times, Naval Research Logistics Quarterly, 15, 375—401 (1968). Zabel E., A Note on the Optimality of (s, S) Policies in Inventory Theory, Management Science, 9, 123—125 (1962).
Литература к главе 20 и приложению III КНИГИ 1. Benes V. E., General Stochastic Processes in the Theory of Queues, AddisonWesley, 1963. 2. Cox D. R., Smith W. L., Queues, Wiley, 1961. 3. Lee A. M., Applied Queueing Theory, St. Martin's Press, 1966. 4. Morse P. M., Queues, Inventories and Maintenance: The Analysis of Operations Systems with Variable Demand and Supply, Wiley, 1958. 5. Prabhu N. U., Queues and Inventories: A Study of Their Basic Stachastic Processes, Wiley, 1965; русский перевод: Прабху Н., Методы теории массового обслуживания, перев. с англ., изд-во «Машиностроение», 1969. 6. Riordan J., Stochastic Service Systems, Wiley, 1962; русский перевод: Риордан Дж., Вероятностные системы обслуживания, перев. с англ., изд-во «Связь», 1966. 7. Saaty L., Elements of Queueing Theory with Applications, McGraw-Hill, 1961. 8. Syski R., Introduction to Congestion Theory in Telephone Systems, Oliver and Boyd, 1960. 9. TakdcsL., Introduction to the Theory of Queues, Oxford University Press, 1962.
ЛИТЕРАТУРА
СТАТЬИ 1. Ancker С. J., Jr., Gafarian A. V., Some Queuing Problems with Balking and Reneging — I, Operations Research, 11, 88—100 (1963). 2. Ancker C. J., Jr., Gafarian A. V., Some Queuing Problems with Balking and Reneging — II, Operations Research, 11, 928—937 (1963). 3. Avi-Itzhak В., Preemptive Repeat Priority Queues as a Special Case of the Multipurpose Server Problem — I, Operations Research, 11, 597—609 (1963). 4. Avi-Itzhak В., Preemptive Repeat Priority Queues as a Special Case of the Multipurpose Server Problem — II, Operations Research, 11, 610—619 (1963). 5. Avi-Itzhak В., Maxwell W. L., Miller L. M., Queuing with Alternating Priorities, Operations Research, 13, 306—318 (1965). 6. Cinlar E., Disney R. L., Stream of Overflows form a Finite Queue, Operations Research, 15, 131—134 (1967). 7. Cobham A., Priority Assignment in Waiting Line Problems, Operations Research, 2, 70—76 (1954). 8. Evans R. V., Queuing when Jobs Require Several Services which Need Not be Sequenced, Management Science, 10, 298—315 (1964). 9. Evans R. V., Capacity of Queuing Networks, Operations Research, 15, 530— 536 (1967). 10. Gaver D. P., Jr., Observing Stochastic Processes and Approximate Transform Inversion, Operations Research, 14, 444—459 (1966). 11. Gordon W. /., Newell G. F., Closed Queuing Systems with Exponential Servers, Operations Research, 15, 254—265 (1967). 12. Gordon W. J., Newell G. F., Cyclic Queuing Systems with Restricted Length Queues, Operations Research, 15, 266—277 (1967). 13. Harris T. J., Duality of Finite Markovian Queues, Operations Research, 15, 575-576 (1967). 14. ffillier F. S., Economic Models for Industrial Waiting Line Problems, Management Science, 10, 119—130 (1963). 15. Jackson J. R., Multiple Servers with Limited Waiting Space, Naval Research Logistics Quarterly, 5, 315—321 (1958). 16. Jackson J. R., Queues with Dynamic Priority Discipline, Management Science, 8, 18-34 (1961). 17. Jackson J. R., Jobshop-Like Queueing Systems, Management Science, 10, 131—142 (1963). 18. Jewell W. S., A Simple Proof of: L=KW, Operations Research, 15, 1109—1116 (1967). 19. Kabak I. W., Blocking and Delays in MW/M/c Bulk Queuing Systems, Operations Research, 16, 830—840 (1968). 20. Keilson J., A Note on the Waiting-Time Distribution for the M/G/i Queue with Last-Come-First-Served Discipline, Operations Research, 16, 1230—1232 (1968). 21. Kendall D. G., Stochastic Processes Occurring in the Theory of Queues and Their Analysis by the Method of Imbedded Markov Chains, Annals of Mathematical Statistics, 24, 338—354 (1953). 22. Kleinrock L., Optimum Bribing for Queue Position, Operations Research, 15, 304—318 (1967). 23. Kleinrock L., Finkelstein R. P., Time Dependent Priority Queues, Operations Research, 15, 104—116 (1967). 24. Little J. D. C., A Proof for the Queuing Formula: L = \W, Operations Research, 9, 383—387 (1961). 25. Mitrany I. L., Avi-Itzhak В., A Many-Server Queue with Service Interruptions, Operations Research, 16, 628—638 (1968). 26. Moder J. J., Phillips C. R., Jr., Queuing with Fixed and Variable Channels, Operations Research, 10, 218—231 (1962). 27. Neuts M. F., The Busy Period of a Queue with Batch Service, Operations Research, 13, 815-819 U965).
ЛИТЕРАТУРА
485
28. Neuts M. F., An Alternative Proof of a Theorem of Takacs on the GI/M/l Queue, Operations Research, 14, 313—316 (1966). 29. Oliver R. M., An Alternate Derivation of the Pollaczek-Khintchine Formula, Operations Research, 12, 158—159 (1964). 30. Prabhu N. U., Transient Behavior of a Tandem Queue, Management Science, 13, 631-639 (1953). 31. Restrepo R. A., A Queue with Simultaneous Arrivals and Erlang Service Distribution, Operations Research, 13, 375—381 (1965). 32. Saunders L. R., Probability Functions for Waiting Times in Single-Channel Queues, with Emphasis on Simple Approximations, Operations Research, 9, 351—362 (1961). 33. Schrage L. E., The Queue MlGli with Feedback to Lower Priority Queues, Management Science, 13, 466—474 (1967). 34. Schrage L. E.,A Proof of the Optimality of the Shortest Remaining Processing Time Discipline, Operations Research, 16, 687—690 (1968). 35. Schrage L. E., Miller L. W., The Queue M/G/i with the Shortest Remaining Processing Time Discipline, Operations Research, 14, 670—684 (1966). 36. Sobel M. J., Optimal Average Cost Police for a Queue with Start-Up and Shut-Down Costs, Operations Research, 17, 145—162 (1969). 37. Wolff. R W., Problems of Statistical Inference for Birth and Death Queuing Models, Operations Research, 13, 343—357 (1965). 38. Young J. P., Administrative Control of Multiple-Channel Queuing Systems with Parallel Input Streams, Operations Research, 14, 145—156 (1966).
Литература к главе 21 КНИГИ 1. Bonini С. P., Simulation of Information and Decision Systems in the Firm, Prentice-Hall, 1963. 2. Conway R. W., Maxwell W. L., Miller L. W., Theory of Scheduling, AddisonWesley, 1967. 3. Cyert R. M., March, J. G., A Behavioral Theory of the Firm, Prentice-Hall, 1963. 4. Greenlaw P. S., Herron L. W., Rawdon R. H., Business Simulation in Industrial and University Education, Prentice-Hall, 1962. 5. Hammersley J. M., Handscomb D. C., Monte Carlo Methods, Wiley, 1964. 6. Markowltz H. M., Hausner В., Karr H. W., SIMSCRIPT: A Simulation Programming Language, Prentice-Hall, 1962. 7. Meier R. C., Newell W. Т., Pazer H. L., Simulation in Business and Economics, Prentice-Hall, 1969. 8. Mize J. H., Cox J. G., Essentials of Simulation, Prentice-Hall, 1968. 9. Naylor T. H., Balintfy J. L., Burdick D. S., Chu K., Computer Simulation Techniques, Wiley, 1966. 10. RAND Corporation, A. Million Random Digits with 100,000 Normal Deviates, The Free Press, 1955. СТАТЬИ 1. Blake K., Gordon G., System Simulation with Digital Computers, IBM Systems Journal, 3, 14—20 (1964). 2. Burr I. W., A. Useful Approximation to the Normal Distribution Function, with Application to Simulation, Technometrics, 9, 647—651 (1967). 3. Clark С. Е., Importance Sampling of Monte Carlo Analyses, Operations Research, 9, 502—620 (1961). 4. Cohen K. J., Elton E. J., Inter-Temporal Portfolio Analysis Based on Simulation of Joint Returns, Management Science, 14, 5—18 (1967).
486
ЛИТЕРАТУРА
5. Efron R., Gordon G., A General Purpose Digital Simulator and Examples of its Application: Part I — Description of the Simulator, IBM Systems Journal, 3, 22—34 (1944). 6. Ehrenfeld S., Ben-Tuvia S., The Efficience of Statistical Simulation Procedures, Technometrics, 4, 257—275 (1962). 7. Fetter R. В., Thompson J. D., The Simulation of Hospital Systems, Operations Research, 13, 689—711 (1965). 8. Fishman G, S., Problems in the Statistical Analysis of Simulation Experiments: The Comparison of Means and the Length of Sample Records, Communications of the ACM, 10, 94—99 (1967). 9. Fishman G. S., The Allocation of Computer Time in Comparing Simulation Experiments, Operations Research, 16, 280—295 (1968). 10. Fishman G. S., Kiviat P. J., The Analysis of Simulation-Generated Time Series, Management Science, 13, 525—557 (1967). 11. Gafarian A. V., Ancker G. J., Mean Value Estimation from Digital Computer Simulation, Operations Research, 14, 25—44 (1966). 12. Ghare P. M., Multichannel Queuing System with Bulk Service, Operations Research, 16, 189—192 (1968). 13. Gordon G., A General Purpose Systems Simulator, IBM Systems Journal, 18—32 (1962). 14. Greenberger M., Method in Randomness, Communications of the ACM, 8, 177— 179 (1965). 15. Hertz D. В., Risk Analysis in Capital Investment, Harvard Business Review, 42, 95-106 (1964). 16. Hertz D. В., Investment Policies that Pay Off, Harvard Business Review, 46, 96—108 (1968). 17. Hull R. E., Dobell A. R., Random Number Generators, SIAM Review, 4, 230—254 (1967). 18. Kabak I. W., Stopping Rules for Queuing Simulations, Operations Research, 16, 431—437 (1968). 19. Krasnow H. S., Merikallio R. A., The Past, Present, and Future of General Simulation Languages, Management Science, 11, 236—267 (1964). 20. MacLaren M. D., Marsaglia G., Uniform Random Number Generators, Journal of the Association for Computing Machinery, 12, 83—89 (1965). 21. Markowitz H. M., Simulating with Simscript, Management Science, 12, B-396 — B-405 (1966). 22. Maxwell W. L., Mehra M., Multiple-Factor Rules for Sequencing with Assembly Constraints, Naval Research Logistics Quarterly, 15, 241—254 (1968). 23. McKenney J. L., Simultaneous Processing of Jobs on an Electronic Computer, Management Science, 8, 344—354 (1962). 24. Nelson R. Т., Queuing Network Experiments with Varying Arrival and Service Processes, Naval Research Logistics Quarterly, 13, 321—347 (1966). 25. Nelson R. Т., Labor and Machine Limited Production Systems, Management Science, 13, 648—671 (1967). 26. Nelson R. Т., Dual-Resource Constrained Series Service Systems, Operations Research, 16, 324—341 (1968). 27. Scheuer E., Stoller D. S., On the Generation of Normal Random Vectors, Technometrics, 4, 278—281 (1962). 28. Shubik M., Bibliography on Simulation, Gaming, Artificial Intelligence and Allied Topics, Journal of the American Statistical Association, 55, 736—751 (1960). 29. Taft M. I., Reisman A., Toward Better Curricula Through Computer Selected Sequencing of Subject Matter, Management Science, 13, 926—945 (1967). 30. Teichroew D., Lubin J. P., Computer Simulation-Discussion of the Technique and Comparison of Languages, Communications of the ACM, 9, 723—741 (1966). 31. Tocher K. D., Review of Simulation Languages, Operational Research Quarterly, 16, 189-218 (1965). 32. Westlake W. J., A. Uniform Random Number Generator Based on the Combination of Two Congruential Generators, /. of ACM, 14, 337—340 (1967).
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автокорреляция т. 3, 377, 382 Алгол т. 3, 351 Алгоритм т. 1, 125 — аддитивный т. 2, 285 — декомпозиции т. 2, 456 — задания маршрутов т. 2, 279 — итераций по критерию т. 3, 151 — итераций по стратегиям т. 3, 153, 166 — максимального потока т. 1, 318 — минимальной стоимости/максимального потока т. 1, 325 — отыскания кратчайшего пути т.1, 270 — — — — для ациклической сети т. 1, 294 — последовательного нахождения безусловного максимума т. 2, 445, 448 — рекуррентный т. 2, 11 — симплексный т. 1, 132 — — двойственный т. 1, 187 — — квадратичный т. 2, 363 — —модифицированный т. 2, 439 Алгоритмы градиентные мелкошаговые т. 2, 436 Альтернативные ограничения т. 2, 250 — оптимальные решения т. 1, 57, 111, 142 Анализ классификационный т. 1, 171 — многомерный т. 3, 383 — многошаговый т. 2, 211 — решения на чувствительность т. 1, 57, 167 — спектральный т. 3, 377 — управляющих решений т. 1, 11 — факторный т. 3, 383 Арбитраж коммерческий т. 1, 62 Атрибутивные связи т. 3, 357 Базис т. 1, 134 — вырожденный т. 1, 144 — исходный т. 1, 134, 145 — нестандартный т. 2, 439 — стандартный т. 2, 439 Базисное решение т. 1, 134 Бесконечные последовательности значений эффекта т. 2, 134
Бесконечный плановый период т. 2, 131 — — — как предел конечного периода т. 2, 131 — — — с дисконтированием т. 2, 145 Блок-схема алгоритма задания маршрутов т. 2, 279 — — исключения подциклов т. 2, 277 — — основанного на методе ветвей и границ т. 2, 272 — — частичного перебора т. 2, 290 — — частичных циклов т. 2, 283 — событий для модели массового обслуживания т. 3, 373 — функционирования имитационной модели управления запасами т. 3, 370 Буферный запас т. 3, 244 Вероятностные ограничения т. 3,47,245 Верхняя граница оптимального значения целевой функции т. 2, 275 Веса смежных точек т. 2, 378 Винера — Хопфа интегральное уравнение т. 3, 472 Вогнутые целевые функции т. 2, 50, 356 Входной поток т. 3, 274 — — не обладающий «памятью» т. 3, 279 — — пуассоновский т. 3, 293, 313 — — стационарный т. 3, 279 Выбор модели т. 1, 21 Выпуклая оболочка множества допустимых решений т. 2, 259 Выпуклое множество т. 1, 111 Выпуклые целевые функции т. 2, 50 Выпуклый полиэдральный конус т. 1, 115 Вырожденность сплошная т. 2, 266 Выходной поток т. 3, 316 — пуассоновский т. 3, 316 Гамма-распределение т. 3, 282 Гарантийный запас т. 3, 244 Генерация случайных переменных т. 3, 362 чисел т. 3, 359, 360
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Гибкость алгоритма т. 2, 54 Градуировка времени неоднородная т. 3, 369 — — однородная т. 3, 368 Двоичное представление т. 2, 284 Двойственная задача линейного программирования т. 1, 84, 173 Двойственности теорема т. 1, 175 — — нелинейного программирования т. 2, 436 Двойственный симплекс-критерий I т. 1, 188 — симплекс-критерий II (максимизация) т. 1, 191 — симплекс-критерий II (минимизация) т. 1, 189 Дерево альтернатив т. 1, 31 — решений т. 3, 95 Джона условия т. 2, 433 Дисконтирования коэффициент т. 2, 140 Дисперсия спроса т. 3, 240 Дисциплина очереди т. 3, 274, 294 — — «первым пришел — первым обслуживаешься» т. 3, 275 — — по случайному закону т. 3, 275 — — при наличии приоритета т. 3, 310 — — «пришел последним — обслуживаешься первым» т. 3, 275 Длина шага т. 2, 346 Длительность планового периода т. 2, 27 Допустимое решение задачи линейного программирования т. 1, 105 Допустимые значения переменной т. 1, 142 Достаточное условие существования максимума вогнутой функции т. 2, 357 Задача баланса сборочных линий т. 2, 242 — выбора оптимального транспортного маршрута т. 1, 78 — динамического планирования т. 1, 64 — дихотомического выбора т. 2, 247 — замены оборудования т. 1, 231; т. 2, 153; т. 3, 110, 170 — комбинаторная т. 2, 243 — коммивояжера т. 1, 235; т. 2, 252, 274 — координационная суженная т. 2, 450
Задача массового обслуживания т. 3 270 — об оптовых складах т. 1, 220 — о восстановлении т. 2, 109 — — дилижансах т. 2, 8 кратчайшем пути т. 1, 253; т. 2 168; т. 3, 139 — — назначениях т. 1, 226, 317 — определения оптимального объема заказа (размера партии) т. 1. 34; т. 3, 102, 224 — — оптимальной сети телефонной связи т. 1, 36 — отыскания пути минимальной стоимости т. 1, 228 — — — — продолжительности т. 1 228 — планирования трудовых ресурсов т. 1, 239 — производственная «места и времени» т. 1, 33 — размещения (взвешенная) т. 1, 248 — распределения усилий т. 2, 98, 104, 105; т. 3, 91 — — ресурсов т. 1, 54 — рационального составления комбикорма т. 1, 57 — регулирования численности обслуживающего персонала т. 3, 70 — сетевая (обобщенная) т. 1, 247 — составления жидких смесей т. 1. 59 — — коммерческого прогноза т. 3, 107 — транспортная т. 1, 53, 213, 272; т. 3, 52 — — обобщенная т. 1, 248 — — с ограниченной пропускной способностью т. 1, 286 — — Хитчкока — Купмаиса т. 1, 77 — управления запасами т. 2, 14; т. 3, 98, 198 Задачи сетевого планирования при ограниченных ресурсах т. 2, 242 Закон движения системы т. 3, 156 Замена базиса т. 1, 136 Затраты интегральные дисконтированные т. 2, 153, 217 — на оформление заказа на поставку товаров т. 3, 203 — на подготовительные операции т. 2, 63 — на подготовку производства т. 2, 241 — на содержание запасов т. 2, 33; т. 3, 203 — производственные т. 2, 52, 63 — связанные с использованием наиболее дешевого маршрута т. 1, 79
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
— связанные с оформленном дополнительного заказа т. 3, 105 — связанные с производством на отрезке времени т. 2, 66 — штрафные т. 3, 170 Зацикливание симплекс-процедуры т. 1, 152 Избыточное ограничение т. 1, 82 Имитационное моделирование т. 3, 254 Имитационный процесс т. 3, 353 — тост т. 3, 348 — эксперимент т. 3, 348, 351 Индукция обратная т. 3, 97 Искусственная переменная т. 1, 146 Искусственный интеллект т. 3, 386 Итерации по критерию т. 2, 170 — по стратегиям т. 2, 195 Канал (обслуживания) т. 3, 276 Канонические формы задачи линейного программирования т. 1, 109 Кендалла обозначения т. 3, 293 Колебания спроса сезонные т. 1, 218 Колмогорова — Чэпмена уравнения т. 3, 320 Контроль за уровнем запасов непрерывный т. 3, 205 _ _ _ _ периодический (дискретный) т. 3, 205, 413 Контур (сети) т. 1, 244 Коэффициент дисконтирования на отрезке времени т. 2, 140; т. 3, 139 — загруженности прибора т. 3, 298 Коррелированные случайные величины т. 3, 368 Критерий I квадратичного симплексного алгоритма т. 2, 364 Критерий II квадратичного симплексного алгоритма т. 2, 364 Критерии составные т. 1, 87 — среднего эффекта за отрезок времени т. 2, 137 — Чебышева т. 2, 381 — эквивалентного среднего эффекта т. 2, 144 — эффективности т. 1, 12, 23 Куна — Таккера условие т. 2, 432 Лапласа преобразование (одностороннее) т. 3, 454 Лапласа — Стилтьеса преобразование т. 3, 453 Линеаризация т. 2, 372 Линейное программирование т. 1, 30, 51
489
Линейности аксиомы т. 1, 55 Локальный максимум т. 2, 337, 357 Марковские цепи т. 3, 147, 156, 445 — — вложенные т. 3, 457 Марковский процесс т. 3, 283, 456 — — дискретный т. 3, 321 — — однородный во времени т. 3, 321 Марковское свойство системы т. 3, 140, 146 Матрица вероятностей переходов т. 3, 147, 156, 464 — — — дважды стохастическая т. 3, 158 — инциденций узлы — дуги т. 1, 244 Метод алгоритмический т. 1, 129 — «больших штрафов» т. 1, 147 — вероятностных ограничений т. 3, 60 — возврата т. 2, 256, 272 — Гаусса (исключения переменных) т. 1, 127 — генерации цифровых! последовательностей псевдовероятностный т. 3, 360 — дихотомии т. 2, 341 — задания маршрутов т. 2, 278 — золотого сечения т. 2, 339 — имитационного моделирования т. 1, 36; т. 3, 347 — исключения подциклов т. 2, 275 — интераций по критерию т. 2, 159; т. 3, 151 — итераций по стратегиям т. 2, 163; т. 3, 366 — композиций т. 3, 366 — конгруэнции т. 3, 360 — кратчайшего пути т. 1, 326 — критического пути т. 1, 237 — минимальной стоимости/максимального потока т. 1, 324 — мультипараметрической регрессии т. 3, 383 — мультипликативных конгруэнции т. 3, 361 — наискорейшего подъема с оптимальной длиной шага т, 2, 350 Ньютона — Рафсона т. 2, 354 — обратного преобразования т. 3, 363 — обратной индукции т. 1, 32 — обрыва ветвей т. 2, 272 — однородной градуировки времени т. 3, 368 — отрицательных корреляций т. 3, 382 -— отсекающих плоскостей т. 2, 256 — параметрического программирования т. 1, 171
490
ПРЕДМЕТНЫЙ
Метод последовательных приближений т. 2, 158, 192; т. 3, 151, 445 — присоединенных целевых функций т. 1, 171 — проецируемых градиентов т. 2, 419 — сверток т. 3, 366 — секущих плоскостей т. 2, 418 — симплексный т. 1, 124, 284 — синтеза систем т. 3, 278 — случайного регулирования т. 3, 381 — статистического анализа т. 2, 354 — стохастической аппроксимации т. 3, 383 — субрелаксации т. 2, 354 — целочисленных форм т. 2, 258 — чувствительных поверхностей т. 3, 383 — частичных циклов т. 2, 280 — штрафной функции т. 2, 443 — эквивалентных преобразований т. 3, 366 Методы эвристического программирования т. 3, 386 Механизм обслуживания т. 3, 274, 275 Моделирование т. 1, 19 Модель гиперболического программирования т. 2, 381 — глобального усреднения т. 3, 44 — динамическая т. 2, 5 — замены оборудования т. 1, 230 — имитационная т. 1, 37; т. 3, 348,356 — комбинаторная т. 2, 240 — линейного программирования т. 1, 30, 51 — — — стохастическая т. 3, 34 — массового обслуживания т. 1, 36; т. 3, 270 — — — с вынужденными отказами т. 3, 303 — — — с конечной длиной очереди т. 3, 303 — — — с неограниченной длиной очереди т. 3, 304 — нелинейная т. 2, 326 — распределения усилий т. 2, 98 — самообслуживания т. 3, 292 — сетевая т. 1, 212 — стохастическая т. 3, 10, 12 — — многошаговая т. 3, 69 — транспортная т. 1, 77 — управления запасами т. 2, 49 — — — с вогнутой функцией затрат т. 2, 52, 71 — — — статическая (одношаговая) т. 3, 209 — упреждающих действий т. 3, 42 •— целочисленного программирования т. 2, 240 — чистой гибели т. 3, 290
УКАЗАТЕЛЬ
Модульное исчисление т. 3, 360 Монотонно возрастающая последовательность приближений т. 2, 160 — убывающая последовательность приближений т. 2, 161 Небазисные переменные т. 1, 134 Нелинейные ограничения т. 2, 329 Неограниченное оптимальное решение' т. 1, 64, 112, 165 Непрерывное слежение за уровнем запасов т. 3, 205 Неотрицательная переменная т. 1, 107 Неравенство треугольника т. 1, 229 Ньютона —• Рафсона метод т. 2, 354 Обработка данных статистическая т. 3, 375 Обслуживание групповое т. 3, 278 Обслуживания длительность т. 3, 293, 313 — механизм т. 3, 275 Обслуживающие приборы т. 3, 276 — — расположенные последовательно т. 3, 276 — — функционирующие параллельно т. 3, 276 Ограничение избыточное т. 1, 82 Ограничения вероятностные т. 3, 47, — в линейных оптимизационных моделях т. 1, 29, 105 48, 245 — второстепенные т. 1, 193 — двойственной задачи т. 1, 178 — дополнительные т. 1, 194; т. 2, 58 — нелинейные т. 2, 329 — сепарабельные т. 2, — сепарабельные т. 2, 376 — совместно-вероятностные т. 3, 50 Опора функции линейная т. 2, 422 Опорный план т. 1, 128 Определение сети (линейного графа) т. 1, 243 Очередь конечная т. 3, 303 — неограниченной длины т. 3, 304 •— с ограниченным временем ожидания т. 3, 275 Переменная двойственной задачи т. 1, 179, 182 — значения которой ограничены снизу т. 1, 109 — избыточная т. 1, 106 — искусственная т. 1, 146 — не имеющая ограничений в знаке т. 1, 56, 107, 238
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Переменная остаточная т. 1, 106 — свободная т. 2, 285, 362 — случайная т. 3, 362 Период числовой последовательности т. 3, 361 Планового периода длительность т. 2, 23 Поиск седловой точки функции Лагранжа т. 2, 452 Поллачека — Хинчина формулы т. 3, 307 Полнота симплекс-алгоритма т. 1, 130 Потоки на сетях т. 1, 77 Правило выбора знака т. 1, 63, 67 — ограниченного ввода в базис т. 2, 374 — пополнения запасов т. 3, 209 — принятия управляющего решения т. 3, 40, 357 — сложных процентов т. 2, 140 Представление в пространстве решений задачи линейного программирования т. 1, 110 — — — условий задачи линейного программирования т. 1, 115 Преобразование Лапласа одностороннее т. 3, 453 — Лапласа — Стилтьеса т. 3, 453 Применения исследования операций в некоммерческой сфере т. 1, 43 Прогноз спроса т. 2, 32 Прогнозы сбыта т. 1, 18 Программирование гиперболическое т. 2, 381 — динамическое т. 2, 23 — дробно-линейное т. 2, 381 — линейное т. 1, 30, 50 — — стохастическое т. 3, 34, 43 — нелинейное т. 2, 324 — параметрическое т. 1, 171 — с вероятностными ограничениями т. 3, 46 — целочисленное т. 2, 240 — эвристическое т. 3, 386 Пропускная способность разреза т. 1, 316 Пространство решений т. 1, 110 — условий т. 1, 110 Процесс восстановления т. 3, 279 — пуассоновский т. 3, 278, 283 Процессы ковариационно-стационарные т. 3, 377 — рождения и гибели т. 3, 320, 325 — стационарные т. 3, 156 — чистого рождения т. 3, 283 Пуассоновское распределение вероятностей т. 3, 240 Путь минимальной продолжительности (на транспортной сети) т. 1, 228
491
Путь минимальной стоимости (на транспортной сети) т. 1, 228 Рандомизация т. 3, 23 Распределение вероятностей т. 3, 24 — — биномиальное т. 3, 364 — — гамма т. 3, 282 — — геометрическое т. 3, 298 — — нормальное т. 3, 247, 367 — — отрицательно биномиальное т. 3, 416, 444 — — пуассоновское т. 3, 240 — — — усеченное т. 3, 291 — — стационарное т. 3, 156, 297,449 — — экспоненциальное т. 3, 279, 455 — Эрланга т. 3, 286 — — и-фазное т. 3, 293 — Юла—Фарри т. 3, 285 Реакция сбыта т. 2, 104 Режим слежения за уровнем запасов т. 3, 205, 207 Рекуррентное соотношение динамического программирования т. 2, 8, 19, 98; т. 3, 99 Рекуррентные события т. 3, 279 Решение типа «да — нет» т. 2, 241 Сдвиг стартовой точки т. 1, 146 Сети эквивалентные т. 1, 77 Сеть т. 1, 73, 78, 213 — ациклическая т. 1, 231, 244 — двудольная т. 1, 244 — многопродуктовая т. 1, 248 — общего вида т. 1, 288 — ориентированная т. 1, 243 — связная т. 1, 244 — с ограниченной пропускной способностью т. 1, 313 — типа «дерево» т. 1, 244 — транспортная т. 1, 73 Сжатие времени т. 3, 348 Симплекс-критерий I (максимизация) т. 1, 135, 169 Симплекс-критерий I (минимизация) т. 1, 148, 279 Симплекс-критерий II т. 1, 136, 279 Симплекс-критерий I двойственный т 1, 188 Симплекс-критерий II (максимизация) двойственный т. 1, 191 Симплекс-критерий II (минимизация) двойственный т. 1, 189 Симплексный алгоритм т. 1, 318 Симплекс-таблица т. 1, 157 Скидка цены в зависимости от размера заказа т. 2, 64
492
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Скользящее планирование т. 2, 29 Скрытые издержки т. 1, 142 Состояние статистического равновесия т. 3, 157, 297 ' Спроса колебания т. 1, 218 ' Срок запаздывания поставки т. 3, 202 Стоимость замены оборудования т. 2, 109 — изменения объема производства т. 2 74 — эксплуатации оборудования т. 2, 109 Стратегия т. 1, 33 — детерминированная т. 3, 153 — минимальных затрат т. 2, 10, 13 — оптимальная т. 1, 33, 34; т. 2, 9, 18 — рандомизированная т. 3, 112 — стационарная т. 3, 112 — управления запасами т. 3, 204 — формы («, S) т. 3, 209 Ступенчатые цены т. 2, 64 Сферы применения операционных методов т. 1, 42 — Сходимость симплекс-алгоритма т. 1, 130, 144, 150 Теорема двойственности линейного программирования т. 1, 175 — — нелинейного программирования т. 2, 437 — о базисе т. 1, 150 — об оптимальности (s, S) -стратегии для статической модели т. 3, 220 — — эквивалентности форм т. 3, 36 — о виде оптимальной программы т. 2, 64 — — влиянии варьирования верхних границ т. 2, 58 — — длительности планового периода для модели восстановления т. 2, 159 — _ _ _ _ _ _ с выпуклой функцией затрат т. 2, 60 — длительности планового периода для модели, учитывающей единовременные затраты т. 2, 72 _ _ дополнительной нежесткости т. 1, 177 — — максимальном потоке/минимальном разрезе т. 1, 317 _ _ стационарной стратегии т. 2, 199 _ — — — при а = 1 т. 3, 155 при 0 < а < 1 т. 3, 149 _ _' треугольном свойстве транспортной задачи т. 1, 282 — — целочисленности т, 1, 246 — центральная предельная т. 1, 367 Точки регенерации т. 3, 456, 465 Траффик-интенсивность т. 3, 297
Треугольная структура системы линейных уравнений т. 1, 277 Триангуляция т. 1, 277 Уилсона формула т. 3, 230 Универсальный язык моделирования GPSS т. 3, 349 Уравнение восстановления т. 3, 448 — интегральное Винера — Хопфа т. 3 472 — Поллачека — Хинчина т. 3, 461 — экстремальное т. 2, 155; т. 3, 146 — сохранения потока (материального баланса) т. 1, 246 Уравнения в конечных разностях т. 3, 297, 314 — Колмогорова — Чэпмена т. 3, 320 Уровень запасов т. 1, 35; т. 2, 18, 28; т. 3, 99 критический т. 3, 204, 207, 209 — — страховых т. 2, 328 — обслуживания т. 3, 244 — сбыта т. 1, 66 — спроса т. 1, 77; т. 3, 99, 202 Условие Джона г. 2, 433 — Куна — Танкера т. 2, 432 — оптимальности Лагранжа т. 2, 435 — целочисленности т. 1, 283 Условия неопределенности т. 1, 11 Формула экономически выгодного размера партии т. 2, 157 — рекуррентная динамического программирования т. 2, 11 — Уилсона т. 3, 230 Формулы Поллачека — Хинчина т. 3, 307 Фортран т. 3, 351 Функции дитонические т. 2, 225 — целевые сепарабельные т. 2, 372 Функция вогнутая т. 2, 50 — выпуклая т. 2, 50 — квазивыпуклая т. 2, 336 — затрат на содержание запаса т. 3, 208 — — нелинейная т. 2, 329 — нормального распределения т. 3, 247 — ожидаемых штрафных потерь т. 3, 217 — потерь нормированная интегральная т. 3, 247, 442 —- производящая т. 3, 453 — реакции сбыта т. 2, 104 — сглаживающая т. 2, 74 — унимодальная т. 2, 338
ПРЕДМЕТНЫЙ
Функция целевая т. 1, 61, 115, 289; т. 2, 10, 424 — — вогнутая т. 2, 49, 50 — — выпуклая т. 2, 49, 50 — — мультивременная т. 3, 23 Характеристики модели операционные т. 3, 273 — — измеряемые т. 3, 358 — решения рабочие т. 3, 15
УКАЗАТЕЛЬ
493
Числа случайные униформные т. 3, 359 — Фибоначчи т. 2, 225 Штраф единовременный т. 3, 216 — за неудовлетворение спроса т. 3, 203 Штрафные затраты т. 3, 170 — потери т. 3, 200 — ситуации т. 3, 200 Штрафных потерь функция т. 3, 217
Целевая функция т. 1, 61, 115, 289; т. 2, 10, 424 Целочисленность т. 1, 283 Цена неопределенности т. 3, 34, 45 Цены ступенчатые т. 2, 64 Цепи Маркова т. 3, 147, 156, 445, 456 — вложенные т. 3, 457 Цепь множественная т. 3, 159 — ориентированная т. 1, 244 — циклическая т. 3, 159 Цикл ориентированный т. 1, 244 — числовой последовательности т. 3, 361 Циклы несвязные т. 1, 236
Экзогенные события т. 3, 357 Экономическая рентабельность операционного исследования т. 3, 430 Экономические последствия, порождаемые неопределенностью т. 3, 33 Экстремальная точка т. 1, 111 Эффект дисконтированный интегральный т. 2, 139, 188; т. 3, 138 — средний за отрезок т. 2, 137 — средний эквивалентный т. 2, 135, 144 Эффективности критерий т. 1, 12, 23 — норма внутренняя т. 2, 135 Эффективность предельная возрастающая т. 2, 63 — — убывающая т. 2, 53 — экономическая т. 1, 12
Чебышева критерий т. 2, 381 Числа конгруэнтные по модулю т. 3, 360
Язык моделирования PL/I т. 3, 351 — — Симскрипт т. 3, 351
Оглавление
Том I Предисловие к русскому изданию Глава 1 ИСКУССТВО И НАУКА В ОРГАНИЗАЦИОННОМ УПРАВЛЕНИИ 1.1. Несколько слов о термине «исследование операций» 1.2. О других названиях 1.3. Границы применимости количественного анализа 1.4. Важность построения моделей 1.5. Процесс количественного анализа 1.6. Исследование операций «в миниатюре» 1.7. На пределе возможностей 1.8. О чем не следует забывать Упражнения
9 9 9 16 19 22 26 39 45 45
Глава 2 ПОСТРОЕНИЕ
ЛИНЕЙНЫХ
ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
2.1. Введение 2.2. Задача распределения ресурсов 2.3. Задача рационального составления комбикорма 2.4. Задача составления жидких смесей 2.5. Многосторонний коммерческий арбитраж 2.6. Динамическое планирование (пример комплексного производственного планирования) 2.7. Распределение потоков товарных поставок на транспортной сети 2.8. Задача выбора оптимального транспортного маршрута 2.9. Использование линейного программирования при решении производственных задач Упражнения
50 50 54 57 59 62 64 73 78 84 90
Глава 3 АЛГЕБРАИЧЕСКОЕ И ГЕОМЕТРИЧЕСКОЕ ПРЕДСТАВЛЕНИЯ ЛИНЕЙНЫХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ
104
3.1. Введение 3.2. Алгебраическая формулировка задачи в общем виде 3.3. Канонические формы для линейных оптимизационных моделей 3.4. Геометрическая интерпретация 3.5. Представление в пространстве решений большего числа измерений 3.6. Представление в пространстве условий Упражнения
104 104 109 110 114 115 119
ОГЛАВЛЕНИЕ
_
__
495
Глава 4 СИМПЛЕКСНЫЙ МЕТОД 4.1. В перспективе — теория 4.2. Общее ознакомление с задачей 4.3. Алгоритмический метод 4.4. Введение в симплексный алгоритм 4.5. Полнота алгоритма 4.6. Область применимости 4.7. Свойства сходимости 4.8. Требования к вычислительным процедурам 4.9. Табличное представление 4.10. Матричное представление Упражнения
124
,[24 ^25 129 132 144 148 150 159 156 158 160
Глава 5 АНАЛИЗ МОДЕЛЕЙ НА ЧУВСТВИТЕЛЬНОСТЬ ^ДВОЙСТВЕННАЯ ЗАДАЧА ! 5.1. Анализ модели после нахождения оптимального решения . . . . 5.2. Целевая функция 5.3. Константы в правых частях ограничений 5.4. Двойственность 5.5. Решение двойственной задачи 5.6. Продолжение анализа на чувствительность 5.7. Заключение 5.8. Двойственный симплекс-алгоритм 5.9. Дополнительные ограничения 5.10. Переменные, значения которых ограничены^сверху Упражнения
167 167 169 171 173 178 182 186 187 192 194 198
Глава 6 ОПТИМИЗАЦИЯ НА СЕТЯХ 6.1. Значение сетевых моделей 6.2. Классическая транспортная задача 6.3. Модель с промежуточными пунктами 6.4. Модель назначений 6.5. Модель выбора кратчайшего пути 6.6. Календарное планирование методом критического пути 6.7. Календарное планирование трудовых ресурсов 6.8. Общие понятия сетевых моделей 6.9. Обобщенная сетевая задача 6.10. Многопродуктовая сеть Упражнения
212 212 213 219 226 227 236 239 243 247 248 250
Глава 7 АЛГОРИТМЫ РЕШЕНИЯ СЕТЕВЫХ ЗАДАЧ 7.1. Сущность и оценка рассматриваемых вопросов
269 269
496
ОГЛАВЛЕНИЕ
7.2. Основные положения 7.3. Симплексный метод решения транспортных задач 7.4. Дополнительные замечания по симплексному методу 7.5. Оценка чувствительности решения 7.6. Кратчайший маршрут в сети общего вида 7.7. Кратчайший маршрут в ациклической сети Упражнения
270 272 282 289 290 294 296
Приложение I АЛГОРИТМЫ РЕШЕНИЯ СЕТЕВЫХ ЗАДАЧ . . . 1.1. Максимальный поток в сети с ограниченными пропускными способностями 1.2. Решение задачи о назначениях 1.3. Алгоритмы решения других классов сетевых задач Литература
313 313 317 329 330
Том II Глава 8 ВВЕДЕНИЕ В ТЕОРИЮ ДИНАМИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ 8.1. Анализ динамических процессов 8.2. Задача о дилижансах: аллегория 8.3. Простейшая задача управления запасами 8.4. Числовой пример 8.5. Анализ чувствительности решения 8.6. Поиски возможностей улучшения плана Упражнения
5 5 8 14 22 25 34 37
Глава 9 ДИНАМИЧЕСКИЕ ОПТИМИЗАЦИОННЫЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ 9.1. Использование особенностей структуры 9.2. Выпуклые и вогнутые целевые функции 9.3. Модель управления запасами с выпуклой функцией затрат . . . . 9.4. Анализ длительности планового периода в моделях с выпуклой функцией затрат 9.5. Модель управления производством и запасами с вогнутой функцией затрат 9.6. Алгоритм оптимизации модели с вогнутой функцией затрат . . . . 9.7. Анализ длительности планового периода в моделях с вогнутой функциеи затрат 9.8. Модель управления запасами при сглаживании производства . . . Упражнения
49 49 49 52 59 "3 66 1\J ' 74 80
ОГЛАВЛЕНИЕ
4'J7
Глава 10 ЕЩЕ О ДИНАМИЧЕСКОМ ПРОГРАММИРОВАНИИ 10.1. Введение 10.2. Модель распределения усилий 10.3. Распределение усилий. Два ограничения 10.4. Распределение усилий. Погруженная задача 10.5. Целочисленное линейное программирование 10.6. Модель замены оборудования 10.7. Структура многошагового анализа 10.8. Сущность динамических процессов 10.9. Вычислительные возможности метода динамического программирования 10.10. Область применения динамического программирования Упражнения
97 97
98 104 105 108 108 111 113 115 Ив 117
Глава 11 ПРИНЯТИЕ РЕШЕНИЯ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ
131
11.1. Модели с бесконечным плановым периодом 11.2. Тонкости, связанные с оценкой бесконечных последовательностей 11.3. Модель эксплуатации лесного хозяйства 11.4. Модель восстановления с бесконечным числом этапов 11.5. Методы последовательных приближений 11.6. Метод последовательных приближений в пространстве функций (метод итераций по критерию) 11.7. Метод последовательных приближений в пространстве стратегий (метод итераций по стратегиям) 11.8. Эквивалентная задача линейного программирования 11.9. Повторное рассмотрение задачи нахождения кратчайшего пути Упражнения
131 134 150 153 158 159 163 166 168 174
Глава 12 МЕТОДЫ ОПТИМИЗАЦИИ ПРИ БЕСКОНЕЧНОМ ПЛАНОВОМ ПЕРИОДЕ 12.1. Дискретное динамическое программирование 12.2. Методы последовательных приближений 12.3. Минимизация среднего эффекта за отрезок 12.4. Демонстрация метода итераций по стратегиям на числовых примерах 12.5. Простая модель управления запасами 12.6. Подход на основе линейного программирования 12.7. Заключительные замечания Упражнения
188^8 *^
203^11 *? 1 А ^1Г> ^23 ^б1
498
ОГЛАВЛЕНИЕ
Глава 13 МОДЕЛИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ И КОМБИНАТОРНЫЕ МОДЕЛИ " 13.1. Поиск философского камня 13.2. Постановки задач целочисленного программирования 13.3. Общие сведения о методах решения задач целочисленного программирования 13.4. Алгоритмы отсечения. (Метод целочисленных форм) 13.5. Метод ветвей и границ 13.6. Задачи коммивояжера 13.7. Метод частичного (неявного) перебора Упражнения .
240 240 246 256 258 267 274 284 294
Глава 14 •ОПТИМИЗАЦИЯ ПРИ НЕЛИНЕЙНОЙ ЦЕЛЕВОЙ ФУНКЦИИ . . .
324
14.1. Введение в нелинейное программирование 14.2. Направленность подхода и круг охватываемых вопросов . . . . 14.3. Оптимизация нелинейной функции одной переменной 14.4. Максимизация нелинейной функции многих переменных без ограничений 14.5. Метод скорейшего подъема 14.6. Квадратичное программирование 14.7. Сепарабелыюе программирование 14.8. Непосредственная линеаризация 14.9. Максимизация выпуклой целевой функции Упражнения
324 331 334 343 350 358 371 380 383 384
Глава 15 УСОВЕРШЕНСТВОВАННЫЕ ПРОГРАММИРОВАНИЯ
МЕТОДЫ
НЕЛИНЕЙНОГО
15.1. Крупношаговые методы 15.2. Метод выпуклых комбинаций 15.3. Симплексный метод вогнутого программирования 15.4. Другие подходы 15.5. Оптимизация при нелинейных ограничениях 15.6. Метод допустимых направлений 15.7. Теоретические свойства оптимального решения. 15.8. Возвращение к квадратичному программированию 15.9. Метод штрафной функции 15.10. Обобщенный алгоритм программирования 15.11. Декомпозиция задач линейного программирования Упражнения Литература
402 402 405 411 418 421 426 430 437 443 449 455 459 478
ОГЛАВЛЕНИЕ
/qg
Том III Глава 16 ВВЕДЕНИЕ В ТЕОРИЮ СТОХАСТИЧЕСКИХ ОПТИМИЗАЦИОННЫХ МОДЕЛЕЙ 16.1. Управляющие решения в условиях неопределенности . . . . . . 16.2. На пути к оптимальному решению 16.3. Заблуждение относительно средних 16.4. Двухшаговая линейная модель 16.5. Модель с вероятностными ограничениями 16.6. Случай транспортной сети 16.7. Многошаговая линейная модель 16.8. Квадратичная критериальная функция (линейный вид оптимального решения) Упражнения
5 5 13 29 34 46 52 61 69 72
Глава 17 ВЕРОЯТНОСТНЫЕ МОДЕЛИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 17.1. Введение 17.2. Задача распределения усилий 17.3. Проблема улучшения качества продукции и дерево решений . . . 17.4. Элементарная модель управления запасами 17.5. Задача определения оптимального размера партии 17.6. Задача составления коммерческого прогноза 17.7. Стохастическая модель восстановления (задача замены оборудования) 17.8. Вопросы применимости и вычислительные аспекты методов вероятностного динамического программирования Упражнения
90 91 93 98 102 107 НО 114 115
Глава 18 ДИНАМИЧЕСКОЕ ЦЕПЯХ
ПРОГРАММИРОВАНИЕ НА
МАРКОВСКИХ
18.1. Введение 18.2. Стохастическая модель задачи о кратчайшем маршруте 18.3. Бесконечный плановый период с дисконтированием (а < 1) . . . 18.4. Эквивалентный средний эффект (а = 1) 18.5. Подход, основанный на использовании аппарата линейного программирования 18.6. Вычислительные аспекты 18.7. Модель замены оборудования в виде марковских цепей Упражнения
138 138 139 145 154 165 169 170 172
500
ОГЛАВЛЕНИЕ
Глава 19 СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ
ЗАПАСАМИ
. . . .
197
19.1. Новый подход 197 19.2. Научный подход к решению задачи управления запасами . . . . 198. 19.3. Основные факторы, учитываемые при анализе систем управления запасами 201 19.4. Статическая модель 207 19.5. Модели экономически выгодных размеров заказываемых партий . 224 19.6. Динамические вероятностные модели с режимом непрерывного контроля уровня запасов 237 19.7. Несколько общих замечаний по поводу практического использовании результатов исследования 251 Упражнения 255 Глава 20 МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ
270
20.1. Введение 20.2. Классификация моделей массового обслуживания 20.3. Распределение вероятностей для длительностей интервалов между последовательными поступлениями требований на обслуживание . . . 20.4. Распределение вероятностей для длительностей обслуживания 20.5. Одноканальная модель с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания 20.6. Многоканальная модель с пуассоновским входным потоком и экспоненциальным распределением длительностей обслуживания 20.7. Процессы рождения и гибели 20.8. О других моделях массового обслуживания Упражнения
270> 274 27& 287 294 313. 320 328 329
Глава 21 ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ ОПЕРАЦИОННЫХ СИСТЕМ С ПОМОЩЬЮ ЭВМ
343
21.1. Когда другие методы беспомощны 21.2. Имитационное моделирование в перспективе 21.3. Пример имитационного моделирования фондовой биржи 21.4. Построение имитационной модели 21.5. Генерация случайных событий 21.6. Приращение времени 21.7. Проектирование имитационного эксперимента 21.8. Языки программирования 21.9. Задачи ближайшего будущего Упражнения
343 349 351 356 359 368 375 383 386 387
ОГЛАВЛЕНИЕ
501
Глава 22 ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ОПЕРАЦИОННОГО ИССЛЕДОВАНИЯ
393
22.1. Текущее положение 22.2. Как поставить исследование операций на службу руководителю 22.3. Как руководить разработкой операционного проекта 22.4. Как руководить подразделением, выполнякщ!:^ операционное исследование , 22.5. Взгляд в будущее
393 395 401 408 410
Приложение II СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ЗАПАСАМИ € ПЕРИОДИЧЕСКИМ КОНТРОЛЕМ
413
11.1. 11.2. П.З. 11.4. 11.5. 11.6. 11.7.
413 413 418 422 433 437 445
Введение Временные соотношения и неудовлетворенный спрос Модель с конечным плановым периодом Вид и полное определение оптимальных стратегий Случай нулевых накладных расходов Модель с бесконечным плановым периодом Анализ модели с помощью марковских цепей
Приложение III НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ МАССОВОГО ОБСЛУЖИВАНИЯ 111.1. 111.2. 111.3. 111.4. 111.5.
АНАЛИЗА МОДЕЛЕЙ
Предварительные замечания Модель типа M/GH Модель типа GI/M/1 Модель типа GI/M/S Модель типа G//G/1
453 453 456 465 469 471
Приложение IV
473
ТАБЛИЦЫ
473
Литература Предметный указатель
476 487
ПОПРАВКА В т. 2 на стр. 180, 17-я строка снизу читать по стратегиям.
вместо слов по критерию
следует
УВАЖАЕМЫЙ
ЧИТАТЕЛЬ!
Ваши замечания о содержании книги, ее оформлении, качестве перевода и другие просим присылать по адресу: 129820, Москва, И-110, ГСП, 1-й Рижский пер., д. 2, издательство «Мир».
С. ВАГНЕР
Основы исследования операций Том 3 Редактор М. ВЕЛИКОВСКИЙ Художник А. Шипов Художественный редактор Ю. Урманчеев Технический редактор Я. Иовлева Сдано в набор 31/1 1973 г. Подписано к печати 25/V 1973 г. Бумага тип. № 1 60x901/16=15,75 бум. л. 31,50 усл. печ. л. Уч.-изд. п. 34,22 Изд. № 20/6896 " нл 2 p. C7 к. Зак. 0870 ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ордена Трудового Красного знамени Московская типография JM» 7 «Искра революции» Спюзполиграфпрома при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли., Москва, К-1, Трехпрудный пер., 9