Государственный комитет Российской Федерации по рыболовству Камчатский государственный технический университет
Кафедра ...
8 downloads
169 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Государственный комитет Российской Федерации по рыболовству Камчатский государственный технический университет
Кафедра радиооборудования судов
ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ТЕХНИЧЕСКИХ УСТРОЙСТВ
Рекомендовано советом учебно-методического объединения вузов Российской Федерации по образованию в области эксплуатации авиационной и космической техники в качестве учебного пособия для студентов специальности 201300 «Техническая эксплуатация транспортного радиооборудования»
Петропавловск-Камчатский 2003
УДК 621.396.61(075) ББК 72.4(2) Б19 Рецензенты: А.А. Дуров, кандидат технических наук, доцент, заведующий кафедрой радиооборудования судов КамчатГТУ М.И. Водинчар, кандидат физико-математических наук, доцент, заведующий кафедрой высшей математики КГПУ
Бакеев Д.А., Ильина И.В., Ильин И.А. Б19
Основы научных исследований. Экспериментальное исследование технических устройств: Учебное пособие для студентов специальности 201300 «Техническая эксплуатация транспортного радиооборудования». – Петропавловск-Камчатский: КамчатГТУ, 2003. – 94 с. ISBN 5–328–00042–0 Учебное пособие составлено в соответствии с требованиями к обязательному минимуму содержания основной образовательной программы подготовки специалиста по специальности 201300 «Техническая эксплуатация транспортного радиооборудования» государственного образовательного стандарта высшего профессионального образования. На примере транзисторного автогенератора гармонических колебаний последовательно изложены теория организации и проведения эксперимента, основные этапы экспериментальных исследований, построения имитационных математических моделей, статистической обработки результатов, а также методы математического обоснования этих исследований. Книга предназначена для студентов технических университетов и радиотехнических вузов по дисциплине «Основы научных исследований».
УДК 621.396.61(075) ББК 72.4(2)
ISBN 5–328–00042–0
© КамчатГТУ, 2003 © Авторы, 2003
2
Содержание
Введение ......................................................................................................... 5 1. Задачи экспериментального исследования автогенератора гармонических колебаний ............................................. 6 1.1. Основные концепции планирования экспериментальных исследований ................................................... 6 1.2. Основные этапы проведения экспериментальных исследований ................................................... 10 1.3. Математическая модель автогенератора на основе дифференциальных уравнений, описывающих переходный процесс в контуре ............................... 11 1.4. Задачи экспериментального исследования автогенератора гармонических колебаний ...................................... 18 2. Применение методов математической статистики при экспериментальных исследованиях автогенератора гармонических колебаний ............................................. 19 2.1. Точечные оценки основных статистических характеристик частоты автогенератора ........................................... 19 2.2. Интервальные оценки основных статистических характеристик частоты автогенератора .......................................... 26 2.3. Основные законы распределения случайных величин, применяемые при статистической обработке результатов экспериментальных исследований .............................. 37 2.4. Статистическая проверка гипотез при экспериментальных исследованиях автогенератора и при обработке результатов исследований .................................... 48 2.5. Имитационная математическая модель частоты автогенератора (корреляционный анализ) ........................ 57 2.6. Исследование влияния элементов схемы автогенератора на его частоту (дисперсионный анализ) ............... 65 3. Планирование эксперимента для обоснования имитационной математической модели частоты автогенератора первого и второго порядка ........................................... 76 3.1. Планирование и проведение двухфакторного и трехфакторного эксперимента для обоснования математической модели частоты автогенератора первого порядка ...................................................... 76 3
3.2. Планирование и проведение дробного факторного эксперимента для обоснования математической модели частоты автогенератора первого порядка ....................................................... 83 3.3. Планирование и проведение эксперимента для обоснования имитационной математической модели частоты автогенератора второго порядка ........................... 88 Заключение ..................................................................................................... 93 Литература ..................................................................................................... 94
4
Введение Выпускники специальности «Техническая эксплуатация транспортного радиооборудования» занимаются эксплуатацией судового радиооборудования, поэтому они должны в процессе обучения пробрести навыки в организации и проведении экспериментальных исследований при настройке и эксплуатации судовых радиоэлектронных устройств. Современные методы проведения экспериментальных исследований позволяют ускорить исследование сложных радиоэлектронных устройств и повысить эффективность исследования во много раз. Математическая теория эксперимента позволяет оптимизировать эксперимент, проводить его таким образом, чтобы свести к минимуму интуитивный, "волевой" подход к организации эксперимента, который заменяется научно обоснованной программой проведения экспериментального исследования, причем субъективные оценки уступают место достаточно надежным статистическим оценкам результатов эксперимента на всех последовательных этапах экспериментального исследования. Для радиоинженера основная цель большинства экспериментальных исследований состоит в нахождении такой совокупности входных управляемых переменных (факторов), при которых оптимизируемая целевая функция принимает экстремальное значение, и это должно достигаться при минимуме возможного числа опытов, а также затрат времени и средств. Примером применения формализованных методов планирования и проведения эксперимента может служить настройка многокаскадного усилителя с распределенным усилением, где целевой функцией может быть величина коэффициента усиления на выходе при заданной полосе пропускания. На одном из предприятий опытному настройщику требовалось несколько дней для настройки такого усилителя. Применение методов планирования эксперимента позволило сократить время настройки до нескольких десятков минут. При этом требования к квалификации настройщика существенно снизились, т. к. применение формализованных методов настройки не требует глубоких знаний сущности физических процессов, протекающих в усилителе. В первом разделе учебного пособия рассмотрены основные концепции планирования экспериментов, определены понятия и модели. Рассмотрены основные этапы статистического планирования и проведения эксперимента. Поставлена задача экспериментального исследования широко применяемого в радиоэлектронной аппаратуре транзисторного автогенератора гармонических колебаний. Во втором разделе учебного пособия рассмотрены вопросы обработки результатов экспериментальных исследований, статистических процедур по выбору гипотез, оценки значимости действующих факторов, обоснования имитационной математической модели. 5
В третьем разделе учебного пособия рассмотрены вопросы планирования эксперимента. На примере автогенератора рассмотрены проведение полного факторного эксперимента, дробного факторного эксперимента, план для обоснования имитационной модели второго порядка – центральный композиционный ортогональный план. В заключении сформулированы полученные результаты.
1. Задачи экспериментального исследования автогенератора гармонических колебаний 1.1. Основные концепции планирования экспериментальных исследований Эксперимент (от лат. experimentum – проба, опыт) − метод познания, при помощи которого в контролируемых и управляемых условиях исследуются явления природы и общества [1]. Планирование эксперимента – раздел математической статистики, изучающий рациональную организацию измерений, подверженных случайным ошибкам [2]. Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности. Любое техническое устройство можно представить в виде «черного ящика», полностью игнорируя все внутренние особенности моделируемого объекта. Такая модель называется имитационной математической моделью. Целью моделирования в этом случае является описание поведения объекта «черного ящика» как единого целого. Для этого «черного ящика» находят связь между выходным параметром (функцией отклика) и входными переменными (факторами), отвлекаясь при этом от сущности механизма явлений, протекающих в исследуемом объекте. При этом предполагают, что механизм явлений можно описать дифференциальными уравнениями, хотя практически их получить трудно или порой невозможно из-за сложности объекта исследования. Далее предполагают, что систему дифференциальных уравнений можно решить, хотя практически ни решение, ни даже аналитический вид той функции, которой оно задается, как правило, неизвестны. С учетом принятых предположений зависимость между функцией отклика объекта исследования, представленного в виде «черного ящика», и факторами, действующими на его входе, в общем виде может быть описана полиномом любого порядка: 6
k
k
k
i =1
i ≠1
i =1
Y = θ0 + ∑θi xi + ∑θij xi x j + ∑θii xi2 + ... Коэффициенты этого полинома являются коэффициентами ряда Тейлора, т. е. значениями частных производных в точке, вокруг которой осуществляется разложение неизвестной функции, задающей решение неизвестных нам дифференциальных уравнений. Так,
∂ 2Y ∂Y ∂ 2Y θi = , θij = , θii = 2 . ∂xi ∂xi ∂x j ∂xi С точки зрения понимания механизма явлений, происходящих в исследуемом объекте, имитационная математическая модель интереса не представляет. Зная значения первых членов ряда Тейлора, невозможно восстановить исходные дифференциальные уравнения, которыми описывается механизм процесса. Правда, возможна физическая интерпретация полученных результатов, но она не дает однозначных представлений о природе явлений. Зато полиномиальная модель очень удобна для оптимизации значений функции отклика и при планировании эксперимента. Обычно рассматривается следующая схема планирования эксперимента. При экспериментальном исследовании производят измерение функции отклика F ( θ , х ) , которая зависит от неизвестных параметров (вектор θ ) и от переменных х (факторы). Факторы по выбору экспериментатора могут принимать значения из некоторого допустимого множества х. Целью эксперимента обычно является оценка всех или некоторых параметров θ или их функций либо проверка некоторых гипотез о параметрах θ . В случае, когда отклик является случайной величиной, связь между переменными x1 , x2 , ... xk характеризуется математической моделью, которая называется уравнением регрессии. Для аппроксимации широко используются полиномиальные модели. Например, производится измерение частоты колебаний автогенератора (АГ). Известно, что на нее влияют емкость контура (переменная х1 ), индуктивность контура (переменная х2 ), напряжение источника питания (переменная х3 ). Частота АГ является функцией переменных х1 , х2 , х3 и неизвестного вектора θ:
Y = F ( θ , х ) = θ0 + θ1 x1 + θ 2 x2 + θ 3 x3 .
(1.1.1)
Численные значения вектора θ определяются из эксперимента. Уравнение (1.1.1) называют уравнением регрессии. Исходя из цели эксперимента, формулируется критерий оптимальности плана эксперимента. Под планом эксперимента понимается совокупность значений, задаваемых переменным х в эксперименте. Обычно оценки параметров θ ищут по методу наименьших квадратов, а гипотезы о параметрах θ проверяются с помощью F-критерия Фишера ввиду оп7
тимальных свойств этого метода. В обоих случаях при этом оказывается естественным выбирать в качестве критерия оптимальности плана с заданным числом экспериментов некоторую функцию от дисперсии и коэффициентов корреляции оценок методом наименьших квадратов. Дисперсия (от лат. dispersion − рассеяние) в математической статистике и теории вероятностей есть мера рассеяния (отклонение от среднего). Корреляция в математической статистике является вероятностной или статистической зависимостью. В отличие от функциональной зависимости корреляционная возникает тогда, когда зависимость одного фактора от другого осложняется наличием случайных дополнительных факторов. Метод наименьших квадратов – один из методов теории ошибок для оценки неизвестных величин по результатам измерений, содержащих случайные ошибки. Он применяется также для приближенного представления заданной функции другими (более простыми) функциями и часто оказывается полезным при обработке наблюдений. В качестве примера найдем параметры θ0 и θ1 при линейной аппроксимации частоты АГ при воздействии одного параметра х . Тогда уравнение регрессии можно записать в виде: Y = θ0 + θ1 x .
Необходимо минимизировать разность:
D=
n
∑ [Y − ( θ i
0
+ θ1 xi )] 2 ,
i =1
где: Yi – измеренные значения частот АГ; xi – численные значения параметра х ; n – число измерений. Для минимизации D приравнивают к нулю частные производные по θ0 и θ1 , тогда можно записать уравнения: n dD = 2 (Yi − θ0 + θ1 xi )( −1 ) = 0 ; dθ 0 i =1
∑
n dD = 2 (Yi − θ0 + θ1 xi )( − xi ) = 0. dθ 1 i =1
∑
После упрощений получаем:
nθ0 + θ1 n
n
∑ i =1 n
θ0 ∑ xi + θ1 ∑ i =1
i =1
8
xi =
n
∑Y ; i
i =1
xi2
=
n
∑Y x . i i
i =1
Решение системы этих уравнений имеет вид: n
θ0 = Y − θ1 x ; Y = n
n
θ1 =
∑
∑Y
i
i =1
n
xiYi −
i =1
n
∑x
2 i
; x=
i =1
n
;
n
∑x ∑ Y i
−(
i =1
∑x
i
n
i =1
n
n
i
i =1
∑x )
.
2
i
После проведения эксперимента и оценки θ0 , θ1 значения частоты АГ могут вычисляться при использовании имитационной модели Y = θ 0 + θ1x. Отметим, что в случае, когда F ( θ , х ) линейно зависит от θ, оптимальный план часто можно построить до проведения эксперимента, в других случаях уточнение плана эксперимента происходит по ходу эксперимента. В теории планирования эксперимента применяют методы, основанные на следующих основных концепциях: – концепция многофакторного эксперимента; – концепция рандомизации; – концепция последовательного планирования. Концепция многофакторного эксперимента может быть рассмотрена на следующем примере, приведенном в работе [5]. Пусть в линейной задаче оценки параметров θ действует k факторов x1 , x2 , ... xk . Уравнение регрессии можно записать в виде:
F ( θ , x ) = θ0 + θ1 x1 + θ 2 x2 + ... + θ k xk . Необходимо найти выборочные оценки qi для коэффициентов регрессии θi , а именно qi → θi . Эту задачу можно решать традиционным однофакторным методом, варьируя каждую переменную по очереди. Предположим, что для каждой переменной сделано n повторных опытов и эти переменные изменяются только на двух уровнях, а именно на уровнях +1 и –1. Тогда дисперсия оценки коэффициента регрессии будет определена уравнением:
σ { qi } = 2
σ 2{ F } 2n
.
Эта величина не зависит от общего числа независимых переменных, поскольку каждая из них изучается в отдельности, и значение qi определяется всего двумя усредненными измерениями, которыми и задается значение дисперсии коэффициента регрессии. Если же воспользоваться другой стратегией, варьируя все переменные сразу так, чтобы каждый эффект оценивался по всей 9
совокупности опытов, то можно надеяться в благоприятном случае уменьшить дисперсию оценки по сравнению с дисперсией единичного измерения в ( k + 1 )n раз, так как оценки будут производиться по всем ( k + 1 )n опытам. Концепция рандомизации применяется для такой организации эксперимента, при которой некоторые плохо контролируемые факторы ставятся в положение случайных. При этом в процессе статистической обработки происходит (хотя бы частично) самоисключение плохо контролируемых факторов, устранение некоторых систематических погрешностей. Концепция последовательного эксперимента предусматривает возможность планировать не весь эксперимент сразу, а поэтапно: сначала планируется первый этап, полученные результаты анализируются, а на основе этого анализа планируется следующий этап. Если уже на первом этапе получены ответы на интересующие вопросы, то эксперимент прекращается. Если же неопределенность имеет место, то опыт продолжается. Такая стратегия позволяет зачастую ограничиваться минимальным числом измерений. Не каждый эксперимент использует все эти идеи, но именно их совокупность явилась основой достижений современной теории планирования эксперимента и обработки экспериментальных результатов.
1.2. Основные этапы проведения экспериментальных исследований Экспериментальные исследования включают в себя следующие этапы: – постановка эксперимента; – планирование; – выполнение; – анализ и интерпретация результатов; – представление результатов. Постановка эксперимента заключается в определении его цели, выборе выходных и входных переменных, т. е. выборе отклика и факторов, установлении области возможных значений факторов, совместимых с имеющимися ограничениями. Постановка эксперимента опирается на априорную информацию и является наименее формализуемым этапом экспериментальных исследований. Планирование эксперимента есть процесс определения необходимого числа опытов (или, что то же, числа экспериментальных точек) и установления порядка проведения эксперимента (последовательности получения экспериментальных точек), обеспечивающих решение поставленной задачи с требуемой точностью. Именно на этом этапе используются идеи многофакторного эксперимента, рандомизации и последовательного планирования. Если цель эксперимента – получение оценок некоторых статистических параметров, характеризующих объект, то число опытов должно быть достаточным для того, чтобы неопределенность оценок не превышала приемлемых значений. Но лишние опыты, удорожающие эксперимент, проводиться не должны. Если необходимо построить математическую модель объекта, то планирование эксперимента 10
должно предусматривать получение результатов, необходимых для ее построения. При этом желательно, чтобы число опытов было минимальным. Кроме того, конкретная задача может диктовать дополнительные требования к планированию эксперимента. Так, при решении экстремальной задачи необходимо выбрать наилучшую стратегию достижения экстремума функции отклика. При планировании эксперимента исследователь должен: – обеспечить высокую надежность и четкость интерпретации результатов экспериментального исследования; – составить четкую и последовательную логическую схему построения всего процесса исследования, в которой указано, что, когда и как нужно делать; максимально формализовать процесс разработки модели и сопоставления экспериментальных данных различных опытов объекта исследования с целью широкого применения вычислительной техники. Всем перечисленным требованиям отвечают статистические методы планирования эксперимента, являющиеся одним из эмпирических способов получения математического описания исследуемых объектов. При применении статистических методов планирования эксперимента математическое описание представляется обычно в виде полинома (1), где Y – функция отклика, а x1 , x2 , ... xk – факторы, влияющие на объект исследования. Непосредственное выполнение эксперимента в соответствии с планом обеспечивает получение экспериментальных данных, которые используются для нахождения требуемых оценок и построения математического описания объекта. Анализ и интерпретация результатов производятся на заключительном этапе экспериментального исследования. Анализ осуществляется средствами математической статистики. Он дает оценки интересующих экспериментатора величин и определяет степень достоверности этих оценок. Интерпретация имеет своей целью выражение результатов анализа в терминах и понятиях той области науки или техники, в интересах которой был проведен эксперимент. Без интерпретации полученные результаты могут быть не поняты, а значит, и не использованы в полной мере. Представление результатов является последней заботой экспериментатора.
1.3. Математическая модель автогенератора на основе дифференциальных уравнений, описывающих переходный процесс в контуре Автогенераторы (АГ) гармонических колебаний на биполярных транзисторах получили широкое распространение. Их применяют в качестве опорных генераторов в возбудителях передатчиков и гетеродинах приемников, в качестве частотных модуляторов в различных устройствах автоматики и контрольноизмерительной аппаратуре. Рассмотрим переходные процессы в колебательной системе (КС), которая в простейшем случае представляет собой колебательный контур, содержащий катушку, индуктивность которой L, конденсатор, емкость которого С, активное сопротивление величиной R (рис. 1а). 11
R
L
L
С
T
C
а
б
Рис. 1. Эквивалентные схемы контура и автогенератора
Предположим, что конденсатор заряжен до напряжения U0 от внешнего источника напряжения. В соответствии с законом Кирхгофа можно записать: t
di 1 ri + L + idt = 0. dt C 0
∫
Дифференцируя, получим уравнение второго порядка для тока в цепи: d 2i i ri + L 2 + = 0. C dt
Обозначив
1 r = w02 , получим: = 2d и LC L d 2i di + 2d + w02i = 0. 2 dt dt
(1.1.2)
Характеристическое уравнение для последнего дифференциального уравнения имеет вид:
α 2 + 2dα + w02 = 0. Легко найти корни характеристического уравнения:
α 1 = −d + d 2 − w02 ; α 2 = −d − d 2 − w02 . Теперь можно найти решение дифференциального уравнения (1.1.2) в виде:
i = A1eα1t + A2eα 2t . Ток установившегося режима равен нулю, поэтому i( 0 ) = 0 ,
U C ( 0 ) = U0 . 12
di( 0 ) =0, dt
Подставляя значение тока и его производной до коммутации (при t = 0 ), получим:
i=
U0 ( eα1t − eα 2t ). L( α 1 − α 2 )
Пусть в рассматриваемом случае корни характеристического уравнения будут комплексными, что имеет место при d < w02 . Введем обозначение w02 − d 2 = w12 , тогда
α 1 = − d + d 2 − w02 = − d + jw1 = w0 e jθ , α 2 = − d − d 2 − w02 = − d − jw1 = w0 e jθ ,
θ = arctg(
− w1 ). −d
Выражение для тока, c учетом формулы Эйлера, имеет вид:
i=−
U 0 −dt e sin w1t . w1 L
Из полученных выражений следует, что в контуре происходит колебательный процесс. Ток и напряжение периодически меняют знак. Амплитуда колебаний убывает по показательному закону, т. е. в цепи совершаются затухающие колебания тока и напряжения. Для поддержания незатухающих колебаний в контуре включим в него активный элемент – биполярный транзистор (рис. 1б). В этой схеме:
Z1 = R1 + jX 1 ; Z 2 = R2 + jX 2 ; Z 3 = R3 + jX 3 ; где R1 , R2 , R3 – активные сопротивления, а X1, X2, X3 – реактивные сопротивления комплексных величин Z1 , Z 2 , Z 3 . Очевидно, что R1 + R2 + R3 = R. Для повышения добротности КС необходимо уменьшать активные потери R в ее элементах, поэтому R1, R2, R3 должны быть достаточно малы. Приближенно можно считать Z1 = jX1; Z2 = jX2; Z3 = jX3. Реактивные элементы X1, X2, X3 образуют КС, в которой два реактивных элемента имеют одинаковый знак (положительный или отрицательный), а еще один реактивный элемент отличается знаком от двух других. Транзистор, включаемый в контур, является усилителем, преобразующим энергию источника питания в энергию переменного тока, частота и фаза которого не отличаются от частоты и фазы собственных колебаний контура. Поэтому энергия этого тока восполняет потери на активном сопротивлении R контура. Внесение в контур энергии переменного тока эквивалентно внесению 13
в него отрицательного сопротивления, компенсирующего положительное сопротивление потерь R. Колебания в контуре в этом случае будут незатухающие. Для работы транзистора в режиме усиления колебаний, которые поступают в базовую цепь и снимаются в коллекторной цепи, необходимо обеспечить питание постоянным напряжением коллекторной и базовой цепей (источник коллекторного питания и источник базового смещения). Питание базовой цепи можно осуществить с помощью делителя напряжения от источника коллекторного питания. На рис. 2 представлена электрическая схема автогенератора, получившая название емкостной трехточечной схемы. В этой схеме R2 и R3 – делитель напряжения источника коллекторного питания Ек . С помощью делителя формируется напряжение смещения:
Есм = Ек
R3 . R2 + R3
R1 C3
R2 C4
+ C5
L1
R3
C2
R4
Вых
-
C1
Рис. 2. Электрическая схема АГ
Индуктивность L1 является индуктивностью колебательного контура; емкость соединенных последовательно конденсаторов C1, C4, C5 является емкостью колебательного контура; Lбл – блокировочная индуктивность (развязывает по высокой частоте автогенератор и источник питания); С4 − блокировочная емкость (развязывает по постоянной составляющей базовую и коллекторную цепи транзистора). Общая емкость контура, в который включен транзистор, определяется выражением: 1 1 1 1 = + + . C C1 C4 C5
Эквивалентное сопротивление параллельного колебательного контура будет определяться уравнением: Rое = RхарQ , где: Rхар =
Q=
Rхар R
L – характеристическое сопротивление контура; C – добротность контура. 14
а Z3 Z1 Z2
Uвх
Uвых
б Рис. 3. Эквивалентная схема АГ
Найдем условия самовозбуждения емкостной трехточечной схемы, рассматривая ее как систему с замкнутой обратной связью. Если U вх и U вых – операторные изображения сигналов на входе и выходе при разомкнутой цепи обратной U связи (рис. 3), то передаточная функция К ( р ) = вых . Для того чтобы найти U вх функцию К ( р ) , учтем, что напряжение U аб на зажимах контура возникает за счет тока i = SU вх , проходящего через параллельно-последовательно соединенdi ные элементы Z1, Z2, Z3 ( S = , где S – крутизна переходной характеристики dU вх транзистора):
SU вх Z1( Z 2 + Z 3 ) . Z1 + Z 2 + Z 3
U аб = Поскольку
U вых =
U аб ( Z 2 + Z 3 ) , Z1 + Z 2 + Z 3
то
К( р ) =
U вых SZ1Z 2 . = U вх Z1 + Z 2 + Z 3
Учитывая, что конденсатор C1 включен параллельно с эквивалентным сопротивлением контура Rое , можно записать:
Z1 =
Rое . 1 pC1( +R) pC1 15
Для Z2, Z3 можно записать:
Z2 =
1 ; Z 3 = pL ; pC 2
подставляя в выражение для передаточной функции, получим:
K( p ) =
U вых U вх
=
SRое = 1, М( р )
M ( p ) = C1 C2 L Rое p 3 + C2 Lp 2 + ( C1 + C2 )Rое p + 1 − SRое = 0. Цепь будет неустойчивой, если определитель Гурвица [1, с. 348] отрицателен:
D=
L C2
C1 C2 L Rое
1 − SRое
Rое ( С1 + С2 )
=
= LC2 Rое ( С1 + С2 ) − ( 1 − SRое )С1 С2 L Rое < 0. Из полученного выражения следует:
С2 < SRое . С1 Если обозначить
С2 С1
= K ос , то условие самовозбуждения можно записать в виде: S Rое K ос > 1 .
Учитывая, что S = Se jϕs , R = R ⋅ e jϕr , K ос = Ke jϕk , можно условие самовозбуждения переписать в виде двух условий: 1) условие баланса амплитуд
SRK > 1, 2) условие баланса фаз
ϕ s + ϕr + ϕk = 2πn ; n = 1, 2 , ... Частота колебаний АГ зависит от параметров КС, поэтому изменение частоты во времени (стабильность частоты АГ) будет определяться изменением во времени основных параметров КС. Для рассматриваемой простейшей колебательной системы – одиночного параллельного колебательного контура – можно отыскать эквивалентные параметры Lэк , Сэк , Rэк (рис. 1а). Они определяются собственными параметрами ненагруженного контура L, C, R и вносимыми в него комплексными сопротив16
лениями от усилительного элемента и цепи нагрузки. Вносимое в контур комплексное сопротивление от усилительного элемента АГ состоит из выходного сопротивления усилительного элемента, образованного выходной емкостью Свых и внутренним сопротивлением активного элемента Ri (значения Cвых и Ri зависят от режима работы усилительного элемента), и комплексного сопротивления Z вн = Rвн + jX вн , обеспечивающего условие самовозбуждения в АГ. Если условие самовозбуждения выполняется, то вносимое в контур сопротивление Rвн отрицательно, а характер и знак реактивной составляющей сопротивления Х вн зависят от конкретной схемы АГ. Будем условно трактовать Х вн как емкость Свн , знак которой определяется конкретной схемой. Если емкость Свн положительна, то Сэк увеличивается; если Свн отрицательна, то Сэк уменьшается. Цепь нагрузки характеризуется входными параметрами Свх и Rвх каскада, на который работает АГ. Значения Свх и Rвх , так же как Свых и Rвых , зависят от режима работы АГ. Упрощенная схема эквивалентного контура АГ показана на рис. 4.
m2 m1 Свых
Ri
Свн
С
Rвн
Rое
Свх
Rвх
Рис. 4. Упрощенная схема эквивалентного контура АГ
Усилительный элемент АГ и цепь нагрузки подключены к контуру с учетом коэффициентов включения m1 и m2 . Тогда имеем:
Сэк = С +
m12Cвых
+
m12Cвн
+
m22Cвх ;
1 1 m12 m12 m22 = + + + . Lэк = L ; Rэк Rое Ri Rвн Rвх
Параметры эквивалентного контура АГ изменяются во времени из-за дестабилизирующих факторов, что приводит к изменению его резонансной частоты, следовательно, и частоты колебаний АГ. Нестабильность частоты автогенератора во многом определяется изменениями во времени вносимых в контур емкостей Свых , Свх и Свн . Для уменьшения влияния изменения этих емкостей на результирующую емкость эквивалентного контура Сэк нужно либо снизить коэффициенты включения m1 , m2 , либо увеличивать емкость контура С. При выполнении этих условий пересчитанные в контур емкости Cвых , Свх и Свн составляют малую долю от результирующей емкости Сэк . При этом 17
можно повысить стабильность частоты АГ. Однако бесконечно уменьшать коэффициенты включения m1 , m2 невозможно вследствие срыва колебаний АГ. Поэтому ограничиваются минимально возможными значениями коэффициентов включения m1 , m2 , при которых условие самовозбуждения выполняется. Изменение температуры окружающей среды влияет на стабильность частоты АГ. Повышение температуры вызывает удлинение проводов и размеров каркаса катушек (увеличивает их индуктивности), а также расширение пластин конденсаторов и изменение зазора между пластинами (изменяет их емкости). Это приводит к изменению частоты АГ. Изменение температуры окружающей среды приводит к изменению параметров усилительного элемента, в том числе его реактивных параметров. Это особенно касается входной и выходной емкостей транзистора, изменение которых приводит к изменению емкости контура и, следовательно, к изменению его частоты. Режимы работы усилительных элементов зависят от приложенного напряжения источников питания. Если по каким-либо причинам напряжение питания изменяется, то изменяются входные и выходные параметры усилительных элементов, а следовательно, частота колебаний АГ. Поэтому напряжение питания АГ должно быть стабилизированным. Одним из основных параметров АГ является стабильность рабочей частоты. Зависимость усилительных свойств транзистора, его входной и выходной проводимостей от питающих напряжений, температуры окружающей среды, режима работы является одной из главных причин нестабильности частоты АГ. Для рассматриваемого АГ относительная нестабильность частоты составляет –3 10 , поэтому для частот порядка сотен килогерц значение частоты, измеряемое частотомером, представляет собой случайную величину, числовое значение которой содержит шесть знаков. У этого числа неизменные первые три знака, а три последних будут принимать случайные значения при измерении. Из изложенного следует, что значение частоты на выходе автогенератора без учета добротности колебательной системы определяется из дифференциального 1 . Однако вследствие нестабильности уравнения формулой Томпсона ϖ = LC различных факторов частота на выходе автогенератора – случайная величина.
1.4. Задачи экспериментального исследования автогенератора гармонических колебаний Для рассматриваемого АГ могут быть решены задачи, которые можно считать типичными для технических устройств: 1. Оценка определенных характеристик (параметров) изучаемого объекта, проявляющих себя статистически, а также проверка некоторых гипотез, касающихся упомянутых характеристик; эта задача имеет непосредственное отношение к измерительным процессам в промышленных условиях; для рассматриваемого АГ такой задачей является измерение и оценка частоты АГ. 18
2. Выявление воздействия, влияния на выходную величину тех или иных факторов; результатом такого эксперимента должно быть одно из утверждений: «да» или «нет»; соответствующая экспериментальная процедура называется дисперсионным анализом; для рассматриваемого АГ такой задачей является достоверная оценка влияния на частоту АГ факторов (индуктивности, емкости, напряжения питания). 3. Установление функции отклика, т. е. статистически достоверной зависимости, связывающей отклик с факторами, другими словами – построение математической модели изучаемого объекта; это задача регрессионного анализа. Для рассматриваемого АГ такой задачей является построение имитационной математической модели АГ. 4. Определение степени взаимной статистической связи двух величин, что является предметом корреляционного анализа. Для рассматриваемого АГ такой задачей является установление статистической связи между факторами. 5. Нахождение оптимальных условий функционирования устройства, т. е. определение значений факторов, при которых отклик является максимальным (или минимальным); эта задача решается в ходе выполнения экстремального эксперимента. Для рассматриваемого АГ такой задачей является подбор таких значений факторов (индуктивности, емкости, напряжения питания), которые позволят получить требуемое значение частоты АГ.
2. Применение методов математической статистики при экспериментальных исследованиях автогенератора гармонических колебаний
2.1. Точечные оценки основных статистических характеристик частоты АГ Частота АГ является случайной величиной и поэтому необходимо применение основных понятий теории вероятностей для экспериментальной оценки статистических характеристик этой случайной величины − частоты АГ. Теория вероятностей является математической наукой, изучающей закономерности, присущие массовым явлениям. Используя собственные методы, теория вероятностей позволяет теоретическим путем определить вероятностные характеристики одних случайных величин через вероятностные характеристики других. Эти методы позволяют существенно уменьшить количество экспериментов, проводимых для изучения конкретных случайных величин. Но полностью устранить экспериментальную информацию при изучении случайных величин нельзя. Корни изучения случайных явлений всегда лежат в эксперименте, в методах обработки и исследования опытных данных. Совокупность методов анализа экспериментальных данных, получаемых при изучении случайных явлений, составляет предмет математической статистики. Точнее, математическая статистика занимается сбором, регистрацией 19
и обработкой результатов наблюдений с целью установления закономерностей, управляющих массовыми случайными явлениями. В зависимости от характера экспериментальной информации в математической статистике решаются следующие задачи: 1. Определение закона распределения случайной величины. 2. Проверка статистических гипотез. 3. Определение неизвестных параметров распределения. Основным методом математической статистики является выборочный метод. Опишем идею этого метода. Предположим, что при изучении некоторого случайного явления мы имеем дело с некоторыми однородными объектами; это могут быть как физические объекты, так и их параметры. Совокупность всех таких исследуемых объектов называется генеральной совокупностью. Множество n объектов, отобранных случайным образом из генеральной совокупности, называется выборкой объема n. Выборочный метод заключается в том, что по данным анализа выборки объема n делается заключение обо всей генеральной совокупности в целом. Выборка называется репрезентативной, если каждый объект из генеральной совокупности имеет одинаковую возможность попасть в эту выборку. Отсюда вытекает, что в силу статической устойчивости результаты изучения такой выборки будут близки к результатам исследования всей совокупности в целом. Исследование генеральной совокупности в целом обычно трудоемко, дорого, требует большого времени либо вообще неосуществимо. Поэтому очень важно уметь составлять качественную, репрезентативную выборку. Существуют два основных способа формирования выборки − с повторением и без повторения. Если выборка формируется так, что каждый отобранный в выборку объект после описания возвращается в генеральную совокупность, то мы имеем дело с повторным способом формирования выборки. При бесповторном способе формирования выборки объект в генеральную совокупность не возвращается. Предположим, что все объекты генеральной совокупности пронумерованы. Если для формирования выборки мы выбираем объект в случайном порядке, то такая выборка называется простой или случайной. Если для формирования выборки выбираются объекты из генеральной совокупности с заданными интервалами, то выборка называется механической. Например, механической является выборка каждого десятого элемента из генеральной совокупности. Предположим, что мы изучаем некоторую случайную величину Х, которая наблюдается в эксперименте. Наиболее полная информация о характере случайной величины содержится в функции распределения, поэтому будем считать, что нас интересует возможность определить эту функцию. В каждом из экспериментов случайная величина Х принимает некоторое значение. Совокупность экспериментов, в результате которых получаем множество значений Х, представляет собой первичный статистический материал. Этот материал называется простой статистической совокупностью или простым статистическим рядом. 20
Пример 1. Пусть в результате проведенных измерений получены значения частот АГ. Обозначим через i − порядковый номер измерения, через f i − значение частоты АГ, полученное в i-м измерении. Следующая таблица 2.1.1 дает простой статистический ряд для случайной величины: Таблица 2.1.1 1 2 3 4 5 6 7 8 9 10 i fi 194766 194645 194730 194730 194901 194810 194701 194810 194850 194870
Простой статистический ряд подлежит обработке методами математической статистики с целью получения более содержательной информации. Одним из основных видов обработки является получение статистической функции распределения F*(x) случайной величины Х. Под статистической функцией распределения случайной величины Х будем понимать частоту появления события Х < х в первичном простом статистическом ряде:
F*(x) = P(X < x).
(2.1.1)
Ясно, что для определения F*(x) нужно найти число опытов, в которых X < x, и разделить это число на общее число проведенных опытов. Пример 2. Составим статистическую функцию распределения для случайной величины f − частоты АГ из примера 1. Наименьшее значение f равно 194645 Гц, поэтому F*(x) при х ≤ 194645 будет равна нулю. Значение частоты f1 = 194645 наблюдалось 1 раз, поэтому в точке f1 = 194645 F*(x) будет иметь разрыв с величиной скачка 1/10. Аналогично в точке f2 = 194701 функция F*(x) имеет разрыв с величиной скачка 1/10. В промежутке от 194701 до 194730 F*(x) будет равна 2/10, но в точке f3 = 194730 имеет скачок, равный 2/10, т. к. f3 = 194730 появилась 2 раза из 10. На отрезке от 194730 до 194766 F*(x) равна 4/10, в точке f4 = 194766 она скачком изменяется на величину 1/10, значение f4 = 194766 принимает 1 раз. Аналогично в точке f5 = 194840 для F*(x) имеем скачок 2/10, в точке f6 = 194850 − 1/10, в точке f7 = 194870 скачок равен 1/10 и в точке f8 = 194901 скачок равен 1/10. График статистической функции распределения случайной величины f изображен на рис. 5.
Рис. 5. График F*(x) статистической функции распределения случайной величины f
21
Заметим, что F*(x) для любой случайной величины является разрывной функцией. При увеличении числа опытов статистическая функция распределения F*(x) стремится к истинной функции распределения F(x). Однако для большого числа наблюдений простой статистический ряд становится неудобной формой записи первичного статистического материала. Действительно, трудно сделать какие-либо выводы, наблюдая таблицу, содержащую сотни или тысячи чисел. В этом случае простой статистический ряд подвергается первичной статистической обработке, по нему строится статистический или вариационный ряд. Для этого весь диапазон изменения случайной величины Х делится на интервалы точками:
X1 = min, x2, x3, ..., xN = max X. Для каждого интервала вычисляется количество значений х, попадающих в этот интервал. Это количество делится на общее число наблюдений и называется частотой, соответствующей данному разряду. Статистический ряд представляет собой таблицу 2.1.2, где Ii – интервал (xi, xi+1), Pi* – частота. Таблица 2.1.2 Ii Pi*
x1 , x2 P1*
x2 , x3 P2*
... ...
xN-1, xN PN*
Число интервалов, из которых сформирован статистический ряд, не должно быть очень велико, в противном случае он будет так же необозрим, как и простой статистический ряд. Практика показывает, что число N наиболее целесообразно выбирать в пределах от 10 до 20. Статистический ряд можно представить в виде графика, который называется гистограммой. Гистограмма является статистическим аналогом плотности распределения вероятности случайной величины Х. А именно: на оси ОХ откладываются границы интервалов x1, x2, ..., хN. На каждом из интервалов (xi, xi+1) строится прямоугольник с основанием xi, xi+1 и площадью Pi*. Полученная совокупность прямоугольников, а иногда лишь верхняя граница этих прямоугольников и называется гистограммой. Пример 3. В результате проведенного изучения частот АГ получен статистический ряд (таблица 2.1.3). Таблица 2.1.3
ni
194760 194770 6
194770 194780 13
194780 194790 63
194790 194800 98
194800 194810 86
194810 194820 86
194820 194830 57
194830 194840 16
Pi*
0,014
0,030
0,144
0,224
0,224
0,197
0,130
0,037
Ii
В этом примере Ii обозначены интервалы для частот f АГ в Гц, Pi* – частоты, соответствующие данному интервалу. 22
Теперь составляем гистограмму:
Рис. 6. Гистограмма частот АГ
Числовым характеристикам случайной величины Х соответствуют статистические аналоги. Пусть в n опытах наблюдалась случайная величина Х, которая в i-м опыте принимала значение xi . При этом значение xi появляется ni раз, так что имеем:
n1 + n2 +...+ n k = n. Тогда выборочной средней m*x называется величина
m*x = M *
[x ] = 1 n
k
∑x n . i i
(2.1.2)
i =1
Выборочной дисперсией называется среднее арифметическое значение квадратов отклонений xi от выборочной средней:
D*x = D*
[x ] = 1 n
∑ (x − m ) n . k
i
* 2 x i
(2.1.3)
i =1
Корень квадратный из выборочной дисперсии называется выборочным средним квадратическим отклонением:
σ x* = Dx* .
(2.1.4)
Исправленной выборочной дисперсией S2 называется величина:
S2 =
n D*x . n −1 23
(2.1.5)
Величина S2 вводится потому, что при вычислении D*x всегда возникает систематическая ошибка, приводящая к уменьшению дисперсии, особенно для малых выборок. Так, при n = 25 D*x и S2 отличаются примерно на 4 %. Величина S2 ближе к истинной дисперсии случайной величины Х. Модой M *x называется xi значение, которому соответствует наибольшая n частота Px* = i . n Коэффициентом вариации V называется величина: ∗ σ V = ∗x ⋅ 100 %.
(2.1.6)
mx
Функции распределения случайных величин могут зависеть от некоторых числовых характеристик. Например, нормальный закон распределения зависит от двух параметров: m и σ, закон распределения Пуассона зависит от одного параметра λ, и т. д. Если значение некоторого параметра неизвестно, то при проведении серии опытов это значение уточняется и может быть приближенно вычислено. Оценкой параметра Θ называется функция выборочных значений Ψ(x1, x2, ... , xn) = Ψn , которая в определенном смысле приближается к точечному Θ значению. Оценка Ψn может отличаться от Θ в той или иной мере. Оценка называется несмещенной, если ее математическое ожидание совпадает с Θ : M[Ψn] = Θ. Оценка называется состоятельной, если:
P(⏐Ψn −Θ⏐≤ ε) →1 при n→∞. Оценка называется эффективной, если она имеет наименьшую дисперсию среди всех оценок данного типа. Понятия несмещенности, состоятельности и эффективности характеризуют качество оценки Ψn. Пусть над случайной величиной Х проведено n наблюдений с результатами x1, x2, ..., xn. Тогда для математического ожидания M[x] выборочное среднее является состоятельной и несмещенной оценкой:
m ∗x =
1 n
n
∑x . i
i =1
Для дисперсии D[X] мы знаем две оценки: D*x и S2. Однако оценка D*x не является несмещенной. Покажем это для случая, когда M[x] = 0. Действительно:
D*x =
1 n
n
∑ i =1
xi2
−
m∗x
1 n 2 ⎛1 = xi − ⎜⎜ n i =1 ⎝n
∑
2
⎞ 1 xi ⎟⎟ = n ⎠ i =1 n −1 n 2 2 = 2 xi − 2 n i =1 n n
∑
∑
24
n
∑
xi2
i =1
1 − 2 n
∑x x . i
j>i
j
n
∑ i =1
xi2 − 2 ⋅
1 n2
∑x x i
i< j
j
=
[ ]
Теперь вычислим M Dx∗ :
[ ]
M Dx∗ =
[ ]
[ ]
n −1 2 M xi2 − 2 ∑ M xi x j . 2 ∑ n n j>i
В силу независимости значений признаков xi второе слагаемое в правой части для независимых испытаний равно нулю. Отсюда:
[ ]
M Dx∗ =
n −1 D[ X ] , n
т. е. D*x действительно не является несмещенной. n−1 Умножая D*x на , получаем несмещенную оценку S2: n
M[S 2] = D[X]. Пример 4. Был проведен ряд измерений частоты АГ. Она составила 194892, 194894, 194903, 194905 и 194906 Гц. Найти выборочное среднее, выборочную и исправленную дисперсии частоты, выборочное среднеквадратическое отклонение. Решение. Выборочное среднее определяется по формуле (2.1.2):
m*x = 1/5 ⋅ (194892 + 194894 + 19490 3+ 194905 +194906) = 194900. Выборочная дисперсия находится по формуле (2.1.3):
D*x = 1/5 ⋅ [(194892 − 194900)2 + (194894 − 194900)2 + + (194903 − 194900)2 + (194905 − 194900)2 + + (194906 − 194900)2] = 1/5(64 + 36 + 9 + 25 + 36) = 34. Отсюда по формуле (2.1.4) находим выборочное среднее квадратическое отклонение: ∗ ∗ σ x = Dx = 34 ≈ 5 ,8310.
Исправленная дисперсия S2 находится по формуле (2.1.5):
S2 =
5 ∗ ⋅ Dx = 42 ,5. 4
Наконец, находим исправленное среднее квадратическое отклонение:
S = 42 ,5 = 6 ,5. 25
2. 2. Интервальные оценки основных статистических характеристик частоты автогенератора Ранее нами были получены оценки для математического ожидания, дисперсии и ряда других параметров случайных величин. Эти оценки представляли собой числовые характеристики выборки, они давали числовое значение оцениваемого параметра и ничего не говорили о точности и надёжности этого значения. Оценки подобного вида называются точечными. В ряде случаев очень важно оценить степень точности и надёжности, именно: указать числовой интервал, в котором с заданной вероятностью лежит оцениваемая величина. В математической статистике для получения информации о точности и надёжности оценок пользуются доверительными интервалами и доверительными вероятностями. Пусть для параметра Θ получена оценка Ψn, и нас интересует допущенная при этом ошибка. Зададимся некоторой вероятностью γ и найдём значение ε такое, что
P(⏐Θ − Ψn ⏐ ≤ ε) = γ.
(2.2.1)
При этом большие по величине ошибки, возникающие от замены Θ на Ψn, будут встречаться с малой вероятностью, равной 1 – γ. Соотношение (2.2.1) может быть представлено в виде:
P(Ψn − ε ≤ Θ ≤ Ψn + ε) = γ. Интервал, в который с вероятностью γ попадает значение Θ, называется доверительным интервалом Iγ:
Iγ = (Ψn − ε; Ψn + ε). Вероятность γ выполнения неравенства ⏐Θ − Ψn⏐≤ ε называется доверительной вероятностью или надёжностью оценки Θ. Заметим, что величина Θ является детерминированной, а оценка Ψn − случайной. Поэтому доверительный интервал является интервалом со случайными границами. Величина P =1 – γ называется уровнем значимости. На практике чаще всего применяются уровни значимости 0,05, 0,01 и 0,001. Нахождение доверительного интервала Iγ осложняется тем, что в формуле (2.2.1) закон распределения ошибки ⏐Θ − Ψn⏐ зависит от закона распределения случайной величины Х и, следовательно, от неизвестной величины Θ. На практике можно применять при n ≥ 20 следующий приём: в законе распределения Х заменяется Θ на Ψn. В качестве примера рассмотрим построение доверительного интервала для математического ожидания. Предположим, что для некоторой случайной ве26
личины Х с неизвестной дисперсией D и математическим ожиданием M получены опытные наблюдения x1, x2, ..., xn. На основе этих опытов получены оценки:
1 m = n ∗
1 S = n 2
n
∑x ;
(2.2.2)
i
i =1
∑ (x − m ) . n
i
∗ 2
(2.2.3)
i =1
Построим доверительный интервал Iγ для математического ожидания M случайной величины Х. Прежде всего отметим, что поскольку m* представляет собой сумму одинаково распределённых случайных величин xi , то она в силу центральной предельной теоремы распределена по закону, близкому к нормальному. На практике m* можно считать нормально распределённой уже при n = 10. Нормальный закон распределения характеризуется двумя параметрами: m и σ. Значение σ выбирается в соответствии с формулой σ = S . n В качестве m выбираем m*. Используя формулу для вероятности попадания нормально распределенной случайной величины в заданный интервал, получаем:
⎛ε ⎝σ
P(⏐m − m* ⏐ ≤ ε) = 2Ф ⎜
⎞ ⎟ −1. ⎠
Задавая значение γ и решая уравнение
⎛ε ⎞ ⎟ −1 = γ ⎝σ ⎠
2Ф ⎜
(2.2.4)
относительно ε, найдём приближённое решение задачи о нахождении доверительного интервала:
Iγ ≈ (m* − ε*; m* + ε*).
(2.2.5)
Здесь ε* есть решение уравнения (2.2.4). Если дисперсия D случайной величины Х известна, то в уравнении (2.2.4) в качестве σ следует взять величину D . Пример 1. В результате проведенного эксперимента было проведено двадцать измерений частоты АГ (в МГц): 10,5; 10,8; 11,2; 10,9; 10,4; 10,6; 10,9; 11,0; 10,8; 10,3; 11,3; 10,6; 10,5; 10,7; 10,8; 10,9; 10,8; 10,9; 10,8; 10,7; 10,9; 11,0. Требуется найти оценку математического ожидания параметра АГ и построить доверительный интервал с доверительной вероятностью γ = 0,8. Решение. Вычисляем величину: 27
1 m* = 20
20
∑ x = 10 ,78. i
i =1
Поскольку величина D неизвестна, то в качестве σ введем оценку:
n 2 S = 0 ,0564. n −1
σ=
Из уравнения 2Ф(tj) − 1 = γ находим по таблице для функции Лапласа tj = 1,282. Тогда εj = tj − σ = 0,072. Доверительный интервал имеет вид: Ij ≈ (m* − ε*; m* + ε*) = (10,71;10,85). Теперь покажем, как строится доверительный интервал для дисперсии. Пусть над случайной величиной Х проведено n опытов с результатами наблюдений x1, x2, ..., xn. Параметры m и σ для величины Х неизвестны. Получим для дисперсии D несмещенную оценку:
S = 2
1 n ∗ 2 ∑ ( xi − m ) , n − 1i = 1
(2.2.6)
где
1 n m* = ⋅ xi . n i =1
∑
Входящие в сумму величины (xi − m*)2 не являются независимыми. Однако при n ≥ 20 сумма практически распределена по нормальному закону. Оценка S 2 для дисперсии является несмещённой M[S2] = D. Дисперсия величины D вычисляется по формуле:
[ ]
1 n−3 D S2 = μ4 − D2 , n n( n − 1 )
(2.2.7)
где μ4 = M[(x − M[x])4] − так называемый четвертый центральный момент величины Х. Чтобы использовать формулу (2.2.7), нужно знать хотя бы приближенное значение для μ4 и D. Вместо D можно использовать S2, однако вычислить μ4 оказывается много сложнее. Можно в принципе заменить μ4 его оценкой вида:
1 μ = n 4*
n
∑( x − m i
∗ 4
) .
(2.2.8)
i =1
Однако эта формула имеет большую погрешность. Если величина Х распределена по нормальному закону, то
μ4 = 3D2, 28
(2.2.9)
и формула (2.2.7) принимает вид:
D S2 =
[ ]
2 D2 . n −1
(2.2.10)
[ ]
2 4 S , n −1
(2.2.11)
Можно заменить D на S2:
D S2 =
откуда легко находится оценка для среднего квадратического отклонения дисперсии:
σ ∗D =
2 2 S . n −1
Теперь для построения доверительного интервала с доверительной вероятностью γ воспользуемся уравнением:
⎛ ε ⎞⎟ − 1 = γ. P ⎛⎜ S 2 − D ≤ ε ⎞⎟ ≡ 2Ф⎜ ⎜σ∗ ⎟ ⎝ ⎠ ⎝ D⎠ Обозначив решение этого уравнения через ε ∗j , получаем доверительный интервал для дисперсии: Ij
≈
(S
2
)
− ε ∗γ , S 2 + ε ∗γ .
(2.2.12)
При получении интервальных оценок [формулы (2.2.5), (2.2.12)] мы предположили наличие нормального распределения для m∗ и D = S2. Если нормальный закон удовлетворяется лишь приближенно, то и оценки имеют приближенный характер. Однако существуют и точные методы построения доверительных интервалов. Но в этом случае нужно знать закон распределения случайной величины Х, т. е. точную форму зависимости функции распределения F(X) от неизвестных параметров распределения m, σ и т. д. Наиболее хорошо исследовано построение доверительных интервалов для нормально распределенной случайной величины Х. В этом случае случайная величина
m∗ − M [ X ] T= ⎛ S ⎞ ⎜ ⎟ ⎝ n⎠ имеет распределение Стьюдента с n – 1 степенями свободы.
29
(2.2.13)
Поэтому можно оценить вероятность:
⎛ ⎜ P⎜ ⎜ ⎜ ⎝
⎞ ⎟ m M [X ] < tγ ⎟ = γ, ⎟ S ⎛ ⎞ ⎜ ⎟ ⎟ ⎝ n⎠ ⎠ ∗
или
t S⎞ ⎛ P⎜⎜ m∗ − M [ X ] < γ ⎟⎟ = γ. n⎠ ⎝ Окончательно:
t S t S⎞ ⎛ P ⎜⎜ m∗ − γ < m < m∗ + γ ⎟⎟ = γ, n n⎠ ⎝ где tγ зависит от γ и n. Для функции tγ составлены подробные таблицы. Замеt S тим, что этот метод полезен при малых выборках. При n < 30 числа γ и ε ∗γ n практически одинаковы. Таблица tγ приведена в приложении [8, c. 464]. Пример 2. В лаборатории имеется 8 генераторов. Время бесперебойной работы для них приведено в следующей таблице: Время в месяцах Кол−во
12 1
13 1
15 2
16 2
18 1
Требуется определить вероятность того, что среднее время бесперебойной работы любого другого генератора будет отличаться от среднего времени не более, чем на 2,5 месяца (δ = 2,5). С вероятностью γ = 0,95 найти доверительный интервал для среднего времени бесперебойной работы. Решение. Определим среднее значение времени бесперебойной работы:
m∗ =
12 + 13 + 3 ⋅ 15 + 2 ⋅ 16 + 18 = 15 . 8
Вычисляем уточненное среднее квадратическое отклонение:
S=
( −3 )2 + ( −2 )2 + 0 2 ⋅ 3 + 1 ⋅ 2 + 32 24 = ≈ 1,85 . 7 7
Поскольку выборка мала, воспользуемся таблицей для tγ = t(γ, n). Имеем соотношение:
δ=
tγ ⋅ S n 30
= 2,5;
откуда
tγ =
8 ⋅δ 8 ⋅ 2 ,5 = ≈ 382 . S 1,85
При n = 8, t = 3,82 по таблице для tγ находим γ = 0,993. Поскольку имеем P(⏐15 − m⏐ < 2,5) = 0,993, то событие {⏐15 − m⏐ < 2,5} почти достоверно. Доверительный интервал определится из условия:
S S ⎞ ⎛ P⎜ 15 − t j < m∗ < 15 + t j ⎟ = 0,95. n n⎠ ⎝ При n = 8, γ = 0,95 по таблице для tγ = t(γ, n) находим tγ = 2,37. Точность оценки:
δγ =
tγ ⋅ S n
=
2 ,37 ⋅ 1,85 ≈ 1,55 . 8
Доверительный интервал имеет вид:
Iγ = (m* − δγ; m* + δγ) = (13,45; 16,55). Пример 3. Проведем экспериментальный анализ частоты автогенератора, которая является случайной величиной. Для экспериментальной оценки статистических характеристик этой случайной величины необходимо применение основных понятий теории вероятностей. Для оценки основных статистических характеристик случайной величины производят ее измерение. Например, в результате проведенных измерений получены распределения частот АГ в виде табл. 2.1.1. Обработку этих данных для получения характеристик одномерной случайной величины производят построениями ряда распределения, диаграммы накопленных частот, гистограммы. Помимо этого, определяют оценки математического ожидания, дисперсии и среднего квадратического отклонения. Построение ряда распределения. Ряд распределения получают из выборки экспериментальных данных путем расположения X i ( i = 1, 2 , ..., N ) в порядке возрастания от X min до X max . Пусть в результате проведенных измерений получено распределение 10 частот АГ в виде: 194766; 194645; 194730; 194730; 194901; 194810; 194701; 194810; 194850; 194870. Тогда им соответствует ряд распределения: 194645; 194701; 194730; 194730; 194766; 194810; 194810; 194850; 194870; 194901. Построение диаграммы накопленных частот (эмпирический аналог интегрального закона распределения). Диаграмму строят в соответствии с формулой:
Fn ( X ) =
N
i =1
31
1
∑N ,
где N – число элементов в выборке, для которых значение X i < X . Практически это делается следующим образом. На оси абсцисс откладываются интервалы, величина которых равна среднему квадратическому отклонению. Первый интервал получают как [ f ср − S / 2; f ср + S / 2 ] , где для рассматриваемого ряда распределения 194645; 194701; 194730; 194730; 194766; 194810; N
194810; 194850; 194870; 194901 выборочная средняя fср = (1 / N) ∑ fi = 194767 Гц; i =1
N
оценка дисперсии S 2 = ( 1 / N )∑ ( fi − f ср )2 = 1304 Гц ; оценка среднего квадраi =1
тического отклонения S = S 2 = 36 ,1 . Следующие интервалы получают добавлением величины среднего квадратического отклонения к границам первого интервала и далее к последующим интервалам. На рис. 5 показаны восемь интервалов, которые построены в соответствии с изложенным выше. Далее на оси абсцисс указывают значения наблюдений X max . Значение по оси ординат равно нулю, левее точки X min и далее во всех других точках X max диаграмма имеет скачок, равный 1/N. Если существует несколько совпадающих значений X max , то в этом месте на диаграмме происходит скачок, равный a/N, где a – число совпадающих точек. Для величин X i > X max значение диаграммы накопленных частот равно 1. Используя данные предыдущего примера, построим диаграмму накопленных частот (рис. 7).
Рис. 7. Диаграмма накопленных частот и функция нормального распределения
Для выравнивания статистического распределения с помощью нормального необходимо определить значения нормальной функции распределения на границах интервалов по формуле: 32
P = Φ * [( b − f ср ) / S ] ,
где b – граница интервала, x
1 Φ( x ) = ⋅ ∫ e −0 ,5 t dt . 2π −∞
Значения нормальной функции распределения на границах интервалов приведены в таблице 2.2.1. Таблица 2.2.1 Границы интервалов
Р
194641 194677 194713
0,0002 0,0062 0,0668
194749
0,3085
194785 194821 194857 194893 194929
0,6915 0,9332 0,9938 0,9998 1,0000
График функции нормального распределения совмещен на рис. 7 с диаграммой накопленных частот. Построение гистограммы выборки (эмпирический аналог функции плотности распределения) и выравнивание статистического распределения с помощью нормального распределения. В таблице 2.2.2 приведены результаты измерения частоты автогенератора. Таблица 2.2.2 N 1 2 3 4 5 6 7 8 9 10
fi 194691 194730 194775 194771 194771 194764 194764 194766 194835 194801
N 11 12 13 14 15 16 17 18 19 20
fi 194830 194855 194835 194909 194850 194881 194795 194869 194797 194815
N 21 22 23 24 25 26 27 28 29 30
fi 194801 194845 194871 194860 194801 194825 194826 194815 194860 194821
По проведенным измерениям (табл. 2.2.2) вычислим выборочную среднюю X и выборочное среднее квадратическое отклонение Sx: 33
N
∑X
X ср = ( 1 / N )
i
= 194814 ,3 Гц ; ,
i =1
Sx
2
1 N = ( X i − X )2 = 2175 ,8 Гц ; , N − 1 i =1
∑
2
S X = S X = 46 ,65 Гц .
Для построения гистограммы возьмем за центр распределения величину, примерно равную выборочной средней 194814 Гц, и будем откладывать по оси абсцисс интервалы, величина которых примерно равна оценке среднего квадратического отклонения. Центр распределения совпадает с центром интервала (рис. 7). Заменим реальное распределение распределением в виде таблицы 2.2.3, где выделено шесть интервалов соответственно попаданию в них N – частот распределения, и найдем P1 – отношение этих частот к общему числу измерений. Таблица 2.2.3 Интервал Начало 194653 194699 194745 194791 194837 194883
Конец 194699 194745 194791 194837 194883 194929
N
Pi
1 1 6 13 8 1
0.033 0.033 0.2 0.43 0.27 0.03
Рис. 8. График функции нормального распределения с диаграммой накопленных частот
Строим гистограмму (рис. 8), представляющую собой ступенчатую кривую, значение которой на i-м интервале ( X i , X i +1 ) равно Pi . 34
Для выравнивания статистического распределения с помощью нормального необходимо определить значения функции нормального распределения на границах интервалов.
y( U ) =
1 ⋅ e −U 2π
2
/2
, π = 3 ,14 .
В таблице 2.2.4 приведены значения функции нормального распределения. Таблица 2.2.4 Частоты 194814 194837 194883 194929
194614 194791 194745 194699
Y(U) 0,3989 0.3571 0,1295 0,0175
График функции нормального распределения совмещен на рис. 8 с гистограммой. Проверка гипотезы о нормальном распределении частоты АГ. Для проверки гипотезы о нормальном распределении частоты АГ воспользуемся результатами измерений (табл. 2.2.2). Требуется проверить гипотезу о том, что генеральная совокупность всех частот АГ распределена нормально. Заменим полученное реальное распределение распределением в виде табл. 2.2.3, где выделено шесть интервалов, соответствующих попаданию в них частот распределения. В таблице 2.2.3 произведем замену каждого из 5 интервалов на среднюю частоту в этом интервале. Считаем, что выборочная средняя равна математическому ожиданию ( f ср = 194814,3 Гц) и выборочное среднее квадратическое отклонение s = σ = 46,65. Вычислим теоретические частоты:
nit = [ N ⋅ h ⋅ y( U i ) / σ ], где: N = 30 – объем выборки; h = 46 − шаг (разность между двумя соседними вариантами); U i = ( f i − f ср ) / σ – нормированная экспериментальная частота. Таблица 2.2.5 Средняя частота интервала 194576 194722 194768 194814 194860 194906
Число частот, попавших в интервал 1 1 6 13 8 1
35
В таблицах 2.2.6, 2.2.7 помещены результаты вычислений теоретических частот, соответствующих нормальному распределению и наблюдаемому значению критерия χ 2 Пирсона. Таблица 2.2.6 i 1 2 3 4 5 6
fi 194676 194722 194768 194814 194860 194906
U i = ( f i − f ср ) / σ
y(U) 0,0044 0,0540 0,2420 0,3989 0,2420 0,0540
–3 –2 –1 0 1 2
nit 0,132 1,62 7,26 11,697 7,26 1,62 Таблица 2.2.7
i
ni
nit
ni – nit
(ni – nit)2
1 2 3 4 5 6
1 1 6 13 8 1
0,132 0,62 0,26 11,97 7,26 1,62
0,868 –0,62 –1,26 –1,303 0,74 –0,62
0,7534 0,3844 0,5876 0,6978 0,5476 0,3844
( ni − nit )2 nit 5,7076 0,2373 0,2187 0,1452 0,0754 0,2373
Суммируя значения из последнего столбца, получим: 2 χ набл = 6,6215.
По таблице критических точек распределения χ 2 (хиквадрат) [8, приложение 5, с. 464], по уровню значимости a = 0,05 и числу степеней свободы k = s − r = 6 – 3 = 3 ( s – число интервалов, r – число независимых условий, которые заключаются в том, что, во-первых, сумма вероятностей всех частот равна единице; во-вторых, теоретическое распределение подбирается с тем условием, чтобы совпадали теоретические и статистические средние значения; в-третьих, чтобы совпадали теоретические и статистические дисперсии) находим критическую точку правосторонней критической области: 2 X кр ( 0 ,05;3 ) = 7,82. 2 2 Так как X набл < Х кр ( 0 ,05;3 ) , гипотезу о нормальном распределении генеральной совокупности подтверждаем. Другими словами, измеренные и теоретические частоты различаются незначительно.
36
2.3. Основные законы распределения случайных величин, применяемые при статистической обработке результатов экспериментальных исследований Выборочные характеристики параметров генеральной совокупности сами являются случайными величинами, следовательно, имеют те или иные законы распределения. В настоящей главе мы изучим наиболее часто встречающиеся законы распределения таких характеристик. Нормальное распределение. Нормальный закон распределения случайных величин играет весьма важную роль в теории вероятностей и математической статистике. С одной стороны, этот закон наиболее часто встречается на практике, с другой – к этому закону приближаются многие другие законы распределения в различных предельных случаях. Например, этому закону подчиняется сумма или среднее значение большого числа независимых или слабо зависимых случайных величин. Этот закон возникает в интегральной теореме Муавра-Лапласа и ряде других важных задач. Нормальный закон характеризуется плотностью вероятности: ( x −m ) 1 ⋅ e− 2σ . f(х) = σ 2π 2
2
График этой функции симметричен относительно точки x = m, в которой 1 f(x) достигает своего максимума, равного . При x → ±∞ кривая y = f(x) σ ⋅ 2π неограниченно приближается к оси Х. Величина m представляет собой математическое ожидание случайной величины Х, распределенной по нормальному закону, а σ – среднеквадратическое отклонение этой величины. Действительно, M [ x] =
∞
∫
xf ( x )dx =
−∞
=
σ 2
x ⋅e
−
( x − m )2 2σ 2
⋅ dx =
dx = σ 2 dt =
∞
∫ (m + σ
)
2
2t e −t dt =
−∞
∞
π −∫∞
∞
σ ⋅ 2π −∫∞
x−m = t, σ 2
1⋅σ 2 = σ ⋅ 2π =
1
t e
−t 2
dt +
37
m
∞
∫ e −t
π −∞
2
dt .
В курсе математического анализа оба последних интеграла вычисляются: ∞
∫ t e dt = 0; −t 2
−∞
∞
∫ e−t dt = π . 2
−∞
Поэтому M[x] = m. Аналогичным способом можно вычислить дисперсию: ∞
D[x] =
∫ ( x − M [X ] )
2
f ( x )dX .
−∞
Читателю предлагается проверить, что
1 D[x] = σ 2π
∞
∫( x − m )
2 −
e
( x − m )2 2σ 2
dX = σ 2 ,
−∞
т. е. σ = D[x ] . Нормальный закон распределения с математическим ожиданием m и средним квадратическим отклонением σ обычно обозначается N (m, σ). Форма кривой y = f(x) зависит от параметров m и σ. Прямая x = m является осью симметрии кривой. Это вытекает из самой формулы для f(x). Если в ней заменить x – m на m – x, то f(x) не изменится. Если же в нормальном законе менять величину m, то кривая y = f(x) будет передвигаться параллельно самой себе вдоль оси x. Величина σ характеризует форму кривой, а именно: чем меньше значение σ, тем выше максимальное значение f(x), т. е. тем выше и уже форма кривой около точки максимума. На рис. 9 приведено несколько кривых y = f(x) с различными значениями m и σ.
Рис. 9. Зависимость формы кривой нормального распределения от m и σ
38
Вероятность попадания нормально распределенной случайной величины Х в интервал (α, β) определяется формулой: β
( x −m ) 1 ∫ σ 2π e− 2σ dX . α
P(α < X < β ) =
2
2
С точки зрения вычислений правую часть этого выражения можно упростить. Действительно, x
( x−m ) 1 − F(х) = ∫ e 2σ dx . −∞ σ 2π 2
2
Сделаем замену:
x−m
= t,
σ тогда
x −m
F(х) =
1 2π
σ
∫
e
t2 2
dt .
t2 2
dt
−
−∞
Интеграл вида
Ф(х) =
1 2π
x
∫e
−
−∞
называется интегралом вероятностей, или интегралом ошибок Гаусса. Он не вычисляется в элементарных функциях, однако хорошо изучен и для него составлены подробные таблицы. В теории вероятностей Ф(х) называют иногда нормальной функцией распределения. Ясно, что Ф(х) есть функция распределения вероятности для нормально распределенной случайной величины с m = 0 и σ = 1. Очевидно:
⎛ X −m⎞ F(X) = Ф ⎜ ⎟. σ ⎝ ⎠ Окончательно:
⎛α − m ⎞ ⎛β −m⎞ P(α < X < β) = Ф⎜ ⎟ − Ф⎜ ⎟. σ σ ⎝ ⎠ ⎝ ⎠
39
β −m есть расстояние от точки X = β до m, измеренное σ α −m в среднеквадратических отклонениях σ. Аналогично определяется и . σ ⎛α ⎞ Отсюда немедленно вытекает, что P(⏐X – m⏐ < α) = 2Ф ⎜ ⎟ − 1 . ⎝σ ⎠ Заметим, что
Здесь мы использовали свойство симметричности:
Ф(–х) = 1 – Ф(х). Для практических вычислений очень важны следующие соотношения:
P(⏐X – m⏐ < σ) ≈ 0,6826; P(⏐X – m⏐ < 2σ) ≈ 0,9544; P(⏐X – m⏐ < 3σ) ≈ 0,9973. Последнее из этих соотношений известно в математической статистике под названием «правило трех сигм», а именно: с вероятностью Р ≈ 0,9973 отклонение нормально распределенной случайной величины от математического ожидания не превышает трех среднеквадратических отклонений σ. В общем случае справедлива формула:
P(⏐X-m⏐ < kσ ) = 2Ф1(k), где x
x 1 − 2 dx . e 2π ∫0
Ф1(x) =
2
1 + Ф1(х) = Ф(х). 2 Пример 1. Математическое ожидание и дисперсия нормально распределенной случайной величины Х равны 10 и 4 соответственно. Найти вероятность того, что в результате эксперимента величина Х примет значение между 12 и 14. Решение. Вычисляем значение среднеквадратического отклонения: σ = D[x ] = 2. Имеем α = 12; β = 14; m = 10; σ = 2. β −m α −m Поэтому = 2; = 1; Ф(2) = 0,9772; Ф(1) = 0,8413.
Заметим, что
σ
σ
Окончательно:
P(12 < X < 14) = Ф(2) – Ф(1) = 0,1359.
40
Пример 2. Математическое ожидание и среднеквадратическое отклонение нормально распределенной случайной величины Х равны соответственно 7 и 4. Написать плотность распределения вероятности для Х. Решение. Из формулы для плотности нормального закона распределения сразу же имеем: ( x −7 ) 1 − f(x) = e 32 . 4 2π 2
Распределение χ2. Для вычисления точечных оценок дисперсии генеральной совокупности используются выборочная или уточненная выборочная дисперсии. Обе эти формулы содержат сумму квадратов значений признаков выборки. Пусть случайные величины хi (I = 1, 2, ..., n) независимы и распределены по нормальному закону N(0, 1). Найдем распределение случайной величины: n
χ = ∑ xi2 . 2
i =1
Заметим, что χ2 ≥ 0, поэтому (χ2 < 0) = 0. Следовательно, представляет интерес изучение распределения χ2 только на положительной полуоси. Обозначим:
Fn (x) = Р(χ2 < x). По нашему предположению, случайные величины хi имеют плотность распределения: xi2
1 −2 f(x )= e , i 2π а их совместная плотность распределения определится соотношением:
1 n 1 n ) exp( − Σ xi2 ) . 2 i =1 2π
f ( x1 , x2 , ..., xn ) = ( Поэтому можно записать:
Fn ( x ) = (
1 n ) K 2π
∫ ∫
exp( −
χ 2 <x
1 2
n
∑x
2 i
)dx1 ...dxn .
i =1
Заметим, что область интегрирования представляет круг радиуса x1/2 в n-мерном пространстве с центром в начале координат, причем переменная х входит в Fn (x) только в качестве радиуса области интегрирования. Вычислим приращение Fn (x), соответствующее приращению аргумента h:
41
1 n Fn ( x + h ) − Fn ( x ) = ( ) 2π
∫ 2
x< χ ≤ x + h
1 exp( − 2
n
∑x
2 i
)dx1 ...dxn .
i =1
Применяя к последнему интегралу теорему о среднем значении, получим: Fn( x + h ) − Fn( x ) = (
1 n 1 ) exp(− ( x +θ ⋅ h ) ∫ dx1...dxn , 2 2π x<χ2≤x+h
(2.3.1)
где 0 < θ < 1 – некоторая константа. Оценим интеграл:
∫ dx ...dx
I( x ) =
1
n
n χ 2 = ∑ xi2 < x i =1
.
Поскольку I(x) является объемом шара радиуса x1/2 в n-мерном пространстве, то I(x) пропорционален xn/2: I(
n x ) = Cx 2
.
Поэтому из формулы (2.3.1) получим:
Fn ( x + h ) − Fn ( x ) h
1 − ( x +θh ) ( 2 = Ce
x+
n h )2
−
n x2
h
.
Вычисляя предел при h→0, получим:
fn( x ) =
Fn' (
n 1 −1 − x x ) = Cx 2 e 2 .
(2.3.2)
Используя условие нормировки для плотности распределения вероятности
Fn (∞) = 1, получим: ∞
C
∫
x n −1 − 2 2 x e dx
= 1.
0
Сделав замену переменной
x = z , приходим к равенству: 2 n ∞ n −1 −z 2 2 2 C e z dz
∫ 0
42
= 1.
Учитывая, что интеграл в последнем соотношении представляет собой Г-функцию Эйлера: ∞
∫
Г ( т ) = e −t t m−1dt , 0
получим значение для С:
C=
1 n 22
n Г( ) 2
.
Окончательно выражение для плотности распределения χ2 имеет вид: fn( x ) =
1 n 22
n Г( ) 2
n x −1 − 2 2 x e
.
Этот закон распределения суммы квадратов n независимых нормально распределенных случайных величин называется χ2-распределением. Число n называется числом степеней свободы. Читателю предлагается убедиться, что М[χ2] = n, D[χ2] = 2n. Если число степеней свободы n > 30, то можно воспользоваться приближенной формулой:
χ2 ≈
[
]
2 1 ( 2 n − 1 )1 2 + z , 2
где z имеет стандартное нормальное распределение N(0, 1). χ2-распределение часто встречается в задачах проверки гипотез, а именно: если 1 D = n ∗
n
∑( x − m i
∗ 2
)
i =1
есть выборочная дисперсия, построенная для нормально распределенной генеnD ∗ ральной совокупности с дисперсией σ2, то случайная величина 2 распредеσ 2 лена по закону χ с n – 1 степенью свободы. χ2-распределение с m степенями свободы имеет следующие числовые характеристики: математическое ожидание M [X ] = m ; дисперсию
[ ]
D X 2 = 2m ; 43
8 ; m 12 β2 = . m
β1 =
асимметрию эксцесс
T-распределение Стьюдента. В задачах интервального оценивания математического ожидания нормально распределенной генеральной совокупности при неизвестном среднем квадратическом отклонении и многих других задачах необходимо знать распределение величины t=
z n , v
где z распределена по закону N(0, 1), а v распределена по закону χ2 с n степенями свободы, причем эти случайные величины являются независимыми. Закон распределения случайной величины t называется законом распределения Стьюдента с n степенями свободы. Найдем плотность этого закона. Для этого определим совместную плотность распределения случайных величин z и ν. Поскольку z имеет плотность распределения вероятности: − 1 e 2π
fz( x ) =
x2 2
,
а плотность распределения ν есть fν ( x ) =
1 n 22
n Г( ) 2
n x −1 − 2 2 x e
,
то совместная плотность распределения z и ν в силу независимости имеет вид: z2
1 −2 fν ,z ( z ,ν ) = e 2π
1 n 22
ν
n Г( ) 2
n ν −1 − 2 e 2.
Поэтому Ft ,n ( x ) = P( t < x ) = P(
∫
=C z<
z n
ν
z2 ν − − e 2 2
ν
x ν n
44
< x ) = P( z < n −1 2 dzd
ν,
x ν )= n
где
1
C= 2π
n 22
n Г( ) 2
.
Переходя от двойного интеграла к повторному, получим:
Ft ,n
x ν n
∞ n −1 −ν ( x ) = C ν 2 e 2 dν
∫
∫
e
−
z2 2 dz
.
−∞
0
Дифференцируя последнее выражение по переменной х, получим:
sn ( x ) = F ' t ,n
2 ∞ n −1 −ν − x ν 2 2n (x)=C ν 2 e
∫ 0
C ∞ = ν n ∫0
ν n
dν =
x2 n−1 ν − ( 1+ ) n dν . 2 e 2
Сделаем замену переменных: x2 u = ν ( 1 + ), n
тогда получим:
C sn ( x ) = n
n+1 2 2
∞
n
∫
x 2 2 +1 0 (1+ ) n
n−1 u 2 e −u du .
Заметим, что интеграл в последнем выражении выражается через Г-функцию Эйлера и равен Г[(n + 1)/2]. Окончательно получим:
x2 − sn ( x ) = Bn ( 1 + ) n
n+1 2 ,
n+1 ) 2 где Bn = . n Γ ( ) nπ 2 График функции sn(x) симметричен относительно оси у, поэтому M[t] = 0. При больших значениях n распределение близко к нормальному распределе-
Γ(
45
нию N(0, 1). Например, при n > 30 погрешность между нормальным распределением и распределением Стьюдента составляет примерно 1 %. Однако при малых n функция sn(x) убывает медленнее нормального распределения. Основные числовые характеристики: математическое ожидание M [t( n )] = 0 ; n , существует только при n > 2; дисперсия D[t( n )] = n −1 асимметрия β1 = 0 ; 6 , существует только при n > 4. эксцесс β 2 = n−4 Распределение Стьюдента часто применяется при статистической обработке нормальных генеральных совокупностей. Прежде всего следует отметить, что если X – нормальная генеральная совокупность с математическим ожиданием (средним значением) α, S – исправленное выборочное среднее квадратическое отклонение, x – выборочное среднее, n − объем выборки, то случайная велиn − 1( x − α ) распределена по закону Стьюдента с n − 1 степенью чина t = S свободы. Случайную величину t можно использовать для получения интервальных оценок неизвестного среднего α генеральной совокупности, а также для сравнения двух выборок. F-распределение Фишера. В задаче сравнения дисперсий различных генеральных совокупностей, а также в ряде других задач дисперсионного анализа и статистического оценивания необходимо знать закон распределения отношения независимых двух случайных величин, распределенных по закону χ2 со степенями свободы n и m соответственно. Этот закон получил название распределения ФишераСнедекора, или F-распределения. Рассмотрим распределение случайной величины:
u mu , F= n = v nv m где u и v распределены по закону χ2 со степенями свободы n и m соответственно. Совместная плотность распределения u и ν в силу независимости имеет вид: f n ,m ( u ,v ) =
u +v m n −1 − −1 u2 e 2 v 2 ,
1 n+m 2 2 Г(
n m )Г ( ) 2 2
46
поэтому функция распределения для F при х > 0 имеет вид: K ( x ) = P( F < x ) = P(
∫∫
=С
mu < x ) = P( mu < xnv ) = nv
n m −u v −1 −1 − u 2 v 2 e 2 e 2 dudv .
mu ≤ xnv
Вычислим приращение функции К(х): ∞ m −1 − v K ( x + h ) − K ( x ) = C v 2 e 2 dv
∫
m( x + h )v n u n −1 − u 2 e 2 du .
∫
mxv n
0
Применяя к последнему интегралу теорему о среднем, получим: v ∞ m −1 − 2 2 v e (
K( x + h ) − K( x ) = ∫ 0
n
m( x + θ h )v 2 −1 − ) e n
m( x +θ h )v 2n
mhv dv . n
Разделив обе части последнего соотношения на h и вычисляя предел при h→0, получим:
kn ,m ( x ) = С0
mx m + n n ∞ v ) −1 − ( 1+ −1 n v 2 x2 e 2 dv .
∫
0
После замены переменной
v xm z = (1+ ) 2 n приходим к выражению
kn ,m ( x ) = C1
n ∞ −1 x 2 e− z
∫ 0
n+m −1 z 2
(1+
xm n
n+m ) 2
n −1 x2
dz = Cn ,m (1+
xm n
n+ m ) 2
.
Окончательно плотность распределения вероятности случайной величины, F-распределенной со степенями свободы n и m, имеет вид:
kn ,m ( x ) = 0 , при x ≤ 0 ,
47
n −1 x2
kn ,m ( x ) = Cn ,m (1+
xm n
n+ m , ) 2
при x > 0 ,
где n −1 x2
∞
Сn ,m = ( ∫ 0
(1+
xm n
n+ m ) 2
dx )−1 .
Основные числовые характеристики: математическое ожидание M [F ( m ,n )] = дисперсия D[F ( m ,n )] = асимметрия β1 =
n , существует только при n > 2; n−2
2n2 ( m + n − 2 ) , существует только при n > 4; m( n − 2 )2 ( n − 4 )
( 2 m + n − 2 ) 8( n − 4 ) . (n −6 ) m + n − 2
F-распределение широко используется в дисперсионном анализе для сравнения выборочных дисперсий одной и той же генеральной совокупности. В частности, отношение двух выборочных дисперсий подчиняется F-распределению с числами степеней свободы n1 – 1 и n2 – 1, где n1 и n2 – объемы выборок.
2.4. Статистическая проверка гипотез при экспериментальных исследованиях автогенератора и при обработке результатов исследований Как уже говорилось ранее, самой полной характеристикой случайной величины X является функция распределения. Однако в ряде задач эта функция первоначально неизвестна и подлежит определению в результате обработки статистического материала. В некоторых случаях можно лишь предполагать тип закона распределения − нормальный, равномерный, Пуассона и т. д. В других задачах тип распределения известен заранее, но параметры распределения (например, m или σ для нормального закона) неизвестны. Мы будем называть статистической гипотезой предположение о типе неизвестного распределения или о неизвестных параметрах известного распределения. В этом плане предположение типа «распределение случайной величины Х является нормальным» есть статистическая гипотеза. Предположение же типа «завтра будет дождь» не является статистической гипотезой − здесь нет ни распределения, ни неизвестных параметров распределения. 48
Следуя терминологии математической статистики, выдвигаемая гипотеза называется нулевой, противоречащая ей гипотеза – конкурирующей. Обычно проверяется истинность нулевой гипотезы. Для этого чаще всего используется некоторая специальная случайная величина с известным законом распределения, называемая статистическим критерием. Множество значений оцениваемого параметра делится на два подмножества. На первом из них нулевая гипотеза принимается, оно называется областью принятия гипотезы. На втором множестве критерий принимает такое значение, при котором нулевая гипотеза отвергается. Точки, разделяющие эти два множества, называются критическими точками; область, на которой нулевая гипотеза отвергается, называется критической. Выдвигаемая гипотеза может быть правильной или неправильной. В результате проверки выдвигаемой гипотезы также возможно сделать правильный или неправильный вывод. Ошибки, которые возникают при этом, делятся на два типа. Ошибки первого рода заключаются в том, что отвергается правильная гипотеза. Ошибки второго рода заключаются в принятии неправильной гипотезы. Введем еще одно важное понятие. Мощностью критерия называется вероятность попадания в критическую область при условии справедливости конкурирующей гипотезы. Чем больше мощность критерия, тем вероятнее отвергнуть нулевую гипотезу, когда она неверна. Рассмотрим задачу сравнения двух дисперсий, вычисленных по двум независимым выборкам, извлеченным из двух генеральных нормально распределенных совокупностей Х и У. Объем этих выборок n1 и n2 соответственно. По этим выборкам вычисляются выборочные исправления дисперсии S x2 и S y2 , которые служат для проверки нулевой гипотезы. Нулевая гипотеза Н0 : D(X) = D(У). Обозначим большую из выборочных дисперсий Sδ2 , а меньшую через S m2 . В качестве критерия выбираем отношение
Sδ2 F= 2, Sm
(2.4.1)
называемое дисперсионным отношением. Распределение случайной величины F зависит только от объемов n1 – большей выборки и n2 – меньшей выборки. Величины k1 = n1 – 1 и k2 = n2 – 1 называются степенями свободы, само распределение называется распределением Фишера–Снедекора. В зависимости от вида конкурирующей гипотезы возможны два подхода к решению задачи. 1. Конкурирующая гипотеза Н1 : D(X) > D(У). При этом вычисляется наблюдаемое значение критерия:
Fнабл
Sδ2 = 2, Sm
и по таблице критических точек распределения Фишера-Снедекора, по заданному уровню значимости α и по числам степеней свободы k1 и k2 находится 49
критическая точка Fкр (α, k1, k2), где k1 относится к большей исправленной дисперсии. Если Fнабл < Fкр, то нет оснований отвергать нулевую гипотезу. Если Fнабл > Fкр, то нулевую гипотезу отвергают. Пример 1. По двум независимым выборкам, объемы которых равны n1 = 10 и n2 = 17, извлеченным из генеральных совокупностей Х и У, найдены исправленные выборочные дисперсии S x2 = 36 и S y2 = 12. На уровне значимости
α = 0,01 проверить нулевую гипотезу Н0 : D(X) = D(У) при конкурирующей гипотезе Н1 : D(X) > D(У). Решение.
Fнабл =
36 = 3. 12
По таблице вычисляем Fкр (0,01; 9; 16) = 3,78. Имеем Fнабл < Fкр, поэтому нет оснований отвергать нулевую гипотезу. 2. Конкурирующая гипотеза Н1 : D(X) ≠ D(У). В этом случае критическую точку ищут в таблице по уровню значимости α 2 , а все остальное без изменений. Теперь рассмотрим задачу сравнения исправленной выборочной дисперсии с гипотетической дисперсией генеральной совокупности Х с нормальным распределением. Пусть гипотетическое значение дисперсии равно σ 02 . Эта величина может быть получена теоретически или с помощью иных соображений. Пусть из генеральной совокупности Х извлечена выборка объемом n, по которой вычислена исправленная выборочная дисперсия σ2. По этой величине σ2 требуется при α проверить нулевую гипотезу заданном уровне значимости 2 2 2 Н1 : M S = σ 0 , иначе говоря, существенно или нет отличаются σ и σ 02 . В качестве критерия проверки нулевой гипотезы выбирается случайная величина
[ ]
χ = 2
( n − 1 )σ 2
σ 02
.
В зависимости от вида конкурирующей гипотезы различаются три случая: 1. Конкурирующая гипотеза Н1 : σ2 > σ02. Для принятия решения по уровню значимости α и числу степеней свободы k = n – 1 с помощью таблицы критических точек распределения χ2 находится величина χкр (α, k). Затем вычисляется наблюдаемое значение критерия:
χ
2
набл
=
( n − 1 )σ 2
σ 02
.
Если χ2набл < χ2кр, то нулевая гипотеза принимается. Если χ2набл > χ2кр, то нулевая гипотеза отвергается. 50
Пример 2. Из нормальной генеральной совокупности извлечена выборка объема n = 21, по ней найдена исправленная выборочная дисперсия σ2 = 16,2. Требуется при уровне значимости α = 0,01 проверить нулевую гипотезу Н0 : σ2 = σ0215, приняв в качестве конкурирующей гипотезы Н1 : σ2 > 15. Решение. Вычисляем значение наблюдаемого критерия:
χ
2
набл
=
( n − 1 )σ 2
σ
2 0
=
( 21 − 1 )16 ,2 = 21,6 . 15
По таблице, используя уровень значимости α = 0,01; по числу степеней свободы k = n − 1 = 20 находим критическую точку: χ2кр (0,01; 20) = 37,6. Поскольку χ2набл < χ2кр, нет необходимости отвергать нулевую гипотезу. 2. Конкурирующая гипотеза Н1 : σ 2 ≠ σ 02 Для принятия решения по уровню значимости α находим левую и правую критические точки:
χ2лев. кр (1 –
α 2
; k) и χ2прав. кр (
α 2
; k).
Если χ2лев. кр < χ2набл < χ2прав. кр, то нулевая гипотеза сохраняется, в противном случае она отвергается. 3. Конкурирующая гипотеза Н1 : σ2 < σ02. Находим критическую точку χ2кр (1 – α; k). Если χ2набл > χ2кр (1 – α; k), нет оснований отвергать нулевую гипотезу, в противном случае она отвергается. Теперь займемся сравнением математических ожиданий. Прежде всего, рассмотрим алгоритм проверки нулевой гипотезы о равенстве математических ожиданий двух генеральных совокупностей Х и У Н0 : M[X] = M[У]. Поскольку выборочное среднее является несмещенной оценкой математического ожидания, то нулевую гипотезу можно переписать в терминах выборочных средних: Н0 : Х = У . Предположим вначале, что дисперсии известны. В качестве критерия проверки нулевой гипотезы выберем случайную величину:
Z=
X −У , D[ X ] D[ У ] + n m
(2.4.3)
где n и m – объемы выборок из Х и У соответственно. Критерий Z является нормальной случайной величиной с нулевым математическим ожиданием и единичной дисперсией. В зависимости от вида конкурирующей гипотезы Н1 возможны следующие случаи: 51
1. Для принятия решения по уровню значимости α при конкурирующей гипотезе Н1 : M[X] ≠ M[У] вычисляем наблюдаемое значение критерия Z:
Zнабл =
X −У , D[ X ] D[ У ] + n m
и по таблице функции Лапласа Ф(Z) находим критическую точку из уравнения:
1−α . 2
Ф(Zкр) =
Если |Zнабл| < Zкр, то нет оснований отвергать нулевую гипотезу. Если |Zнабл| > Zкр, то нулевую гипотезу отвергают. 2. При конкурирующей гипотезе Н1 : M[X] > M[У] находим критическую точку по таблице функции Лапласа из уравнения:
Ф(Zкр) =
1 − 2α . 2
Если Zнабл < Zкр, то нет оснований отвергать нулевую гипотезу. Если Zнабл > Zкр, то нулевую гипотезу отвергают. 3. При конкурирующей гипотезе Н1 : M[X] < M[У] находим критическую точку так же, как и в предыдущем случае. Если Zнабл > −Zкр, то нет оснований отвергать нулевую гипотезу, в противном случае нулевая гипотеза отвергается. Пример 3. Даны две генеральные совокупности Х и У, причём D[X] = 80, D[У] = 100 . Из этих совокупностей извлечены две выборки объемом n = 40 и m = 50, найдены выборочные средние Х = 130 и У = 140. На уровне значимости α = 0,01 проверить нулевую гипотезу Н0 : M[X] = M[У] при конкурирующей гипотезе Н1 : M[X] ≠ M[У]. Решение. Вычисляем наблюдаемое значение критерия по формуле (2.4.3):
Zнабл =
130 − 140 = −5 . 80 100 + 40 50
Находим критическое (Zкр) значение из уравнения:
Ф(Zкр) =
1 − 0 ,01 = 0 ,495. 2
По таблице функции Лапласа находим Zкр = 2,58. Поскольку |Zнабл| > Zкр, то нулевую гипотезу отвергаем и считаем, что выборочные средние отличаются существенно. 52
В некоторых задачах требуется определить значение среднего m генеральной нормальной совокупности. Иногда это определение сводится к проверке нулевой гипотезы Н0 : m = m0, где m0 – гипотетическое предполагаемое значение для m. Если дисперсия σ2 генеральной совокупности Х известна, то для проверки нулевой гипотезы используется критерий:
U=
(X − m ) 0
n
σ
.
(2.4.4)
В соответствии с центральной предельной теоремой величина U распределена приблизительно по нормальному закону с нулевым средним и единичной дисперсией. Поэтому U выбирается в качестве критерия проверки нулевой гипотезы, а именно: 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0 : m = m0 (о равенстве средней генеральной нормальной совокупности Х с известной дисперсией σ2 гипотетическому значению m0) при конкурирующей гипотезе Н0 : m ≠ m0, необходимо вычислить наблюдаемое значение критерия:
Uнабл =
(X − m )
n
0
σ
,
где X − среднее выборочное значение признака Х, n – объем выборки. После этого по таблице функций Лапласа находится критическая точка из 1−α . уравнения Ф(Uкр) = 2 Если |Uнабл| < Uкр, то нет оснований отвергать нулевую гипотезу, в противном случае гипотеза Н0 отвергается. 2. Если конкурирующая гипотеза имеет вид Н1 : m > m0, то критическое значение находится из уравнения:
Ф(Uкр.) =
1 − 2α . 2
Если Uнабл < Uкр, нет оснований отвергать нулевую гипотезу, в противном случае Н0 отвергается. 3. Если в качестве конкурирующей гипотезы выбирается Н1 : m < m0, то Uкр находится как в предыдущем разделе. Если Uнабл > –Uкр, нет оснований отвергать нулевую гипотезу, в противном случае Н0 отвергается. Если же дисперсия генеральной совокупности Х неизвестна, то в качестве критерия проверки нулевой гипотезы Н0 : m = m0 выбирается случайная величина:
T=
(X − m ) 0
S
53
n
,
(2.4.5)
1 n ni(X i − X )2 − исправленная выборочная дисперсия, а S − исгде S = ∑ n − 1 i=1 2
правленное среднее квадратическое отклонение. Случайная величина Т имеет распределение Стьюдента с k = n − 1 степенями свободы. Теперь оценка нулевой гипотезы Н0 : m = m0 в зависимости от вида конкурирующей гипотезы проводится следующим образом. Вычисляется наблюдаемое значение критерия Тнабл:
Tнабл. =
(X − m ) 0
n
S
.
(2.4.6)
1. При конкурирующей гипотезе Н1 : m ≠ m0 по таблице критических точек распределения Стьюдента по заданному уровню значимости α и числу степеней свободы k = n − 1 находится двустороннее критическое значение tдв.(α, k). Если |Tнабл| < tдв, то нет оснований отвергать нулевую гипотезу. В противном случае Н0 отвергается. 2. При конкурирующей гипотезе Н1 : m > m0 по заданному уровню значимости α и числу степеней свободы k= n − 1 находится правосторонняя критическая точка tпр(α, k). Если |Tнабл| < tпр, то нет оснований отвергать нулевую гипотезу. В противном случае Н0 отвергается. 3. Если в качестве конкурирующей гипотезы выбирается Н1 : m< m0, то, как и в предыдущем пункте, вычисляется tпр(α, k). Если |Tнабл| < tпр, то нет оснований отвергать нулевую гипотезу. В противном случае Н0 отвергается. Распределение Стьюдента используется также для проверки равенства средних X и У двух нормальных генеральных совокупностей Х и У с неизвестными дисперсиями по выборкам одного и того же объема n. Действительно, если Xi есть выборка объема n из генеральной совокупности Х, a Уi – аналогичная выборка из У, то составляются разности di = X i − У i . Затем по выборке di составляется исправленное среднее квадратическое отклонение Sd. Для того чтобы проверить нулевую гипотезу Н0 : M[X] = M[У] о равенстве двух средних из нормальных совокупностей Х и У при конкурирующей гипотезе Н1 : M[X] ≠ M[У], следует вычислить значение критерия: Tнабл.= 1 где d = n
n
∑d
i
d⋅ n , Sd
(2.4.7)
− среднее значение для di.
i =1
Затем по данному уровню значимости α, числу степеней свободы k = n − 1 по таблице распределения Стьюдента находится двусторонняя критическая 54
точка tдв.кр(α, k). Если |Tнабл| < tдв, то нет оснований отвергать нулевую гипотезу. Если |Tнабл| > tдв, то нулевая гипотеза отвергается. Приведем еще одно применение распределения Стьюдента. Пусть имеются две нормально распределенные генеральные совокупности X и У. Из этих совокупностей извлечены две выборки одинакового объема n. По этим выборкам найден коэффициент корреляции rxy, причем оказалось, что rxy ≠ 0. Требуется проверить нулевую гипотезу Н0 : rxy = 0 – о равенстве нулю коэффициента корреляции rxy для генеральных совокупностей X и У при конкурирующей гипотезе Н0 : rxy ≠ 0. Для этого необходимо вычислить наблюдаемое значение критерия: Tнабл. =
rxy n − 2 1 − rxy2
.
(2.4.8)
По уровню значимости α и числу степеней свободы k = n – 2 по таблице Стьюдента находится двусторонняя критическая точка tдв.кр(α, k). Если |Tнабл| > tдв.кр, то нулевую гипотезу отвергают. Если |Tнабл| < tдв.кр, то нет оснований отвергать нулевую гипотезу. В заключение приведем два критерия, с помощью которых можно проверить гипотезу о равенстве дисперсий различных генеральных совокупностей. Пусть Х1, Х2, …, Хm представляют собой некоторые генеральные совокупности, распределенные по нормальному закону, и требуется на уровне значимости α проверить нулевую гипотезу о равенстве между собой дисперсий этих генеральных совокупностей: Н0 : D[X1] = D[X2] = … = D[Xm]. Пусть из каждой генеральной совокупности извлечены выборки равного объема n. По этим выборкам вычислены уточненные выборочные дисперсии S21, S22, …, S2m. Известно, что для проверки нашей нулевой гипотезы может служить следующий критерий, называемый критерием Кочрена:
G=
max Si2 n
∑ Si2
.
i =1
Ясно, что критерий Кочрена представляет собой отношение максимальной уточненной выборочной дисперсии к сумме всех полученных уточненных выборочных дисперсий. Распределение критерия Кочрена зависит от числа степеней свободы k = n − 1 и числа выборок m. Для проверки нулевой гипотезы поступаем обычным образом, а именно вычисляем наблюдаемое значение критерия:
55
Gнабл =
max Si2 m
∑
.
Si2
i =1
Затем с учетом числа степеней свободы k = n − 1 и числа выборок m по таблице критических значений распределения Кочрена находим Gкр. Если Gнабл < Gкр, то основная гипотеза принимается, в противном случае нулевая гипотеза отвергается. При этом в качестве оценки для общего значения дисперсий обычно выбирается их среднее значение: 1 D[X] = m
m
∑S
2 i
.
i =1
Имеется обобщение критерия Кочрена, которое называется критерием Бартлетта. Критерий Бартлетта решает ту же задачу, однако выборки из генеральных совокупностей Х1, Х2, …, Хm могут иметь различные объемы ni, причем ni ≥ 4. Для того чтобы на уровне значимости α проверить нулевую гипотезу о равенстве дисперсий генеральных совокупностей Н0 : D[X1] = D[X2]= … = D[Xm], введем обозначения: ki = ni − 1 и пусть k =
m
∑k . i
i =1
Обозначим: m
s2 =
∑k S
2 i i
i =1
,
k
V = 2,303(k lg s 2 −
m
∑ k lg s i
2 i
),
i =1
1 C = 1+ ( 3(m - 1)
m
∑ 1/k − 1/k) . i
i =1
Критерием Бартлетта называется величина B=
V . C
Оказывается, что критерий Бартлетта имеет χ2-распределение. Критическое значение критерия Бартлетта зависит от уровня значимости α и числа степеней свободы m − 1. По таблице критических значений χ2 находим соответствующее критическое значение χ2кр и сравниваем его с Внабл. Если Внабл < χ2кр, то нет оснований отвергать нулевую гипотезу, в противном случае нулевая гипотеза отвергается. 56
Заметим, что критерий Бартлетта очень критичен к закону распределения генеральной совокупности и при малейшем отклонении его от нормального приводит к значительным ошибкам. Поэтому использовать критерий Бартлетта следует лишь в крайних случаях, а на практике стараться делать исследуемые выборки равных объемов и использовать критерий Кочрена. 2.5. Имитационная математическая модель частоты автогенератора (корреляционный анализ)
При изучении различных естественнонаучных, технических, экономических и ряда других задач часто возникает необходимость установить взаимосвязь между двумя или несколькими величинами. Эти взаимосвязи могут иметь различную природу, важнейшими из них являются следующие: 1. Функциональная зависимость означает, что задан детерминированный закон, связывающий изучаемые величины. Если величин две − Х и У, то функциональная зависимость означает наличие связи типа У = f (X). 2. Статистическая зависимость между случайными переменными Х и У означает, что изменение одной из них приводит к изменению закона распределения другой. 3. Корреляционная зависимость между двумя случайными величинами Х и У означает, что изменение одной из них приводит к изменению математического ожидания другой. В этом плане можно считать корреляционную зависимость частным случаем статистической зависимости. Примером корреляционной зависимости является, например, зависимость между ценами на топливо и ценами на строительные материалы, либо зависимость между ростом и весом человека. Рассмотрим более подробно смысл и содержание корреляционных зависимостей. Пусть имеются случайные величины Х и У и нас интересует вопрос − зависит или нет Х от У. Пусть в результате наблюдений мы можем одновременно определить значения Xi и Уi. Составим таблицу 2.5.1, которая называется корреляционной. Заметим, что в этой таблице m
∑n j =1
je
= n ye ,
k
∑n
ei
= nxe ,
i =1
k
∑n
ye
=
e =1
m
∑n
xe
= n.
e =1
Таблица 2.5.1 у
У1
У2
...
Уk
Σnx
X1 X2
n11 n21
n12 n22
... ...
N1k N2k
Σn1j Σn2j
Xm Σny
nm1 Σni1
nm2 Σni2
.. ...
nmk Σnik
Σnmj Σnij
х
57
Здесь nij обозначает количество реализаций, в которых наблюдалась пара xi, yj. Предполагается, что x1, x2 , …, xm и y1, y2, …, yk упорядочены по возрастанию. Назовем условным средним значением случайной величины У при условии, что x = xi , величину ni 1 y1 + ni 2 y2 + K + nik yk . ni 1 + ni 2 + K + nik
У xi =
Аналогично, условным средним значением Х при условии y = yi называется величина n1 j x1 + n2 j x2 + K + nmj xm
X yj =
n1 j + n2 j + K + nmj
.
По таблице 2.5.1 можно составить две новые таблицы. Таблица 2.5.2 X1
X2
...
Xm
Уx
Уx
...
У xm
1
2
Таблица 2.5.3 У1
Ху
1
У2
...
Уm
Ху
...
Хy
2
m
Ломаная линия, построенная по таблице 2.5.2, называется эмпирической линией регрессии У на Х. Аналогично линия для таблицы 2.5.3 называется эмпирической линией регресcии Х на У. В ряде случаев вместо эмпирической линии регрессии строят плавную линию, иногда просто прямую линию, наилучшим образом приближающую данные таблиц 2.5.2 или 2.5.3. Такая линия (или прямая) называется теоретической линией (или прямой регрессии). Корреляционная зависимость называется прямой корреляцией, если линия регрессии возрастает. В противном случае зависимость называется обратной корреляцией. Проще всего искать линию регрессии в виде многочлена. Коэффициенты этого многочлена определим следующим способом, который называется методом наименьших квадратов. Будем искать линию регрессии с У на Х по таблице 2.5.2 в виде многочлена:
у = a0 x e + a1 x e−1 + a2 xl −2 + K + ae−1 x + ae .
(2.5.1)
Составим следующую сумму: S=
m
∑ i =1
( уi − a0 xie − a1 xie−i − K − ae−1 xi − a e )2 . 58
(2.5.2)
Сумма S является функцией коэффициентов многочлена (2.5.1) и при некоторых значениях коэффициентов a0, a1,… ae, достигает наименьшего значения. Эти значения находятся из решения системы уравнений:
∂S = 0; ∂ ao ∂S = 0; ∂ a1
(2.5.3)
..............
∂S = 0. ∂ aе
Система (2.5.3) представляет собой необходимое условие экстремума функции (2.5.2) и может быть переписана в более подробном виде. Действительно, т. к. m ∂S = 2∑ ( уi − a0 xie − a1 xie−i − K − a e )(− xil −1 ), ∂a j i =1
то система (2.5.3) принимает вид: m
ao
∑ i =1 m
ao
∑
xi2 e
+ a1
m
∑ i =1
xi2 e−1
+ a1
i =1
m
ao
xi2 e−1
∑x
e i
i =1
+ a1
m
∑ i =1 m
+ K + ae
xi2 e−2
∑x
e −1 i
i =1
m
∑
xie
=
i =1
+ K + ae
+ K + ae
m
∑у х ; e i i
i =1
m
∑
xie−1
i =1 m
=
m
∑у x
e −1 i i ;
(2.5.4)
i =1
m
∑1 = ∑ у . i
i =1
i =1
Доказано, что эта система уравнений всегда имеет единственное решение, поэтому теоретическая линия регрессии вида (2.5.1) единственна. Наиболее простой вид система (2.5.4) принимает для случая линейной регрессии y = ax + b. В этом случае S=
m
∑
( уi − axi
− b) . 2
i =1
Вычисляя производные: m ∂S = 2∑ ( уi − axi − b )(− xi ) , ∂a i =1 m ∂S = 2∑ уi − axi − b )(− 1) ∂b i =1
и приравнивая их к нулю, получаем систему уравнений: 59
m
a
∑
xi2
+b
i =1
∑x = ∑у x ,
∑x
i
+b⋅m =
i =1
(2.5.5)
i i
i
i =1
m
a
m
m
i =1 m
∑у . i
i =1
Решая систему, получаем: ⎛ m ⎞⎛ m ⎞ m уi xi − ⎜⎜ xi ⎟⎟⎜⎜ уi ⎟⎟ ⎝ i −1 ⎠⎝ i =1 ⎠ , a = i −1 2 m m ⎛ ⎞ m xi2 − ⎜⎜ xi ⎟⎟ i =1 ⎝ i =1 ⎠ m
∑
∑
∑
m
b=
∑
∑
m
m
m
∑ ∑ у −∑x ∑у x i =1
xi2
i
i −1
i
i =1
i i
i =1 2
⎛ m ⎞ 2 m xi − ⎜⎜ xi ⎟⎟ ⎝ i =1 ⎠ i =1 m
∑
(2.5.6)
∑
.
(2.5.7)
Аналогично можно построить прямую регрессии с Х на У. Представим таблицу 2.5.1 в виде простого статистического ряда, который содержит все выполненные наблюдения над случайными величинами Х и У: x1 y1
... ...
x2 y2
xn yn
Выборочные средние обозначим X и Y соответственно. Выборочным ковариационным моментом, или выборочной ковариацией, называется величина
1 n K xy = ∑ (xi − X )( yi − У ). n i =1
(2.5.8)
Нетрудно увидеть, что Kxy = XY − XY . Если Х и У – независимые случайные величины, то при n → ∞ величина Kxy → 0. Таким образом, ковариационный момент может служить мерой корреляционной связи между Х и У. Однако более удобной характеристикой корреляционной связи является коэффициент корреляции. Выборочным коэффициентом корреляции rxy называется величина n
∑ (xi − X )( yi − У )
rxy=
i =1 n
n
∑ (xi − X ) ∑ (уi − У )
i =1
2
i =1
60
2
=
K xy
σ ∗x ⋅ σ ∗y
.
(2.5.9)
Эта формула может быть записана несколько иначе: rxy =
XУ − X ⋅ У . σ ∗x ⋅ σ ∗y
(2.5.10)
Выборочный коэффициент корреляции обладает следующими свойствами: 1. –1 ≤ rxy ≤ 1. 2. Если rxy = 0, то с большой вероятностью между Х и У нет линейной корреляционной связи, хотя возможна другая корреляционная зависимость (например, квадратическая, кубическая и т. д.). 3. Если rxy = ± 1, то с большой вероятностью между Х и У существует линейная зависимость. 4. Чем больше |rxy|,тем теснее связь между Х и У. 5. Если |rxy| n − 1 > 3, то связь между Х и У достаточно вероятна. 6. Если У = aX + b, то |rxy| = 1. Заметим, что прямая регрессии У на Х может быть записана с помощью выборочного коэффициента корреляции следующим образом:
σ ∗y y − У = rxy ∗ (х − X ). σx
(2.5.11)
Аналогично записывается уравнение регрессии c Х на У: ∗ σ х − X = rxy ∗x (y − У ) . σy
(2.5.12)
В качестве примера найдем линию регрессии для зависимости частоты АГ от емкости контура, полученную экспериментально (таблица 2.5.4). Таблица 2.5.4 С, пФ
100
510
1000
10000
F, кГц
586633
459894
F398486
129148
Найдем уравнение регрессии при аппроксимации линейным выражением Y = A + B1X. Нормальное уравнение для построения аппроксимирующего полинома получают, используя метод наименьших квадратов. Нужно минимизировать D: D=
N
∑( Y
j
− A − B1 X j )2 .
j =1
Если взять частные производные по A, B1 и приравнять их к нулю, получим:
61
N dD = 2∑ [( Y j − A − B1 X j ) ⋅ ( −1 )] = 0 ; dA j =1 N dD = 2∑ [( Y j − A − B1 X j ) ⋅ ( − X j )] = 0 . dB j =1
После перестановки членов и упрощения приходим к двум уравнениям для оценок параметров А и B1: N
N
j =1
j =1
N ⋅ A + B1 ⋅ ∑ X j =∑ Y j ; N
N
j =1
j =1
N
A ⋅ ∑ X j + B1 ⋅∑ X j =∑ X jY j . 2
j =1
Имеем два уравнения с двумя неизвестными A, B1. Обозначим:
N = a11 ; a12 =
N
∑X
b1 =
j;
j =1
a21 = a12 ; a22 =
∑X
j
∑Y ; j
j =1
2
N
N
; b2 =
j =1
N
∑X Y . j j
j =1
Тогда расширенная матрица системы запишется так:
a11 a12 b1 a21 a22 b2
.
Решим эту систему методом Крамера, для чего вычислим следующие определители:
Δ= ΔA = ΔB =
a11
a12
a21
a22
b1 b2
= a11 ⋅ b2 − a12 ⋅ a21 ;
a12 = b1 ⋅ a22 − b2 ⋅ a12 ; a22
a11 b1 = a11 ⋅ b2 − b1 ⋅ a21 ; a21 b2
A=
ΔA Δ ; B1 = B . Δ Δ
Проведенные расчеты для выборочной средней частоты позволили найти следующие величины: b1 = 1574,161; а12 = 11610; а22 = 101270096; b2 = 1983175,25; А = 504,612; B1 = –0,0383.
62
Уравнение для частоты в зависимости от емкости колебательного контура записывается: Y = A + B1X = 504,612 – 0,0383Х.
Подстановка в полученное уравнение значений емкости контура позволила получить следующие результаты, сведенные в табл. 2.5.5: Таблица 2.5.5 С, пФ Y, КГц
100 586,6
510 459,89
1000 398,48
10000 129,14
Y, КГц
500,7
485,09
466,34
121,93
Получено экспериментально Получено из уравнения линейной регрессии
Нелинейная регрессия Сравнение частот АГ, измеренных экспериментально и полученных на основании линейной модели, показывает, что линейная модель недостаточно точно отображает зависимость частоты от емкости колебательного контура АГ. Поэтому найдем криволинейное уравнение регрессии. В данном случае нужно минимизировать D: N
D = ∑ ( Y j − A − B1 X − B2 X 2 )2 . j =1
Взяв частные производные, после перестановки членов и упрощения приходим к трем уравнениям для оценок параметров A, B1, B2: N
N
N
j =1
j =1
j =1
N ⋅ A + B1 ∑ X j + B2 ∑ X j = ∑ Y j ; N
N
j =1
j =1
2
N
N
A∑ X j + B1 ∑ X j + B2 ∑ X j = ∑ X jY j ; N
N
3
j =1
j =1
N
N
A∑ X j + B1 ∑ X j + B2 ∑ X j = ∑ X j Y j . 2
j =1
3
j =1
4
j =1
2
j =1
Имеем три уравнения с тремя неизвестными A, Bl, В2. Обозначим: N
N
j =1
j =1
N
N = a11 ; a12 = ∑ X j ; a13 = ∑ X j ; b2 = ∑ Y j ; 2
j =1
a21 = a12 ; a22 = a13 ; a31 = a13 ; N
N
N
j =1
j =1
N
a23 = ∑ X j ; b2 = ∑ X jY j ; a33 = ∑ X j ; b3 = ∑ X j Y j . j =1
3
63
4
j =1
2
Тогда расширенная матрица системы запишется следующим образом: a11 a21
a12 a22
a13 a23
b1 b2 .
a31
a32
a33
b3
Решим эту систему также методом Крамера, для чего вычислим определители: a11 Δ = a21 a31
a12 a22 a32
b1 ΔA = b2 b3 a11 ΔB1 = a21 a31
ΔB 2
a13 a ⋅a ⋅a + a ⋅a ⋅a + a ⋅a ⋅a − a23 = 11 22 33 12 23 31 13 21 32 − a13 ⋅ a22 ⋅ a31 − a12 ⋅ a21 ⋅ a33 − a11 ⋅ a23 ⋅ a32 ; a33
a12 a13 b ⋅a ⋅a + a ⋅a ⋅b + a ⋅b ⋅a − a22 a23 = 1 22 33 12 23 3 13 2 32 − a13 ⋅ a22 ⋅ b3 − a12 ⋅ b2 ⋅ a33 − b1 ⋅ a23 ⋅ a32 ; a32 a33 b2 a13 a ⋅b ⋅ a + b ⋅ a ⋅ a + a ⋅ a ⋅b − b2 a23 = 11 2 33 1 23 31 13 21 3 − a13 ⋅ b2 ⋅ a31 − b1 ⋅ a21 ⋅ a33 − a11 ⋅ a23 ⋅ b3 ; b3 a33
a11 a12 = a21 a22 a31 a32
b3 a ⋅ a ⋅ b + a ⋅ b ⋅ a + b ⋅ a21 ⋅ a32 − b2 = 11 22 3 12 2 31 − b1 ⋅ a22 ⋅ a31 − a12 ⋅ a21 ⋅ b3 − a11 ⋅ b2 ⋅ a32 ; b3 A=
ΔA Δ Δ ; B1 = B1 ; B2 = B 2 . Δ Δ Δ
Проведенные расчеты позволили найти величины:
Δ = 9,665 · 1021; ΔB1 = –2,202 · 1021; ΔA = 5,763 · 1024; ΔB2 = 1,751· 1017;
А = 595,253; B1 = –0,228; B2 = 0,00001811.
Уравнение для частоты в зависимости от емкости колебательного контура записывается как Y = A + B1 X + B0 X2 = 596,253 – 0,228Х + 0,00001811Х2.
Подстановка в полученное уравнение значений емкости контура позволило получить результаты, сведенные в таблице 2.5.6. Сравнение частот АГ, измеренных экспериментально и полученных на основании линейной и криволинейной моделей, показывает, что криволинейная модель более точно отображает зависимость частоты от емкости колебательного контура АГ. 64
Таблица 2.5.6 С, пФ Y, КГц Y, КГц
100 586,633 573,651
510 459,89 484,77
100 398,486 386,535
10000 129,148 129,204
Эксперимент Нелинейная регрессия
Сравнение частот автогенератора, измеренных экспериментально и полученных на основании линейной и криволинейной моделей, показывает, что криволинейная модель более точно отображает зависимость частоты автогенератора от емкости контура. 2.6. Исследование влияния элементов схемы автогенератора на его частоту (дисперсионный анализ)
Под дисперсионным анализом (analysis of variance) понимается статистический метод, предназначенный для изучения влияния различных факторов на результаты эксперимента. Дисперсионный анализ был первоначально предложен Р. Фишером, который определил его как метод отделения дисперсии, приписываемой различным группам исследуемых факторов. Этот метод позволил рассматривать с единой точки зрения многие задачи теории оценивания и проверки гипотез в моделях регрессии. Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, биологии и техники. В основе каждой задачи дисперсионного анализа лежит план эксперимента, то есть правило соотнесения проводимых измерений с определенной комбинацией рассматриваемых факторов. Методом дисперсионного анализа можно оценивать эффекты от каждого фактора и каждой комбинации факторов, а также случайные ошибки. Возникающие здесь статистические задачи связаны с оценкой этих эффектов и проверкой статистических гипотез о них. Формулировка и проверка соответствующих статистических гипотез и является содержанием дисперсионного анализа. Следует заметить, что дисперсионный анализ предназначен для обработки планируемых экспериментов, однако его широко применяют для обработки экспериментальных данных, полученных без предварительного планирования, например, в задачах выборочных обследований. Задачи дисперсионного анализа различают по характеру анализируемых факторов: рассматривают задачи с постоянными факторами, со случайными и смешанные, а также задачи, в которых часть факторов является количественными (регрессионными) переменными, а часть имеет неколичественный характер. Методы решения таких задач составляют так называемый ковариационный анализ. Кроме того, задачи дисперсионного анализа различают по числу анализируемых факторов (анализ однофакторный, двухфакторный и т. д.) и по виду используемого плана эксперимента.
65
Однофакторный дисперсионный анализ При однофакторном дисперсионном анализе исследуется влияние на результирующий признак одного качественного фактора. В основе однофакторного анализа лежит следующая теоретико-вероятностная схема: Yji = ai + εji; i = 1, 2, …, I; j = 1, 2, …, ni; I
∑n = n ; i
i =1
где: Yji − значения результирующего признака; ai − математические ожидания результирующего значения при i-м значении качественного фактора; εji − случайные отклонения результирующего признака от среднего значения; ni − число наблюдений при i−м значении качественного фактора; n − общее число наблюдений. Всюду в дальнейшем мы будем полагать, что εji являются нормально распределенными случайными величинами с нулевыми математическими ожиданиями и одинаковыми дисперсиями: М[εji] = 0; D[εji] = σ2.
В результате осуществления выборочного эксперимента получим I групп выборочных значений результирующего признака Yji(i = 1, 2, …, I; j = 1, 2, …, ni). По указанной выборке необходимо проверить справедливость гипотезы H0 : a1 = a2 = … = aI = a, т. е. что качественный фактор не влияет на результирующий признак. Введем для каждой группы и для всей выборки в целом выборочные средние:
1 y= n
I
ni
1 y ji ; yi = ni j =1
∑∑ i =1
ni
∑y
ji .
j =1
Известно, что выборочные групповые средние yi являются несмещенными и состоятельными оценками средних ai. Если, согласно гипотезе Н0, все средние одинаковы (ai = a), то общее выборочное среднее y не должно статистически отличаться от групповых yi . В противном случае отличие должно быть статистически значимым и может быть установлено методами проверки статистических гипотез. Представим полную сумму квадратов отклонений результирующего признака от общего среднего в форме двух сумм квадратов отклонений:
66
2
S =
I
ni
∑∑( y
ji
2
− y) =
i =1 j =1
ni
I
∑∑(( y
2
− yi ) + ( yi − y )) =
ji
i =1 j =1
+
ni
I
∑ ∑( y − y )
2
i
I
ni
∑∑( y
ji
− yi )2 +
i =1 j =1
+2
i =1 j =1
ni
I
∑∑( y − y )( y i
ji
− yi ).
i =1 j =1
Читателю предлагается убедиться, что последняя сумма, соответствующая удвоенным произведениям, при раскрытии квадратов сумм обращается в нуль. Поэтому имеем: 2
S =
I
ni
∑∑( y
2
− yi ) +
ji
i =1 j =1
ni
I
∑∑( y − y )
2
i
= S R2 + S A2 .
i =1 j =1
Сумма S R2 определяет сумму квадратов отклонений между отдельным наблюдением и средним значением внутри конкретной серии и называется суммой квадратов отклонений внутри серий. Иногда она называется остаточным отклонением. Сумма S А2 определяет сумму квадратов отклонений между средними значениями серий и общим средним. Она называется рассеиванием по факторам. Заметим, что величина ni
1
σ
∑( y
2
ji
− yi )2
j =1
имеет распределение χ2 с ni −1 степенью свободы. Отсюда вытекает, что сумма таких выражений по переменной суммирования i, которая имеет вид:
SR2
σ
2
=
I
ni
∑∑( y
ji
− yi )2 ,
i=1 j =1
также распределена по закону χ2 с n − I степенями свободы. Аналогично величина
S A2
σ
2
=
1
σ
2
I
ni
∑∑( y − y ) i
2
i =1 j =1
распределена по закону χ2 с I − 1 степенями свободы. Отношение двух случайных величин, распределенных по закону χ2, распределено по закону Фишера, а именно: величина
S A2 F = I −2 1 SR n−I 67
имеет распределение Фишера с I − 1, n − I степенями свободы. Заметим, что если нулевая гипотеза H0 верна, то y не должно значительно отличаться от yi , поскольку все эти статистики являются состоятельными и несмещенными оценками величины а. В этом случае SA2 будет малой. Если же нулевая гипотеза H0 неверна, то SA2 будет принимать достаточно большие значения. Для проверки гипотезы Н0 можно использовать следующий статистический критерий: если F ≤ Fα,кр (I − 1, n − I), то гипотеза Н0 принимается, в противном случае − отвергается. Здесь Fα,кр (I − 1, n − I) определяется из уравнения: Р{F > F α,кр (I − 1, n − I) ⎢ Н0} = α, где α – заданная ошибка первого рода, т. е. вероятность отвергнуть гипотезу Н0, когда она верна. Таким образом, если окажется выполненным условие:
F > Fα,кр (I − 1, n − I), то принимаем решение, что исследуемый фактор существенно влияет на результирующий признак, причем состоятельными и несмещенными оценками теоретических средних аi являются yi , а состоятельной и несмещенной оценкой для дисперсии σ2 случайной составляющей является:
1 σ = n−I 2
I
ni
∑∑( y
ji
− yi )2 .
i =1 i =1
Для примера проведем дисперсионный анализ с целью выявления влияния емкости колебательного контура АГ на его частоту. Остальные факторы служат фоном (ошибкой эксперимента). В результате проведения эксперимента должны получить ответ на вопрос: значимым ли является рассматриваемый фактор или нет? Пусть, например, рассматриваются два значения емкости контура (фактор X1) при постоянном значении индуктивности (фактор Х2). Одно значение емкости соответствует нижнему уровню фактора, а другое – верхнему уровню. План проведения эксперимента для трех параллельных опытов приведен в таблице 2.6.1. Таблица 2.6.1 Число параллельных опытов n 1 2 3
Уровни проведения эксперимента (N = 2) X1 = +1; Х2 = +1 X1 = –1; Х2 = +1 Частота АГ Частота АГ Y11 Y21 Y12 Y22 Y13 Y23
Емкости колебательного контура АГ равны 100, 1000 пФ при постоянном значении индуктивности. Значение емкости 100 пФ соответствует нижнему уровню фактора, а 1000 пФ – верхнему уровню. Экспериментальные данные приведены в таблице 2.6.2. 68
Таблица 2.6.2 Уровни проведения эксперимента (N = 2) X1 = +1; Х2 = +1 X1 = –1; Х2 = –1 Частота АГ Частота AГ 398490 586559 398472 586601 398484 586610 398482 586590 162 602
Число параллельных опытов n 1 2 3 Yср Si2
После проведения эксперимента проведем оценку величин экспериментального среднего и дисперсии в каждом столбце по формулам: N
Yiсс
1 N = Yi ; Si = ( Yi − Y )2 . N − 1 i =1 i =1
∑
∑
2
Далее проверяются однородности дисперсий. Так как даже одна грубая ошибка может исказить результаты исследования, проведенного при небольшом числе экспериментов, то необходим контроль воспроизводимости результатов исследования, который осуществляется с помощью критерия Кочрена. Этот критерий применяется для оценки однородности дисперсий при одинаковом числе повторов каждого эксперимента. Для этого подсчитывается параметр:
G=
S max
2
.
N
∑S
i
i =1
Для рассматриваемого примера G = 602/(168 + 602) = 0,772. Найденное наблюдаемое значение G сравнивают с его критическим значением Gкр. Критическое значение Gкp представляет собой максимально возможное значение параметра G, при котором гипотеза о воспроизводимости эксперимента еще может считаться справедливой. В этом случае максимальная изменчивость функции отклика, полученная в результате проведения n параллельных опытов, не отличается от ожидаемых среди N опытов. Поэтому, если G < Gкp, то "подозрительное" максимальное значение изменчивости не является "инородным", а представляет собой результат случайного рассеяния исследуемой функции отклика, т. е. эксперимент воспроизводим. В противном случае, когда G > Gкp, эксперимент невоспроизводим; необходимо повторить его в анализируемой экспериментальной точке, добившись воспроизводимости, т. е. выполнения G < Gкp. Критическое значение отношения рассматриваемой изменчивости к сумме всех изменчивостей находят из таблицы критических значений критерия Кочрена для нормального закона распределения значений функций отклика в генеральной их совокупности [5, с. 189, таблица 4]. 69
Задаваясь определенным значением коэффициента риска (обычно задаются 0,1; 0,05; 0,01), Gкp определяют в столбце, соответствующем числу параллельных опытов (n), и строке, соответствующей числу номеров опытов (N). Для рассматриваемого примера при коэффициенте риска 0,05, n = 3 и N = 2 Gкр = 0,97. G = 0,772 < Gкр = 0,97, следовательно, эксперимент воспроизводим. После проверки однородности дисперсий найдем оценку главного экспериментального среднего значения функции отклика: N
∑ Yi i =1
Yср =
Nn
.
Для рассматриваемого примера Yср = (398490 + 398472 + 398484 + 586559 + + 586601 + 586610)/2 · 3 = 492536. Проведем оценку дисперсии между выборками (факторную дисперсию):
SΦ
2
n N = ( Yср − Yi )2 . N − 1 i =1
∑
Для рассматриваемого примера SФ = 3[(492536-398482)2 + (492536 – – 86590)2 = 5,3 · 1010. Дисперсия внутри выборки, характеризующая случайную изменчивость исследуемого процесса, будет определяться по формуле: S0 ω
2
N 1 1 = ( Yср − Yi )2 + N ( n − 1 ) i =1 N( n − 1 )
∑
N
∑( Y
ср
− Y j )2 .
j =1
Для рассматриваемого примера S0ω2 = 0,25[(398482 – 398490)2 + (398482 – – 398472)2 + (398482 – 398484)2 + (586590 – 586559)2 + (586590 – 586601)2 + + (586590 – 586610)2] = 412,5. Обозначим через ti отклонения от математического общего среднего (эффекты изменения частоты при изменении емкости контура), так что a
∑t
i
=0.
i =1
Можно сформулировать две гипотезы: Н0 : ti = t2 = ... = ta = 0; H1 : ti <0 или ti > 0, хотя бы для одного i. Таким образом, если справедлива нулевая гипотеза Н0, то каждое наблюдение складывается из математического ожидания общего среднего и случайной ошибки, и величина емкости контура на частоту генератора не влияет. Если справедлива альтернативная гипотеза H1, то величина емкости контура на частоту генератора влияет. Проверка гипотезы состоит в следующем. Берется случайная выборка, по 70
которой находится значение некоторой статистики, и принимается решение отклонить или принять нулевую гипотезу. Для сравнения дисперсий двух нормально распределенных совокупностей необходимо взять случайные выборки объема n1 и n2 из первой и второй совокупностей соответственно. При этом статистики для проверки гипотез H0 : σ12 = σ22, H1 : σ12 <> σ22 определяются отношением выборочных дисперсий: 2
S F= Φ2. S0 ω Верхние односторонние пределы Fkp в зависимости от числа степеней свободы числителя и знаменателя для F-распределения Фишера приведены в таблице [3, с. 467]. Пример. Допустим, необходимо проверить гипотезы: H0 : σ12 = σ22; H1 : σ12 > σ22. Берутся две случайные выборки из n1 = 12 и n2 = 10 наблюдений, выборочные дисперсии S12 = 14,5; S22 = 10,8. Численное значение статистики для проверки гипотезы составляет: 2
S 14 ,5 F = 12 = = 1,34 . 10 ,8 S2 Из таблицы "Верхние односторонние пределы Fкp в зависимости от чисел степеней свободы числителя (k1) и знаменателя (k2) для F-распределения Фишера при уровне значимости q = 0,05" [3, с. 467] находим Fкp(0,05; 11; 9) = 2,9. Поскольку F < Fкp, нет оснований отклонять нулевую гипотезу. Другими словами, статистических данных недостаточно для вывода о том, что σ12 > σ22. Для рассматриваемого примера с автогенератором из сравнения значений 2 Sф и S0ω2 видно, что факторная дисперсия намного превышает дисперсию ошибки. Текущее значение для критерия Фишера составляет: 2
2
F = SΦ / S0ω = 1,286 ⋅ 10 8 . Число степеней свободы для факторной дисперсии K1 = N – l = 1; для дисперсии ошибки K2 = N(n – l) = 4. Критическое значение критерия Фишера для коэффициента риска 0,01 определяем по таблице [3, с. 457]:
Fкp(0,01; 1; 4)= 21,2. Так как F >> Fкp, то существенное отличие факторной дисперсии и дисперсии ошибки является закономерным и, следовательно, можно утверждать, что емкость конденсатора контура АГ существенно влияет на частоту АГ. 71
Двухфакторный дисперсионный анализ. В случае, когда возникает необходимость учитывать влияние на результирующий признак двух факторов, приходим к двухфакторному дисперсионному анализу. Теоретико-вероятностная схема в этом случае имеет вид: Yjik = aik + εjik; i = 1, 2, …, I; k = 1, 2, …, K; j = 1, 2, …, nik; где: Yjik − значения результирующего признака; aik − математические ожидания результирующего значения при i-м значении качественного первого фактора и k-м значении второго фактора; εjik − случайные отклонения результирующего признака от среднего значения, которые предполагаются независимыми случайными величинами с нулевыми математическими ожиданиями и одинаковыми дисперсиями:
М[εjik] = 0; D[εjik] = σ; nik − число наблюдений при i-м значении первого качественного фактора и k-м значении второго, nik − общее число наблюдений в i, k-й клетке. Математические ожидания результирующего значения можно представить в виде aik = a + αi + βk + γik, при этом I
K
I
K
i =1
k =1
i =1
k =1
∑αi = ∑ β k = ∑ γ ik = ∑ γ ik = 0 , 1 IK
∑a
− генеральное среднее;
1 K 1 βk = ( I
∑a
ik
− a ) − главные эффекты первого фактора;
∑a
ik
− a ) − главные эффекты второго фактора;
где: a =
αi = (
ik
i ,k
k
i
γ ik = ( aik −
1 I
∑a
i ,k
i
−
1 K
∑a
ik
k
+
1 IK
∑a
) − эффекты взаимодействия.
ik
i ,k
Можно доказать, что наилучшими оценками эффектов являются оценки, полученные методом наименьших квадратов (МНК-оценки), а именно: ) 1 a= IK
)
αi = (
1 K
∑y
ik ;
i ,k
∑y
ik
k
72
) − a );
)
βk = ( )
γ ik = ( yik −
1 I
∑y
1 I
ik
∑y
) − a );
1 K
ik
ik
i
−
i
1 yik = nik
∑y
+
k
1 IK
∑y
ik
);
i ,k
nik
∑ y jik . j =1
Общая вариация результирующего признака представляется в виде суммы четырех слагаемых − двух вариаций, обусловленных факторами, вариации взаимодействия и остаточной вариации:
∑(y
jik
− y )2 = KN
i,j,k
+N
∑( y
ik
i,k
−
1
∑( K ∑ y
ik
i
1 K
∑y
ik
k
−
1 I
− y)2 + IN
k
∑y
ik
1
∑( I ∑ y
ik
k
+ y )2 +
i
∑(y
jik
− y)2 +
i
2 − yik )2 = S A2 + S B2 + S AB + S R2 .
i,j,k
Вычислив эти вариации, можно приступать к проверке гипотез:
HA : αI = 0; HB : βk = 0; HAB : χik = 0. Для этого также используем критерий Фишера, а именно: S A2 /(I − 1) если 2 ≤ Fα [I − 1, IK(N − 1)] , то нет оснований отвергать гипотезу НА, S R /IK(N − 1) в противном случае эту гипотезу следует отвергнуть. S B2 /(K − 1 ) ≤ Fα [K − 1, IK(N − 1)] , то нет оснований отАналогично, если 2 S R /IK(N − 1) вергать гипотезу НВ, в противном случае эту гипотезу следует отвергнуть. 2 S AB /[(I − 1 )( K − 1)] ≤ Fα [(I − 1)(K − 1), IK(N − 1)] , то нет осНаконец, если S R2 /IK(N − 1) нований отвергать гипотезу НАВ, в противном случае она отвергается. Рассмотрим следующий пример двухфакторного дисперсионного анализа. Пусть исследуется влияние напряжения источника питания и емкости конденсатора контура на частоту АГ. Пусть фактор xi − емкость конденсатора контура, верхнему уровню соответствует 1000 пФ, нижнему – 100 пФ; фактор x2 – напряжение источника питания, рассматриваются два уровня: 4 и 10 вольт. Данные трех параллельных измерений (n = 3) частоты АГ (в МГц) в четырех опытах (N = 4) приведены в таблице 2.6.3. 73
Таблица 2.6.3 Номер опыта N
x1
x2
Y1
Y2
Y3
1 2 3 4
100 1000 100 1000
4 4 10 10
3,51 1,25 2,81 1,01
3,52 1,26 2,82 1,02
3,5 1,3 2,8 1,02
YΣ =
N
∑Y
j
j =1
10,53 3,81 8,43 3,03 n
1 YΣ N
si2
3,51 1,27 2,81 1,01
0,0001 0,0007 0,0001 0,0001
N
Y = ∑∑ Y ij= 25 ,8 i =1 j =1
Комбинация обработок для рассматриваемого плана может быть изображена графически в виде квадрата (рис. 10). ) Y2 представляет собой комбинацию обработок x1 на верхнем уровне и x2 – ) на нижнем уровне; Y3 – комбинация обработок, когда x1 на нижнем и x2 – на ) ) верхнем уровнях; Y4 – оба фактора на верхнем уровне; Y1 – комбинация обработок, когда оба фактора на нижнем уровне. Y3
Y4
Y1
Y2
Рис. 10. Комбинации обработок
Определим средний эффект фактора как изменение отклика, обусловленное изменением уровня этого фактора и усредненное по уровням других факторов. ) ) Y2 − Y Тогда эффект x1 на нижнем уровне x2 равен , эффект x1 на верхнем уровне n ) ) Y4 − Y3 x2 равен , и среднее арифметическое этих величин находится по формуле: n
x1 =
1 ) ) ) ) ( Y4 + Y2 − Y3 − Y1 ) . 2n
Аналогично можно записать выражения:
1 ) ) ) ) ( Y4 − Y2 + Y3 − Y1 ); 2n 1 ) ) ) ) x1 x2 = ( Y4 − Y2 − Y3 + Y1 ) . 2n
x2 =
Выражения x1, x2, x1x2 называют контрастами [6] и используют для оценки суммы квадратов: 74
1 ) ) ) ) 2 ( Y4 + Y2 − Y3 − Y1 ) ; 4n 1 ) ) ) ) SS x2 = ( Y4 − Y2 + Y3 − Y1 )2 ; 4n ) 1 ) ) SS x1x2 = ( Y4 − Y21 − Yˆ3 + Y1 )2 ; 4n SSx1 = (3,03 + 3,81 – 8,43 – 10,53)2/12 = 12,2412; SSx2 = 0,6912; SSx1x2 = 0,1452. SS x1 =
Общая сумма квадратов, у которой ( 4 n − 1 ) степеней свободы, находится по формуле:
SSобщ =
n
N
∑∑Y
ij
i =1 j =1
2
−
1 2 Y = 3,512 + 3,52 2 + … + 1,02 2 + 12 − 55 ,47 = 13 ,0791. nk
Сумма квадратов ошибки, которая обладает 4( n − 1 ) степенью свободы, находится вычитанием:
SSош = SSобщ − SS x1 − SS x 2 − SS x1 x 2 = 13,0791 − 12,2412 − 0,1452 − 0,6912 = 0,0015. Для ответа на вопрос о влиянии на функцию отклика факторов x1, x2, x1x2 находят текущее значение критерия Фишера, которое определяется соответствующим отношением средних квадратов с учетом степени свободы:
F1 =
SS x1 ; SSош
F2 =
SS x 2 SS ; F12 = x1 x 2 . SSош SSош
Средний квадрат определяется как отношение суммы квадратов к степени свободы этой суммы квадратов. В таблицу 2.6.4 сведены результаты вычислений. Таблица 2.6.4 Факторы
x1 x2 x1 x2 Ошибка
Сумма квадратов 12,2412 0,6912 0,1452 0,0015
Степени свободы 1 1 1 8
Средний квадрат 12,2412 0,6912 0,1452 0,0001875
Значение критерия 65286,4 3686,4 774,4
Критические значения для критерия Фишера определяются по таблицам «Критические точки распределения F Фишера-Снедекора», в зависимости от чисел степеней свободы числителя (SSx) и знаменателя (SSош) при уровне значимости α = 0,01", и приведены в таблице [8, с. 467]: Fкр (0,01; 1,8) = 5981; Fкр (0,05; l,8) = 239. 75
С вероятностью 0,99 можно утверждать, что только фактор x1 существенно влияет на функцию отклика. Для факторов x2 и x1x2 соблюдается условие: Fx2 < Fкр и Fx1x2 < Fкр, поэтому для утверждения о том, что эти факторы значимы при вероятности 0,99, необходимо увеличить число параллельных опытов и найти новое значение критерия. Однако с вероятностью 0,95 можно утверждать, что все факторы существенно влияют на функцию отклика, т. к. в этом случае Fx > Fкр .
3. Планирование эксперимента для обоснования имитационной математической модели частоты автогенератора первого и второго порядка
3.1. Планирование и проведение двухфакторного и трехфакторного эксперимента для обоснования математической модели частоты автогенератора первого порядка Рассмотрим задачу обоснования линейной математической модели зависимости частоты автогенератора от величин емкости, индуктивности колебательного контура, напряжения источника питания. При проведении полного факторного эксперимента учитывается влияние на функцию отклика исследуемого объекта не только каждого рассматриваемого в эксперименте фактора в отдельности, но и их взаимодействий. Влияние взаимодействий факторов – это когда уровень одного фактора определяет характер влияния другого фактора на функцию отклика. Математическое описание поверхности отклика объекта в окрестности точки базового режима можно получить варьированием каждого из факторов на двух уровнях, отличающихся от базового уровня на величину интервала варьирования. Интервал варьирования по каждому управляемому фактору выбирается так, чтобы приращение величины отклика к базовому значению можно было заметить при небольшом числе параллельных опытов. Полным факторным экспериментом (ПФЭ) называется эксперимент, реализующий все возможные неповторяющиеся комбинации уровней k независимых управляемых факторов, каждый из которых реализуется на двух уровнях. Число этих комбинаций N = 2 k определяет тип ПФЭ. На ранних стадиях исследования, когда чаще всего приходится рассматривать много факторов, планы 2k особенно полезны. При использовании таких планов число комбинаций обработок, с помощью которых могут быть исследованы в полном факторном эксперименте k факторов, оказывается минимальным. Поскольку для каждого фактора берется только два уровня, то отклик приблизительно линеен в диапазоне изменения выбранных уровней. Первым планом типа 2k является план лишь с двумя факторами x1 , x2 с двумя уровнями каждый, т. е. план 22. 76
Считаем, что модель исследуемого объекта является линейной и имеет вид:
Y = θ0 + θ1 x1 + θ 2 x2 + θ12 x1 x2 . Все возможные комбинации для двух факторов, варьируемых на двух уровнях, будут исчерпаны, если повторить четыре опыта. Для удобства обработки результатов опыта проводится преобразование значений управляемых переменных к безразмерным величинам: x iσ = ( xi − x0 i ) / Δxi , где: x0 i – начальное значение i-го фактора в центре плана; Δxi – значение интервала варьирования по i-му фактору; xi – текущее значение i-го фактора. Для рассматриваемого опыта значение емкости контура АГ составляет 1000 пФ и 100 пФ. Зададимся шагом варьирования по этому фактору: Δx1 = 900 пФ. Варьирование значений фактора относительно его базового значения проводится на двух уровнях. Переходя от абсолютных значений рассматриваемого фактора к безразмерным его значениям, получим для верхнего уровня рассматриваемого фактора: x iσ = ( xi − x0 i ) / Δxi = (1000 – 900)/900 = +1; для нижнего уровня: x iσ = ( xi − x0 i ) / Δxi = (100 – 1000)/900 = –1. Аналогично, задаваясь шагом варьирования для напряжения источника питания Δx2 = 6 В, получим для верхнего уровня +1, для нижнего уровня –1. Матрица планирования приведена ниже (пишется только знак).
Таблица 3.1.1 Номер опыта 1 2 3 4
x0 + + + +
x1 – + – +
x2 – – + +
x1 x2 + – – +
Y Y11 Y21 Y12 Y22
В этой таблице x0 – фиктивная переменная, соответствующая коэффициенту θ0 . Обработка и анализ результатов полного факторного эксперимента предусматривает следующий порядок его проведения. Вначале оцениваются дисперсии среднего арифметического в каждой строке матрицы по формуле:
Si2 =
1 n ( Yin − Yi )2 . n − 1 i =1
∑
Далее проверяются однородности дисперсий. Так как даже одна грубая ошибка может исказить результаты исследования, проведенного при небольшом числе экспериментов, то необходим контроль воспроизводимости результатов исследования, который осуществляется с помощью критерия Кочрена. 77
Если проверка показала, что эксперименты воспроизводимы, то их результаты можно использовать для оценки коэффициентов регрессии. Если эксперименты невоспроизводимы, то рекомендуется увеличить число параллельных опытов. Затем создается математическая модель объекта с проверкой статистической значимости коэффициентов полинома. Независимая оценка коэффициентов полинома проводится по формуле: N
1 θi = N
∑x Y . ji j
j =1
Здесь xji принимает значения +1 или –1 в соответствии с матрицей планирования. После вычисления коэффициентов оценивается их значимость для определения степени влияния факторов на выходной параметр. Основой оценки значимости является t-критерий. Проверяется адекватность математической модели. Оцениваем дисперсию адекватности: 2 s АД
N
1 = N −d
∑( Y
j
− Y jt )2 ,
j =1
где: d – число членов аппроксимирующего полинома; Y j – результат эксперимента;
Y jt – значение выходного параметра, предсказанное имитационной моделью в той же точке факторного пространства. 2 Если s АД не превышает дисперсии опыта, то полученная математическая модель адекватно представляет результаты эксперимента. Дисперсия воспроизводимости эксперимента (среднее значение всех дисперсий функции отклика в параллельных опытах) равна: 2
S j {Y } =
N
∑( S
2 j
) / n;
j =1
2
Sj =
1 ( n −1)
N
∑( Y
j
− Yср )2 .
j =1
Оценим величину дисперсии для каждой строки матрицы (табл. 2.6.3):
S12 = 0,0001; S 22 = 0,0007; S32 = 0,0001; S42 = 0,0001. Дисперсия воспроизводимости определяется по формуле:
S 2j { Y } = 0,00025. 78
Проверим однородность дисперсий, подсчитаем текущее значение критерия Кочрена:
G=
S max
2
n
∑S
2
=
0 ,007 = 0 ,7 . 0 ,001
i
i =1
Критичное значение критерия Кочрена Gкр для номеров опытов, каждый из которых состоит из n параллельных опытов, при заданных значениях коэффициента риска 0,05; n = 3, N = 4 определяется из таблицы [9, с. 189]; для Gкр(0,05; n = 3, N = 4) = 0,77. Поскольку G < Gкр, то делаем вывод, что эксперимент воспроизводим. Подсчитаем значение каждого коэффициента предполагаемой имитационной модели в виде полинома:
1 θ1 = n
θ2 =
1 n
θ0 = θ12 =
n
∑X
i =1 n
∑X
= 0 ,25( 3 ,51 + 1,27 − 2 ,81 + 1,01 ) = −1,01;
1iY1i
2 iY2 i
= 0 ,25( −3 ,51 − 1,27 + 2 ,81 + 1,01 ) = −0 ,24;
i =1 n
1 n
∑X
0 iY0 i
1 n
∑X
12 iY12 i
= 0 ,25( 3 ,51 + 1,27 + 2 ,81 + 1,01 ) = 2 ,15;
i =1 n
= 0 ,25( 3 ,51 − 1,27 + 2 ,81 + 1,01 ) = 0 ,11 .
i =1
Имитационная модель в виде полинома Yi = θ0 + θ1 x1 + θ 2 x2 + θ12 x1 x2 при подстановке коэффициентов принимает вид: Yi = 2 ,15 − 1,01x1 − − 0 ,24 x2 + 0 ,11x1 x2 . Оценим значимость коэффициентов полинома с помощью критерия Стьюдента, предварительно рассчитав значение t-параметра для каждого коэффициента и соответствующей ему дисперсии ошибки определения этого коэффициента. Учитывая ортогональность матрицы планирования, дисперсия ошибок каждого из коэффициентов будет одной и той же и определяется так:
S 2j {
θ }=
S 2j { Y } nN
.
Для рассматриваемого примера S2{B} = 0,0000208; подсчитаем t-параметр для каждого коэффициента полинома:
θ0 → t0 = θ0 / S 2 { B } = 2 ,15 / 0 ,00456 = 471,5; θ1 → t1 = θ1 / S 2 { B } = 1,01 / 0 ,00456 = 221,5; 79
θ 2 → t2 = θ 2 / S 2 { B } = 0 ,24 / 0 ,00456 = 52 ,63; θ12 → t12 = θ12 / S 2 { B } = 0 ,11 / 0 ,00456 = 24 ,12. Определим критичное значение t-параметра по таблице [8, с. 466] для числа степеней свободы s = n( N − 1 ) = 2 · 4 = 8, при коэффициенте риска 0,01 tкр = l,86. Из сравнения найденного значения tкр со значениями t-параметров можно утверждать с вероятностью 0,9, что все параметры имитационной модели значимы. Проверим адекватность математической модели. Для оценки дисперсии адекватности найдем значение функции отклика при подстановке коэффициентов имитационной модели в соответствии с матрицей планирования эксперимента:
Y1 = 2,15 + 1,01 + 0,24 + 0,11 = 3,51; Y2 = 2,15 – 1,01 + 0,24 – 0,11 = 1,27; Y3 = 2,15 + 1,01 – 0,24 – 0,11 = 2,81; Y4 = 2,15 – 1,01 – 0,24 + 0,11 = 1,01. Значения функции отклика, полученные с помощью имитационной модели, полностью соответствуют усредненным значениям этой функции, полученным в результате эксперимента, следовательно, модель адекватна. В качестве другого примера рассмотрим ПФЭ, когда на объект исследования воздействуют три фактора. Считаем, что модель исследуемого процесса является линейной и имеет вид:
Y = θ0 + θ1x1 + θ2 x2 + θ3 x3 + θ12x1x2 + θ13x1x3 + θ23x2 x3 + θ123x1x2 x3 . Все возможные комбинации для трех факторов, варьируемых на двух уровнях, будут исчерпаны, если поставить восемь опытов. Матрица планирования приведена ниже (пишется только знак). Таблица 3.1.2 Номер опыта 1 2 3 4 5 6 7 8
x0
x1
x2
x3
x1 x2
x1 x3
x2 x3
x1 x2 x3
Y
+ + + + + + + +
– + – + – + – +
– – + + – – + +
– – – – + + + +
+ – – + + – – +
+ – + – – + – +
+ + – – – – + +
– + + – + – – +
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8
В качестве примера приведены результаты эксперимента, полученные при изменении трех факторов (таблица 3.1.3) при проведении трех параллельных опытов: x0 – фиктивная переменная; x1 – индуктивность колебательного конту80
ра АГ (+1 соответствует 95 мкГн; –1 соответствует 52 мкГн); x2 – емкость колебательного контура АГ (+1 соответствует 1900 пФ; –1 соответствует 1200 пФ); x3 – напряжение источника питания АГ (+1 соответствует 15 В; –1 соответствует 10 В). Таблица 3.1.3 Номер опыта 1 2 3 4 5 6 7 8
x0
x1
x2
x3
+ + + + + + + +
– + – + – + – +
– – + + – – + +
– – – – + + + +
x1 x2 x1 x3 x2 x3 + – – + + – – +
+ – + – – + – +
+ + – – – – + +
x1 x2 x3 – + + – + – – +
Y1
Y2
Y3
510090 396721 437322 336818 516902 400690 440652 338942
510375 396752 437133 336917 516743 400565 440802 338913
510192 396821 437081 336972 516812 400692 440791 338888
Обработка и анализ результатов полного факторного эксперимента предусматривает следующий порядок их проведения. Вначале оцениваются дисперсии среднего арифметического в каждой строке матрицы по формуле:
Si2
1 n = ( Yin − Yi )2 . n − 1 i =1
∑
В таблице 3.1.4 приведены результаты оценок среднего арифметического и дисперсии частоты автогенератора при проведении трех параллельных опытов. Далее проверяются однородности дисперсий. Опыт считается воспроизводимым, если дисперсия Si2 целевой функции в каждой точке факторного пространства однородна. Таблица 3.1.4 Номер опыта 1 2 3 4 5 6 7 8
Y1
Y2
Y3
Yi
Si2
510090 396721 437322 336818 516902 400690 440652 338942
510375 396752 437322 336917 516743 400565 440802 333913
510192 396821 437081 336972 516812 400692 440791 338888
510219 396765 437179 336902 516819 400649 440748 338914
20853 1113 15987 6090 6357 5293 6990 730 8
∑ Si 2 = 63414 i =1
81
Дисперсия считается однородной, если отношение дисперсии целевой функции в той точке факторного пространства, где она максимальна, к сумме дисперсий во всех точках меньше критического:
G=
2 S max N
∑S
= 2
20853 = 0 ,329 . 63414
i
i =1
Если G < Gкр , то опыты воспроизводимы. Здесь Gкр – критерий Кочрена – выбирается по числу степеней свободы и уровню значимости. Число степеней свободы для числителя (число параллельных опытов) Y1 = 3; число экспериментальных точек Y2 = 8. Критичное значение параметра G определяется из таблицы [9, с.189]: для коэффициента риска 0,05; Y1 = 3, Y2 = 8 Gкp(0,05;3;8) = 0,52. Поскольку G < Gкр , то делаем вывод, что эксперимент воспроизводим. Если проверка показала, что эксперименты воспроизводимы, то их результаты можно использовать для оценки коэффициентов регрессии. Если эксперименты невоспроизводимы, то рекомендуется увеличить число параллельных опытов. Далее создается математическая модель объекта с проверкой статистической значимости коэффициентов полинома. Независимая оценка коэффициентов полинома проводится по формуле: 1 θi = N
N
∑x Y , ji j
j =1
где xij принимает значения +1 или –1 в соответствии с матрицей планирования. Подсчитаем значение каждого коэффициента предполагаемой имитационной модели в виде полинома:
1 θ0 = n
n
∑X
0 iY0 i
=
i =1
= (510219 + 396765 + 437179 + 336903 + 516819 + + 400649 + 440748 + 3389140)/8 = 422274. Аналогично: θ1 = (−510219 + 396765 − 437179 + 336903 − 516819 + 3389140)/8 = –53966; θ 2 = (−510219 − 396765 + 437179 + 336903 − 516819 + 3389140)/8 = – 33838; θ 3 = (−510219 − 396765 − 437179 − 336903 + 516819 + 3389140)/8 = –2008; θ12 = (510219 − 396765 − 437179 + 336903 + 516819 + 3389140)/8 = 3439; 82
+ 400649 − 440748 +
− 400649 + 440748 + + 400649 + 440748 +
− 400649 − 440748 +
θ 23 = (510219 + 396765 − 437179 − 336903 − 516819 − 400649 + 440748 + + 3389140)/8 = 612; θ13 = (510219 + 396765 + 437179 + 336903 + 516S19 + 400649 + 440748 − – 3389140)/8 = 534; θ123 = (−510219 + 396765 + 437179 − 336903 + 516819 − 400649 − 440748 + + 3389140)8 = −145. Имитационная модель имеет вид:
Y = 422274 x0 − 53966 x1 − 33838x2 − 2008x3 + + 3439x1x2 + 534x1x3 + 612x2x3 − 145x1x2x3. Для проверки статистической значимости коэффициентов полинома применяется критерий Стьюдента, а проверка адекватности математической модели производится по критерию Фишера, аналогично тому, как это было сделано при проведении двухфакторного эксперимента.
3.2. Планирование и проведение дробного факторного эксперимента для обоснования математической модели частоты автогенератора первого порядка При большом числе учитываемых в эксперименте факторов полный факторный эксперимент становится громоздким и занимает большое время для своего проведения. Правда, при этом уменьшаются ошибки при определении коэффициентов полинома, так как для оценки каждого из них используются все опыты. Однако число опытов можно сократить, если априори известно, что на результат опыта не оказывают влияния те или иные взаимодействия факторов. В этом случае используют дробный факторный эксперимент, или так называемые дробные реплики от полного факторного эксперимента. Предположим, что необходимо получить имитационную математическую модель АГ при трех учитываемых факторах – емкость, индуктивность контура и напряжение источника питания, которая имеет вид:
Y =θ0 +θ1x1 +θ2x2 +θ3x3 +θ12x1x2 +θ13x1x3 +θ23x2x3 +θ123x1x2x3.
(3.2.1)
При использовании полного факторного эксперимента для определения коэффициентов полинома первого порядка необходимо провести восемь опытов для определения восьми коэффициентов: θ 0 ,θ 1 ,θ 2 ,θ 3 ,θ 12 ,θ 13 ,θ 23 ,θ 123 . Однако, если взаимодействие между факторами отсутствует, можно ограничиться четырьмя опытами. В этом случае можно воспользоваться матрицей планирования полного факторного эксперимента для двух факторов x1, x2 (заменив обозначение x1x2 на x3). Предполагаемая математическая модель будет иметь вид полинома первого порядка, не учитывающего взаимодействия факторов: 83
Y = θ0 + θ1 x1 + θ 2 x2 + θ 3 x3 . Такой сокращенный план содержит половину опытов от требуемого их числа 2k для полного факторного эксперимента (в рассматриваемом случае четыре опыта вместо восьми) и называется полурепликой от полного факторного эксперимента, или дробным факторным экспериментом (ДФЭ). При использовании матрицы планирования ДФЭ нужно всегда помнить, что получается совместная оценка нескольких эффектов: факторов и их взаимодействий, т. е. x1 = x2x3, x2 = x1x3, x3 = x1x2. Поэтому подсчитываемые в дальнейшем значения линейных коэффициентов θ0 ,θ1 ,θ 2 ,θ 3 полинома по экспериментальным значениям функции отклика будут всегда включать также значения коэффициентов, учитывающих эффект влияния взаимодействия факторов на функцию отклика (в рассматриваемом случае это коэффициенты θ12 ,θ13 ,θ 23 ,θ123 ). В результате этого подсчитанные значения коэффициентов полинома фактически будут иметь следующий вид:
θ Д 1 = θ1 + θ 23 ; θ Д 2 = θ 2 + θ13 ; θ Д 3 = θ 3 + θ12 ; где: θ1 ,θ 2 ,θ 3 – действительные значения коэффициентов полинома, θ Д 1 ,θ Д 2 ,θ Д 3 – полученные их значения при наличии эффекта влияния взаимодействия факторов на функцию отклика. Поэтому для получения математической модели (3.2.1), адекватной исследуемому АГ, необходимо быть уверенным в отсутствии эффекта влияния взаимодействия факторов на экспериментальное значение функции отклика. Только при этом условии подсчитанные коэффициенты θ Д будут искомыми значениями линейных коэффициентов θi . Для нахождения коэффициентов θ0 ,θ1 ,θ 2 ,θ 3 составлен план проведения эксперимента и измерены значения частоты АГ в соответствии с планом в виде матрицы таблицы 3.2.1. Таблица. 3.2.1 Номер опыта
x0
x1
x2
x3
Y1
Y2
Y3
Yср
S i2
1 2 3 4
+ + + +
– + – +
– – + +
+ – – +
516902 396721 437322 338942
516743 396752 437133 338913
516812 396821 437082 338888
516819 396765 437179 338914
6357 1113 15987 730 24187
Считаем, что модель исследуемого АГ является линейной и имеет вид: 84
Y = θ0 + θ1 x1 + θ 2 x2 + θ 3 x3 . Обработка и анализ результатов дробного факторного эксперимента предусматривает следующий порядок их проведения. Вначале оцениваются дисперсии среднего арифметического в каждой строке матрицы по формуле:
Si2
1 n = ( Yin − Yi )2 . n − 1 i =1
∑
Затем проверяются однородности дисперсий. Опыт считается воспроизводимым, если дисперсия Si2 целевой функции в каждой точке факторного пространства однородна. Дисперсия считается однородной, если отношение дисперсии целевой функции в той точке факторного пространства, где она максимальна, к сумме дисперсий во всех точках меньше критического:
G=
S max
2
N
∑S
=
2
15987 = 0 ,66 . 24187
i
i =1
Если G < Gкр , то опыты воспроизводимы. Здесь Gкр – критерий Кочрена – выбирается по числу степеней свободы и уровню значимости. Критичное значение критерия Кочрена Gкр для номеров опытов, каждый из которых состоит из n параллельных опытов, при заданных значениях коэффициента риска 0,05; n = 3, N = 4 определяется из таблицы [9, стр. 189]; для Gкр ( 0,05; n = 3, N = 4 ) = 0,77. Поскольку G < Gкр , то делаем вывод, что эксперимент воспроизводим. Если проверка показала, что эксперименты воспроизводимы, то их результаты можно использовать для оценки коэффициентов регрессии. Если эксперименты невоспроизводимы, то рекомендуется увеличить число параллельных опытов. Затем создается математическая модель объекта с проверкой статистической значимости коэффициентов полинома. Независимая оценка коэффициентов полинома проводится по формуле:
θi =
1 N
N
∑x Y , ji j
j =1
где xi принимает значения +1 или –1 в соответствии с матрицей планирования. Значения коэффициентов полинома вычисляются по формулам:
θ01 = (516902 + 396721 + 437322 + 333942)/4 = 422419; θ11 = (–516902 + 396721 – 437322 + 338942)/4 = –54579; 85
θ 21 = (–516902 – 396721 + 437322 + 338942)/4 = –34372; θ 31 = (516902 – 396721 – 437322 + 338942)/4 = 5447. Таким образом, имитационная модель имеет вид:
Y = 422419 – 54579 x1 – 34372 x2 + 5447 x3 . Результаты проверки модели приведены в таблице 3.2.2. Таблица. 3.2.2 Первая полуреплика
x0
x1
x2
x3
Опыт
+ + + +
– + – +
– – + +
+ – – +
516819 396765 437179 338914
Вторая полуреплика Расчет модели 516819 396764,65 437178,65 338914,34
x0
x1
x2
x3
Опыт
+ + + +
– + – +
– – + +
– + + –
510219 400649 440748 336902
Расчет модели 505923,96 407659,65 448073,65 328019,31
При проверке модели рассматривались все возможные значения факторов x1, x2, x3. Возникает следующий вопрос: правильно ли имитационная модель отображает значения частоты АГ для тех значений факторов x1, x2, x3, для которых не проведены измерения в рассматриваемой полуреплике? Для ответа на него проведем необходимые измерения частоты АГ в соответствии с матрицей планирования (таблица 3.2.3). Из таблицы 3.2.3 в таблицу 3.2.4 перенесены значения частоты АГ (выделены) для тех факторов, которые не были учтены при проведении измерений первых четырех реплик дробного факторного эксперимента. Сравнение экспериментальных данных (вторая полуреплика) и полученных с помощью модели, обоснованной при проведении первой полуреплики (таблица 3.2.1), показывает, что между ними существует расхождение, т. е. модель адекватна первой полуреплике эксперимента и неадекватна его второй полуреплике. Поэтому для второй полуреплики определены коэффициенты полинома другой имитационной модели. Таблица 3.2.3 №
x0
x1
1 2 3 4
+ + + +
– + – +
x2 – – + +
x3 – + + –
Y1
Y2
Y3
Yср
Si2
510090 400690 440652 336818
510375 400565 440802 336917
510192 400692 440791 336972
510219 400649 440748 336902
20853 5293 6990 6090 39227
В таблице 3.2.4 приведены значения коэффициентов полинома, полученные с помощью экспериментов для двух полуреплик. В этой же таблице приведены коэффициенты полинома, полученные путем вычислений по формулам, приведенным ниже. 86
Таблица 3.2.4 ДФЭ1 4 опыта 422419 –54579 –34372 5447
θ0 θ1 θ2 θ3 θ12 θ13 θ23 θ123
ДФЭ2 4 опыта 422129 –53354 –33304 –1431
ДФЭ или ПФЭ 8 опытов 422274 –53966 –33838 –2008 3439 534 612 –145
Отметим, что коэффициенты полинома, которые вычислены при проведении восьми опытов, могут быть получены из коэффициентов для двух полуреплик по формулам:
θ0 =
θ01 + θ02
θ1 =
2
= (422419 + 422129)/2 = 422274;
θ11 + θ12
= (–54579-53354)/2 = –53966; 2 θ +θ θ 2 = 21 22 = (–34372 – 33304)/2 = –33838; 2 θ 31 + θ 32 θ3 = − = –(5447 – 1431)/2 = –2008; 2 −θ +θ θ 23 = 21 12 = (54579 – 53354)/2 = 612; 2 −θ +θ θ13 = 21 22 = (34372-33304) /2= 534; 2 θ −θ θ12 = 31 32 = (5447 + 1431)/2 = 3439; 2 θ02 + θ01 = (422129 – 422419)/2 = –145. θ123 = 2 Из этого следует, что полный факторный эксперимент для большого числа факторов всегда имеет смысл проводить в два этапа, т. е. разбивать на полуреплики, четверть реплики и т. д. В случае, если полученный с помощью полуреплики полином не удовлетворяет предъявляемым требованиям, можно провести дополнительные опыты с другой полурепликой и получить столько же информации, сколько ее можно получить с помощью полного факторного эксперимента. В таблице 3.2.5 приведены результаты экспериментальных исследований АГ и вычисления имитационных моделей в виде полиномов, содержащих различное число коэффициентов. Для каждого полинома найдено значение дисперсии как сумма квадратов отклонений от экспериментального значения. Для экспериментальных значений дисперсия находилась как сумма квадратов от87
клонений от среднего значения при проведении трех параллельных опытов. Имитационная модель, содержащая 8 членов полинома, полностью адекватна усредненным экспериментальным значениям. Для имитационной модели содержащая 4 члена полинома дисперсия адекватности определяется по формуле: 2 s АД
1 = N −d
N
1 ( Y j − Y jt )2 = 200165040 = 50041250. 4 j =1
∑
Дисперсия воспроизводимости опыта равна 63414. Таким образом, дисперсия воспроизводимости опыта много меньше дисперсии адекватности, поэтому в рассматриваемом примере имитационная модель, составленная только на основе одной полуреплики, не является адекватной. Таблица 3.2.5 Результаты эксперимента и вычисления моделей Измеренные средние значения Полином, содержащий 8 Полином, содержащий 4 частоты и дисперсия коэффициентов коэффициента 2 2 Fi Fi Fi Si Si Si2 516819 6357 516819 0 516819 0 400649 5293 400649 0 400649 49149300 440748 6990 440748 0 440748 53660204 338914 730 338914 0 338914 0 510219 20853 510219 0 510219 18447294 396764 1113 396764 0 396764 0 437178 15987 437178 0 437178 0 336902 6090 336902 0 336902 78908248 63414 0 200165040
3.3. Планирование и проведение эксперимента для обоснования имитационной математической модели частоты автогенератора второго порядка Поверхность отклика аппроксимируется наиболее эффективным образом, если уделить должное внимание плану эксперимента. Предположим, что необходимо для экспериментальных данных подобрать модель первого порядка с k переменными:
Y = θ0 +
k
∑θ x + ε , i i
i =1
где ε – погрешность. Существует единственный класс планов, минимизирующих дисперсию коэффициентов регрессии { θi } – это ортогональные планы первого порядка. 88
План первого порядка ортогонален, если все недиагональные элементы матрицы X T X равны нулю. Это означает, что равны нулю суммы смешанных произведений столбцов матрицы X . План типа 2 k не позволяет оценить ошибку эксперимента, для этого необходимо повторить некоторые из измерений. Обычно план дополняется несколькими наблюдениями в центре плана (в точке xi = 0, i = 1,2 , ..., k ). Введение центральных точек в план типа 2 k не влияет на { θi } при i ≥ 1 ; оценка же θ0 становится средним арифметическим всех наблюдений. Вычисляемое для линейного уравнения значение θ0 при реализации факторного эксперимента в «почти стационарной области» является совместной оценкой для свободного члена и суммы квадратичных членов, так как безразмерные значения, стоящие в соответствующих столбцах матрицы ПФЭ, будут одинаковыми. Поэтому разность θ0 – Y может дать представление о поверхности отклика. Другим ортогональным планом первого порядка является симплекс. Симплекс представляет собой правильную фигуру с k + 1 вершиной в k измерениях. Так, при k = 2 симплексный план – равносторонний треугольник, а при k = 3 – правильный тетраэдр. Из теории интерполяции известно, что для нахождения раздельных оценок коэффициентов интерполяционного полинома, рассматриваемого как предполагаемая имитационная модель объекта исследования, число уровней изменения каждой из независимых переменных должно быть на единицу больше порядка полинома. Другими словами, для вычисления полинома второго порядка число уровней должно быть как минимум три. В ПФЭ 3k при k = 2 потребуется проведение как минимум девяти опытов, а для трех факторов их число возрастет до 27. Поэтому при увеличении числа учитываемых факторов применение ПФЭ 3k нерационально, так как это планирование характеризуется резким увеличением объема эксперимента. Сократить число опытов можно, используя так называемые центральные композиционные планы (ЦКП), ядром которых являются линейные ортогональные планы. Большое преимущество этих планов состоит в том, что если гипотеза о линейности математической модели в результате анализа экспериментальных данных не подтвердилась, то нет необходимости ставить все эксперименты заново для получения модели более высокого порядка. Достаточно в этом случае добавить несколько специально спланированных экспериментальных точек, чтобы получить план, соответствующий полиному второго порядка. Построение ЦКП можно пояснить на примере с двумя независимыми переменными, соответствующими двум факторам x1 , x2 . Предположим, что для нахождения линейной модели применен ПФЭ 2 2 . В результате анализа экспериментальных данных установлено, что имитационная математическая модель в виде полинома первого порядка не адекватна исследуемому процессу. Тогда в центре плана, соответствующего начальному 89
значению всех учитываемых в эксперименте факторов, проводится опыт, условия которого в матрице планирования эксперимента отображаются нулями для безразмерных величин всех факторов. Для повышения достоверности полученного экспериментального значения функции отклика Y в центре плана опыты повторяют при неизменных нулевых значениях факторов. Подсчитанное среднее значение функции отклика Y сравнивают с теоретическим значением θ0 , которое несложно получить из разработанной линейной модели объекта исследования в результате ранее проведенного ПФЭ 2 2 и анализа его результатов. По разности θ0 – Y оценивают кривизну поверхности отклика. При подтверждении неадекватности линейной модели ставятся дополнительные опыты для значений факторов, превышающих их абсолютные значения по верхнему и нижнему уровням (в безразмерных величинах). Эти значения должны быть больше единицы по абсолютным значениям, установленным в предшествующем плане ПФЭ. Таким образом, в ПФЭ 2 2 к ранее проведенным четырем опытам добавляются еще пять опытов (включая опыт в центре плана), четыре из которых соответствуют «звездным точкам». «Звездные точки» представляют собой два уровня варьирования каждым из двух факторов, они расположены на расстоянии большем, чем ± 1 от центра плана, и лежат на поверхности сферы радиусом α . Общее число опытов ЦКП при k факторах составит: N = 2 k + 2 k + m0 , где 2 k – число «звездных точек»; m0 – число опытов в центре плана, а общее число уровней варьирования ЦКП равно трем. В теории планирования эксперимента для получения моделей второго порядка различают несколько типов ЦКП. Наибольшее распространение получили ортогональный и рототабельный ЦКП. Центральный композиционный ортогональный план (ЦКОП) предусматривает проведение только одного опыта, условия которого соответствуют начальным значениям всех учитываемых факторов (в центре плана), т. е. m0 = 1 . Поэтому N = 2 k + 2k + 1 . Матрица ЦКОП для k = 2 приведена в таблице 3.3.1. Как видно из матрицы планирования, ЦКОП при k = 3 содержит всего 9 опытов. Следует также обратить внимание на то, что условие ортогональности матрицы выполняется только для линейных членов соответствующего полинома 2-го порядка, представляющего собой имитационную модель вида:
Y = θ0 + θ1x1 + θ2 x2 + θ12x1x2 + θ11x12 + θ22x22 .
(3.3.1)
Воспользовавшись методом наименьших квадратов, запишем нормальные уравнения для определения коэффициентов θ i . Для этого необходимо минимизировать разность
D=[
n
∑(Y −θ i
0
−θ1x1i −θ2 x2i −θ12x1i x2i −θ11x12i −θ22x22i )]2 .
i=1
90
(3.3.2.)
Для частной производной
∂D имеем: ∂θ0
n ∂D = 2 ⋅ [ ∑ (Yi − θ0 − θ1 x1i − θ 2 x2i − θ12 x1i x2i − θ11 x12i − θ 22 x22i )] ( −1 ) = 0 . ∂θ0 i =1
Тогда n
n
i =1
i =1
∑ Yi = nθ0 + θ1 ∑
n
n
n
i =1
i =1
i =1
x1i + θ 2 ∑ x2i + θ12 ∑ x1i x2i + θ11 ∑
x12i
n
+ θ 22 ∑ x22i . (3.3.3) i =1
Аналогично n
n
n
i =1
i =1
i =1
∑ Yi x1i = θ0 ∑ x1i + θ1 ∑ x12i + θ 2 ∑ x1i x2i + n
n
n
i =1
i =1
i =1
(3.3.4)
+ θ12 ∑ x12i x2i + θ11 ∑ x13i + θ 22 ∑ x22i x1i . Таблица 3.3.1 Номер опыта 1 2 3 4 5 6 7 8 9
x0
x1
x2
x1 x2
x12
x22
Y
+ + + + + + + + +
– + – +
– – + + 0 0
+ – – + 0 0 0 0 0
+ + + +
+ + + + 0 0
Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9
–α
α 0 0 0
–α
α 0
α2 α2
0 0 0
α2 α2
0
Чтобы оценить коэффициенты θ i , воспользуемся таблицей 3.3.2, в которой отражены результаты проведенных экспериментов. Таблица 3.3.2 Номер опыта 1 2 3 4
С, пФ 1800 2500 1800 2500
L, мкГн 54 54 74 74
x1
x2
x1 x2
Y , кГц
+ +
+ +
+ +
979 802 700 571
Для рассматриваемой ортогональной матрицы имеем:
91
n
∑x
1i
=0;
i =1
n
∑x
2i
=0;
i =1
n
∑
x12i
=4;
i =1
n
∑x
2 2i
=4;
i =1
поэтому из формул (3.3.3) и (3.3.4) можно найти коэффициенты:
4θ0 = 4θ1 =
∑Y
i
∑Y x
i 1i
= 979 + 802 + 700 + 571 = 3052; = –979 + 802 – 700 + 571 = –306;
θ0 = 763; θ1 = –76,5. Аналогично можно найти коэффициенты:
4 θ 2 = –979 – 802 + 700 + 571 = –510; 4 θ12 = 979 – 802 – 700 + 571 = 48; θ 2 = –127,5; θ12 = 12. Для проведенных четырех опытов имитационная математическая модель имеет вид:
Y = θ0 + θ1x1 + θ2 x2 + θ12x1x2 = 763 – 76,5 x1 – 127,5 x2 + 12 x1 x2 . Проведем еще один опыт при значениях С = 1150 пФ и L = 64 мкГн. Этот опыт соответствует значениям x1 = 0 и x2 = 0 . Измеренное значение частоты АГ равно 795 кГц. Таблица 3.3.3 №
С, пФ
L, мкГн
x1
x2
x1 x2
x12
x22
Y , кГц
5
1150
64
0
0
0
0
0
795
Найдем разность: θ0 – Y = 763 – 795 = –32. Величина разности по абсолютной величине достаточно большая, и можно сделать вывод, что поверхность отклика обладает значительной кривизной, поэтому имитационная модель должна быть моделью второго или более высокого порядка. Проведем дополнительно еще четыре опыта для обоснования модели второго порядка. План проведения этих опытов и результаты эксперимента приведены в таблице 3.3.4, которая дополняет таблицы 3.3.2 и 3.3.3.
92
Таблица 3.3.4 Номер опыта 6 7 8 9
С, пФ
L, МкГн
x1
x2
x12
x22
Y
1626 674 1150 1150
64 64 90,5 37,5
1,41 –1,41 0 0
0 0 1,41 –1,41
2 2 0 0
0 0 2 2
519 1007 519 1007
Для оценки коэффициентов θ11 и θ 22 из уравнения (3.3.1) можно найти:
4θ0 + 4θ11 + 4θ 22 =
∑Y = 519 + 1007 + 519 + 1007 = 3052. i
В соответствии с экспериментом коэффициент θ0 = 795; тогда θ11 + θ 22 = −32 . Из уравнения n
∑
Yi x12i = θ0
i =1
+ θ12
n
∑ i =1
∑
x12i + θ1
x13i x2 i
n
∑
x13i + θ 2
i =1
+ θ11
n
∑
x14i
n
∑x
2 1i x2 i
+
i =1
+ θ 22
i =1
n
∑x
2 2 2 i x1i
i =1
можно найти коэффициенты θ11 = θ 22 = −16 , тогда имитационная модель имеет вид:
Y = θ0 + θ1x1 + θ2 x2 + θ12x1x2 + θ11x12 + θ22x22 = = 795 – 76,5 x1 – 127,5 x2 + 12 x1 x2 – 16 x12 – 16 x22 . Заключение
Проведенный анализ позволил получить следующие результаты. На примере простого устройства – транзисторного автогенератора гармонических колебаний – поставлена типичная для сложных технических устройств задача экспериментального исследования определяющего параметра (частоты колебаний АГ) как функции элементов схемы и напряжения питания. Рассмотрены физические процессы, протекающие в АГ; записано дифференциальное уравнение второго порядка, описывающее переходный процесс в контуре при подключении его к источнику питания; показано, что затухающие электромагнитные колебания в контуре могут быть преобразованы в незатухающие с помощью транзистора, включенного в контур. Определены условия стационарного режима автогенератора; непосредственно из дифференциального уравнения следует, что частота колебаний на выходе автогенератора определяется хорошо известной формулой Томпсона. 93
Проведен экспериментальный анализ частоты автогенератора; построен ряд распределения, диаграмма накопленных частот, гистограмма; показано, что распределение частоты автогенератора подчиняется нормальному закону. Проведен дисперсионный анализ влияния индуктивности и емкости контура на частоту автогенератора, показано, что оба фактора являются значимыми. Проведены полные факторные эксперименты зависимости частоты автогенератора от индуктивности и емкости (два фактора) и от индуктивности, емкости и напряжения питания (три фактора); обоснованы линейные имитационные математические модели; доказана воспроизводимость экспериментов; проверена статистическая значимость коэффициентов полиномов; проверены адекватности моделей. В два этапа проведен дробный факторный эксперимент; установлена взаимосвязь коэффициентов полинома имитационной модели при переходе от дробного факторного эксперимента к полному факторному эксперименту, что позволяет реализовать концепцию последовательного планирования эксперимента. Обоснована имитационная модель второго порядка, которая более полно описывает зависимость частоты от параметров контура автогенератора. Показано, что имитационная модель частоты и модель частоты на основе дифференциального уравнения одинаково описывают поведение частоты как монотонно убывающей функции индуктивности и емкости контура. Сравнительный анализ двух рассмотренных моделей показывает, что имитационная модель более пригодна для работы с конкретной схемой. Литература
1. Большой энциклопедический словарь. – М.: Большая Российская энциклопедия; СПб.: «Норинг», 1997. – 1599 с. 2. Большая советская энциклопедия. – М.: Сов. энциклопедия, 1978. – 514 с. 3. Баскаков С.И. Радиотехнические цепи и сигналы. – М.: Высшая школа, 1988. – 448 с. 4. Радиопередающие устройства / Под ред. В.В. Шахгильдяна. – М.: Радио и связь, 1990. – 516 с. 5. Налимов В.В. Теория эксперимента. – М.: Наука, 1971. – 412 с. 6. Монтгомери Д.К. Планирование эксперимента и анализ данных. – Л.: Судостроение, 1980. – 216 с. 7. Статистические методы в инженерных исследованиях (лабораторный практикум) / Под ред. Г.К. Круга. – М.: Высшая школа, 1983. – 316 с. 8. Гмурман В.Е. Теория вероятностей и математическая статистика. – М: Высшая школа, 1977. – 422 с. 9. Елохин В.Г. и др. Современный эксперимент: подготовка, проведение, анализ результатов. – М.: Радио и связь, 1997. – 400 с. 10. Пискунов Н.С. Дифференциальное и интегральное исчисления. 2 т. – М.: Интеграл-Пресс, 2001. – 575 с. 11. Вероятность и математическая статистика / Под ред. Ю.В. Прохорова – М.: Энциклопедия, 2000. – 910 с. 94