ВЫСШАЯ МАТЕМАТИКА учебное пособие для студентов технических вузов (часть 3) составитель Семёнова Т.В.
Ряды. Основные определения Определение. Сумма членов бесконечной числовой последовательности называется числовым рядом.
При этом числа
будем называть членами ряда, а un – общим членом ряда.
Определение. Суммы (частичными) суммами ряда.
, n = 1, 2, … называются частными
Таким образом, возможно рассматривать последовательности частичных сумм ряда S1, S2, …,Sn, …
Определение. Ряд последовательность его частных сумм. последовательности его частных сумм.
называется сходящимся, если сходится Сумма сходящегося ряда – предел
Определение. Если последовательность частных сумм ряда расходится, т.е. не имеет предела, или имеет бесконечный предел, то ряд называется расходящимся и ему не ставят в соответствие никакой суммы.
Свойства рядов.
1) Сходимость или расходимость ряда не нарушится если изменить, отбросить или добавить конечное число членов ряда. 2) Рассмотрим два ряда
и
, где С – постоянное число.
Теорема. Если ряд сходится и его сумма равна S, то ряд его сумма равна СS. (C ≠ 0)
тоже сходится, и
3) Рассмотрим два ряда
и
. Суммой или разностью этих рядов будет
называться ряд , где элементы получены в результате сложения (вычитания) исходных элементов с одинаковыми номерами. Теорема. Если ряды
и
сходятся и их суммы равны соответственно S и σ, то
тоже сходится и его сумма равна S + σ.
ряд
Разность двух сходящихся рядов также будет сходящимся рядом. Сумма сходящегося и расходящегося рядов будет расходящимся рядом. О сумме двух расходящихся рядов общего утверждения сделать нельзя.
При изучении рядов решают в основном две задачи: исследование на сходимость и нахождение суммы ряда.
Критерий Коши (необходимые и достаточные условия сходимости ряда) Для того, чтобы последовательность была сходящейся, необходимо и существовал такой номер N, что при n > N и достаточно, чтобы для любого любом p > 0, где р – целое число, выполнялось бы неравенство: . Доказательство. (необходимость) Пусть
, тогда для любого числа
найдется номер N такой, что неравенство
выполняется при n>N. При n>N и любом целом p>0 выполняется также неравенство
. Учитывая оба неравенства, получаем:
Необходимость доказана. Доказательство достаточности рассматривать не будем.
Сформулируем критерий Коши для ряда.
Для того, чтобы ряд достаточно, чтобы для любого p>0 выполнялось бы неравенство
был сходящимся необходимо и существовал номер N такой, что при n>N и любом
.
Однако, на практике использовать непосредственно критерий Коши не очень удобно. Поэтому как правило используются более простые признаки сходимости:
1) Если ряд сходится, то необходимо, чтобы общий член un стремился к нулю. Однако, это условие не является достаточным. Можно говорить только о том, что если общий член не стремится к нулю, то ряд точно расходится. Например, так называемый гармонический ряд нулю.
является расходящимся, хотя его общий член и стремится к
Пример. Исследовать сходимость ряда
Найдем значит ряд расходится.
- необходимый признак сходимости не выполняется,
2) Если ряд сходится, то последовательность его частных сумм ограничена. Однако, этот признак также не является достаточным. Например, ряд 1-1+1-1+1-1+ … +(-1)n+1+… последовательность его частных сумм в силу того, что
расходится,
т.к.
расходится
Однако, при этом последовательность частных сумм ограничена, т.к. n.
при любом
Ряды с неотрицательными членами При изучении знакопостоянных рядов ограничимся рассмотрением рядов с неотрицательными членами, т.к. при простом умножении на –1 из этих рядов можно получить ряды с отрицательными членами.
Теорема. Для сходимости ряда с неотрицательными членами необходимо и достаточно, чтобы частные суммы ряда были ограничены.
Признак сравнения рядов с неотрицательными членами. Пусть даны два ряда
и
при un, vn ≥ 0.
Теорема. Если un ≤ vn при любом n, то из сходимости ряда , а из расходимости ряда
следует сходимость ряда
следует расходимость ряда
Доказательство. Обозначим через Sn и σn частные суммы рядов условию теоремы ряд
и
. Т.к. по
сходится, то его частные суммы ограничены, т.е. при всех n σn
< M, где М – некоторое число. Но т.к. un ≤ vn, то Sn ≤ σn то частные суммы ряда ограничены, а этого достаточно для сходимости.
тоже
Пример. Исследовать на сходимость ряд
Т.к.
, а гармонический ряд
расходится, то расходится и ряд
.
Пример. Исследовать на сходимость ряд
Т.к.
, а ряд тоже сходится.
сходится ( как убывающая геометрическая прогрессия), то ряд
Также используется следующий признак сходимости:
Теорема. Если
и существует предел
отличное от нуля, то ряды
и
, где h – число,
ведут одинаково в смысле сходимости.
Признак Даламбера Если для ряда ∑ u с неотрицательными членами существует такое число n
q <1,
что для всех достаточно больших n выполняется неравенство u n +1 ≤ q, un
то ряд сходится, если же для всех достаточно больших n
u n +1 ≥ 1 , то ряд расходится. un
Признак Коши (радикальный) Если для ряда с неотрицательными членами существует такое число q<1, что для всех достаточно больших n выполняется неравенство , то ряд неравенство
то ряд
сходится, если же для всех достаточно больших n выполняется
расходится.
Следствие. Если существует предел расходится.
Пример. Определить сходимость ряда
, то при ρ<1 ряд сходится, а при ρ>1 ряд
.
Вывод: ряд сходится.
Пример. Определить сходимость ряда
.
Т.е. признак Коши не дает ответа на вопрос о сходимости ряда. Проверим выполнение необходимых условий сходимости. Как было сказано выше, если ряд сходится, то общий член ряда стремится к нулю.
, таким образом, необходимое условие сходимости не выполняется, значит, ряд расходится. Интегральный признак Коши. Если ϕ(х) – непрерывная положительная функция, убывающая на промежутке [1;∞), то ряд ϕ(1) + ϕ(2) + …+ ϕ(n) + … = в смысле сходимости.
и несобственный интеграл
одинаковы
сходится при α>1 и расходится α≤1 т.к.
Пример. Ряд
сходится при α>1 и расходится α≤1. Ряд
соответствующий несобственный интеграл называется общегармоническим рядом.
Следствие. Если f(x) и ϕ(х) – непрерывные функции на интервале (a, b] и то интегралы сходимости.
и
ведут себя одинаково в смысле
Знакопеременные ряды. Знакочередующиеся ряды Знакочередующийся ряд можно записать в виде:
где
Признак Лейбница. Если
у
знакочередующегося
величины ui убывают сходится.
ряда
абсолютные
и общий член стремится к нулю
, то ряд
Абсолютная и условная сходимость рядов.
Рассмотрим некоторый знакопеременный ряд (с членами произвольных знаков).
(1) и ряд, составленный из абсолютных величин членов ряда (1):
(2)
Теорема. Из сходимости ряда (2) следует сходимость ряда (1).
Доказательство. Ряд (2) является рядом с неотрицательными членами. Если ряд (2) сходится, то по критерию Коши для любого ε>0 существует число N, такое, что при n>N и любом целом p>0 верно неравенство:
По свойству абсолютных величин:
То есть по критерию Коши из сходимости ряда (2) следует сходимость ряда (1). Определение. Ряд
называется абсолютно сходящимся, если сходится ряд
.
Очевидно, что для знакопостоянных рядов понятия сходимости и абсолютной сходимости совпадают. Определение. Ряд
называется условно сходящимся, если он сходится, а ряд
расходится.
Признаки Даламбера и Коши для знакопеременных рядов. Пусть
- знакопеременный ряд.
Признак Даламбера. Если существует предел , то при ρ<1 ряд будет абсолютно сходящимся, а при ρ>1 ряд будет расходящимся. При ρ=1 признак не дает ответа о сходимости ряда.
Признак Коши. Если существует предел , то при ρ<1 ряд будет абсолютно сходящимся, а при ρ>1 ряд будет расходящимся. При ρ=1 признак не дает ответа о сходимости ряда.
Свойства абсолютно сходящихся рядов. 1) Теорема. Для абсолютной сходимости ряда необходимо и достаточно, чтобы его можно было представить в виде разности двух сходящихся рядов с неотрицательными членами.
Следствие. Условно сходящийся ряд является разностью двух расходящихся рядов с неотрицательными стремящимися к нулю членами.
2) В сходящемся ряде любая группировка членов ряда, не изменяющая их порядка, сохраняет сходимость и величину ряда.
3) Если ряд сходится абсолютно, то ряд, полученный из него любой перестановкой членов, также абсолютно сходится и имеет ту же сумму.
Перестановкой членов условно сходящегося ряда можно получить условно сходящийся ряд, имеющий любую наперед заданную сумму, и даже расходящийся ряд.
4) Теорема. При любой группировке членов абсолютно сходящегося ряда (при этом число групп может быть как конечным, так и бесконечным и число членов в группе может быть как конечным, так и бесконечным) получается сходящийся ряд, сумма которого равна сумме исходного ряда.
5) Если ряды
и
сходятся абсолютно и их суммы равны соответственно S и σ,
то ряд, составленный из всех произведений вида взятых в каком угодно порядке, также сходится абсолютно и его сумма равна S⋅σ - произведению сумм перемножаемых рядов. Если же производить перемножение условно сходящихся рядов, то в результате можно получить расходящийся ряд. Функциональные последовательности. Определение. Если членами ряда будут не числа, а функции от х, то ряд называется функциональным. Исследование на сходимость функциональных рядов сложнее исследования числовых рядов. Один и тот же функциональный ряд может при одних значениях переменной х сходиться, а при других – расходиться. Поэтому вопрос сходимости функциональных рядов сводится к определению тех значений переменной х, при которых ряд сходится. Совокупность таких значений называется областью сходимости. Так как пределом каждой функции, входящей в область сходимости ряда, является некоторое число, то пределом функциональной последовательности будет являться некоторая функция:
Определение. Последовательность {fn(x)} сходится к функции f(x) на отрезке [a,b], если для любого числа ε>0 и любой точки х из рассматриваемого отрезка существует номер N = N(ε, x), такой, что неравенство
выполняется при n>N. При выбранном значении ε>0 каждой точке отрезка [a,b] соответствует свой номер и, следовательно, номеров, соответствующих всем точкам отрезка [a,b], будет бесчисленное множество. Если выбрать из всех этих номеров наибольший, то этот номер будет годиться для всех точек отрезка [a,b], т.е. будет общим для всех точек.
Определение. Последовательность {fn(x)} равномерно сходится к функции f(x) на отрезке [a,b], если для любого числа ε>0 существует номер N = N(ε), такой, что неравенство
выполняется при n>N для всех точек отрезка [a,b].
Пример. Рассмотрим последовательность Данная последовательность сходится на всей числовой оси к функции f(x)=0, т.к.
Построим графики этой последовательности:
Как видно, при увеличении числа n график последовательности приближается к оси х.
Функциональные ряды Определение. Частными (частичными) суммами функционального ряда называются функции
Определение. Функциональный ряд называется сходящимся в точке (х=х0), если в этой точке сходится последовательность его частных сумм. Предел последовательности
называется суммой ряда
в точке х0.
Определение. Совокупность всех значений х, для которых сходится ряд называется областью сходимости ряда.
называется равномерно сходящимся на отрезке [a,b], если Определение. Ряд равномерно сходится на этом отрезке последовательность частных сумм этого ряда.
Теорема. (Критерий Коши равномерной сходимости ряда)
Для равномерной сходимости ряда необходимо и достаточно, чтобы для любого числа ε>0 существовал такой номер N(ε), что при n>N и любом целом p>0 неравенство
выполнялось бы для всех х на отрезке [a,b].
Теорема. (Признак равномерной сходимости Вейерштрасса) (Карл Теодор Вильгельм Вейерштрасс (1815 – 1897) – немецкий математик)
Ряд сходится равномерно и притом абсолютно на отрезке [a,b], если модули его членов на том же отрезке не превосходят соответствующих членов сходящегося числового ряда с положительными членами :
т.е. имеет место неравенство: .
Еще говорят, что в этом случае функциональный ряд рядом
.
Пример. Исследовать на сходимость ряд
Так как
мажорируется числовым
.
всегда, то очевидно, что
.
При этом известно, что общегармонический ряд при α=3>1 сходится, то в соответствии с признаком Вейерштрасса исследуемый ряд равномерно сходится и притом в любом интервале.
Пример. Исследовать на сходимость ряд
.
На отрезке [-1,1] выполняется неравенство т.е. по признаку Вейерштрасса на этом отрезке исследуемый ряд сходится, а на интервалах (-∝, -1) ∪ (1, ∝) расходится. Свойства равномерно сходящихся рядов.
1) Теорема о непрерывности суммы ряда.
Если члены ряда - непрерывные на отрезке [a,b] функции и ряд сходится равномерно, то и его сумма S(x) есть непрерывная функция на отрезке [a,b].
2) Теорема о почленном интегрировании ряда. Равномерно сходящийся на отрезке [a,b] ряд с непрерывными членами можно почленно интегрировать на этом отрезке, т.е. ряд, составленный из интегралов от его членов по отрезку [a,b] , сходится к интегралу от суммы ряда по этому отрезку.
3) Теорема о почленном дифференцировании ряда.
Если члены ряда сходящегося на отрезке [a,b] представляют собой непрерывные функции, имеющие непрерывные производные, и ряд, составленный из этих производных сходится на этом отрезке равномерно, то и данный ряд сходится равномерно и его можно дифференцировать почленно.
На основе того, что сумма ряда является некоторой функцией от переменной х, можно производить операцию представления какой – либо функции в виде ряда (разложения функции в ряд), что имеет широкое применение при интегрировании, дифференцировании и других действиях с функциями. На практике часто применяется разложение функций в степенной ряд.
Степенные ряды. Определение. Степенным рядом называется ряд вида
. Для исследования на сходимость степенных рядов удобно использовать признак Даламбера.
Пример. Исследовать на сходимость ряд Применяем признак Даламбера:
. Получаем, что этот ряд сходится при
и расходится при
.
Теперь определим сходимость в граничных точках 1 и –1.
При х = 1:
ряд сходится по признаку Лейбница
При х = -1:
ряд расходится (гармонический ряд).
Теоремы Абеля. (Нильс Хенрик Абель (1802 – 1829) – норвежский математик)
Теорема. Если степенной ряд , то он сходится и притом абсолютно для всех
сходится при x = x1 .
Доказательство. По условию теоремы, так как члены ряда ограничены, то
где k- некоторое постоянное число. Справедливо следующее неравенство:
Из этого неравенства видно, что при x<x1 численные величины членов нашего ряда будут меньше ( во всяком случае не больше ) соответствующих членов ряда правой части записанного выше неравенства, которые образуют геометрическую прогрессию. Знаменатель этой прогрессии по условию теоремы меньше единицы, следовательно, эта прогрессия представляет собой сходящийся ряд. Поэтому на основании признака сравнения делаем вывод, что ряд сходится, а значит ряд
сходится абсолютно.
Таким образом, если степенной ряд сходится в любой точке интервала длины 2
сходится в точке х1, то он абсолютно с центром в точке х = 0.
Следствие. Если при х = х1 ряд расходится, то он расходится для всех
.
Таким образом, для каждого степенного ряда существует такое положительное число R, что при всех х таких, что ряд абсолютно сходится, а при всех ряд расходится. При этом число R называется радиусом сходимости. Интервал (-R, R) называется интервалом сходимости. Отметим, что этот интервал может быть как замкнутым с одной или двух сторон, так и не замкнутым. Радиус сходимости может быть найден по формуле:
Пример. Найти область сходимости ряда
Находим радиус сходимости
.
Следовательно, данный ряд сходится при любом значении х. Общий член этого ряда стремится к нулю.
Теорема. Если степенной ряд
сходится для положительного значения х=х1 , то
он сходится равномерно в любом промежутке внутри
.
Действия со степенными рядами. 1) Интегрирование степенных рядов.
Если некоторая функция f(x) определяется степенным рядом: от этой функции можно записать в виде ряда:
, то интеграл
2) Дифференцирование степенных рядов.
Производная функции, которая определяется степенным рядом, находится по формуле:
3) Сложение, вычитание, умножение и деление степенных рядов.
Сложение и вычитание степенных рядов сводится к соответствующим операциям с их членами:
Произведение двух степенных рядов выражается формулой:
Коэффициенты сi находятся по формуле:
Деление двух степенных рядов выражается формулой:
Для
определения
коэффициентов
qn
рассматриваем
произведение
, полученное из записанного выше равенства и решаем систему уравнений:
Разложение функций в степенные ряды Разложение функций в степенной ряд имеет большое значение для решения различных задач исследования функций, дифференцирования, интегрирования, решения дифференциальных уравнений, вычисления пределов, вычисления приближенных значений функции. Возможны различные способы разложения функции в степенной ряд. Такие способы как разложение при помощи рядов Тейлора и Маклорена были рассмотрены ранее. Существует также способ разложения в степенной ряд при помощи алгебраического деления. Это – самый простой способ разложения, однако, пригоден он только для разложения в ряд алгебраических дробей.
Пример. Разложить в ряд функцию
.
Пусть в результате получится ряд 2
a 0 + a1x + a 2 x 2 + a 3 x 3 + …
.Тогда
1 = (1-х)
3
(a 0 + a 1 x+ a 2 x + a 3 x + …) = = a 0 + a 1 x + a 2 x 2 + a 3 x 3 +…- a 0 x - a 1 x 2 - a 2 x 3 -…= a 0 + (a 1 - a 0 )x + (a 2 - a 1 )x 2 + ( a 3 a 2 )x 3 + … Отсюда
a 0 =1, a 1 =a 0 , a 2 =a 1 , a 3 =a 2 …, следовательно
1 = 1 + х + х 2 +х 3 +… 1− x
Если применить к той же функции формулу Маклорена
,
то получаем:
Итого, получаем:
Рассмотрим способ разложения функции в ряд при помощи интегрирования.
С помощью интегрирования можно разлагать в ряд такую функцию, для которой известно или может быть легко найдено разложение в ряд ее производной. Находим дифференциал функции х.
и интегрируем его в пределах от 0 до
Пример. Разложить в ряд функцию Разложение в ряд этой функции по формуле Маклорена было рассмотрено выше. Теперь решим эту задачу при помощи интегрирования.
При
получаем по приведенной выше формуле:
Разложение в ряд функции
найдено ранее
Тогда получаем:
Окончательно получим:
Решение дифференциальных уравнений с помощью степенных рядов С помощью степенных рядов возможно интегрировать дифференциальные уравнения. Рассмотрим линейное дифференциальное уравнение вида:
Если все коэффициенты и правая часть этого уравнения разлагаются в сходящиеся в некотором интервале степенные ряды, то существует решение этого уравнения в некоторой малой окрестности нулевой точки, удовлетворяющее начальным условиям. Это решение можно представить степенным рядом:
Для нахождения решения остается определить неизвестные постоянные ci. Эта задача решается методом сравнения неопределенных коэффициентов. Записанное выражение для искомой функции подставляем в исходное дифференциальное уравнение, выполняя при этом все необходимые действия со степенными рядами (дифференцирование, сложение, вычитание, умножение и пр.) Затем приравниваем коэффициенты при одинаковых степенях х в левой и правой частях уравнения. В результате с учетом начальных условий получим систему уравнений, из которой последовательно определяем коэффициенты ci. Отметим, что этот метод применим и к нелинейным дифференциальным уравнениям.
Пример. Найти решение уравнения
c начальными условиями y(0)=1, y’(0)=0.
Решение уравнения будем искать в виде
Подставляем полученные выражения в исходное уравнение:
Отсюда получаем:
………………
Получаем, подставив начальные условия в выражения для искомой функции и ее первой производной:
Окончательно получим:
Итого:
Существует и другой метод решения дифференциальных уравнений с помощью рядов. Он носит название метод последовательного дифференцирования.
Рассмотрим тот же пример. Решение дифференциального уравнения будем искать в виде разложения неизвестной функции в ряд Маклорена.
Если
заданные
начальные
условия y(0)=1, y’(0)=0
подставить
в
исходное
дифференциальное уравнение, получим, что Далее запишем дифференциальное уравнение в виде дифференцировать его по х.
После подстановки полученных значений получаем:
и будем последовательно
Ряды Фурье ( Жан Батист Жозеф Фурье (1768 – 1830) – французский математик) Тригонометрический ряд. Определение. Тригонометрическим рядом называется ряд вида:
или, короче, Действительные числа ai, bi называются коэффициентами тригонометрического ряда.
Если ряд представленного выше типа сходится, то его сумма представляет собой периодическую функцию с периодом 2π, т.к. функции sinnx и cosnx также периодические функции с периодом 2π. Пусть тригонометрический ряд равномерно сходится на отрезке [-π; π], а следовательно, и на любом отрезке в силу периодичности, и его сумма равна f(x). Определим коэффициенты этого ряда.
Для решения этой задачи воспользуемся следующими равенствами:
Справедливость этих равенств вытекает из применения к подынтегральному выражению тригонометрических формул. Т.к. функция f(x) непрерывна на отрезке [-π; π], то существует интеграл
Такой результат получается в результате того, что
.
Получаем:
Далее умножаем выражение разложения функции в ряд на cosnx и интегрируем в пределах от -π до π.
Отсюда получаем: Аналогично умножаем выражение разложения функции в ряд на sinnx и интегрируем в пределах от -π до π.
Получаем:
Выражение для коэффициента коэффициентов an.
а0
является
частным
случаем
для
выражения
Таким образом, если функция f(x) – любая периодическая функция периода 2π, непрерывная на отрезке [-π; π] или имеющая на этом отрезке конечное число точек разрыва первого рода, то коэффициенты
существуют и называются коэффициентами Фурье для функции f(x).
Определение. Рядом Фурье для функции f(x) называется тригонометрический ряд, коэффициенты которого являются коэффициентами Фурье. Если ряд Фурье функции f(x) сходится к ней во всех ее точках непрерывности, то говорят, что функция f(x) разлагается в ряд Фурье.
Достаточные признаки разложимости в ряд Фурье. Теорема. (Теорема Дирихле) Если функция f(x) имеет период 2π и на отрезке
[-π;π] непрерывна или имеет конечное число точек разрыва первого рода, и отрезок [-π;π] можно разбить на конечное число отрезков так, что внутри каждого из них функция f(x) монотонна, то ряд Фурье для функции f(x) сходится при всех значениях х, причем в точках непрерывности функции f(x) его сумма равна f(x), а в точках разрыва его , т.е. среднему арифметическому предельных значений сумма равна слева и справа. При этом ряд Фурье функции f(x) сходится равномерно на любом отрезке, который принадлежит интервалу непрерывности функции f(x). Функция f(x), для которой выполняются условия теоремы Дирихле называется кусочно – монотонной на отрезке [-π;π]. Теорема. Если функция f(x) имеет период 2π, кроме того, f(x) и ее производная f’(x) – непрерывные функции на отрезке [-π;π] или имеют конечное число точек разрыва первого рода на этом отрезке, то ряд Фурье функции f(x) сходится при всех значениях х, причем в точках непрерывности его сумма равна f(x), а в точках разрыва она равна
. При этом ряд Фурье функции f(x) сходится равномерно на любом отрезке, который принадлежит интервалу непрерывности функции f(x). Функция, удовлетворяющая условиям этой теоремы, называется кусочно – гладкой на отрезке [-π;π].
Разложение в ряд Фурье непериодической функции. Задача разложения непериодической функции в ряд Фурье в принципе не отличается от разложения в ряд Фурье периодической функции.
Если функция f(x) задана на отрезке, равном 2π, её разложение ничем не отличается от разложения в ряд периодической функции. Если же отрезок, на котором задана функция, меньше, чем 2π, то функция продолжается на интервал (b, a + 2π) так, чтобы условия разложимости в ряд Фурье сохранялись. Вообще говоря, в этом случае продолжение заданной функции на отрезок (интервал) длиной 2π может быть произведено бесконечным количеством способов, поэтому суммы получившихся рядов будут различны, но они будут совпадать с заданной функцией f(x) на отрезке [a,b].
Ряд Фурье для четных и нечетных функций. Отметим следующие свойства четных и нечетных функций:
1) 2) Произведение двух четных и нечетных функций является четной функцией. 3) Произведение четной и нечетной функций – нечетная функция.
Справедливость этих свойств может быть легко доказана исходя из определения четности и нечетности функций.
Если f(x) – четная периодическая функция с периодом 2π, удовлетворяющая условиям разложимости в ряд Фурье, то можно записать:
Таким образом, для четной функции ряд Фурье записывается:
Аналогично получаем разложение в ряд Фурье для нечетной функции:
Пример. Разложить в ряд Фурье периодическую функцию отрезке [-π;π].
с периодом T = 2π на
Заданная функция является нечетной, следовательно, коэффициенты Фурье ищем в виде:
Получаем:
.
Построим графики заданной функции и ее разложения в ряд Фурье, ограничившись первыми четырьмя членами ряда.
Ряды Фурье для функций любого периода.
Ряд Фурье для функции f(x) периода Т = 2l, непрерывной или имеющей конечное число точек разрыва первого рода на отрезке [-l, l] имеет вид:
Для четной функции произвольного периода разложение в ряд Фурье имеет вид:
Для нечетной функции:
Ряд Фурье по ортогональной системе функций. Определение. Функции ϕ(х) и ψ(х), определенные на отрезке [a, b], называются ортогональными на этом отрезке, если
Определение. Последовательность функций ϕ1(x), ϕ2(x), …, ϕn(x), непрерывных на отрезке [a, b], называется ортогональной системой функций на этом отрезке, если все функции попарно ортогональны.
Отметим, что ортогональность функций не подразумевает перпендикулярности графиков этих функций.
Определение. Система функций называется ортогональной и нормированной (ортонормированной), если
Определение. Рядом Фурье по ортогональной системе функций ϕ1(x), ϕ2(x), …,ϕn(x) называется ряд вида:
коэффициенты которого определяются по формуле:
,
где f(x) = - сумма равномерно сходящегося на отрезке [a, b] ряда по ортогональной системе функций. f(x) – любая функция, непрерывная или имеющая конечное число точек разрыва первого рода на отрезке [a, b].
В случае ортонормированной системы функций коэффициенты определяются:
Интеграл Фурье. Пусть функция f(x) на каждом отрезке [-l,l], где l – любое число, кусочно – гладкая или кусочно – монотонная, кроме того, f(x) – абсолютно интегрируемая функция, т.е. сходится несобственный интеграл
Тогда функция f(x) разлагается в ряд Фурье:
Если подставить коэффициенты в формулу для f(x), получим:
Переходя к пределу при l→∞, можно доказать, что
Обозначим
и
При l→∞ Δun →0.
Можно доказать, что предел суммы, стоящий в правой части равенства равен интегралу
Тогда
- двойной интеграл Фурье.
Окончательно получаем:
- представление функции f(x) интегралом Фурье.
Двойной интеграл Фурье для функции f(x) можно представить в комплексной форме:
Преобразование Фурье. Определение. Если f(x) – любая абсолютно интегрируемая на всей числовой оси функция, непрерывная или имеющая конечное число точек разрыва первого рода на каждом отрезке, то функция
называется преобразованием Фурье функции f(x). Функция F(u) называется также спектральной характеристикой функции f(x).
Если f(x) – функция, представимая интегралом Фурье, то можно записать:
Это равенство называется обратным преобразованием Фурье
и называются Интегралы соответственно косинус - преобразование Фурье и синус – преобразование Фурье.
Косинус – преобразование Фурье будет преобразованием Фурье для четных функций, синус – преобразование – для нечетных. Преобразование Фурье применяется в функциональном анализе, гармоническом анализе, операционном исчислении, теории линейных систем и др.
Элементы теории функций комплексного переменного Определение. Если каждому комплексному числу z из некоторого множества D по некоторому закону поставлено в соответствие определенное комплексное число w из множества G, то на этой области задана однозначная функция комплексного переменного, отображающая множество D на множество G.
w = f(z) Множество D называется областью определения, множество G – областью значений функции.
Комплексную функцию можно записать в виде:
u, v – действительные функции от переменных х и у.
Если каждому z∈ D соответствует несколько различных значений w, то функция w=f(z) называется многозначной.
Определение. Функция
имеет предел в точке z0, равный
числу А = a + ib, если
Свойства функций комплексного переменного. Для функций комплексного переменного f(z) и g(z) справедливы следующие свойства:
1)
2)
3)
Определение. Функция если выполняется равенство
называется непрерывной в точке z0,
Основные трансцендентные функции. Определение. Трансцендентными называются аналитические функции, которые не являются алгебраическими.
Если аргументом показательной или тригонометрических функций является комплексное число, то определение этих функций, вводимое в элементарной алгебре теряет смысл.
Рассмотрим разложение в степенной ряд следующих функций:
Функции ez, cosz, sinz связаны между собой формулой Эйлера. Эта формула может быть очень легко получена сложением соотвествующих рядов.
Также справедливы равенства:
Для тригонометрических функций комплексного аргумента справедливы основные тригонометрические тождества (синус и косинус суммы, разности и т.д.), которые справедливы для функций действительного аргумента.
Определение. Гиперболическим синусом, косинусом, тангенсом и котангенсом называются соответственно функции:
Гиперболические функции могут быть выражены через тригонометрические:
Гиперболические функции sh z и ch z имеют период 2πi, а функции th z и cth z – период πi.
Пример. Найти sin(1+2i).
Определение. Логарифмическая функция комплексного аргумента определяется как функция, обратная показательной.
и Arg ew =
Если w = u + iv, то Тогда eu =
= v.
.
Итого:
Для комплексного числа z = a + ib
Определение. логарифма.
Выражение
называется
главным
значением
Логарифмическая функция комплексного аргумента обладает следующими свойствами:
1)
2) 3)
4)
Обратные тригонометрические функции комплексного переменного имеют вид:
Производная функций комплексного переменного. Определение. Производной от однозначной функции w = f(z) в точке z называется предел:
Определение. Функция f(z), имеющая непрерывную производную в любой точке области D называется аналитической функцией на этой области.
Правила дифференцирования функций комплексного аргумента не отличаются от правил дифференцирования функций действительной переменной. Аналогично определяются производные основных функций таких как синус, косинус, тангенс и котангенс, степенная функция и т.д. Производные гиперболических функций определяются по формулам:
Вывод правил интегрирования, значений производных основных функций ничем не отличается от аналогичных операций с функциями действительного аргумента, поэтому подробно рассматривать их не будем.
Условия Коши – Римана. (Бернхард Риман (1826 – 1866) – немецкий математик) , Рассмотрим функцию комплексной переменной определенную на некоторой области и имеющую в какой – либо точке этой области производную
Стремление к нулю Δz→0 может осуществляться в следующих случаях:
1) 2)
В первом случае:
Во втором случае:
Тогда должны выполняться равенства:
Эти равенства называются условиями Коши – Римана, хотя еще раньше они были получены Эйлером и Даламбером.
Теорема. Если функция
имеет производную в точке
z = x + iy, то ее действительные компоненты u и v имеют в точке (х, у) частные производные первого порядка, удовлетворяющие условию Коши – Римана.
Также справедлива и обратная теорема. На основании этих теорем можно сделать вывод, что из существования производной следует непрерывность функции.
Теорема. Для того, чтобы функция была аналитической на некоторой области необходимо и достаточно, чтобы частные производные первого прядка функций u и v были непрерывны на этой области и выполнялись условия Коши – Римана.
Интегрирование функций комплексной переменной. - непрерывная функция комплексного переменного z, Пусть определенная в некоторой области и L – кривая, лежащая в этой области.
Кривая L задана уравнением
Определение. Интеграл от функции f(z) вдоль кривой L определяется следующим образом:
, то
Если учесть, что
Теорема. (Теорема Коши) Если f(z) - аналитическая функция на некоторой области, то интеграл от f(z) по любому кусочно – гладкому контуру, принадлежащему этой области равен нулю.
Интегральная формула Коши.
Если функция f(z) – аналитическая в односвязной замкнутой области с кусочно – гладкой границей L.
Тогда справедлива формула Коши:
где z0 – любая точка внутри контура L, интегрирование по контуру производится в положительном направлении (против часовой стрелки). Эта формула также называется интегралом Коши.
Ряды Тейлора и Лорана. (Пьер Альфонс Лоран (1813 – 1854) – французский математик) Функция f(z), аналитическая в круге степенной ряд по степеням (z – z0).
, разлагается в сходящийся к ней
Коэффициенты ряда вычисляются по формулам:
Степенной ряд с коэффициентами такого вида называется рядом Тейлора.
Рассмотрим теперь функцию f(z), аналитическую в кольце может быть представлена в виде сходящегося ряда:
. Эта функция
Ряд такого вида называется рядом Лорана. При этом функция f(z) может быть представлена в виде суммы:
Ряд, определяющий функцию f1(x), называется правильной частью ряда Лорана, а ряд, определяющий функцию f2(x), называется главной частью ряда Лорана.
Если предположить, что r = 0, то можно считать, что функция аналитична в открытом круге за исключением центральной точки z0. Как правило, в этой точке функция бывает не определена.
Тогда точка z0 называется изолированной особой точкой функции f.
Рассмотрим следующие частные случаи:
1) Функция f(x) имеет вид: . Т.к. степенной ряд сходится во всех точках внутри круга, то его сумма f1(x) определена и непрерывно дифференцируема во всех точках круга, а, следовательно, и в центре круга z0. В этом случае говорят, что особенность функции f в точке z0 устранима. Для устранения особой точки достаточно доопределить функцию в центре круга (f(z0) = c0) и функция будет аналитической не только в окрестности центра круга, но и в самом центре.
В этом случае
для любого контура L, содержащего точку z0 и
принадлежащего к кругу
.
2) Функция f(x) имеет вид:
.
В этом случае точка z0 называется полюсом функции f(z) порядка (кратности) m. При m = 1 точку z0 называют еще простым полюсом. Порядок полюса может быть определен по формуле:
z0 – полюс порядка т.
3) Функция f(z) имеет вид
, где в ряду
не равно нулю бесконечное количество коэффициентов с-k. В этом случае говорят, что функция f(z) имеет в точке z0 существенно особую точку.
Определение. Пусть z0 – изолированная особая точка функция f(z), т.е. пусть функция
из которого исключена точка z0. Тогда
f(z) – аналитическая в некотором круге интеграл
называется вычетом функции f(z) в точке z0, где L – контур в круге ориентированный против часовой стрелки и содержащей в себе точку z0.
Вычет также обозначают иногда
.
,
Если
есть ряд Лорана функции f в точке z0, то .
Таким образом, если известно разложение функции в ряд Лорана, то вычет легко может быть найден в случае любой особой точки.
В частных случаях вычет может быть найден и без разложения в ряд Лорана.
Например, если функция
,а
имеет простой нуль при z = z0
, то z = z0 является простым полюсом функции f(z).
Тогда можно показать, что вычет находится по формуле
Если z = z0 – полюс порядка m ≥ 1, то вычет может быть найден по формуле:
Пример. Найти вычет функции
относительно точки z = 2.
Эта точка является полюсом второго порядка. Получаем:
Теорема о вычетах Теорема. Пусть функция f(z) – аналитическая на всей плоскости z, за исключением конечного числа точек z1, z2, …, zN. Тогда верно равенство:
А интеграл от функции по контуру L, содержащему внутри себя эти точки, равен
Эти свойства применяются для вычисления интегралов. Если функция f(z) аналитическая в верхней полуплоскости, включая действительную ось, за исключением N точек, то справедлива формула
Пример. Вычислить определенный интеграл
.
Подынтегральная функция является аналитической в верхней полуплоскости за исключением точки 2i. Эта точка является полюсом второго порядка.
Найдем вычет функции
Получаем
Пример. Вычислить определенный интеграл
Подынтегральная функция является аналитической в верхней полуплоскости за исключением точки i. Эта точка является полюсом второго порядка. Найдем вычет функции
Получаем
Операционное исчисление. Преобразование Лапласа (Пьер Симон Лаплас (1749 – 1825) – французский математик) Рассмотрим функцию действительного переменного t, определенную при t ≥ 0. Будем также считать, что функция f(t)- кусочно - непрерывная, т.е. в любом конечном интервале она имеет конечное число точек разрыва первого рода, и определена на бесконечном интервале (-∞, ∞), но f(t) = 0 при t < 0. Будем считать, что функция ограничена условием:
Рассмотрим функцию
где p = a + ib – комплексное число.
Определение. Функция F(p) называется изображением Лапласа функции f(t).
Также функцию F(p) называют L – изображением или преобразованием Лапласа.
Обозначается
При этом функция f(t) называется начальной функцией или оригиналом, а процесс нахождения оригинала по известному изображению называется операционным исчислением.
Теорема. (Теорема единственности) Если две непрерывнные функции f(x) и g(x) имеют одно и то же L – изображение F(p), то они тождественно равны.
Определение. Функцией Хевисайда (Оливер Хевисайд (1850 – 1925) – английский физик) называется функция
Свойства изображений.
Если
, то справедливы следующие свойства:
1) Свойство подобия.
2) Свойство линейности.
3) Смещение изображения.
4) Дифференцирование изображения.
5) Дифференцирование оригинала.
6) Интегрирование изображения.
(Справедливо при условии, что интеграл сходится)
7) Интегрирование оригинала.
Таблица изображений некоторых функций.
Для большинства функций изображение находится непосредственным интегрированием.
Пример. Найти изображение функции f(t) = sint.
Изображения некоторых функций приведены в следующей таблице.
№ 1
f(t) 1
F(p)
№ 9
2
sinαt
10
3
cosαt
11
4
e-αt
12
5
shαt
13
6
chαt
14
7
15
8
16
f(t)
F(p)
*
* - при условии, что
Теоремы свертки и запаздывания Теорема. (теорема запаздывания) Если f(t) = 0 при t < 0, то справедлива формула
где t0 – некоторая точка.
Определение. Выражение обозначается f1∗ f2.
называется сверткой функций f1(t) и f2(t) и
Теорема. (теорема свертки) Преобразование Лапласа от свертки равно произведению преобразований Лапласа от функций f1(t) и f2(t) .
Теорема. (Интеграл Дюамеля (Дюамель (1797 – 1872) – французский математик)). Если
, то верно равенство
Для нахождения изображений различных функций наряду с непосредственным интегрированием применяются приведенные выще теоремы и свойства.
Пример. Найти изображение функции
.
Из таблицы изображений получаем:
.
По свойству интегрирования изображения получаем:
Пример. Найти изображение функции
Из тригонометрии известна формула
Тогда
.
.
=
.
Операционное исчисление используется как для нахождения значений интегралов, так и для решение дифференциальных уравнений. Пусть дано линейное дифференциальное уравнение с постоянными коэффициентами.
Требуется найти решение этого дифференциального уравнения, удовлетворяющее начальным условиям:
Если функция x(t) является решением этого дифференциального уравнения, то оно обращает исходное уравнение в тождество, значит функция, стоящая в левой части уравнения и функция f(t) имеет (по теореме единственности) одно и то же изображение Лапласа.
Из теоремы о дифференцировании оригинала {
} можно сделать
вывод, что
Тогда Обозначим
Получаем:
Это уравнение называется вспомогательным (изображающим) или операторным уравнением. Отсюда получаем изображение
, а по нему и искомую функцию x(t).
Изображение получаем в виде:
Где
Этот многочлен зависит от начальных условий. Если эти условия нулевые, то многочлен равен нулю, и формула принимает вид:
Рассмотрим применение этого метода на примерах. Пример. Решить уравнение Изображение искомой функции будем искать в виде:
Находим оригинал, т.е. искомую функцию:
Пример. Решить уравнение
Пример. Решить уравнение:
Изображение искомой функции Для нахождения оригинала необходимо разложить полученную дробь на элементарные дроби. Воспользуемся делением многочленов (знаменатель делится без остатка на p – 1): p3 – 6p2 + 11p – 6 p - 1 p3 – p2 p2 – 5p + 6 -5p2 + 11p -5p2 + 5p 6p - 6 6p - 6 0
В свою очередь Получаем:
Тогда:
Определим коэффициенты А, В и С.
Тогда
Приемы операционного исчисления можно также использовать для решения систем дифференциальных уравнений.
Пример. Решить систему уравнений:
Обозначим уравнения:
- изображения искомых функций и решим вспомогательные
Решим полученную систему алгебраических уравнений.
ТВ и МС Комбинаторные формулы Пусть имеется множество, состоящее из n элементов. Обозначим его Un. Перестановкой из n элементов называется заданный порядок во множестве Un. Примеры перестановок: 1)распределение n различных должностей среди n человек; 2)расположение n различных предметов в одном ряду. Сколько различных перестановок можно образовать во множестве Un? Число перестановок обозначается Pn (читается Р из n). Чтобы вывести формулу числа перестановок, представим себе n ячеек, пронумерованных числами
1,2,...n. Все перестановки будем образовывать,
располагая элементы Un в этих ячейках. В первую ячейку можно занести любой из n элементов (иначе: первую ячейку можно заполнить n различными способами). Заполнив первую ячейку, можно n-1 способом заполнить вторую ячейку (иначе: при каждом способе заполнения первой ячейки находится n-1 способов заполнения второй ячейки). Таким образом существует n(n-1) способов заполнения двух первых ячеек. При заполнении первых двух ячеек можно найти n-2 способов заполнения третьей ячейки, откуда получается, что три ячейки можно заполнить n(n-1)(n-2) способами. Продолжая этот процесс, получим, что число способов заполнения n
ячеек
равно
n(n − 1)(n − 2)...3 ⋅ 2 ⋅ 1. Отсюда
Pn = n(n - 1)(n - 2)...⋅3⋅2⋅1 Число n(n - 1)(n - 2)...⋅3⋅2⋅1, то есть произведение всех натуральных чисел от 1 до n, называется "n-факториал" и обозначается n!. Отсюда Pn =n! Пример. 5 ! = 5 ⋅ 4 ⋅ 3 ⋅ 2 = 120 . По определению считается: 1!=1; 0!=1.
Размещениями из n элементов по k элементов будем называть упорядоченные подмножества, состоящие из k элементов, множества Un (множества, состоящего из n элементов). Число размещений из n элементов по k элементов обозначается
Ank (читается "А из n по k").
Примеры задач, приводящих к необходимости подсчета 1) Сколькими способами можно выбрать из 15 человек 5 кандидатов и назначить их на 5 различных должностей? 2) Сколькими способами можно из 20 книг отобрать 12 и расставить их в ряд на полке? В задачах о размещениях полагается k
n! (n - k ) !
Отсюда получаем: Ank = n ! ( n− k ) ! Пример. Сколько существует различных вариантов выбора 4-х кандидатур из 9-ти специалистов для поездки в 4 различных страны? A94 =
Сочетаниями
9! 9! = = 9 ⋅ 8 ⋅ 7 ⋅ 6 = 3024 (9 − 4) ! 5 !
из
n
элементов
по
k
элементов
называются
подмножества, состоящие из k элементов множества Un (множества, состоящего из n элементов). Одно сочетание от другого отличается только составом выбранных элементов (но не порядком их расположения, как у размещений). Число сочетаний из n элементов по k элементов обозначается Cnk (читается "C из n по k").
Примеры задач, приводящих к необходимости подсчета числа сочетаний: 1) Сколькими способами можно из 15 человек выбрать 6 кандидатов для назначения на работу в одинаковых должностях? 2) Сколькими способами можно из 20 книг отобрать 12 книг? Выведем формулу для подсчета числа сочетаний. Пусть имеется множество Un и нужно образовать упорядоченное подмножество множества Un, содержащее k элементов (то есть образовать размещение). Делаем это так: 1) выделим какие-либо k элементов из n элементов множества
Un Это,
согласно сказанному выше, можно сделать Cnk способами; 2) упорядочим выделенные k элементов, что можно сделать Pk = k ! способами. Всего можно получить Cnk ⋅ Pk вариантов (упорядоченных подмножеств), откуда следует: Ank = Cnk ⋅ Pk ,то есть Cnk =
Ank n! = Pk (n − k)! k !
Пример: 6 человек из 15 можно выбрать числом способов, равным C156 =
Задачи называются
на
15 ! 15 ⋅ 14 ⋅ 13 ⋅ 12 ⋅ 11 ⋅ 10 = = 5005 9! 6! 6 ⋅ 5⋅ 4 ⋅ 3 ⋅ 2
подсчет
числа
комбинаторными.
подмножеств
Рассмотрим
конечного
некоторые
множества
комбинаторные
задачи. 1.Из семи заводов организация должна выбрать три для размещения трех различных заказов. Сколькими способами можно разместить заказы? Так как все заводы различны, и из условия ясно, что каждый завод может либо получить один заказ, либо не получить ни одного, здесь нужно считать число размещений A73 =
7! = 7 ⋅ 6 ⋅ 5 = 210 4!
2.Если из текста задачи 1 убрать условие различия трех заказов, сохранив все остальные условия, получим другую задачу. Теперь способ размещения заказов определяется только выбором тройки заводов, так как
все эти заводы получат одинаковые заказы, и число вариантов определяется как число сочетаний. C73 =
7! = 35 4 !⋅ 3 !
3.Имеются 7 заводов. Сколькими способами организация может разместить на них три различных производственных заказа? (Заказ нельзя дробить, то есть распределять его на несколько заводов). В отличие от условия первой задачи, здесь организация может отдать все три заказа первому заводу или, например, отдать два заказа второму заводу, а один - седьмому. Задача решается так. Первый заказ может быть размещен семью различными способами (на первом заводе, на втором и т.д.). Разместив первый заказ, имеем семь вариантов размещения второго (иначе, каждый способ размещения первого заказа может сопровождаться семью способами размещения
второго).
Таким
образом,
существует
7⋅7=49
способов
размещения первых двух заказов. Разместив их каким-либо образом, можем найти 7 вариантов размещения третьего (иначе, каждый способ размещения первых двух заказов может сопровождаться семью различными способами распределения
третьего
заказа).
Следовательно,
существуют
49⋅7=73
способов размещения трех заказов. (Если бы заказов было n, то получилось бы 7n способов размещения). 4.Как решать задачу 3, если в ее тексте вместо слов "различных производственных
заказа"
поставить
"одинаковых
производственных
заказа"? 5.Добавим к условию задачи 1 одну фразу: организация также должна распределить три различных заказа на изготовление деревянных перекрытий среди 4-х лесопилок. Сколькими способами могут быть распределены все заказы? Каждый из A73 способов распределения заказов на заводах может сопровождаться A43 способами размещения заказов на лесопилках. Общее число возможных способов размещения всех заказов будет равно À73 ⋅ À43 =
7! 4! ⋅ = 7! 4 ! 1!
Случайный эксперимент, элементарные исходы, события. Случайным
(стохастическим)
экспериментом
или
испытанием
называется осуществление какого-либо комплекса условий, который можно практически или мысленно воспроизвести сколь угодно большое число раз. Примеры
случайного
эксперимента:
подбрасывание
монеты,
извлечение одной карты из перетасованной колоды, подсчет числа автомобилей в очереди на бензоколонке в данный момент. Явления, происходящие при реализации этого комплекса условий, то есть в результате случайного эксперимента, называются элементарными исходами. Считается, что при проведении случайного эксперимента реализуется только один из возможных элементарных исходов. Если монету подбросить один раз, то элементарными исходами можно считать выпадение герба (Г) или цифры (Ц). Если случайным экспериментом считать троекратное подбрасывание монеты, то элементарными исходами можно считать следующие: ГГГ, ГГЦ, ГЦГ, ЦГГ, ГЦЦ, ЦГЦ, ЦЦГ, ЦЦЦ. Множество всех элементарных исходов случайного эксперимента называется пространством элементарных исходов . Будем обозначать пространство элементарных исходов буквой Ω (омега большая) i-й элементарный исход будем обозначатьωi (ω-омега малая). Если пространство элементарных исходов содержит n элементарных исходов, то Ω=(ω1, ω2 ,..., ωn ). Для троекратного подбрасывания монеты, Ω=(ГГГ, ГГЦ,...ЦЦЦ). Если случайный эксперимент - подбрасывание игральной кости, то Ω=(1,2,3,4,5,6). Если Ω конечно или счетно, то случайным событием или просто событием называется любое подмножество Ω.
Множество называется счетным, если между ним и множеством N натуральных чисел можно установить взаимно-однозначное соответствие. Пример счетного множества: множество возможных значений времени прилета инопланетян на Землю, если время отсчитывать с настоящего момента и исчислять с точностью до секунды. Примеры несчетных множеств: множество точек на заданном отрезке, множество чисел x, удовлетворяющих неравенству 1< x ≤ 2. В случае несчетного множества Ω будем называть событиями только подмножества, удовлетворяющие некоторому условию (об этом будет сказано позже). Приведем примеры событий. Пусть бросается игральная кость, и элементарным исходом считается выпавшее число очков: Ω=(1,2,3,4,5,6). A — событие, заключающееся в том, что выпало четное число очков: А=(2,4,6); B — событие, заключающееся в том, что выпало число очков, не меньшее 3х: B=(3,4,5,6). Говорят,
что
те
исходы,
из
которых
состоит
событие
А,
благоприятствуют событию А. События удобно изображать в виде рисунка,
который
диаграммой
Венна.
называется На
рисунке
1
пространство элементарных исходов Ω изображено в виде прямоугольника, а множество
элементарных
Рис.1
исходов,
благоприятствующих событию A, заключено в эллипс. Сами исходы на диаграмме Венна не изображаются, а информация о соотношении между их множествами
содержится
в
расположении
границ
соответствующих
областей. Суммой (объединением) двух событий А и B (обозначается AUB ) называется событие, состоящее
из
всех
элементарных
исходов,
принадлежащих по крайней мере одному из событий А или B. Событие AUB
происходит,
если происходит по крайней мере одно из событий А или B. Рис.2
Приведем пример объединения событий.
Пусть два стрелка стреляют в мишень одновременно, и событие А состоит в том, что в мишень попадает 1-й стрелок, а событие B - в том, что в мишень попадает 2-й. Событие AUB означает, что мишень поражена, или, иначе, что в мишень попал хотя бы один из стрелков. Произведением
(пересечением)
A∩B событий А и B называется событие, состоящее из всех тех элементарных исходов, которые принадлежат и А и B. На рисунке 3 пересечение событий А и B
Рис.3
изображено в виде заштрихованной области. В условиях приведенного выше примера событие A∩B заключается в том, что в мишень попали оба стрелка. Разностью А\B или А-B событий А и B называется событие, состоящее из всех исходов события А, не благоприятствующих событию B. Диаграмма
Венна
разности
событий
А
и
B
изображена на рисунке 4. В условиях рассмотренного выше примера событие А\B заключается в Рис.4
том, что первый стрелок попал в мишень, а второй
промахнулся. Событие Ω называется достоверным (оно обязательно происходит в результате случайного эксперимента). Пустое множество ∅ называется невозможным событием. Событие A=Ω\A называется противоположным событию А или дополнением
события А. События несовместными,
А
и если
B нет
называются исходов,
принадлежащих и А и B, то есть A∩B = ∅. На рисунке 5 изображены несовместные события А и B.
Непосредственно из введенных определений следуют равенства: AU A =Ω; A∩ A =∅; AUB A ∩ B ; A I B = AUB . Два последних равенства называются формулами Де'Моргана. Рис.5
Вероятностное пространство
Случай конечного или счетного числа исходов. Для
построения
полной
и
законченной
теории
случайного
эксперимента или теории вероятностей, помимо введенных исходных понятий случайного эксперимента, элементарного исхода, пространства элементарных исходов, события, введем аксиому (пока для случая конечного или счетного пространства элементарных исходов). Каждому элементарному исходу ωi пространства Ω соответствует некоторая
неотрицательная
числовая
характеристика
Pi
шансов
его
появления, называемая вероятностью исхода ω i , причем P1 + P2 + ...+ Pn + ... =
∑P i
i: ω ∈ Ω i
=1
(здесь суммирование ведется по всем i, для которых выполняется условие: ω i∈Ω).
Отсюда следует, что 0 ≤ Pi ≤ 1для всех i. Вероятность любого события А определяется как сумма вероятностей всех элементарных исходов, благоприятствующих событию А. Обозначим ее Р(А). P( A) =
∑ ∑ P(ω ) = P i i: ω ∈ A i: ω ∈ A i i i
(*)
Отсюда следует, что 1) 0 ≤ P(A) ≤ 1; 2) P(Ω)=1; 3) P(∅)=0. Будем говорить, что задано вероятностное пространство, если задано пространство элементарных исходов Ω и определено соответствие
ωi → P(ωi ) =Pi. Возникает вопрос: как определить из конкретных условий решаемой задачи вероятность P(ωi ) отдельных элементарных исходов?
Классическое определение вероятности. Вычислять вероятности P(ωi ) можно, используя априорный подход, который
заключается
в
анализе
специфических
условий
данного
эксперимента (до проведения самого эксперимента). Возможна ситуация, когда пространство элементарных исходов состоит из конечного числа N элементарных исходов, причем случайный эксперимент таков, что вероятности осуществления каждого из этих N элементарных исходов представляются равными. Примеры таких случайных экспериментов: подбрасывание симметричной монеты, бросание правильной игральной кости, случайное извлечение игральной карты из перетасованной колоды. В силу введенной аксиомы вероятности каждого 1 элементарного исхода в этом случае равны . Из этого следует, что если N то в соответствии с событие А содержит NA элементарных исходов, определением (*) P( A) =
N
A
N
В данном классе ситуаций вероятность события определяется как отношение числа благоприятных исходов к общему числу всех возможных исходов. Пример. Из набора, содержащего 10 одинаковых на вид электроламп, среди которых 4 бракованных, случайным образом выбирается 5 ламп. Какова вероятность, что среди выбранных ламп будут 2 бракованные? Прежде всего отметим, что выбор любой пятерки ламп имеет одну и ту же вероятность. Всего существует C105 способов составить такую пятерку, то есть случайный эксперимент в данном случае имеет C105 равновероятных исходов. Сколько из этих исходов удовлетворяют условию "в пятерке две бракованные лампы", то есть сколько исходов принадлежат интересующему нас событию? Каждую интересующую нас пятерку можно составить так: выбрать две бракованные лампы, что можно сделать числом способов, равным C42 . Каждая пара бракованных ламп может встретиться столько раз, сколькими способами ее можно дополнить тремя не бракованными лампами, то есть Ñ63 раз. Получается, что число пятерок, содержащих две бракованные лампы, равно C42 ⋅Ñ63 . Отсюда, обозначив искомую вероятность через P, получаем:
P=
C42 ⋅ C63 5 C10
=
10 21
Статистическое определение вероятности. Рассмотрим случайный эксперимент, заключающийся в том, что подбрасывается игральная кость, сделанная из неоднородного материала. Ее центр тяжести не находится в геометрическом центре. В этом случае мы не можем
считать
исходы
(выпадение
единицы,
двойки
и
т.д.)
равновероятными. Из физики известно, что кость более часто будет падать на ту грань, которая ближе к центру тяжести. Как определить вероятность выпадения, например, трех очков? Единственное, что можно сделать, это подбросить эту кость n раз (где n-достаточно большое число, скажем n=1000 или n=5000), подсчитать число выпадений трех очков n3 и считать вероятность исхода, заключающегося в выпадении трех очков, равной n3/n относительной частоте выпадения трех очков. Аналогичным образом можно определить вероятности остальных элементарных исходов — единицы, двойки, четверки и т.д. Теоретически такой образ действий можно оправдать, если ввести статистическое определение вероятности. Вероятность P(ωi) определяется как предел относительной частоты появления исхода ωi
в процессе неограниченного увеличения числа
случайных экспериментов n, то есть mn (ω i ) , n→∞ n
Pi = P(ω i ) = lim
где mn(ωi) – число случайных экспериментов (из общего числа n произведенных случайных экспериментов), в которых зарегистрировано появление элементарного исхода ωi. Так как здесь не приводится никаких доказательств, мы можем только надеяться, что предел в последней формуле существует, обосновывая надежду жизненным опытом и интуицией.
Геометрическая вероятность В одном специальном случае дадим определение вероятности события для случайного эксперимента с несчетным множеством исходов.
Если между множеством Ω элементарных исходов случайного эксперимента и множеством точек некоторой плоской фигуры Σ (сигма большая) можно установить взаимно-однозначное соответствие, а также можо установить взаимно-однозначное соответствие между множеством элементарных исходов, благоприятствующих событию А, и множеством точек плоской фигуры σ (сигма малая), являющейся частью фигуры Σ, то P( A) =
s , S
где s — площадь фигуры σ, S — площадь фигуры Σ. Пример. Два человека обедают в столовой, которая открыта с 12 до 13 часов. Каждый из них приходит в произвольный момент времени и обедает в течение 10 минут. Какова вероятность их встречи? Пусть x — время прихода первого в столовую, а y — время прихода второго (12 ≤ x ≤ 13; 12 ≤ y ≤ 13) . Можно
установить
взаимно-однозначное
соответствие между всеми парами чисел (x;y) (или множеством исходов) и множеством точек квадрата со стороной, равной 1, на координатной плоскости, где начало координат соответствует числу 12 по оси X и по оси Y, как изображено на рисунке 6. Здесь, например,
точка
А
соответствует
Рис.6
исходу,
заключающемуся в том, что первый пришел в 12.30, а второй - в 13.00. В этом случае, очевидно, встреча не состоялась. Если первый пришел не позже второго (y ≥ x), то встреча произойдет при условии 0 ≤ y - x ≤ 1/6 (10 мин.- это 1/6 часа). Если второй пришел не позже первого (x ≥ y), то встреча произойдет при условии 0 ≤ x - y ≤ 1/6.. Между
множеством
исходов,
благоприятствующих встрече, и множеством точек области
σ,
изображенной
на
рисунке 7
в
заштрихованном виде, можно установить взаимнооднозначное cоответствие. Искомая вероятность p равна отношению площади области σ к Рис. 7
площади всего квадрата.. Площадь квадрата равна
единице, а площадь области σ можно определить как разность единицы и суммарной площади двух треугольников, изображенных на рисунке 7. Отсюда следует: p = 1−
25 11 = 36 36
Непрерывное вероятностное пространство. Как уже говорилось ранее, множество элементарных исходов может быть более, чем счетным (то есть несчетным). В этом случае нельзя считать любое подмножество множества Ω событием. Чтобы ввести определение случайного события, рассмотрим систему (конечную или счетную) подмножеств A1 , A2 ,... An пространства элементарных исходов Ω. В случае выполнения трех условий: 1) Ω принадлежит этой системе; 2) из принадлежности А этой системе следует принадлежность A этой системе; 3) из принадлежности Ai и Aj этой системе следует принадлежность Ai U Aj этой системе такая система подмножеств называется алгеброй. Пусть Ω — некоторое пространство элементарных исходов. Убедитесь в том, что две системы подмножеств: 1) Ω, ∅; 2) Ω, А, A, ∅ (здесь А— подмножество Ω) являются алгебрами. Пусть A1 и A2 принадлежат некоторой алгебре. Докажите, что A1 \ A2 и A1∩ A2 принадлежат этой алгебре. Подмножество А несчетного множества элементарных исходов Ω является событием, если оно принадлежит некоторой алгебре. Сформулируем аксиому, называемую аксиомой А.Н. Колмогорова. Каждому
событию
соответствует
неотрицательное
и
не
превосходящее единицы число P(А), называемое вероятностью события А, причем функция P(А) обладает следующими свойствами: 1) Р(Ω)=1 2) если события A1, A2,..., An несовместны, то P(A1UA2U...UAn) = P (A1) + P (A2) +...+ P(An)
Если задано пространство элементарных исходов Ω, алгебра событий и определенная на ней функция Р, удовлетворяющая условиям приведенной аксиомы, то говорят, что задано вероятностное пространство. Это определение вероятностного пространства можно перенести на случай конечного пространства элементарных исходов Ω. Тогда в качестве алгебры можно взять систему всех подмножеств множества Ω.
Формулы сложения вероятностей. Из пункта 2 приведенной аксиомы следует, что если A1 и A2 несовместные события, то P(A1UA2) = P(A1) + P(A2) Если A1 и A2 — совместные события, то A1UA2 =(A1\ A2)UA2, причем очевидно, что A1\A2 и A2 — несовместные события. Отсюда следует: P(A1UA2) = P(A1\ A2) + P(A2)
(*)
Далее очевидно: A1 = (A1\ A2)U(A1∩A2), причем A1\ A2 и A1∩A2 несовместные события, откуда следует: P(A1) = P(A1\ A2) + P(A1∩A2) Найдем из этой формулы выражение для P(A1\ A2) и подставим его в правую часть формулы (*). В результате получим формулу сложения вероятностей: P(A1UA2) = P(A1) + P(A2) – P(A1∩A2) Из последней формулы легко получить формулу сложения вероятностей для несовместных событий, положив A1∩A2 = ∅. Пример. Найти вероятность вытащить туза или червовую масть при случайном отборе одной карты из колоды в 32 листа. Р( ТУЗ ) = 4/32 = 1/8; Р( ЧЕРВОВАЯ МАСТЬ ) = 8/32 = 1/4; Р( ТУЗ ЧЕРВЕЙ ) = 1/32; Р(( ТУЗ ) U (ЧЕРВОВАЯ МАСТЬ )) = 1/8 + 1/4 - 1/32 =11/32 Того же результата можно было достичь с помощью классического определения вероятности, пересчитав число благоприятных исходов.
Условные вероятности. Рассмотрим задачу. Студент перед экзаменом выучил из 30 билетов билеты с номерами с 1 по 5 и с 26 по 30. Известно, что студент на экзамене вытащил билет с номером, не превышающим 20. Какова вероятность, что студент вытащил выученный билет? Определим пространство элементарных исходов: Ω=(1,2,3,...,28,29,30). Пусть событие А заключается в том, что студент вытащил выученный билет: А = (1,...,5,25,...,30,), а событие В — в том, что студент вытащил билет из первых двадцати: В = (1,2,3,...,20) Событие А∩В состоит из пяти исходов: (1,2,3,4,5), и его вероятность равна 5/30. Это число можно представить как произведение дробей 5/20 и 20/30. Число 20/30 - это вероятность события B. Число 5/20 можно рассматривать как вероятность события А при условии, что событие В произошло (обозначим её Р(А/В)). Таким образом решение задачи определяется формулой P(А∩В) = Р(А/В) Р(B) Эта формула называется формулой умножения вероятностей , а вероятность Р(А/В) — условной вероятностью события A. Пример..Из урны, содержащей 7 белых и 3 черных шаров, наудачу один за другим извлекают (без возвращения) два шара. Какова вероятность того, что первый шар будет белым, а второй черным? Пусть X — событие, состоящее в извлечении первым белого шара, а Y — событие, состоящее в извлечении вторым черного шара. Тогда X∩Y событие, заключающееся в том, что первый шар будет белым, а второй — черным. P(Y/X) =3/9 =1/3 — условная вероятность извлечения вторым черного шара, если первым был извлечен белый. Учитывая, что P(X) = 7/10, по формуле умножения вероятностей получаем: P(X∩Y) = 7/30 Событие А называется независимым от события В (иначе: события А и В называются независимыми), если Р(А/В)=Р(А). За определение независимых событий можно принять следствие последней формулы и формулы умножения P(А∩В) = Р(А) Р(B)
Докажите самостоятельно, что если А и В — независимые события, то A и B тоже являются независимыми события.
Пример.Рассмотрим задачу, аналогичную предыдущей, но с одним дополнительным условием: вытащив первый шар, запоминаем его цвет и возвращаем шар в урну, после чего все шары перемешиваем. В данном случае результат второго извлечения никак не зависит от того, какой шар черный или белый появился при первом извлечении. Вероятность появления первым белого шара (событие А) равна
7/10. Вероятность события В -
появления вторым черного шара - равна 3/10. Теперь формула умножения вероятностей дает: P(А∩В) = 21/100. Извлечение шаров способом, описанным в этом примере, называется выборкой с возвращением или возвратной выборкой. Следует отметить, что если в двух последних примерах положить изначальные количества белых и черных шаров равными соответственно 7000 и 3000, то результаты расчетов тех же вероятностей будут отличаться пренебрежимо мало для возвратной и безвозвратной выборок.
Формула полной вероятности. Пусть имеется группа событий H1, H2,..., Hn , обладающая следующими свойствами: 1) Все события попарно несовместны: Hi ∩ Hj =∅; i, j=1,2,...,n; i≠j 2) Их объединение образует пространство элементарных исходов Ω: Ω=H1U H2U ... U Hn. В этом случае будем говорить, что H1, H2,...,Hn образуют полную группу событий. Такие события иногда называют гипотезами. Пусть А - некоторое событие: А ⊂ Ω (диаграмма Венна представлена на рисунке 8). Тогда имеет место формула полной вероятности: Рис.8
P(A) = P(A/ H1)P(H1) + P(A/ H2)P(H2) + ...+ P(A/
Hn)P(Hn) = =
n
∑ P( A / Hi )P( Hi )
i =1
Доказательство. Очевидно: A = (A∩H1) U (A∩H2) U...U (A∩Hn), причем все события A∩Hi (i = 1,2,...,n) попарно несовместны. Отсюда по теореме сложения вероятностей получаем P(A) = P(A∩H1) + P(A∩H1) +...+P(A∩Hn ) Если учесть, что по теореме умножения P(A∩Hi) = P(A/Hi) P(Hi) (i = 1,2,...,n),
то из последней формулы легко получить приведенную выше
формулу полной вероятности. Пример. В магазине продаются электролампы производства трех заводов, причем доля первого завода - 30%, второго - 50%, третьего - 20%. Брак в их продукции составляет соответственно 5%, 3% и 2%. Какова вероятность того, что случайно выбранная в магазине лампа оказалась бракованной. Пусть событие H1 состоит в том, что выбранная лампа произведена на первом заводе, H2 на втором, H3 - на третьем заводе. Очевидно: P(H1) = 3/10, P(H2) = 5/10, P(H3) = 2/10. Пусть событие А состоит в том, что выбранная лампа оказалась бракованной; A/Hi
означает событие, состоящее в том, что выбранна
бракованная лампа из ламп, произведенных на i-ом заводе. Из условия задачи следует: P (A/H1) = 5/10; P(A/H2) = 3/10; P(A/H3) = 2/10 По формуле полной вероятности получаем P( A) =
3 5 5 3 2 2 17 ⋅ + ⋅ + ⋅ = 10 100 10 100 10 100 500
Формула Байеса Пусть H1,H2,...,Hn - полная группа событий и А⊂Ω - некоторое событие. Тогда по формуле для условной вероятности P( Hk / A)
=
P( Hk I A) P(A)
(*)
Здесь P(Hk /A) - условная вероятность события (гипотезы) Hk или вероятность того, что Hk реализуется при условии, что событие А произошло. По теореме умножения вероятностей числитель формулы (*) можно представить в виде P(Hk∩A) = P(A∩Hk) = P(A /Hk) P(Hk) Для представления знаменателя формулы (*) можно использовать формулу полной вероятности P(A) =
n
∑ P( A / Hi )P( Hi )
i =1
Теперь из (*) можно получить формулу, называемую формулой Байеса: P( A / H k )P( H k ) P( H k / A) = n ∑ P( A / Hi )P( Hi ) i =1
По формуле Байеса исчисляется вероятность реализации гипотезы Hk при условии, что событие А произошло. Формулу Байеса еще называют формулой вероятности гипотез. Пример.Рассмотрим приведенную выше задачу об электролампах, только изменим вопрос задачи. Пусть покупатель купил электролампу в этом магазине, и она оказалась бракованной. Найти вероятность того, что эта лампа изготовлена на втором заводе. Выпишем формулу Байеса для этого случая P( H 2 / A) =
P( A / H 2 )P( H 2 ) P( A)
Из этой формулы получаем: P(H2 / A) = 15/34 Предлагаем читателю решить самостотельно две задачи. .№1.В первой урне 7 белых и 3 черных шара, во второй - 8 белых и 2 черных. Из первой урны случайным образом извлекается шар и перекладывается во вторую урну. После перемешивания шаров во второй урне из нее извлекается один шар. Найти вероятность того, что извлеченный из второй урны шар — белый.
№2.В условие задачи №1 внесем изменение. Пусть после перекладывания шара из первой урны во вторую из второй урны извлечен белый шар. Найти вероятность того, что из первой урны во вторую был переложен черный шар.
Повторные независимые испытания. Формула Бернулли. Рассмотрим случай многократного повторения одного и того же испытания или случайного эксперимента. Результат каждого испытания будем считать
не зависящим от того, какой результат наступил в
предыдущих испытаниях. В качестве результатов или элементарных исходов каждого отдельного испытания будем различать лишь две возможности: 1) появление некоторого события А; 2) появление события A, (события, являющегося дополнением А) Пусть вероятность P(A) появления события А постоянна и равна p (0<.p<1). Вероятность P( A) события A обозначим через q: P( A) = 1- p=q. Примерами таких испытаний могут быть: 1) подбрасывание монеты: А - выпадение герба; A - выпадение цифры. P(A) = P( A) = 0,5. 2) бросание игральной кости: А - выпадение количества очков, равного пяти, A выпадение любого количества очков кроме пяти.
P(A) =1/6, P( A) =5/6. 3) извлечение наудачу из урны, содержащей 7 белых и 3 черных шара, одного шара (с возвращением): А - извлечение белого шара, A - извлечение черного шара P(A) = 0,7; P( A) = 0,3 Пусть произведено n испытаний, которые мы будем рассматривать как один сложный случайный эксперимент. Составим таблицу из n клеток, расположенных в ряд, пронумеруем клетки, и результат каждого испытания будем отмечать так: если в i-м испытании событие А произошло, то в i-ю клетку ставим цифру 1, если событие А не произошло (произошло событие A), в i-ю клетку ставим 0. Если, например, проведено 5 испытаний, и событие А произошло лишь во
2 -м
и
5-м
испытаниях,
то
результат
последовательностью нулей и единиц: 0; 1; 0; 0; 1.
можно
записать
такой
Каждому возможному результату n испытаний будет соответствовать последовательность n цифр 1 или 0, чередующихся в том порядке, в котором появляются события A и A в n испытаниях, например: 1; 1; 0; 1; 0; 1; 0; 0; ... 0; 1; 1; 0 14444442444443 n цифр Всего таких последовательностей можно составить 2 n (это читатель может доказать сам). Так как испытания независимы, то вероятность P каждого такого результата определяется путем перемножения вероятностей событий A и A в соответствующих испытаниях. Так, например, для написанного выше результата найдем P = p⋅p⋅q⋅p⋅q⋅p⋅q⋅q⋅...⋅q⋅p⋅p⋅q Если в написанной нами последовательности единица встречается х раз (это значит, что нуль встречается n-x раз), то вероятность соответствующего результата будет pnqn-x независимо от того, в каком порядке чередуются эти x единиц и n-x нулей. Все события, заключающиеся в том, что в n испытаниях событие A произошло x раз, а событие A произошло n-x раз, являются несовместными. Поэтому для вычисления вероятности объединения этих событий (или суммы этих событий), нужно сложить вероятности всех этих событий, каждая из которых равна pnqn-x
. Всего таких событий можно насчитать столько,
сколько можно образовать различных последовательностей длины n, содержащих x цифр "1" и n-x цифр "0". Таких последовательностей получается столько, сколькими способами можно разместить x цифр "1" (или n-x цифр "0") на n местах, то есть число этих последовательностей равно Cnx = Cnn − x
Отсюда получается формула Бернулли: Pn(x) = Cnx p x qn − x По формуле Бернулли рассчитывается вероятность появления события A "x"раз в n повторных независимых испытаниях, где p - вероятность
появления события A в одном испытании, q - вероятность появления события A в одном испытании.
Сформулированные условия проведения испытаний иногда называются "схемой повторных независимых испытаний" или "схемой Бернулли" Число x появления события A в n повторных независимых испытаниях называется частотой. Пример. Из урны, содержащей 2 белых и 6 черных шаров наудачу выбирается с возвращением 5 раз подряд один шар. Подсчитать вероятность того, что 4 раза появится белый шар. В приведенных выше обозначениях n=8; p=1/4; q=3/4; x=5. Искомую вероятность вычисляем по формуле Бернулли: ⎛ 1 ⎞ 4 ⎛ 3⎞ 15 P8 (5) = C54 ⎜ ⎟ ⎜ ⎟ = ⎝ 4⎠ ⎝ 4⎠ 1024
По формуле Бернулли можно подсчитать вероятности всех возможных частот: x=0,1,2,3,4,5. Заметим, что если в этой задаче считать, что белых шаров было 20000, а черных 60000, то очевидно p и q останутся неизменными. Однако в этой ситуации можно пренебречь возвращением извлеченного шара после каждой выборки (при не слишком больших значениях x) и считать вероятности всех частот: x=0,1,2,... по формуле Бернулли. Формула Бернулли при заданных числах p и n позволяет рассчитывать вероятность любой частоты x (0 ≤ x ≤ n). Возникает естественный вопрос: какой частоте будет соответствовать наибольшая вероятность? Предположим, что такая частота существует, и попытаемся ее определить из условия, что вероятность этой частоты не меньше вероятности "предыдущей" и "последующей" частот: Pn(x) ≥ Pn (x-1); Pn(x) ≥ Pn (x+1) Первое неравенство (*) представляется в виде: Cnx p x qn − x ≥ Cnx −1 p x −1qn − x +1 ,
что эквивалентно
p q ≤ или qx ≤ pn − px + p . Отсюда следует: x n− x +1 x ≤ np + p
(1)
Решая второе неравенство (1), получим x ≥ np − q
Таким образом, частота, имеющая наибольшую вероятность (чем вероятнейшая частота), определяется двойным неравенством np − q ≤ x ≤ np + p
Если np + p – целое число (тогда и np – q – целое число), то две частоты: x=np – q и 1x=np + p обладают наибольшей вероятностью. Например, при n = 7; p = , наивероятнейшие частоты: x = 3; x = 4. 2
Случайная величина, распределенная по закону Бернулли. При двух заданных числах: 1) n - количестве повторных независимых испытаний, 2) p - вероятности события A в одном испытании можно по формуле Бернулли подсчитать значение вероятности каждого целого числа x (0 ≤ x ≤ n) , где x – число появлений события A в n испытаниях (частота появления события A). Таким
образом,
каждому
исходу
случайного
эксперимента,
заключающегося в серии из n испытаний по схеме Бернулли, соответствует определенное
число
x,
рассматриваемое
как
случайная
величина,
принимающая значения 0, 1, 2,...n. Соответствие между значениями x и их вероятностями (рассчитанными по формуле Бернулли) называется законом распределения Бернулли. Строгое определение случайной величины и закона распределения будет дано позже. Можно
построить
график
закона
распределения Бернулли (зависимости Pn ( x) ) для конкретных значений n и p. Так как аргумент x принимает
лишь
целые
значения,
график
представляется в виде точек на плоскости
( x, Pn ( x)) .
Для наглядности точки соединяются
ломаной линией, и такой график называется полигоном распределения.
При рисунке
p = 0,5 ,
9,
как
полигон
показано
на
симметричен
относительно прямой x=np (если p близко к
0,5,
то
полигон
близок
к
симметричному) При
малых
p
полигон
существенно
асимметричен,
и
наивероятнейшими являются частоты, бизкие к нулю. На рисунке 10 изображен полигон распределения для p=0,2 при числе испытаний n,равном 6-ти.
При больших p, близких к 1, наиболее вероятны максимальные значения. На рисунке 11 показан полигон распределения, для p=0,8 и n=6. О
других
свойствах
бернуллиевского
распределения будет говориться позже.
Асимптотические формулы для формулы Бернулли. В практических задачах часто приходится вычислять вероятности различных событий, связанных с числом успехов в n испытаниях при больших значениях n. В этих случаях вычисления по формуле по формуле Бернулли становятся затруднительными. Трудности возрастают, когда приходится суммировать вероятности Pn ( x) . К суммированию сводится вычисление вероятностей событий вида k ≤ x≤ l, как, например, в такой задаче: Проводится 70 испытаний по схеме Бернулли с вероятностью появления события А в одном испытании, равной 0,4. Найти вероятность того, что событие А произойдет от 25 до 35 раз, то есть найти Pn(25≤ x ≤ 35).
В отдельных случаях при больших n удается заменить формулу Бернулли приближенными формулами. Такие формулы, которые получаются при условии n → ∞ называются асимптотическими. Если n достаточно велико, а p - величина очень малая, для формулы Бернулли имеет место приближенная (асимптотическая) формула
Pn ( x) = c p q x n
x n− x
λx − λ ≈ e x!
Здесь λ = np ( λ - греческая буква "лямбда"). Эта формула называется формулой Пуассона. По формуле Пуассона вычисляются вероятности числа появлений очень редких событий в массовых испытаниях. Задача. Телефонная станция обслуживает 1000 абонентов. В течение часа любой абонент независимо от остальных может сделать вызов с вероятностью 0,05. Требуется найти вероятность того, что в течение часа было не более 7 вызовов. Здесь λ = np = 5. Пусть x - число вызовов. Нас интересуют значения x, равные 0, 1, K ,7.
50 −5 P(0) = e ; 0!
5 −1 57 −7 P(1) = e ; K P(7) = e 7! 1!
−5 ⎛
52 53 54 55 56 57 ⎞ ⎟ ≈ 0,867 P(0 ≤ x ≤ 7) = e ⎜1 + 5 + + + + + + 2 6 24 120 720 5040⎠ ⎝ Если n достаточно велико, p не сильно отличается от 0,5, имеет место формула Муавра-Лапласа, иногда называемая локальной формулой Лапласа. Pn ( x) = cnx p x qn − x =
1 e 2πnpq
−t 2 2
,
где t =
x − np npq
Из формулы видно, что одинаковые отклонения от величины np вправо и влево здесь имеют одинаковые вероятности. В формуле Бернулли это имеет место лишь при p=0.5. Чтобы определить вероятность того, что в 50 испытаниях по схеме Бернулли при p=0.45 событие А наступило 30 раз, нужно воспользоваться таблицей значений функции y = ex . Часто встречаются таблицы значений так называемой "локальной" функции Лапласа.
y=
1 2π
−t 2 e 2
Если n достаточно велико, а p не сильно отличается от 0,5, имеет место интегральная формула Лапласа: m2
Pn ( m1 ≤ x ≤ m2 ) = ∑ cnx p xqn − x = Φ ( β ) − Φ (α ) x = m1
x2 − pn ; npq
x1 − np ; npq
− u2 t ∫ e 2 du
1 — 2π 0 Лапласа, значения которой определяются из таблиц. Для вычислений используются свойства функции Лапласа 1) Φ (0) = 0
Здесь
β=
α =
Φ (t ) =
функция
2) Φ (∞) = 0,5
3) Φ ( − t ) = −Φ (t ).
При t=3,5 Φ (t ) = 0,499767, и так как Φ (t ) - монотонно возрастающая функция, в практических расчетах при t > 3,5 можно принимать Φ (t ) = 0,5 . Задача. Игральную кость бросают 800 раз. Какова вероятность того, что число очков, кратное 3, выпадает не менее 280 и не более 294 раз? 2 1 Здесь n = 800; p = ; q = 3 3
Дискретные случайные величины. Часто результатом случайного эксперимента является число. Например, можно подбросить игральную кость и получить одно из чисел: 1,2,3,4,5,6. Можно подъехать к бензоколонке и обнаружить определённое число автомашин в очереди. Можно выстрелить из пушки и измерить расстояние от места выстрела до места падения снаряда. В таких случаях будем говорить, что имеем дело со случайной величиной.
Каждому исходу случайного эксперимента поставим в соответствие единственное число xk — значение случайной величины. Тогда естественно рассматривать случайную величину как функцию, заданную на множестве исходов случайного эксперимента. Случайная величина, которая может принимать лишь конечное или счётное число значений, называется дискретной. Случайные величины будем обозначать буквами греческого алфавита: ξ (кси), η (эта), … Значения случайной величины будем записывать в виде конечной или бесконечной последовательности x1, x2,…, xn,… Если говорится, что задана случайная величина ξ, это значит, что каждому исходу ωk случайного эксперимента поставлено в соответствие единственное число xk, что записывается в виде равенства xk = ξ(ωk). Некоторые из значений xk могут совпадать, то есть различным исходам ω может соответствовать одно и то же число x. Если все значения случайной величины совпадают, то будем говорить, что случайная величина постоянна. Пусть Аk — множество всех элементарных исходов, каждому из которых соответствует значение xk (k = 1,2,…,n) случайной величины ξ. Этот факт можно записать в виде формулы
Ak =
U ωi
i : ξ (ω i ) = x k
Таким образом, Аk – это событие (строго говоря, это верно лишь в случае конечного или счётного числа исходов). Для каждого события Аk определим число рk ≥ 0, равное вероятности этого события: рk = P(Ak). Очевидно, что n
n
k =1
i =1
U Ak = Ω , Ai∩Aj = ∅ (i,j = 1,2,…,n, i≠j), ∑ pk = 1.
Теперь каждому значению xk случайной величины ξ можно поставить в соответствие вероятность рk = P(Ak) события Аk. Если такое соответствие определено то будем говорить, что задан закон распределения дискретной случайной величины ξ. Обычно закон распределения дискретной случайной величины представляется в виде таблицы
ξ
х1
х2
х3
…
хn
P
p1
p2
p3
…
pn
(1)
В дальнейшем для краткости будем называть величину pi вероятностью значения хi случайной величины. Отметим, что закон распределения содержит всю информацию о случайной величине, и задать случайную величину можно, просто представив её закон распределения.
Пусть две случайные величины
ξ = {x1,x2,…,xn}; η = {у1, у2,…,уm}
(2)
определены на одном и том же пространстве элементарных исходов. Если Аi (i = 1,2,…,n) – событие, объединяющее все исходы, приводящие к значению
хi случайной величины ξ, а Вj (j = 1,2,…,m) – событие, объединяющее все исходы, приводящие к значению уi случайной величины η, то можно случайную величину ζ = ξ + η, которая принимает все возможные значения zij = xi + yj. Каждому такому значению zij случайной величины ζ ставится в соответствие вероятность pij , равная вероятности определить
пересечения событий Аi и Вj:
pij = P(Ai∩Bj). Таким образом определяется закон распределения суммы двух случайных величин. Также можно определить законы распределения разности ξ – η, ξ произведения ξη и частного случайных величин (последний лишь в η случае, если η не принимает нулевого значения). Две случайные величины
ξ = {x1,x2,…,xn}; η = {у1, у2,…,уm}, определённые на одном и том же пространстве элементарных исходов, имеющие законы распределения
ξ Р
х1 p11
… …
xi p1i
… …
η Р
y1 p12
… …
yj p 2j
… …
называются независимыми, если при любых i и j выполняется равенство
Р((ξ = хi)
∩ (η = yj)) =
p1i p 2j
Пример1. Брошены две игральных кости. Число очков, выпавшее на первой кости, – случайная величина ξ. Число очков, выпавшее на второй кости – случайная величина η. Считаем, что все исходы ((ξ = i)∩(η = j)) (i = 1,2,…,6; j = 1,2, …,6) равновероятны, всего их 36, поэтому
P((ξ = i)∩(η = j)) =
1 36
1 1 и P(η = j)) = , очевидно, что по определению ξ и η – 6 6 независимые случайные величины.
Так как P(ξ = i) =
Пример 2. Даны две независимые случайные величины ξ и η с заданными законами распределения 1 1 2 0 η ξ 1 2 1 3 Р Р 3 3 4 4 Определим случайные величины α и β следующим образом: α = ξ + η, β = ξη. Выясним, являются ли независимыми случайные величины α и β. Составим закон распределения α. Наименьшее значение α равняется 1. Вероятность события α = 1 равна вероятности события (ξ = 0)∩(η = 1), 1 1 1 которая в силу независимости ξ и η равна ⋅ = . Событие α = 2 3 4 12 совпадает с событием ((ξ = 0)∩(η = 2)) U ((ξ = 1)∩(η = 1)). Его вероятность равна 1 3 2 1 5 ⋅ + ⋅ = . 3 4 3 4 12
1 . Таким образом, 2 закон распределения случайной величины α можно представить таблицей 2 3 1 α 1 5 6 Р 12 12 12 Закон распределения β представляется таблицей 1 2 0 β 1 5 1 Р 3 12 2 Рассмотрим события α = 3 и β = 0. Очевидно, что Максимальное значение α, равное 3, имеет вероятность
Р(α = 3) Р(β = 0) =
1 1 1 ⋅ = 2 3 6
С другой стороны, событие (α = 3)∩(β = 0)
–
невозможное, так как α = 3 только при ξ = 1, а β = 0 лишь при ξ = 0. Отсюда следует, что
Р((α = 3)∩(β = 0)) = 0, и теперь ясно, что, по крайней мере, в одном случае условие определения независимости для случайных величин α и β не выполняется. Отсюда следует, что эти случайные величины зависимы. Математическое ожидание случайной величины. Пусть задан закон распределения случайной величины ξ. х2 х3 … хn ξ х1 P Математическое
p1
p2
ожидание
…
p3 Мξ
(или
М(ξ))
pn случайной
величины
ξ
определяется формулой n
Mξ = ∑ xi pi i =1
Рассмотрим пример. Пусть в некотором магазине, торгующем электробытовой техникой, получены статистические данные о числе проданных холодильников в каждый день месяца (условно считаем, что месяц состоит из 30 рабочих дней). Эти данные собраны в таблицу Количество проданных холодильников
0
1
2
3
4
5
Число дней, в которые было продано столько холодильников
3
7
8
9
2
1
По этой таблице легко подсчитать число холодильников, проданных в магазине за месяц: 0*1+1*7+2*8+3*9+4*2+5*1 = 63. Чтобы подсчитать среднее число холодильников, продававшихся в один день месяца, нужно эту сумму разделить на 30, в результате получим 2,1. Если в приведенной таблице каждое число второй строки поделить на 30, то получится последовательность дробей 1 7 4 3 1 1 ; ; ; ; ; , 10 30 15 10 15 30 каждая из которых представляет собой так называемую относительную частоту, с которой в данный месяц появлялся приведенный в верхней строке
объём продаж. Очевидно, что если просуммировать все произведения чисел, стоящих в первой строке таблицы, на их относительные частоты, то получится то же среднее число продававшихся в один день холодильников: 0⋅
1 7 4 3 1 1 + 1 ⋅ + 2 ⋅ + 3 ⋅ + 4 ⋅ + 5 ⋅ = 2,1 10 30 15 10 15 30
Если бы в последней формуле относительные частоты рассчитывались не для одного месяца, а для существенно большего срока, то при некоторых условиях (например, при отсутствии кризисных явлений, существенно влияющих на спрос населения на дорогостоящие товары) эти относительные частоты можно было бы считать довольно близкими к вероятностям соответствующих значений объёма продаж. Таким образом, приходим к выводу, что математическое ожидание случайной величины – это в некотором смысле её среднее значение. Следует отметить, что случайная величина может вообще не принимать значения, равного её математическому ожиданию. Так, например, случайная величина, принимающая только значения 1 и –1, каждое – с вероятностью 0,5, имеет математическое ожидание, равное нулю. Пример. Найти математическое ожидание случайной величины, заданной законом распределения 1 0 ξ p q Р Здесь p + q = 1. Mξ = 1⋅р + 0⋅q = р Свойства математического ожидания. 1. Если случайная величина ξ принимает одно и то же значение при всех исходах случайного эксперимента, то есть ξ ≡ С, то её математическое ожидание равно С. 2. Если Мξ = а, и k – константа, то М(kξ) = kMξ (математическое ожидание случайной величины, умноженной на число, равно математическому ожиданию случайной величины, умноженному на это число). 3. Если Мξ = а, и k – константа, то М(k + ξ) = k + Mξ (математическое ожидание суммы случайной величины и числа равно сумме этого числа и математического ожидания случайной величины).
Выведем формулу для математического ожидания суммы двух случайных величин ξ и η, определённых на одном и том же пространстве элементарных исходов и заданных законами распределения ξ Р М(ξ + η)
х1 p11 =
… …
η Р
xn p1n
y1 p12
… …
yk pk2
(х1 + у1)Р((ξ = х1) ∩ (η = у1))+ (х2 + у1)Р((ξ = х2) ∩ (η = у1)) +…
+(хi + уj)Р((ξ = хi) ∩ (η = уj)) + … + (хn + уk)Р((ξ = хn) ∩ (η = уk))
Очевидно, что сумма в правой части последней формулы содержит nk слагаемых. Преобразуем эту сумму следующим образом: М(ξ + η) = х1 Р((ξ=х1)∩(η=у1)) + х1 Р((ξ=х1)∩(η=у2)) +…+х1 Р((ξ=х1)∩(η=уk)) + + х2Р((ξ=х2)∩(η=у1)) + х2Р((ξ=х2)∩(η=у2)) +… + х2Р((ξ=х2)∩(η=уk)) + … + хnР((ξ=хn)∩(η=у1)) + хnР((ξ=хn)∩(η=у2)) +… + хnР((ξ=хn)∩(η=уk)) + + у1Р((ξ=х1)∩(η=у1)) + у1Р((ξ=х2)∩(η=у1)) +… + у1Р((ξ=хn)∩(η=у1)) + + у2Р((ξ=х1)∩(η=у2)) + у2Р((ξ=х2)∩(η=у2)) +… + у2Р((ξ=хn)∩(η=у2)) + … + уkР((ξ=х1)∩(η=уk)) + уkР((ξ=х2)∩(η=уk)) +… + уkР((ξ=хn)∩(η=уk)) = = х1(Р((ξ=х1)∩(η=у1)) + Р((ξ=х1)∩(η=у2)) +… + Р((ξ=х1)∩(η=уk))) + + х2(Р((ξ=х2)∩(η=у1)) + Р((ξ=х2)∩(η=у2)) +… + Р((ξ=х2)∩(η=уk))) +… + + хn(Р((ξ=хn)∩(η=у1)) + Р((ξ=хn)∩(η=у2)) +… + Р((ξ=хn)∩(η=уk))) + + у1(Р((ξ=х1)∩(η=у1)) + Р((ξ=х2)∩(η=у1)) +… + Р((ξ=хn)∩(η=у1))) + + у2(Р((ξ=х1)∩(η=у2)) + Р((ξ=х2)∩(η=у2)) +… + Р((ξ=хn)∩(η=у2))) + … + уk(Р((ξ=х1)∩(η=уk)) + Р((ξ=х2)∩(η=уk)) +… + Р((ξ=хn)∩(η=уk))) = = х1Р(ξ=х1) + х2Р(ξ=х2) +…+ хn Р(ξ=хn) + + у1Р(η=у1) + у2Р(η=у2) +…+ у1Р(η=у1) = Mξ + Mη При выводе этой формулы использован очевидный факт, что, например, событие ξ=х1 можно представить в виде объединения несовместных событий (ξ=х1)∩(η=у1), (ξ=х1)∩(η=у2), …, (ξ=х1)∩(η=уn). Пример.
Заданы n одинаково распределённых случайных величин ξ1, ξ2, …, ξn с законом распределения 1 0 ξi P
p
q
Найти математическое ожидание суммы этих случайных величин. Решение.
n
M( ∑ ξi ) = i =1
n
∑ Mξi = np
i =1
Теорема. Если случайные величины ξ и η независимы, то М(ξη) = Мξ⋅Мη Доказательство. Если заданы законы распределения двух независимых случайных величин ξ и η х1 y1 ξ η … xi … yj … xn … yk Р
p11
…
…
p1i
Р
p1n
p12
…
p2j
…
pk2
то математическое ожидание произведения этих случайных величин можно представить следующим образом: М(ξη) =
n
k
∑ ∑ хi y j pi1 p 2j
=
i =1 j =1
=
=
х1 p11
k
∑
j =1
х1 p11 Mη
y j p 2j
1 +х2 p2
k
∑
j =1
y j p 2j
+…+
хi p1i
k
∑
j =1
y j p 2j
…+
хn p1n
k
∑ y j p 2j
=
j =1
n
1 + х2 p2 Mη + …+ хi p1i Mη…+ хn p1n Mη = Mη ∑ xi pi = Мξ⋅Мη i =1
Дисперсия случайной величины. Дисперсия Dξ случайной величины ξ определяется формулой Dξ = M(ξ – Mξ)2 Дисперсия случайной величины — это математическое ожидание квадрата отклонения случайной величины от её математического ожидания. Рассмотрим случайную величину ξ с законом распределения 1 2 3 ξ 1 1 1 Р 6 2 3 Вычислим её математическое ожидание. Mξ = 1⋅ 1 + 2⋅ 1 + 3⋅ 1 = 13 6 2 3 6
Составим закон распределения случайной величины ξ – Mξ ξ– Mξ
5 −7 −1 6 6 6 1 1 1 Р 6 2 3 а затем закон распределения случайной величины (ξ – Mξ)2 25 49 1 (ξ– Mξ)2 36 36 36 1 1 1 Р 2 3 6 Теперь можно рассчитать величину Dξ :
Dξ =
1 1 25 1 49 1 17 ⋅ + ⋅ + ⋅ = 36 2 36 3 36 6 36
Используя определение дисперсии, для дискретной случайной величины формулу вычисления дисперсии можно представить в таком виде: Dξ =
n
∑ (xi − Mξ )
2
i =1
pi
Можно вывести ещё одну формулу для вычисления дисперсии: Dξ =
n
∑ (xi − Mξ )
2
i =1
=
n
(
)
pi = ∑ xi 2 − 2 xi Mξ + M 2 ξ pi = i =1
n
n
n
i =1
i =1
i =1
2 ∑ xi pi − 2Mξ ∑ xi pi + M 2ξ∑ pi = Mξ 2 − 2Mξ ⋅ Mξ + M 2 ξ =
= Mξ2 – M2ξ Таким образом, дисперсия случайной величины равна разности математического ожидания квадрата случайной величины и квадрата её математического ожидания. Пример. Найти дисперсию распределения
случайной ξ Р
1 p
величины,
заданной
законом
0 q
Выше было показано, что Mξ = р. Легко видеть, что Mξ2 = р. Таким образом, получается, что Dξ = р – р2 = pq.
Дисперсия характеризует степень рассеяния значений случайной величины относительно её математического ожидания. Если все значения случайной величины тесно сконцентрированы около её математического ожидания и большие отклонения от математического ожидания маловероятны, то такая случайная величина имеет малую дисперсию. Если значения случайной величины рассеяны и велика вероятность больших отклонений от математического ожидания, то такая случайная величина имеет большую дисперсию. Свойства дисперсии. 1. Если k – число, то D(kξ) = k2 Dξ. Доказательство. D(kξ) = M(kξ – M(kξ))2 = M(kξ – k Mξ)2 = M(k2 (ξ – Mξ)2) = k2M(ξ – Mξ)2 = = k2 Dξ 2. Для попарно независимых случайных величин ξ1, ξ2,…, ξn справедливо равенство n
n
i =1
i =1
D ∑ ξ i = ∑ Dξ i Это свойство оставим без доказательства. рассмотреть следующий пример.
Рекомендуем
читателю
Пусть ξ и η – независимые случайные величины с заданными законами распределения: ξ Р
0 0,25
η Р
1 0,75
1 0,7
2 0,7
Показать, что D(ξ + η) = Dξ + Dη.
Биномиальный закон распределения. Пусть заданы числа n ∈ N и p (0≤ p ≤ 1). Тогда каждому целому числу из промежутка [0; n] можно поставить в соответствие вероятность, рассчитанную по формуле Бернулли. Получим закон распределения случайной величины (назовём её β) β
0
…
k
…
n
Р
…
…
C nk p k (1 − p ) n − k
…
…
Будем говорить, что случайная величина β распределена по закону Бернулли. Такой случайной величиной является частота появления события А в n повторных независимых испытаниях, если в каждом испытании событие А происходит с вероятностью p. Рассмотрим отдельное i-е испытание. Пространство элементарных исходов для него имеет вид Ω = {A, A}
Определим на этом пространстве случайную величину ξi следующим образом: ξi = 1, если происходит событие А; ξi = 0, если происходит событие A Закон распределения случайной величины ξi рассматривался в предыдущем параграфе. 1 0 ξi q = 1–p Р p Mξ = ⋅р; Dξ = рq Для i = 1,2,…,n получаем систему из n независимых случайных величин ξi, имеющих одинаковые законы распределения. Если теперь сравнить законы распределения двух случайных величин β и
n
∑ ξi ,
то можно сделать
i =1
очевидный вывод: β =
n
∑ ξi . Отсюда следует, что для случайной величины β,
i =1
имеющей закон распределения Бернулли, математическое ожидание и дисперсия определяются формулами n
Mβ = M ∑ ξ i =
n
∑ Mξ i =
n
∑ p = np;
i =1
i =1
i =1
n
n
n
i =1
i =1
Dβ = D ∑ ξ i = i =1
∑ Dξ i = ∑ pq = npq
Найдём оценку величины р — вероятности успеха в одном испытании некоторого биномиального эксперимента. Для этого проведём n испытаний и подсчитаем *х – xчисло успехов. Оценку р* неизвестной величины р определим формулой р = . n Пример.
Из 20 отобранных для контроля образцов продукции 4 оказались нестандартными. Оценим вероятность того, что случайно выбранный экземпляр продукции не отвечает стандарту отношением р* = 4/20 = 0,2. Так как х случайная величина, р* – тоже случайная величина. Значения * р могут меняться от одного эксперимента к другому (в рассматриваемом случае экспериментом является случайный отбор и контроль 20-ти экземпляров продукции). Каково математическое ожидание р*? Поскольку х есть случайная величина, обозначающая число успехов в n испытаниях по схеме Бернулли, Мx = np. Для математического ⎛ x ⎞ожидания случайной величины р* по определению получаем: Mp* = M ⎜ ⎟ , но n здесь является константой, поэтому по свойству математического ожидания ⎝n⎠ Mp* =
1 1 Mx = np = p n n
Таким образом, “в среднем” получается истинное значение р, чего и следовало ожидать. Это свойство оценки р* величины р имеет название: р* является несмещённой оценкой для р. Отсутствие систематического отклонения от величины оцениваемого параметра р подтверждает целесообразность использования величины р* в качестве оценки.
Непрерывные случайные величины. Случайная величина, значения промежуток, называется непрерывной.
которой
заполняют
некоторый
В частных случаях это может быть не один промежуток, а объединение нескольких промежутков. Промежутки могут быть конечными, полубесконечными или бесконечными, например: (a; b], (–∝ ; a), [b;∝), (–∝; ∝). Вообще непрерывная случайная величина – это абстракция. Снаряд, выпущенный из пушки, может пролететь любое расстояние, скажем, от 5 до 5,3 километров, но никому не придёт в голову измерять эту величину с точностью до 0,0000001 километра (то есть до миллиметра), не говоря уже об абсолютной точности. В практике такое расстояние будет дискретной случайной величиной, у которой одно значение от другого отличается по крайней мере на 1 метр. При описании непрерывной случайной величины принципиально невозможно выписать и занумеровать все её значения, принадлежащие даже достаточно узкому интервалу. Эти значения образуют несчётное множество, называемое «континуум». Если ξ – непрерывная случайная величина, то равенство ξ = х представляет собой, как и в случае дискретной случайной величины,
некоторое случайное событие, но для непрерывной случайной величины это событие можно связать лишь с вероятностью, равной нулю, что однако не влечёт за собой невозможности события. Так например, можно говорить, что только с вероятностью «нуль» снаряд пролетит 5245,7183 метра, или что отклонение действительного размера детали от номинального составит 0,001059 миллиметра. В этих случаях практически невозможно установить, произошло событие или нет, так как измерения величин проводятся с ограниченной точностью, и в качестве результата измерения можно фактически указать лишь границы более или менее узкого интервала, внутри которого находится измеренное значение. Значениям непрерывной случайной величины присуща некоторая неопределенность. Например, нет практического смысла различать два отклонения от номинального размера, равные 0,5 мм и 0,5000025 мм. Вероятность, отличная от нуля, может быть связана только с попаданием величины в заданный, хотя бы и весьма узкий, интервал. Здесь можно привести сравнение с распределением массы вдоль стержня. Отсутствует масса, сосредоточенная, скажем, в сечении, расположенном на расстоянии 20 см от левого конца стержня, имеет смысл говорить лишь о массе, заключённой между сечениями, проходящими через концы некоторого промежутка. Пусть ξ – непрерывная случайная величина. Рассмотрим для некоторого числа х вероятность неравенства х < ξ < х + Δх P(х < ξ < х + Δх). Здесь Δх – величина малого интервала. Очевидно, что если Δх → 0, то P(х < ξ < х + Δх) → 0. Обозначим р(х) предел отношения P(х < ξ < х + Δх) к при Δх → 0, если такой предел существует:
P( x < ξ < x + Δx) = p( x) Δx Δx → 0
lim
(1)
Функция р(х) называется плотностью распределения случайной величины. Из формулы (1) следует равенство, справедливое для малых величин Δх, которое также можно считать определением функции р(х):
P(х < ξ < х + Δх) ≅ p(x)Δх Очевидно,
что
p(x)
–
неотрицательная
функция.
(2) Для
определения
вероятности того, что случайная величина ξ примет значение из промежутка [a, b] конечной длины, нужно выбрать на промежутке произвольные числа x1, х2,…, хn удовлетворяющие условию а=х0<х1<x2<…<xn
и составим сумму ∑ p( xi )Δxi . Рассмотрим процесс, при котором число точек разбиения неограниченно возрастает таким образом, что максимальная i =1 величина Δхi стремится к нулю. Будем считатьn функцию p(x) непрерывной на промежутке (а; b), тогда пределом суммы ∑ p( xi )Δxi будет определённый интеграл по промежутку [a; b] от функции p(x), равный искомой i =1 вероятности: P(a ≤ ξ ≤ b) =
b
∫ p(x )dx
(3)
a
Это равенство можно также рассматривать как определение функции р(х). Отсюда следует, что вероятность попадания случайной величины в любой интервал (х1, х2) равна площади фигуры, образованной отрезком [х1, х2] оси х, графиком функции р(х) и
p(x)
вертикальными прямыми х = х1, х = х2, как x1
x2
x
изображено на рисунке 1. Если все возможные значения Рис. 1 случайной величины принадлежат интервалу (а; b), то для р(х) – её плотности распределения справедливо равенство b
∫ p( x)dx = 1
a
Для удобства иногда считают функцию р(х) определённой для всех значений х, полагая её равной нулю в тех точках х, которые не являются возможными значениями этой случайной величины.
Плотностью распределения может служить любая интегрируемая функция р(х), удовлетворяющая двум условиям: ∞ ≥ 0; 1) р(х) 2) ∫ p ( x)dx = 1 Можно − ∞задавать случайную величину, задавая функцию р(х), удовлетворяющую этим условиям. В качестве примера рассмотрим случайную величину ξ, равномерно распределённую на промежутке [a; b]. В этом случае р(х) постоянна внутри этого промежутка:
⎧c a ≤ x ≤ b p( x) = ⎨ ⎩0 x < a; x > b По свойству 2) функции р(х) ∞
b
−∞
a
∫ p( x)dx = ∫ cdx = c(b − a) = 1 p(x)
Отсюда находится с; график изображён на 1 рис.2. c= b-a Во многих практических задачах встречаются случайные величины, у которых возможные значения не ограничены сверху и снизу. В этом Рис. 2 случае кривая распределения располагается над осью х и при х → ∞ и х → – ∞ асимптотически приближается к этой оси, как изображено на рисунке 1. Вероятность того,
что случайная величина ξ примет значение, меньшее некоторого числа а, равна площади фигуры, заключённой между кривой распределения и горизонтальной координатной осью слева от точки а. Будем считать, что такая площадь существует. Пусть ξ – непрерывная случайная величина. Функция F(x), которая определяется равенством F ( x ) = P (ξ ≤ x ) , называется интегральной функцией распределения или просто функцией распределения случайной xвеличины ξ. Непосредственно из определения следует равенство F ( x) = ∫ p (t )dt . Формула производной определённого интеграла по верхнему пределу в данном случае приводит к соотношению −∞ F ′( x) = p ( x ) . Плотность распределения р(х) называют дифференциальной функцией распределения.
x
Функция распределения F(x) случайной величины ξ имеет следующие свойства. 1. F(x) — непрерывная возрастающая функция. 2. lim F ( x) = 0 ; lim F ( x) = 1 x → −∞ x →∞ Свойства 1 и 2 вытекают непосредственно из определения функции F(x). 3. Приращение F(x) на промежутке (х1; х2) равно вероятности того, что случайная величина ξ принимает значение из этого промежутка: F(x2) – F(x1) = P(x1 < ξ ≤ x2) Доказательство. F(x2) = P(ξ ≤ x2) = P(ξ ≤ x1) + P(x1 < ξ ≤ x2) = F(x1) + P(x1 < ξ ≤ x2) Отсюда P(x1 < ξ ≤ x2) = F(x2) – F(x1) Заметим, что для непрерывной случайной величины ξ справедливы равенства P(x1 < ξ ≤ x2) = P(x1 < ξ < x2) = P(x1 ≤ ξ < x2) = P(x1 ≤ ξ ≤ x2) Для равномерного распределения функция F(x) имеет вид:
при x ≤ a ⎧0 x ⎪⎪ dt x−a = F ( x) = ⎨∫ при a < x < b − − b a b a ⎪a ⎪⎩1 при x ≥ b
1
a
График функции F(x) представлен на рисунке 3. Закон распределения непрерывной случайной Рис. 3 величины можно определить заданием либо функции р(х), либо функции F(x).
b
Правило 3-х σ (трех “сигм”). Пусть имеется нормально распределённая случайная величина ξ с математическим ожиданием, равным а и дисперсией σ2. Определим вероятность попадания ξ в интервал (а – 3σ; а + 3σ), то есть вероятность того, что ξ принимает значения, отличающиеся от математического ожидания не более, чем на три среднеквадратических отклонения. P(а – 3σ< ξ < а + 3σ)=Ф(3) – Ф(–3)=2Ф(3)
x
По таблице находим Ф(3)=0,49865, откуда следует, что 2Ф(3) практически равняется единице. Таким образом, можно сделать важный вывод: нормальная случайная величина принимает значения, отклоняющиеся от ее математического ожидания не более чем на 3σ. (Выбор числа 3 здесь условен и никак не обосновывается: можно было выбрать 2,8, 2,9 или 3,2 и получить тот же вероятностный результат. Учитывая, что Ф(2)=0,477, можно было бы говорить и о правиле 2–х “сигм”.)
Совместное распределение двух случайных величин. Пусть пространство элементарных исходов Ω случайного эксперимента таково, что каждому исходу ωij ставится в соответствие значение случайной величины ξ, равное xi и значение случайной величины η, равное yj. Примеры: 1. Представим себе большую совокупность деталей, имеющих вид стержня. Случайный эксперимент заключается в случайном выборе одного стержня. Этот стержень имеет длину, которую будем обозначать ξ и толщину—η (можно указать другие параметры— объем, вес, чистота обработки, выраженная в стандартных единицах). 2. Если результат эксперимента—случайный выбор какого–либо предприятия в данной области, то за ξ можно принимать объем производства отнесенный к количеству сотрудников, а за η—объем продукции, идущей на экспорт, тоже отнесенной к числу сотрудников. В этом случае мы можем говорить о совместном распределении случайных величин ξ и η или о “двумерной” случайной величине. Если ξ и η дискретны и принимают конечное число значений (ξ – n значений, а η – k значений), то закон совместного распределения случайных величин ξ и η можно задать, если каждой паре чисел xi, yj (где xi принадлежит множеству значений ξ, а y
j
—множеству значений η) поставить в
соответствие вероятность pij, равную вероятности события, объединяющего все исходы ωij (и состоящего лишь из этих исходов), которые приводят к значениям ξ = xi; η = y j. Такой закон распределения можно задать в виде таблицы: η ξ
y1
y2
…
yj
…
yk
x1
… xi
… xn
р11
р12
…
р1j
…
р1k
P1
…
…
…
…
…
…
…
рi1
рi2
…
рij
…
рik
Pi
…
…
…
…
…
…
…
рn1
рn2
…
рnj
…
рnk
Pn
P1
P2
…
Pj
…
Pk
…
n
Очевидно
(*)
k
j ∑ ∑ pi = 1
i =1 j =1
Если просуммировать все рij в i–й строке, то получим k
j ∑ pi = Pi
j =1
вероятность того, что случайная величина ξ примет значение xi. Аналогично, если просуммировать все рij в j–м столбце, то получим n
j j ∑ pi = P
i =1
вероятность того, что η принимает значение y j. Соответствие xi → Pi (i = 1,2,…,n) определяет закон распределения ξ, также как соответствие yj → P j (j = 1,2,…,k) определяет закон распределения k случайной величины η.n j j M ξ = ∑ xi Pi M η = ∑ y P j =1 Очевидно , . i =1
Раньше мы говорили, что случайные величины ξ и η независимы, если pij=Pi⋅P j (i=1,2,…,n; j=1,2,…,k). Если это не выполняется, то ξ и η зависимы. В чем проявляется зависимость случайных величин ξ и η и как ее выявить из таблицы? Рассмотрим столбец y1. Каждому числу xi поставим в соответствие число pi1 pi/1= P1
(1)
которое будем называть условной вероятностью ξ= xi при η=y1. Обратите P( A I B) внимание на то, что это не вероятность Pi события ξ= xi, и сравните формулу P( A / B) = P( B) . (1) с уже известной формулой условной вероятности Соответствие xi→рi/1, (i=1,2,…,n) n будем называть условным распределением случайной величины ξ при η=y1. p ∑ i /1 = 1 Очевидно i = 1 .
Аналогичные условные законы распределения случайной величины ξ j n y2; y3,…, yn ,ставя i можно построить при всех остальных значениях η, pравных ∑ pi / j = 1 в соответствие числу xi условную вероятность p = Pj ( i = 1 ). i/j
В таблице приведён величины ξ при η=yj px11j Pj
ξ
pi/j
условный
px22j Pj
… …
закон
pxiij Pj
распределения
… …
случайной
pxnj Pj
Можно ввести понятие условного математического ожидания ξ при η = yj n
M (ξ / η = y j ) = ∑ xi i =1
pij P
j
=
1
P
j
n
∑ xi pi
j
i =1
Заметим, что ξ и η равноценны. Можно ввести условное распределение η при ξ=xi соответствием pij y → Pi j
(j = 1,2,…,k)
Также можно ввести понятие условного математического ожидания случайной величины η при ξ=xi : pij 1 k j j M ( η / ξ = xi ) = ∑ y = ∑ y pi Pi Pi j = 1 j =1 k
j
Из определения следует, что если ξ и η независимы, то все условные законы распределения одинаковы и совпадают с законом распределения ξ
(напоминаем, что закон распределения ξ определяется в таблице (*) первым и последним столбцом). При этом очевидно, совпадают все условные математические ожидания М(ξ/η = yj) при j = 1,2,…,k, которые равны Мξ. Если условные законы распределения ξ при различных значениях η различны, то говорят, что между ξ и η имеет место статистическая зависимость. Пример I. Пусть закон совместного распределения двух случайных величин ξ и η задан следующей таблицей. Здесь, как говорилось ранее, первый и последний столбцы определяют закон распределения случайной величины ξ, а первая и последняя строки – закон распределения случайной величины η. η
1
2
3
ξ 10
1/36
0
0
1/36
20
2/36
1/36
0
3/36
30
2/36
3/36
2/36
7/36
40
1/36
8/36
16/36
25/36
6/36
12/36
18/36
Полигоны условных распределений можно изобразить на трехмерном графике (рис. 1). Здесь явно просматривается зависимость условного закона распределения ξ от величины η. Пример II. (Уже встречавшийся). Пусть даны две независимые случайные величины ξ и η с законами распределения ξ
0
1
η
1
2
Р
1/3
2/3
Р
3/4
1/4
Найдем законы распределений случайных величин α=ξ+η и β=ξ∗η α
1
2
3
β
0
1
2
Р
3/12
7/12
2/12
Р
4/12
6/12
2/12
Построим таблицу закона совместного распределения α и β. β
0
1
2
α 1
3/12
0
0
3/12
2
1/12
6/12
0
7/12
3
0
0
2/12
2/12
4/12
6/12
2/12
Чтобы получить α=2 и β=0, нужно чтобы ξ приняла значение 0, а η приняла значение 2. Так как ξ и η независимы, то Р(α=2; β=0)= Р(ξ=0; η=2)=Р(ξ=0)∗Р(η=2)=1/12. Очевидно также Р(α=3; β=0)=0. Построим полигоны условных распределений. Здесь зависимость α от β довольно близка к функциональной: значению β=1 соответствует единственное α=2, значению β=2 соответствует единственное α=3, но при β=0 мы можем3говорить лишь, что α с вероятностью 4 принимает значение 1
1 и с вероятностью 4 – значение 2. Пример III. Рассмотрим закон совместного распределения ξ и η, заданный таблицей η ξ
0
1
2
1
1/30
3/30
2/30
1/5
2
3/30
9/30
6/30
3/5
3
1/30
3/30
2/30
1/5
1/6
3/6
2/6
В этом случае выполняется условие P(ξ=xi; η=yj)=P(ξ=xi)∗P(η=yj), i=1,2,3…; j=1,2,3,… Построим законы условных распределений pη=1 ( ξ) =ξpη= 2 ( ξ) =
1
2
3
= pη=3 ( ξ) = pη= 4 ( ξ)
1/5
3/5
1/5
Законы условных распределений не отличаются друг от друга при η=1,2,3 и совпадают с законом распределения случайной величины ξ. В данном случае ξ и η независимы. Характеристикой зависимости между случайными величинами ξ и η служит математическое ожидание произведения отклонений ξ и η от их центров распределений (так иногда называют математическое ожидание случайной величины), которое называется коэффициентом ковариации или просто ковариацией. cov(ξ; η) = M((ξ–Mξ)(η–Mη)) Пусть ξ = {x1, x2, x3,…, xn}, η = {y1, y2, y3,…,yn}. Тогда n
k
∑ ∑ ( xi − Mξ)( y j − Mη)P(( ξ = xi ) I( η = y j ))
cov(ξ; η)= i =1 j =1
(2)
Эту формулу можно интерпретировать так. Если при больших значениях ξ более вероятны большие значения η, а при малых значениях ξ более вероятны малые значения η, то в правой части формулы (2) положительные слагаемые доминируют, и ковариация принимает положительные значения. Если же более вероятны произведения (xi – Mξ)(yj – Mη), состоящие из сомножителей разного знака, то есть исходы случайного эксперимента, приводящие к большим значениям ξ в основном приводят к малым значениям η и наоборот, то ковариация принимает большие по модулю отрицательные значения.
В первом случае принято говорить о прямой связи: с ростом ξ случайная величина η имеет тенденцию к возрастанию. Во втором случае говорят об обратной связи: с ростом ξ случайная величина η имеет тенденцию к уменьшению или падению. Если примерно одинаковый вклад в сумму дают и положительные и отрицательные произведения (xi – Mξ)(yj – Mη)pij, то можно сказать, что в сумме они будут “гасить” друг друга и ковариация будет близка к нулю. В этом случае не просматривается зависимость одной случайной величины от другой. Легко показать, что если P((ξ = xi)∩(η = yj)) = P(ξ = xi)P(η = yj) (i = 1,2,…,n; j = 1,2,…,k), òî cov(ξ; η)= 0. Действительно из (2) следует n
k
(
)
(
)
∑ ∑ ( xi − Mξ) y j − Mη P(ξ = xi )P η = y j =
i =1 j =1
(
n
k
i =1
j =1
)(
)
= ∑ ( xi − Mξ)P(ξ = xi ) ⋅ ∑ y j − Mη P η = y j = = M ( ξ − Mξ ) M ( η − Mη) = 0 ⋅ 0 = 0
Здесь использовано очень важное свойство математического ожидания: математическое ожидание отклонения случайной величины от ее математического ожидания равно нулю. Доказательство (для дискретных случайных величин с конечным числом значений). n
n
n
i =1
i =1
i =1
M ( ξ − Mξ) = ∑ ( xi − Mξ) P( xi ) = ∑ xi P( xi ) − Mξ ∑ P( xi ) = Mξ − Mξ = 0
Ковариацию удобно представлять в виде cov(ξ; η)=M(ξη–ξMη–ηMξ+MξMη)=M(ξη)–M(ξMη)–M(ηMξ)+M(MξMη)= =M(ξη)–MηMξ–MξMη+MξMη=M(ξη)–MξMη Ковариация двух случайных величин равна математическому ожиданию их произведения минус произведение математических ожиданий.
Легко доказывается следующее свойство математического ожидания: если ξ и η—независимые случайные величины, то М(ξη)=МξМη. Таким образом, для независимых случайных величин ξ и η cov(ξ;η)=0.
Коэффициент корреляции. Величина
cov(ξ;η)
зависит
от
единиц
измерения,
в
которых
выражаются ξ и η. (Например, пусть ξ и η—линейные размеры некоторой детали. Если за единицу измерения принять 1 см, то cov(ξ;η) примет одно значение, а если за единицу измерения принять 1 мм, то cov(ξ;η) примет другое, большее значение (при условии cov(ξ;η)≠0)). Поэтому cov(ξ;η) неудобно принимать за показатель связи. Чтобы иметь дело с безразмерным показателем, рассмотрим случайные величины
ξ* =
ξ − Mξ ξ − Mξ η − Mη η − Mη = η* = = ση σξ ; Dξ Dη
Такие случайные величины называются отклонениями случайных величин ξ и η.
нормированными
Каждая из случайных величин ξ* и η* имеет центром (математическое ожидание) нуль и дисперсию, равную единице. Приведём доказательство для случайной величины ξ*.
⎛ ξ − Mξ ⎞ 1 1 ⎟⎟ = Mξ* = M ⎜⎜ Mξ − M ( Mξ)) = ( Mξ − Mξ) = 0 ( σ σ σ ⎠ ⎝ ξ ξ ξ ⎛ η − Mη⎞ Dη 1 ⎟⎟ = Dξ* = D⎜⎜ D η M η − = =1 ( ) 2 2 σ σξ ⎝ ⎠ σξ ξ
Ковариация ξ* и η* называется коэффициентом корреляции случайных величин ξ и η (обозначается ρξη).
⎛ ξ − Mξ η − Mη⎞ M (( ξ − Mξ)( η − Mη)) ⎟ = = cov( ξ, η) = ρξη = M ⎜⎜ ⋅ σ η ⎟⎠ σξσ η ⎝ σξ
=
cov( ξ; η) σξσ η
=
M (ξη) − MξMη σξσ η
;
σξ =
Dξ; σ η =
Dη.
Для независимых ξ и η ρξη=0, так как в этом случае cov(ξ;η)=0 Обратного заключения сделать нельзя. Случайные величины могут быть связаны даже функциональной зависимостью (каждому значению одной случайной величины соответствует единственное значение другой случайной величины), но коэффициент их корреляции будет равен нулю. Примеры: 1. Пусть случайная величина ξ симметрично распределена около нуля. Тогда Мξ=0. Пусть η=ξ2. Тогда М(ξ η)=М(ξ3)=0, так ξ3 тоже симметрично M (ξη) − MξMη распределена ρξη =около нуля. С другой = 0 стороны МξМη=0, так как Мξ=0. Таким σξσ η образом . 2. Пусть закон совместного распределения случайных величин ξ и η задан таблицей η
1
2
1
1/5
0
1/5
2
0
3/5
3/5
3
1/5
0
1/5
2/5
3/5
ξ
Проведём вычисления:
Mξ = 1 ⋅
1 3 1 2 3 8 + 2 ⋅ + 3 ⋅ = 2 Mη = 1 ⋅ + 2 ⋅ = ; 5 5 5 5 5 5;
1 3 1 16 + 2 ⋅ 2 ⋅ + 3⋅1⋅ = 5 5 5 5 ; Mξη − MξMη = 0 . Отсюда следует, что ρξη=0. При этом очевидно, что имеет место функциональная зависимость случайной величины η от случайной величины ξ. Коэффициент корреляции ρξη не меняет своей величины, если вместо случайной величины ξ рассматривать случайную величину ξ1=ξ+à или ξ2=kξ (à и Mξη = 1 ⋅ 1 ⋅
k—постоянные числа, k > 0), так как при перемене начала координат или при изменении масштаба величины ξ нормированное отклонение не меняется. Сказанное в равной мере относится и к η. Вставка! Полезно запомнить формулу D(ξ±η)=Dξ+Dη+2cov(ξ;η) Отсюда следует свойство дисперсии для независимых ξ и η: D(ξ±η)=Dξ+Dη Свойства коэффициента корреляции. –1≤ρξη≤1 1. 2. Если ρξη=1, то η=kξ+b, где k и b—константы, k>0. 3. Если ρξη= –1, то η= kξ+b, где k<0. 4. Если η=kξ+b, (k≠0) или ξ=k1η+b1, то ρξη=1 при k>0 ρξη= – 1 при k<0. Коэффициент корреляции ρξη достигает своих предельных значений –1 и 1 в том и только в том случае, если совместное распределение ξ и η все концентрируется на некоторой прямой в плоскости ξ; η, то есть между ξ и η имеется такая линейная зависимость. Если ⎢ρξη⎢<1, то такой линейной зависимости нет. Все же по мере приближения ⎢ρξη⎢ к единице совместное распределение ξ; η имеет тенденцию концентрироваться вблизи некоторой прямой линии и величину ⎢ρξη⎢ можно считать мерой близости к полной линейной зависимости между ξ и η. Пример. Рассчитаем коэффициент корреляции ρξη для случайных величин при заданном законе совместного распределения η
1
2
3
ξ 10
1/36
0
0
1/36
20
2/36
1/36
0
3/36
30
2/36
2/36
2/36
6/36
40
1/36
9/36
16/36
26/36
6/36 12/36 18/36 1 6 2⋅ 31 + 30 ⋅ 6 + 40 ⋅2 26 3≅ 35,83 2 Mξ = 10 ⋅ + 20 Dξ = (10 −3635,83) ⋅36 + (20 36 − 35,83) 36 ⋅ + (30 − 35,83) ⋅ + 12 36 18 6 36 36 Mη = 1 ⋅ + 2⋅ + 3⋅ ≅ 2,3 36 2 26 36 36 + (40 − 35,83) ⋅ ≅ 57,64 36
σξ ≅ 7,6 2 16 23) 2 ⋅ 12 + (31− 2,3) 2 ⋅ 182≅ 0,556 2 Dη = 1 − 2 , 3 ⋅ + 2 − 2 , ( ) ( M ( ξη) = 10 ⋅ 1 ⋅ 36+ 20 ⋅ 1 ⋅ + 20 ⋅2⋅ + 30 ⋅ 136 ⋅ + 30 ⋅ 2 ⋅ + 36 36 36 36 36 36 ση ≅ 0,7462 1 9 16 + 30 ⋅ 3 ⋅ + 40 ⋅ 1 ⋅ + 40 ⋅ 2 ⋅ + 40 ⋅ 3 ⋅ = 86,94 ⋅ 35,83 3686,94 − 2,336 36 36 ρξη = ≅ 0,8 7,6 ⋅ 0,746 Введем понятие корреляционной зависимости между ξ и η. Пусть задан закон совместного распределения двух случайных величин ξ и η (как в вышеприведенном примере), и условное математическое ожидание ξ меняется в зависимости от значения η. Тогда принято говорить о корреляционной зависимости ξ от η. Если условное математическое ожидание ξ есть линейная функция от η, то между ξ и η имеется линейная корреляционная связь или зависимость. Как правило, говоря о корреляционной зависимости, имеют в виду линейную корреляционную зависимость. Если имеется в виду нелинейная корреляционная зависимость, то это особо оговаривают. Можно дать определение корреляционной зависимости двух случайных величин ξ и η как связи между тенденциями роста ξ и η. Например, между ξ и η существует прямая корреляционная зависимость, если с ростом ξ случайная величина η имеет тенденцию возрастать. (Это означает, что при больших значениях ξ с большей вероятностью встречаются большие значения η). Если большим значениям ξ ñ большей вероятностью соответствуют меньшие значения η, то есть с ростом ξ случайная величина η имеет тенденцию убывать, говорят, что между ξ и η существует обратная корреляционная зависимость. Глубина (или теснота) корреляционной зависимости (или связи) характеризуется коэффициентом ρξη. Чем ближе ⎢ρξη ⎢ к единице, тем теснее глубина корреляционной зависимости. Чем ближе зависимость между условным математическим ожиданием ξ и случайной величиной η к линейной, и чем теснее значения ξ группируются около условных математических ожиданий, тем глубже (теснее) корреляционная связь. Можно говорить о совместном распределении двух непрерывных случайных величин. В большинстве случаев возможен переход от
непрерывных случайных величин к совместному распределению двух дискретных случайных величин следующим образом. Нужно разбить отрезок [a; b] изменения случайной величины ξ на равные отрезки [c0=a; c1]; [c1; c2]; [c2; c3],…,[cn-1; cn=b]. За значение случайной величины ξ принять середину каждого отрезка. Также надо поступить со случайной величиной η, разбив ее область значений [e; f] на равные отрезки [g0 = e; g1]; [g1; ge]…[gk-1; gk=f], и приняв за возможные значения η середины отрезков [gk-1; gk]. Таким образом мы получили дискретные случайные величины ξ*={x1; x2; …xn} и η*={y1; y2; …yk}, причем каждой паре (xi; yj) ставится в соответствие вероятность Pij = P((ξ∈[ci–1; ci])∩(η∈[gi–1; gi])) Таким образом мы придем к уже изученному материалу.
Распределение χ2.
Пусть имеется n независимых случайных величин ξ1, ξ2, ..., ξn, распределенных по нормальному закону с математическим ожиданием, равным и дисперсией, равной единице. Тогда случайная величина n нулю, 2 χ 2 = ∑ ξ i распределена по закону, который называется “распределение χ2” или “распределение Пирсона”. Очевидно, что она может принимать лишь i =1 неотрицательные значения. Число n называется числом степеней свободы. При n > 1 график плотности распределения случайной величины χ2 представляет собой кривую, изображенную на рисунке 1. Для того, чтобы определить вероятность попадания случайной величины χ2 в какой-либо промежуток из множества положительных чисел, пользуются таблицей распределения χ2. Обычно такая таблица позволяет q
0,99
0,975
0,95
...
0,1
0,05
0,01
...
2,71
3,84
6,63
n 1
0,0315 0,0398 0,0239
...
...
...
...
...
...
...
...
10
2,56
3,25
3,94
...
16,0
18,3
23,2
...
...
...
...
...
...
...
...
Таблица 1.
по вероятности q и по числу степеней свободы n определить так называемый квантиль χq2, если q и χq2 связаны соотношением
P(χ2 > χq2) = q. Эта формула означает: вероятность того, что случайная величина χ2 примет значение, большее чем определенное значение χq2, равна q. Таблица 1 представляет собой фрагмент таблицы распределения χ2. Из него видно, что случайная величина χ2 с 10-ю степенями свободы с вероятностью q = 0,95 принимает значение, большее 3,94, а та же величина с одной степенью свободы с вероятностью q = 0,975 превышает 0,00098. Задача. Найти интервал (χ12, χ22), в который случайная величина χ2 с 10-ю степенями свободы попадает с вероятностью, равной 0,9. Решение.
График
плотности
распределения χ2 с 10-ю степенями свободы схематично изображен на рисунке 2. Будем считать, что площади заштрихованных областей (правая область не ограничена справа) равны между собой. Примем условия: P(χ2 < χ12) = P(χ2 > χ22) = (1 - 0,9)/2 = 0,05,
(1)
тогда P(χ12 < χ2 < χ22) = 0,9. Равенства (1) сразу позволяют по таблице определить: χ22 = 18,3. Для определения левой границы интересующего нас интервала придется воспользоваться очевидным равенством P(χ2 > χ12) = 0,95. Из таблицы 1. определяем: χ12 = 3,94 , и теперь можно сформулировать ответ задачи: значение случайной величины χ2 с вероятностью 0,9 принадлежит интервалу (3,94; 18,3).
Распределение Стьюдента. Многие задачи статистики приводят к случайной величине вида t=
ξ k , η
где ξ и η – независимые случайные величины, причем ξ – нормально распределенная случайная величина с параметрами Mξ = 0 и Dξ = 1, а η распределена по закону χ2 c k степенями свободы. Закон распределения случайной величины t называется законом распределения Стьюдента с k степенями свободы.
График плотности распределения для закона Стьюдента схематически изображен на рисунке 3. Кривая плотности распределения схожа с аналогичной кривой для нормального распределения. Таблицы распределения Стьюдента позволяют при данном числе степеней свободы k по вероятности q определить значение tq, для которого выполняется соотношение P(|t| > tq) = q. Фрагмент такой таблицы представляет собой таблица 2. q
0,1
0,05
...
0,01
0,005
...
6,314 12,71
...
63,57
318
...
...
...
...
...
k 1 ... 12 ...
...
...
1,782 2,179 ...
...
...
3,055 3,428
...
...
...
... ...
Таблица 2 Задача. Найти симметричный интервал, в который случайная величина, распределенная по закону Стьюдента с 12-ю степенями свободы, попадает вероятностью 0,9. Решение. Очевидны соотношения: P(–x < t < x) = P(|t| < x) = 1 – P(|t| ≥ x) = 0,9. Из последнего равенства следует: P(|t| ≥ x) = 0,1 , (n = 12). Определяем из таблицы: x = 1,782. Нестрогое неравенство в скобках в левой части последней формулы нас не должно смущать, так как мы имеем дело с
непрерывной случайной величиной, и вероятность того, что она примет конкретное значение, равна нулю. Задача. Найти значение x из условия P(t > x) = 0,995 , где t – случайная величина, распределенная по закону Стьюдента с 12-ю степенями свободы. Решение. На рисунке 4 изображен график плотности распределения Стьюдента с 12-ю степенями
свободы.
Вероятность
того,
что
случайная величина примет значение из области справа от точки x1 равна 0,995 , следовательно в область левее этой точки случайная величина попадает с вероятностью 0,005. Чтобы найти x1, рассмотрим две симметричные области, изображенные на рисунке 5. Допустим, что в каждой из этих областей значение случайной величины оказывается с вероятностью 0,005. Тогда получаем:
x1=
–
x,
x2 = x, причем x определяется из условия P(|t| > x) = 0,01. Из таблицы 2 находим: x = 3,055. Теперь можно выписать ответ задачи: P(t > –3,055) = 0,995.
Распределение Фишера. Важные приложения имеет в статистике случайная величина
ξ k kξ F= 1 = 2 , η k1η k2 где ξ – случайная величина, распределенная по закону χ2 с k1 степенями свободы, а η – случайная величина, распределенная по закону χ2 с k2 степенями свободы. Случайная величина F распределена по закону, называемому законом распределения Фишера с k1 и k2 степенями свободы. При заданных числах k1 и k2 и по вероятности q по таблице определяется значение Fq такое, что P(F > Fq) = q.
Обычно таблицы составляются для значений q, равных 0,05 или 0,01, а иногда для обоих этих значений. Фрагмент такой таблицы представляет собой таблица 3. k1
1
...
10
...
20
...
161,4
...
241,9
...
248
...
k2 1
647,8
6056
6209
...
...
...
...
...
...
...
10
4,96
...
2,97
...
2,77
...
10,04 ...
...
4,85 ...
...
4,41 ...
...
...
Таблица 3. В этой таблице в верхней части каждой клетки дается значение Fq при q = 0,05 , а в нижней части — при q = 0,01.
Математическая статистика. Основной задачей математической статистики является разработка методов получения научно обоснованных выводов о массовых явлениях и процессах из данных наблюдений и экспериментов. Эти выводы и заключения относятся не к отдельным испытаниям, из повторения которых складывается данное массовое явление, а представляют собой утверждения об общих вероятностных характеристиках данного процесса, то есть о вероятностях, законах распределения, математических ожиданиях, дисперсиях и т. д. Такое использование фактических данных как раз и является отличительной чертой статистического метода. Пусть мы располагаем сведениями (обычно довольно ограниченными), например, о числе дефектных изделий в изготовленной в определенных условиях продукции или о результатах испытаний материалов на разрушение и т. п. Собранные нами данные могут представлять непосредственный интерес в смысле информации о качестве той или иной партии продукции. Статистические же проблемы возникают тогда, когда мы на основе той же информации начинаем делать выводы относительно более широкого круга
явлений. Так например нас может интересовать качество технологического процесса, для чего мы оцениваем вероятность получения в нем дефектного изделия или среднюю долговечность изделия. В этом случае мы рассматриваем собранный материал не ради его самого, а лишь как некую пробную группу или выборку, представляющую только серии из возможных результатов, которые мы могли бы встретить при продолжении наблюдений массового процесса в данной обстановке. Выводы и оценки, основанные на материале наблюдений, отражают случайный состав пробной группы и поэтому считаются приблизительными оценками вероятностного характера. Во многих случаях теория указывает, как наилучшим способом использовать имеющуюся информацию для получения по возможности более точных и надежных характеристик, указывая при этом степень надежности выводов, объясняющуюся ограниченностью запаса сведений. В математической статистике рассматриваются две основные категории задач: оценивание и статистическая проверка гипотез. Первая задача разделяется на точечное оценивание и интервальное оценивание параметров распределения. Например может возникнуть необходимость по наблюдениям получить точечные оценки параметров Mξ и Dξ. Если мы хотим
получить
некоторый
интервал,
с
той
или
иной
степенью
достоверности содержащий истинное значение параметра, то это задача интервального оценивания. Вторая задача – проверка гипотез – заключается в том, что мы делаем предположение о распределении вероятностей случайной величины (например, о значении одного или нескольких параметров функции распределения) и решаем, согласуются ли в некотором смысле эти значения параметров с полученными результатами наблюдений.
Выборочный метод. Пусть нам нужно обследовать количественный признак в партии экземпляров некоторого товара. Проверку партии можно проводить двумя способами: 1) провести сплошной контроль всей партии; 2) провести контроль только части партии.
Первый способ не всегда осуществим, например, из–за большого числа экземпляров в партии, из–за дороговизны проведения операции контроля, из–за того, что контроль связан с разрушением экземпляра (проверка электролампы на долговечность ее работы). При втором способе множество случайным образом отобранных объектов называется выборочной совокупностью или выборкой. Все множество объектов, из которого производится выборка, называется генеральной совокупностью. Число объектов в выборке называется объемом выборки. Обычно будем считать, что объем генеральной
совокупности бесконечен. Выборки разделяются
на
повторные
(с
возвращением)
и
бесповторные (без возвращения).
Обычно осуществляются бесповторные выборки, но благодаря большому (бесконечному) объему генеральной совокупности ведутся расчеты и делаются выводы, справедливые лишь для повторных выборок. Выборка должна достаточно полно отражать особенности всех объектов генеральной совокупности, иначе говоря, выборка должна быть репрезентативной (представительной).
Выборки различаются по способу отбора. 1. Простой случайный отбор. Все элементы генеральной совокупности нумеруются и из таблицы случайных чисел берут, например, последовательность любых 30-ти идущих подряд чисел. Элементы с выпавшими номерами и входят в выборку. 2. Типический отбор. Такой отбор производится в том случае, если генеральную совокупность можно представить в виде объединения подмножеств, объекты которых однородны по какому–то признаку, хотя вся совокупность такой однородности не имеет (партия товара состоит из нескольких групп, произведенных на разных предприятиях). Тогда по каждому подмножеству проводят простой случайный отбор, и в выборку объединяются все полученные объекты. 3. Механический отбор. Отбирают каждый двадцатый (сотый) экземпляр. 4. Серийный отбор.
В выборку подбираются экземпляры, произведенные на каком–то производстве в определенный промежуток времени. В
дальнейшем
под
генеральной
совокупностью
мы
будем
подразумевать не само множество объектов, а множество значений случайной величины, принимающей числовое значение на каждом из объектов. В действительности генеральной совокупности как множества
объектов может и не существовать. Например имеет смысл говорить о множестве деталей, которые можно произвести, используя данный технологический процесс. Используя какие–то известные нам характеристики данного процесса, мы можем оценивать параметры этого несуществующего множества деталей. Размер детали – это случайная величина, значение которой определяется воздействием множества факторов, составляющих технологический процесс. Нас, например, может интересовать вероятность, с которой эта случайная величина принимает значение, принадлежащее некоторому интервалу. На этот вопрос можно ответить, зная закон распределения этой случайной величины, а также ее параметры, такие как Mξ и Dξ. Итак, отвлекаясь от понятия генеральной совокупности как множества объектов, обладающих некоторым признаком, будем рассматривать генеральную совокупность как случайную величину ξ, закон распределения и параметры которой определяются с помощью выборочного метода. Рассмотрим выборку объема n, представляющую данную генеральную совокупность. Первое выборочное значение x1 будем рассматривать как реализацию, как одно из возможных значений случайной величины ξ1, имеющей тот же закон распределения с теми же параметрами, что и случайная величина ξ. Второе выборочное значение x2 – одно из возможных значений случайной величины ξ2 с тем же законом распределения, что и случайна величина ξ. То же самое можно сказать о значениях x3, x4,..., xn . Таким образом на выборку будем смотреть как на совокупность независимых случайных величин ξ1, ξ2, ..., ξn, распределенных так же, как
и
случайная
величина
ξ,
представляющая
генеральную
совокупность. Выборочные значения x1, x2, ..., xn – это значения, которые приняли эти случайные величины в результате 1-го, 2-го, ..., n-го эксперимента.
Вариационный ряд. Пусть для объектов генеральной совокупности определен некоторый признак или числовая характеристика, которую можно замерить (размер детали, удельное количество нитратов в дыне, шум работы двигателя). Эта характеристика – случайная величина ξ, принимающая на каждом объекте определенное числовое значение. Из выборки объема n получаем значения этой случайной величины в виде ряда из n чисел: x1, x2,..., xn.
(*)
Эти числа называются значениями признака. Среди чисел ряда (*) могут быть одинаковые числа. Если значения признака упорядочить, то есть расположить в порядке возрастания или убывания, написав каждое значение лишь один раз, а затем под каждым значением xi признака написать число mi, показывающее сколько раз данное значение встречается в ряду (*): x1
x2
x3
...
xk
m1
m2
m3
...
mk
то получится таблица, называемая дискретным вариационным рядом. Число mi называется частотой i-го значения признака. Очевидно, что xi в ряду (*) может не совпадать с xi в вариационном ряду. Очевидна также справедливость равенства k
∑ mi
= n.
i =1
Если промежуток между признака в выборке разбить на каждому интервалу поставить в признака, попавших в этот
наименьшим и наибольшим значениями несколько интервалов одинаковой длины, соответствие число выборочных значений интервал, то получим интервальный
вариационный ряд. Если признак может принимать любые значения из
некоторого промежутка, то есть является непрерывной случайной величиной, приходится выборку представлять именно таким рядом. Если в вариационном интервальном ряду каждый интервал [αi; αi+1) заменить лежащим в его середине числом (αi+αi+1)/2, то получим дискретный
вариационный ряд. Такая замена вполне естественна, так как, например, при измерении размера детали с точностью до одного миллиметра всем размерам из промежутка [49,5; 50,5), будет соответствовать одно число, равное 50.
Точечные оценки параметров генеральной совокупности. Во многих случаях мы располагаем информацией о виде закона распределения случайной величины (нормальный, бернуллиевский, равномерный и т. п.), но не знаем параметров этого распределения, таких как Mξ, Dξ. Для определения этих параметров применяется выборочный метод. Пусть выборка объема n представлена в виде вариационного ряда. Назовем выборочной средней величину
x1m1 + x2m2 +. . .+ xk mk m m m = x1 1 + x2 2 +. . .+ k n n n n mi называется относительной частотой значения признака Величина ω i = n признака, полученные из выборки не группировать и не xi. Если значения представлять в виде вариационного ряда, то для вычисления выборочной средней нужно пользоваться формулой x=
x=
1 n ∑ xi . n i =1
Естественно считать величину x выборочной оценкой параметра Mξ. Выборочная оценка параметра, представляющая собой число, называется точечной оценкой. Выборочную дисперсию k
σ 2 = ∑ ( xi − x ) ω i = i =1
2
1 n 2 ∑ ( xi − x ) n i =1
можно считать точечной оценкой дисперсии Dξ генеральной совокупности. Приведем еще один пример точечной оценки. Пусть каждый объект генеральной совокупности характеризуется двумя количественными признаками x и y. Например деталь может иметь два размера – длину и ширину. Можно в различных районах измерять концентрацию вредных веществ в воздухе и фиксировать количество легочных заболеваний населения в месяц. Можно через равные промежутки времени сопоставлять доходность
акций
данной
корпорации
с
каким-либо
индексом,
характеризующим среднюю доходность всего рынка акций. В этом случае генеральная совокупность представляет собой двумерную случайную величину ξ, η. Эта случайная величина принимает значения x, y на множестве объектов
генеральной
совокупности.
Не
зная
закона
совместного
распределения случайных величин ξ и η, мы не можем говорить о наличии или глубине корреляционной связи между ними, однако некоторые выводы можно сделать, используя выборочный метод. Выборку объема n в этом случае представим в виде таблицы, где i-тый отобранный объект (i= 1,2,...n) представлен парой чисел xi, yi : x1
x2
...
xn
y1 y2 ... yn Выборочный коэффициент корреляции рассчитывается по формуле rxy =
xy − x y σ xσ y
Здесь
1 n xy = ∑ xi yi , σ x = n i =1 σy =
2
σy =
2
σx =
2
1 n ∑ ( xi − x) , n i =1 2
1 n ∑ ( yi − y) . n i =1
Выборочный коэффициент корреляции можно рассматривать как точечную оценку коэффициента корреляции ρξη, характеризующего генеральную совокупность. Выборочные параметры x, sx , rxy или любые другие зависят от того, какие объекты генеральной совокупности попали в выборку и различаются от выборки к выборке. Поэтому они сами являются случайными величинами. Пусть выборочный параметр δ рассматривается как выборочная оценка параметра Δ генеральной совокупности и при этом выполняется равенство Mδ =Δ.
Такая выборочная оценка называется несмещенной. Для доказательства несмещённости некоторых точечных оценок будем рассматривать выборку объема n как систему n независимых случайных величин ξ1, ξ2,... ξn , каждая из которых имеет тот же закон распределения с теми же параметрами, что и случайная величина ξ, представляющая генеральную совокупность. При таком подходе становятся очевидными равенства: Mxi = Mξi =Mξ; Dxi = Dξi =Dξ для всех k = 1,2,...n. Теперь можно показать, что выборочная средняя x есть несмещенная оценка средней генеральной совокупности или , что то же самое, математического ожидания интересующей нас случайной величины ξ :
Mx = M
x1 + x2 +. . .+ xn 1 1 = ( Mξ1 + Mξ 2 +. . .+ Mξ n ) = n Mξ = Mξ . n n n
Выведем формулу для дисперсии выборочной средней: Dx = D
x1 + x2 +. . .+ xn n
=
1
1
n
n2
Dξ1 + Dξ 2 + . . .+ Dξ n1 ) = 2 (
n Dξ =
Dξ . n
Найдем теперь, чему равно математическое ожидание выборочной дисперсии σ 2. Сначала преобразуем σ 2 следующим образом: σ2 =
=
1 n 1 n 2 2 ∑ ( xi − x ) = ∑ ( xi − Mξ + Mξ − x ) = n i =1 n i =1
(
)
1 n 2 2 ∑ ( xi − Mξ) − 2( xi − Mξ)( x − Mξ) + ( x − Mξ) = n i =1 =
1 n 2 2 ∑ ( xi − Mξ) − ( x − Mξ) n i =1
Здесь использовано преобразование: n
n
i =1
i =1
∑ 2( xi − Mξ)( x − Mξ) = 2( x − Mξ) ∑ ( xi − Mξ) =
n 2 ⎞ ⎛ n = 2( x − Mξ )⎜ ∑ xi − ∑ Mξ⎟ = 2( x − Mξ)(nx − nMξ ) = 2n( x − Mξ ) ⎠ ⎝ i =1 i =1
Теперь, используя полученное выше выражение для величины σ 2, найдем ее математическое ожидание. 2 ⎛1 n 2⎞ Mσ = M ⎜⎜ ∑ ( xi − Mξ) − ( x − Mξ) ⎟⎟ = ⎝ n i =1 ⎠ 2
=
1 n 1 2 2 ∑ M ( xi − Mξ) − M ( x − Mξ) = n Dξ − Dx = n i =1 n
= Dξ −
Dξ n − 1 = Dξ . n n
Так как Mσ 2 ≠ Dξ, выборочная дисперсия не является несмещенной оценкой дисперсии генеральной совокупности. Чтобы получить несмещенную оценку дисперсии генеральной n совокупности, нужно 2умножить выборочную дисперсию на . Тогда n 2 n−1 σ , называемая исправленной выборочной получится величина s = n−1 дисперсией.
1 n s = ( xi − x) 2 ∑ n − 1 i =1 2
Пусть имеется ряд несмещенных точечных оценок одного и того же параметра генеральной совокупности. Та оценка, которая имеет наименьшую дисперсию называется эффективной. Полученная из выборки объема n точечная оценка δn параметра Δ генеральной совокупности называется состоятельной, если она сходится по вероятности к Δ. Это означает, что для любых положительных чисел ε и γ найдется такое число nεγ , что для всех чисел n, удовлетворяющих
неравенству n > nεγ выполняется условие P( δ n − Δ < ε ) > 1 − γ . 2 x и s являются несмещёнными, состоятельными и эффективными оценками величин Mξ и Dξ.
Интервальные оценки. Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок
большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности оценок становится очень важным. Введем
понятие
интервальной
оценки
неизвестного
параметра
генеральной совокупности (или случайной величины ξ, определенной на множестве объектов этой генеральной совокупности). Обозначим этот параметр через Δ. По сделанной выборке по определенным правилам найдем числа Δ1 и Δ2, так чтобы выполнялось условие: P(Δ1< Δ< Δ2) =P (Δ∈(Δ1; Δ2)) = γ Числа Δ1 и Δ2 называются доверительными границами, интервал (Δ1, Δ2) — доверительным интервалом для параметра Δ. Число γ называется доверительной вероятностью или надежностью сделанной оценки.
Сначала задается надежность. Обычно ее выбирают равной 0.95, 0.99 или 0.999. Тогда вероятность того, что интересующий нас параметр попал в интервал (Δ1, Δ2) достаточно высока. Число (Δ1 + Δ2) / 2 – середина доверительного интервала – будет давать значение параметра Δ с точностью (Δ2 – Δ1) / 2, которая представляет собой половину длины доверительного интервала. Границы Δ1 и Δ2 определяются из выборочных данных и являются функциями от случайных величин x1, x2,..., xn , а следовательно – сами случайные величины. Отсюда – доверительный интервал (Δ1, Δ2) тоже случаен. Он может покрывать параметр Δ или нет. Именно в таком смысле нужно понимать случайное событие, заключающееся доверительный интервал покрывает число Δ.
в
том,
что
Доверительный интервал для математического ожидания нормального распределения при известной дисперсии. Пусть случайная величина ξ (можно говорить о генеральной совокупности) распределена по нормальному закону, для которого известна дисперсия Dξ = σ 2 (σ > 0). Из генеральной совокупности (на множестве объектов которой определена случайная величина) делается выборка объема n. Выборка x1, x2,..., xn рассматривается как совокупность n независимых случайных величин, распределенных так же как ξ (подход, которому дано объяснение выше по тексту).
Ранее также обсуждались и доказаны следующие равенства: Mx1 = Mx2 = ... = Mxn = Mξ; Dx1 = Dx2 = ... = Dxn = Dξ; M x = Mξ; D x = Dξ /n;
Достаточно просто доказать (мы доказательство опускаем), что случайная величина x в данном случае также распределена по нормальному закону. Обозначим неизвестную величину Mξ через a и подберем по заданной надежности γ число d > 0 так, чтобы выполнялось условие: P(| x – a| < d) = γ
(1)
Так как случайная величина x распределена по нормальному закону с математическим ожиданием M x = Mξ = a и дисперсией D x = Dξ /n = σ 2/n, получаем: P(| x – a| < d) =P(a – d < x < a + d) = ⎛ ⎞ ⎛ ⎞ ⎜ a + d − a⎟ ⎜ a − d − a⎟ ⎛ d n⎞ ⎟ −Φ⎜ ⎟ = 2Φ ⎜ =Φ⎜ ⎟ σ σ ⎝ σ ⎠ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎝ n ⎠ n ⎠ подобрать ⎛ dОсталось ⎛ d n ⎞ d γ таким, чтобы выполнялось равенство n⎞ 2Φ ⎜ ⎟ = γ или Φ ⎜ ⎟ = . ⎝ σ ⎠ ⎝ σ ⎠ 2 Для любого γ ∈[0;1] можно по таблице найти такое число t, что
Φ( t )= γ / 2. Это число t иногда называют квантилем. Теперь из равенства d n
σ
=t
σt определим значение d: d = . n Окончательный результат получим, представив формулу (1) в виде:
σt σ t⎞ ⎛ P⎜ x −
Смысл последней формулы состоит в следующем: с надежностью γ доверительный интервал
σt σt⎞ ⎛ ;x+ ⎜x − ⎟ ⎝ n n⎠ покрывает неизвестный параметр a = Mξ генеральной совокупности. Можно сказать иначе: точечная оценка x определяет значение параметра Mξ с точностью d=σ t / n и надежностью γ. Задача. Пусть имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону с дисперсией, равной
6,25.
Произведена
выборка
объема
n
=
27
и
получено
средневыборочное значение характеристики x = 12. Найти доверительный интервал, покрывающий неизвестное математическое ожидание исследуемой характеристики генеральной совокупности с надежностью
γ =0,99. Решение. Сначала по таблице для функции Лапласа найдем значение t из равенства Φ (t) = γ / 2 = 0,495. По полученному значению t = 2,58 определим точность оценки (или половину длины доверительного интервала) d: d = 2,5×2,58 /
27 ≈ 1,24. Отсюда получаем искомый
доверительный интервал: (10,76; 13,24).
Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии. Пусть ξ – случайная величина, распределенная по нормальному закону с неизвестным математическим ожиданием Mξ, которое обозначим буквой a . Произведем выборку объема n. Определим среднюю выборочную x исправленную выборочную дисперсию s2 по известным формулам.
и
Случайная величина t=
( x − a)
n
s
распределена по закону Стьюдента с n – 1 степенями свободы. Задача заключается в том, чтобы по заданной надежности γ и по числу степеней свободы n – 1 найти такое число tγ , чтобы выполнялось равенство
⎞ ⎛ ( x − a) n ⎜ P⎜ < tγ ⎟⎟ = γ s ⎠ ⎝
(2)
или эквивалентное равенство s s⎞ ⎛ P⎜ x − tγ < a < x + tγ ⎟ =γ . ⎝ n n⎠
(3)
Здесь в скобках написано условие того, что значение неизвестного параметра a принадлежит некоторому промежутку, который и является доверительным интервалом. Его границы зависят от надежности γ , а также от параметров выборки x и s. Чтобы определить значение tγ по величине γ, равенство (2) преобразуем к виду: ⎞ ⎛ ( x − a) n P⎜⎜ ≥ tγ ⎟⎟ = 1 − γ s ⎠ ⎝
Теперь по таблице для случайной величины t, распределенной по закону Стьюдента, по вероятности 1 – γ и числу степеней свободы n – 1 находим tγ . Формула (3) дает ответ поставленной задачи. Задача. На контрольных испытаниях 20-ти электроламп средняя продолжительность их работы оказалась равной 2000 часов при среднем квадратическом отклонении (рассчитанном как корень квадратный из исправленной выборочной дисперсии), равном 11-ти часам. Известно, что продолжительность работы лампы является нормально распределенной случайной величиной. Определить с надежностью 0,95 доверительный интервал для математического ожидания этой случайной величины. Решение. Величина 1 – γ в данном случае равна 0,05. По таблице распределения Стьюдента, при числе степеней свободы, равном 19, находим: tγ = 2,093. Вычислим теперь точность оценки: 2,093×121/ 20 = 56,6. Отсюда получаем искомый доверительный интервал: (1943,4; 2056,6).
Доверительный интервал для дисперсии нормального распределения. Пусть случайная величина ξ распределена по нормальному закону, для которого дисперсия Dξ неизвестна. Делается выборка объема n . Из нее определяется исправленная выборочная дисперсия s2. Случайная величина
χ
2
n − 1)s2 ( = Dξ
распределена по закону χ2 c n –1 степенями свободы. По заданной надежности γ можно найти сколько угодно границ χ12 и χ22
интервалов,
таких, что
(
Ð χ1 < χ 2 < χ 2 2
2
)=γ
(*)
Найдем χ12 и χ22 из следующих условий: P(χ2 ≤ χ12) = (1 – γ )/ 2
(**)
P(χ2 ≥ χ22) = (1 – γ )/ 2
(***)
Очевидно, что при выполнении двух последних условий справедливо равенство (*). В таблицах для случайной величины χ2 обычно дается решение 2 2 уравнения P(χ ≥χq ) = q . Из такой таблицы по заданной величине q и по 2 числу степеней свободы n – 1 можно определить значение χ . Таким q образом, сразу находится 2значение χ22 в формуле (***). Для определения χ1 преобразуем (**): P(χ2 ≥ χ12) = 1 – (1 – γ )/ 2 = (1 + γ )/ 2 Полученное равенство позволяет определить по таблице значение χ12. Теперь, когда найдены значения χ12 и χ22, представим равенство (*) в виде ⎛ 2 (n − 1)s2 ⎞ 2 P⎜⎜ χ 1 < < χ 2 ⎟⎟ = γ . Dξ ⎝ ⎠
Последнее равенство перепишем в такой форме, чтобы были определены границы доверительного интервала для неизвестной величины Dξ:
⎛ (n − 1)s2 n − 1)s2 ⎞ ( ⎜ ⎟ =γ. P⎜ < Dξ < 2 2 χ 1 ⎟⎠ ⎝ χ2
Отсюда легко получить формулу, по которой находится доверительный интервал для стандартного отклонения: ⎛ P⎜ ⎜ ⎝
(n − 1) s χ2
2
<
Dξ <
(n − 1)s⎞⎟ χ 12
⎟ ⎠
=γ
(****)
Задача. Будем считать, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях — случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Исправленная выборочная дисперсия измерений оказалась равной 22,5. Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с надежностью 98%. Решение. По числу степеней свободы, равному 19, и по вероятности (1 – 0,98)/2 = 0,01 находим из таблицы распределения χ2 величину
χ22 = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99 получаем χ12 = 7,63. Используя формулу (****), получаем искомый доверительный интервал: (3,44; 7,49).
Задачи статистической проверки гипотез. Статистическая проверка гипотез является вторым после статистического оценивания параметров распределения и в то же время важнейшим разделом математической статистики. Методы математической статистики позволяют проверить предположения о законе распределения некоторой случайной величины (генеральной совокупности), о значениях параметров этого закона (например Mξ, Dξ ), о наличии корреляционной зависимости между случайными величинами, определенными на множестве объектов одной и той же генеральной совокупности.
Пусть
по
некоторым
данным
имеются
основания
выдвинуть
предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача заключается в том, чтобы подтвердить или опровергнуть это предположение, используя выборочные (экспериментальные) данные. Гипотезы о значениях параметров распределения или о сравнительной величине параметров двух распределений называются параметрическими гипотезами. Гипотезы о виде распределения называются непараметрическими гипотезами.
Проверить статистическую гипотезу – это значит проверить, согласуются ли данные, полученные из выборки с этой гипотезой. Проверка осуществляется с помощью статистического критерия. Статистический критерий – это случайная величина, закон распределения которой (вместе со значениями параметров) известен в случае, если принятая гипотеза справедлива. Этот критерий называют еще критерием согласия (имеется в виду согласие принятой гипотезы с результатами, полученными из выборки). Гипотезу, выдвинутую для проверки ее согласия с выборочными данными, называют нулевой гипотезой и обозначают H0. Вместе с гипотезой H0 выдвигается альтернативная или конкурирующая гипотеза, которая обозначается H1. Например: 1) H0: Mξ= 0
2) H0: Mξ= 0
3) H0: Mξ= 0
H1: Mξ> 0 H1: Mξ= 2 H1: Mξ≠ 0 Пусть случайная величина K – статистический критерий проверки некоторой гипотезы H0. При справедливости гипотезы H0 закон распределения случайной величины K характеризуется некоторой известной нам плотностью распределения pK(x). Выберем некоторую малую вероятность α, равную 0,05 , 0,01 или еще меньшую. Определим критическое значение критерия Kкр как решение одного из трех уравнений, в зависимости от вида нулевой и конкурирующей гипотез: P(K> Kкр) = α
(1)
P(K< Kкр) = α
(2)
P((K< Kкр1)∩(K> Kкр2)) = α
(3)
Возможны и другие уравнения, но они встречаются значительно реже, чем приведенные. Решение уравнения (1) (то же самое для уравнений (2) и (3)) заключается в следующем: по вероятности α, зная функцию pK(x), заданную как правило таблицей, нужно определить Kкр. Что означает условие (1)? Если гипотеза H0 справедлива, то вероятность того, что критерий K превзойдет некоторое значение Kкр очень мала – 0,05 , 0,01 или еще меньше, в зависимости от нашего выбора. Если Kв –
значение критерия K,
рассчитанное по выборочным данным, превзошло значение Kкр, это означает, что выборочные данные не дают основания для принятия нулевой гипотезы H0 ( например, если α=0,01 , то можно сказать, что произошло событие, которое при справедливости гипотезы H0 встречается в среднем не чаще, чем в одной из ста выборок). В этом случае говорят, что гипотеза H0 не согласуется с выборочными данными и должна быть отвергнута. Если
Kв не превосходит Kкр, то говорят, что выборочные данные не противоречат гипотезе H0, и нет оснований отвергать эту гипотезу.
Для уравнения (1) область K> Kкр называется критической областью. Если значение Kв попадает в критическую область, то гипотеза H0 отвергается.
Для уравнения (1) область K < Kкр называется областью принятия гипотезы. Если значение Kв попадает в область принятия гипотезы, то гипотеза H0 принимается.
Рисунок 1. иллюстрирует решение уравнения (1). Здесь pK(x) – известная плотность распределения случайной величины K при условии справедливости гипотезы H0. Пусть
выбрано
некоторое
малое
значение вероятности α, по нему определено значение Kкр и по выборочным данным определено значение Kв, которое попало в критическую область. В
этом случае гипотеза H0 отвергается, но она может оказаться справедливой, просто случайно произошло событие, которое имеет очень малую вероятность α. В этом смысле α есть вероятность отвержения правильной гипотезы H0. Отвержение правильной гипотезы называется ошибкой первого рода. Вероятность α называется уровнем значимости. Таким образом уровень значимости – это вероятность совершения ошибки первого рода.
Критическая область, полученная для уравнения (1) и приведенная на рисунке 1., называется правосторонней. Уравнение
(2)
определяет
левосторонюю критическую область. Ее
изображение приводится на рисунке 2. Отметим, что каждая из заштрихованных фигур на рисунках 1. и 2. имеет площадь, равную α. Уравнение
(3)
определяет
двусторонюю критическую область.
Такая область изображена на рисунке 3. Здесь критическая область состоит из двух частей. В случае двусторонней критической области границы ее частей Kкр1 и Kкр2 определяются таким образом, чтобы выполнялось условие: P(K ≤ Kкр) = P(K ≥ Kкр) = α / 2. На рисунке 3. площадь каждой из заштрихованных фигур равна α / 2. Вид критической области зависит от того, какая гипотеза выдвинута в качестве конкурирующей. Чем меньше уровень значимости, тем меньше вероятность отвергнуть проверяемую гипотезу H0, когда она верна, то есть совершить ошибку первого рода. Но с уменьшением уровня значимости расширяется
область
принятия
гипотезы
H0
и
увеличивается
вероятность принятия проверяемой гипотезы, когда она неверна, то есть когда
предпочтение
должно
быть
отдано конкурирующей гипотезе.
Пусть при справедливости гипотезы H0 статистический критерий K имеет плотность распределения p0(x), а при справедливости конкурирующей гипотезы H1 – плотность распределения p1(x). Графики этих функций приведены на рисунке 4. При некотором уровне значимости находится критическое значение Kкр и правостороняя критическая область. Если значение Kв, определенное по выборочным данным, оказывается меньше, чем Kкр, то гипотеза H0 принимается. Предположим, что справедлива на самом деле конкурирующая гипотеза H1. Тогда вероятность попадания критерия в область принятия гипотезы H0 есть некоторое число β, равное площади фигуры, образованной графиком функции p1(x) и полубесконечной частью горизонтальной координатной оси, лежащей слева от точки Kкр. Очевидно, что β – это вероятность того, что будет принята неверная гипотеза H0. Принятие неверной гипотезы называется ошибкой второго рода. В
рассмотренном случае число β – это вероятность ошибки второго рода. Число 1 – β, равное вероятности того, что не совершается ошибка второго рода, называется мощностью критерия. На рисунке 4 мощность
критерия равна площади фигуры, образованной графиком функции p1(x).и полубесконечной частью горизонтальной координатной оси, лежащей справа от точки Kкр. Выбор статистического критерия и вида критической области осуществляется таким образом, чтобы мощность критерия была максимальной.
Проверка статистической гипотезы о математическом ожидании нормального распределения при известной дисперсии. Пусть имеется нормально распределенная случайная величина ξ,, определенная на множестве объектов некоторой генеральной совокупности. Известно, что Dξ = σ 2. Математическое ожидание Mξ неизвестно. Допустим, что имеются основания предполагать, что Mξ = a, где a – некоторое число (такими основаниями могут быть ограниченные сведения об объектах генеральной совокупности, опыт исследования подобных совокупностей и т. д.). Будем считать также, что имеется другая информация, указывающая на то, что Mξ = a1, где a1 > a. I. Выдвигаем нулевую гипотезу H0: Mξ = a; при конкурирующей гипотезе H1: Mξ = a1. Делаем выборку объема n: x1, x2,..., xn . В основе проверки лежит тот факт, что случайная величина x (выборочная средняя) распределена по нормальному закону с дисперсией σ 2/n и математическим ожиданием, равным a в случае справедливости H0, и равным a1 в случае справедливости H1. Очевидно, что если величина x оказывается достаточно малой, то это дает основание предпочесть гипотезу H0 гипотезе H1. При достаточно большом значении x более вероятна справедливость гипотезы H1. Задачу можно было бы поставить так: требуется найти некоторое критическое число, которое разбивало бы все возможные значения выборочной средней ( в условиях данной задачи это все действительные числа ) на два полубесконечных промежутка. При попадании x в левый промежуток следовало бы принимать гипотезу H0, а при попадании x в правый промежуток предпочтение следовало бы оказать гипотезе H1. Однако на самом деле поступают несколько иначе. В качестве статистического критерия выбирается случайная величина z=
( x − a) σ
n
,
распределенная по нормальному закону , причем Mz = 0 и Dz = 1 ( это следует из свойств математического ожидания и дисперсии ) в случае
справедливости
гипотезы
H0.
Если
справедлива
гипотеза
H1,
то
Mz = a* = ( a1 – a ) n /σ, Dz = 1. На рисунке 1. изображены графики p0(z) и p1(z) – функций плотности распределения случайной величины z при справедливости гипотез H0 и H1, соответственно. Если величина x , полученная из выборочных данных, относительно велика, то и величина z велика, что является свидетельством в пользу гипотезы H1. Относительно малые значения x приводят к малым значениям z, что свидетельствует в пользу гипотезы H0. Отсюда следует, что должна быть выбрана правосторонняя критическая область. По принятому уровню значимости α (например α = 0,05), используя то, что случайная величина z распределена по нормальному закону, определим значение Kкр из формулы α = P(Kкр < z <∞) = Φ(∞) – Φ(Kкр) = 0,5 – Φ(Kкр). 1 − 2α Отсюда Φ ( K êð ) = , и осталось воспользоваться таблицей функции 2 числа Kкр. Лапласа для нахождения Если величина z, полученная при выборочном значении x , попадает в область принятия гипотезы (z < Kкр), то гипотеза H0 принимается (делается вывод, что выборочные данные не противоречат гипотезе H0). Если величина z попадает в критическую область, то гипотеза H0 отвергается. В данной задаче может быть подсчитана мощность критерия:
1 − β = Φ ( ∞) − Φ ( K êð −
(a1 − a) σ
n)
Мощность критерия тем больше, чем больше разность a1– a. II. Если в предыдущей задаче поставить другое условие: H0: Mξ = a; H1: Mξ = a1 , a1 < a, то сохранив смысл всех рассуждений, здесь придется рассматривать левостороннюю критическую область, как изображено на рисунке 2. Здесь, как и в предыдущем случае, a*
= ( a1 – a ) n /σ, а величина Kкр определяется из формулы α = P(–∞ < z < Kкр) = Φ( Kкр) – Φ(–∞) = Φ( Kкр) +
1 . 2
Используя формулу –Φ( Kкр) = Φ( –Kкр), получаем: Φ( –Kкр) =
1 − 2α . 2
Отметим, что по смыслу задачи здесь Kкр – отрицательное число. Значения z, вычисленные по выборочным данным, превышающие Kкр, согласуются с гипотезой H0. Если величина z попадает в критическую область
(z < Kкр),
то
гипотезу
H0
следует
отвергнуть,
считая
предпочтительной гипотезу H1. III. Рассмотрим теперь такую задачу: H0: Mξ = a; H1: Mξ ≠ a. В данном случае большие отклонения величины z от нуля в положительную или отрицательную сторону должны приводить к заключению о ложности гипотезы H0, то есть
здесь
следует
рассматривать
двустороннюю критическую область, как изображено на рисунке 3. Критическое значение Kкр определяется с помощью соотношения P(–Kкр < z < Kкр) = 1 – α = Φ( Kкр) – Φ( – Kкр) = 2Φ( Kкр) . Из этого соотношения следует: Φ( Kкр) =
1− α . 2
Проверка гипотезы о равенстве дисперсий. Гипотезы о дисперсии играют очень важную роль в экономико– математическом моделировании, так как величина рассеяния экспериментальных выборочных данных относительно рассчитанных теоретических значений соответствующих параметров, характеризующаяся
дисперсией, дает возможность судить о пригодности (адекватности) теории или модели, на основании которой строится теория. Пусть нормально распределенная случайная величина ξ определена на некотором множестве, образующем генеральную совокупность, а нормально распределенная случайная величина η определена на другом множестве, которое тоже составляет генеральную совокупность. Из обеих совокупностей делаются выборки: из первой – объема n1, а из второй – объема n2 (отметим, что объем выборки не всегда можно определить заранее, как например в случае, если он равен количеству рыб, попавших в сеть). По каждой выборке рассчитывается исправленная выборочная дисперсия: s12 для выборки из первой совокупности и s22 для выборки из второй совокупности. Поставим задачу: с помощью выборочных данных проверить статистическую гипотезу H0: Dξ = Dη. В качестве конкурирующей гипотезы будем рассматривать идею, заключающуюся в том, что дисперсия той совокупности, для которой исправленная выборочная дисперсия оказалась наибольшей, больше дисперсии другой совокупности. Критерий берется в следующем виде:
F=
S* * . S*
Здесь S**– наибольшая из двух оценок s12 и s22, а S*– наименьшая из тех же двух оценок. Критерий F распределен по закону Фишера с k1 и k2 степенями свободы. Здесь k1 = n1–1, k2 = n2–1, если S**= s12; k1 = n2–1, k2 = n1–1, если S**= s22. В этой задаче естественно рассматривать правостороннюю критическую область, так как достаточно большие выборочные значения критерия F свидетельствуют в пользу конкурирующей гипотезы. При заданном уровне значимости q (обычно q =0,05 или q =0,01) критическое значение Fкр определяется из таблицы распределения Фишера. В случае F > Fкр гипотеза H0 отвергается, а в случае F < Fкр – принимается. Пусть два множества некоторых объектов, обладающих количественным признаком, подвергнуты выборочному контролю. Значения
количественного признака есть распределенные по нормальному закону случайные величины, которые мы обозначим ξ1 и ξ2, соответственно, для первого и для второго множеств. Из первого множества сделана выборка объема n1=21 и подсчитана исправленная выборочная дисперсия, оказавшаяся равной 0,75. Из второго множества сделана выборка объема n2=11. Эта выборка дала значение исправленной выборочной дисперсии, равное 0,25. Выдвигаем гипотезу H0: Dξ1=Dξ2. Конкурирующая гипотеза H1 заключается в том, что Dξ1>Dξ2. В данном случае выборочное значение Fв критерия Фишера равно 3. При выбранном уровне значимости q = 0,05 по числам степеней свободы k1=20, k2=10 находим по таблице распределения Фишера Fкр=2,77. Так как Fв > Fкр, гипотеза о равенстве дисперсий должна быть отвергнута.
Проверка статистической значимости выборочного коэффициента корреляции. Проверкой статистической значимости выборочной оценки δ параметра
Δ
генеральной
совокупности
называется
проверка
статистической гипотезы H0: Δ = 0, при конкурирующей гипотезе
H1: Δ ≠ 0. Если гипотеза H0 отвергается, то оценка δ считается статистически значимой. Пусть имеются две случайные величины ξ и η, определенные на множестве объектов одной и той же генеральной совокупности, причем обе имеют нормальное распределение. Задача заключается в проверке статистической гипотезы об отсутствии корреляционной зависимости между случайными величинами ξ и η. H0: ρξη = 0; H1: ρξη ≠ 0. Здесь ρξη – коэффициент линейной корреляции. Производится выборка объема n и вычисляется выборочный коэффициент корреляции r. За статистический критерий принимается случайная величина t=
r n− 2
1− r
2
,
которая распределена по закону Стьюдента с n – 2 степенями свободы.
Отметим
сначала,
что
все
возможные
значения
выборочного
коэффициента корреляции r лежат в промежутке [–1;1]. Очевидно, что относительно большие отклонения в любую сторону значений t от нуля получаются при относительно больших, то есть близких к 1, значениях модуля r. Близкие к 1 значения модуля r противоречат гипотезе H0, поэтому здесь естественно рассматривать двустороннюю критическую область для критерия t. По уровню значимости α и по числу степеней свободы n – 2 находим из
таблицы
распределения
Стьюдента
значение
tкр.
Если
модуль
выборочного значения критерия tв превосходит tкр, то гипотеза H0 отвергается и выборочный коэффициент корреляции считается статистически значимым. В противном случае, то есть если |tв| < tкр и принимается гипотеза H0, выборочный коэффициент корреляции считается статистически незначимым.
Отделение корней Во многих приближённых методах нахождения корня уравнения
заранее
, на котором лежит искомый корень , и требуется знать какой-либо отрезок притом только один этот корень (то есть предъявляемый отрезок не должен содержать других корней уравнения
). В этом случае говорят, что корень
отделён на
. Отделить корень -- значит указать такой отрезок, на котором корень отрезке отделён. Заметим, что отделить корень можно не единственным образом: если корень отделён на каком-либо отрезке, то годится и любой меньший отрезок, содержащий этот корень. Вообще говоря, чем меньше отрезок, тем лучше, но при этом не следует забывать о том, что на отделение корня на меньших отрезках также тратятся вычислительные усилия, и, быть может, весьма значительные. Таким образом, часто для начала довольствуются весьма широким отрезком, на котором корень отделён. к корню (который, Кроме того, часто нужно знать начальное приближение заметим, неизвестен). В качестве этого начального приближения берут, как правило, ,
любую точку отрезка, на котором отделён корень, например, его середину если описание метода не предписывает поступить как-нибудь иначе. Приведём некоторые утверждения, которые могут помочь при отделении корня. Теорема 1 ( о корне непрерывной функции) Если функция
отрезке
, причём значения её в концах отрезка
знаков, то на отрезке
и
непрерывна на
-- это числа разных
лежит по крайней мере один корень уравнения
.
Практический смысл теоремы -- в том, что если мы, вычисляя значения функции в некоторых точках, видим, что вычисление в двух соседних точках даёт значения разных знаков, то на отрезке между этими точками лежит отыскиваемый корень. Если же известно заранее, что корень один, то получаем, что корень отделён на найденном отрезке. Этот же способ, когда мы наугад вычисляем значения функции в каких-то точках, может привести к отделению корней и в случае, когда корней несколько, но заранее известно их число или хотя бы оценка сверху для их количества. Рассмотрим иллюстрирующий сказанное пример. Пример1 Рассмотрим уравнение . Это уравнение третьей степени, поэтому у него не более трёх корней. Подсчитаем несколько значений функции
, выбирая для простоты целые значения
:
Функция
непрерывна (любой многочлен непрерывен), и имеет разные знаки на
и ; следовательно, по теореме о корне непрерывной концах отрезков функции, на каждом из этих трёх отрезков имеется не менее чем по одному корню. Однако корней не более трёх, так что на каждом отрезке -- ровно по одному корню. Тем , и уравнения (и при этом самым нам удалось отделить все три корня установить, что их действительно три, а не меньше):
Теорема 2 Если функция
строго монотонна на отрезке
, то есть
, то на этом отрезке уравнение
возрастает или убывает на иметь более одного корня.
не может
Доказательство сразу следует из того, что строго монотонная функция принимает каждое своё значение ровно один раз. Если 0 является значением функции, то и значение имеет один корень.
0 принимается один раз, то есть уравнение Тем самым, если отрезок (например, если функции, то на
и
, на котором заведомо имеется хотя бы один корень -- разного знака), -- это отрезок строгой монотонности
отделён ровно один корень
.
Заметим, что интервалы монотонности функции
можно отыскивать, решая
(что соответствует возрастанию функции) и неравенства соответствует убыванию). Пример2 Рассмотрим уравнение
(что
. Для функции
найдём производную
. У этого , поэтому
квадратного трёхчлена отрицательный дискриминант: сохраняет знак коэффициента при Следовательно, функция
, то есть
при всех
возрастает на всей оси
корня. Вычислим значения
в точках
и
и может иметь не более одного
:
. Это
значения разных знаков, поэтому корень существует и отделён на отрезке Пример3 Для функции
Решим неравенство
.
.
найдём интервалы монотонности. и получим:
На этих двух интервалах функция возрастает. Ясно, что на интервале
функция убывает. Найдём значения функции в точках экстремума:
Значит, на отрезке убывания при
отделён корень
и и
при
. Так как, очевидно,
, то имеются ещё два корня:
. Получили следующие отрезки, на которых отделены
корни:
Далее мы будем предполагать, что функция . Это всегда так, если корень
меняет знак при переходе через корень
простой, то есть если
.
Метод простого перебора Пусть задана точность , с которой мы хотим приближённо найти корень . Это означает, что мы должны предъявить в качестве результата вычислений известное число , которое отличается от истинного значения корня (которое нам неизвестно) не более чем на :
.
Пусть искомый корень
отделён на отрезке
.
и Самый простой (но и самый медленный) способ отыскать -- взять шаг перебирать значения с шагом до тех пор, пока функция не сменит знак (по сравнению со знаком исходного числа ;
. Последовательно получаем:
;
. Вычисления продолжаются, пока
. Как только мы получим
, нужно взять за приближённое значение .
корня середину между последними двумя точками:
Метод половинного деления Снова предположим, что корень отделён на отрезке меняет знак при переходе через корень
(функция Положим
и
знаки
и
:
либо
. (Возможен ещё случай
, длина которого ровно в два раза . Обозначим этот отрезок половинной
меньше длины исходного отрезка (то есть положим
в случае, когда
в случае, когда
Далее повторим процесс для отрезка
то корень отделён на
. Если эти знаки
уже найден.) В обоих случаях смены знака корень
оказывается отделён на отрезке
значение функции
и
,
; если же одинаковы, то тогда различны
, и корень лежит в интервале
знаков, и
различны
).
. Сравним знаки чисел
лежит в интервале
; тогда корень
длины через
и
и вычислим значения функции в левом конце отрезка,
и в его середине различны, то корень
и знаки
и
и
разных
одного знака).
: снова отыщем его середину
и сравним знак этого числа со знаком , если одинаковые, то на
, найдём
; если знаки разные, (или же
; тогда корень найден). Длина отрезка, на котором отделён оказывается, что корень, уменьшилась ещё в два раза.
Поступая тем же образом и далее, получаем, что после котором лежит корень, сокращается в
делений длина отрезка, на
раз и становится равной
(если корень
не был точно определён на каком-то предыдущем этапе, то есть не совпал с при некотором ). Пусть -- заданная точность, с которой требуется отыскать корень. Процесс деления отрезков следует остановить, как только станет верным неравенство . Очевидно, что если при этом положить
то расстояние от корня , лежащего где-то в интервале , до середины этого будет выполнено интервала будет не больше , то есть приближённое равенство с нужной точностью. Пример 5 Снова рассмотрим уравнение этого уравнения требуется вычислить с точностью
половинного деления с отрезка
. Пусть корень . Начинаем решение методом
, на котором отделён корень
.
Последовательно находим значение функции в серединах получающихся отрезков:
после чего вычисления прекращаются на девятом шаге, так как очередной отрезок имеет длину
При этом середина последнего отрезка -- это точка
. Получаем, что приближённое значение равно
корня
с точностью до
.
Поскольку при каждом делении отрезка приходится ровно один раз вычислять значение (в том из концов нового отрезка, в котором это значение не было вычислено функции на предыдущих этапах), то в среднем придётся для нахождения корня с точностью вычислить значение функции
раз. Число
можно определить из неравенства
, откуда
Это значение при малых много меньше того значения мы получили, анализируя метод простого перебора.
, которое
Заметим, что метод деления отрезка пополам, как и метод простого перебора, не предъявляет никаких требований к гладкости функции (то есть к существованию её производной): достаточно, чтобы функция была непрерывной. Далее мы рассмотрим более быстрые методы, в которых наличие производной будет играть существенную роль.
Метод хорд (метод линейной интерполяции) Идея метода состоит в том, что по двум точкам построить прямую
(то есть хорду, соединяющую две точки графика
взять в качестве следующего приближения
линейной интерполяцией, найденной по двум значениям интерполяцией функции совпадают со значениями .)
)и
абсциссу точки пересечения этой прямой
. Иными словами, приближённо заменить на этом шаге функцию
с осью
и
и
:
и
назовём такую линейную функцию
её
. (Линейной , значения которой
в двух фиксированных точках, в данном случае -- в точках
В зависимости от того, лежат ли точки и по разные стороны от корня по одну и ту же сторону, получаем такие чертежи:
или же
Итак, очередное последовательное приближение будет зависеть от двух предыдущих: . Найдём выражение для функции
.
Интерполяционную линейную функцию будем искать как функцию с угловым коэффициентом, равным разностному отношению
построенному для отрезка между
Решая уравнение
и
, график которой проходит через точку
:
, находим
то есть (3)
Заметим, что величина
может рассматриваться как разностное приближение для
в точке . Тем самым полученная формула -- это разностный аналог производной итерационной формулы метода Ньютона. Вычисление по формуле (3) гораздо предпочтительнее вычисления по другой полученной нами формуле
хотя эти две формулы математически тождественны, поскольку при использовании формулы (3) в случае вычислений с округлениями (например, на компьютере) достигается меньшая потеря значащих цифр. Имеются две разновидности применения формулы (3). Первая разновидность: вычисления ведутся непосредственно по формуле (.3) при , начиная с двух приближений . При этом не предполагается, что
корню функции
в точках
и
и
, взятых, по возможности, поближе к
лежит между
и
(и что значения
имеют разные знаки). При этом не гарантируется, что корень
попадёт на отрезок между
и
на каком-либо следующем шаге (хотя это и не
исключено). В таком случае затруднительно дать оценку погрешности, с которой приближает истинное значение корня , и поэтому довольствуются таким эмпирическим правилом: вычисления прекращают, когда будет выполнено неравенство где -- желаемая точность нахождения корня. При этом полагают приближённое значение корня равным
.
Пример 8 Решим уравнение
точностью
методом хорд. Зададимся
и возьмём в качестве начальных приближений
концы
. Итерационная формула метода
отрезка, на котором отделён корень: хорд при
и
имеет вид
По этой формуле последовательно получаем:
Седьмое приближение уже дало нам значение корня с нужной точностью; восьмая итерация понадобилась для того, чтобы убедиться: с заданной точностью значение перестало изменяться. Получаем, что
.
,
Упражнение 3 Проведите вычисления тем же методом, переставив местами
начальные приближения
и
, то есть взяв
. Убедитесь, что
и что с точностью
получаются другие значения для искомому корню.
уже
равняется
Пример 9 Проверим, что метод работает и в том случае, если и взяты по одну и ту же сторону от корня (то есть если корень не отделён на отрезке между
и
начальными приближениями). Возьмём всё для того же уравнения Тогда
Мы получили то же значение
.
, причём за то же число итераций. Может показаться, что было ближе
было бы выгоднее расположить начальные приближения иначе, так чтобы
к корню, чем . Однако при этом получаем фактически ту же скорость сходимости, можно заметить лишь небольшое ускорение:
Понадобились всё те же семь вычислений. Вторая разновидность применения формулы (3) называется методом ложного положения. Предположим, что корень и
значения
отделён на отрезке между
-- разных знаков. После вычисления
очередном, -м, этапе из двух отрезков: между тот, в концах которого функция между
и
полагают
равным
и
и
, то есть
по формуле (.3) на
и между
и
-- выбирают
принимает значения разных знаков. Если это отрезок
, то производят перенумерацию предыдущих приближений, то есть , а затем повторяют вычисления по формуле (3). Этим
достигается, что при любом корень при выполнении условия
располагается на отрезке между , где
и
, так что
-- желаемая точность нахождения корня,
вычисления можно прекратить и взять приближённое значение корня равным При этом гарантируется, что будет выполнено неравенство будет определён с нужной точностью.
.
, то есть корень
Такое усложнение алгоритма не даёт, на самом деле, сколько-нибудь заметного преимущества. Проиллюстрируем это на примере.
Пример 10 В ситуации примера.8 применим метод ложного положения. Тогда последовательные приближения будут такими:
Как мы видим, отличаются от вычислений в примере .8 только приближения . (Заметим, что если бы в примере 8 мы взяли упражнение 3, то вдобавок совпали бы значения
, см.
.)
Метод секущих В качестве функции знаком производной
берут любую постоянную в окрестности
, знак которой совпадает со
(и, в частности, на отрезке, соединяющем
и
). Постоянная не зависит также и от номера шага . Тогда формула итераций оказывается очень проста:
и на каждой итерации нужно один раз вычислить значение функции
.
Выясним смысл этой формулы, а также смысл условия о совпадении знаков Рассмотрим прямую, проходящую через точку коэффициентом
на графике
и
.
с угловым
. Тогда уравнением этой прямой будет
Найдём точку пересечения этой прямой с осью
из уравнения
откуда . Следовательно, эта прямая пересекает ось как раз в точке следующего приближения. Тем самым получаем следующую геометрическую интерпретацию последовательных приближений. Начиная с точки соответствующие точки графика
, через
проводятся секущие с угловым коэффициентом
того же знака, что производная
. (Заметим, что, во-первых, значение
производной вычислять не обязательно, достаточно лишь знать, убывает функция или возрастает; во-вторых, что прямые, проводимые при разных , имеют один и тот же угловой коэффициент и, следовательно, параллельны друг другу.) В качестве следующего приближения к корню берётся точка пересечения построенной прямой с осью .
Последовательные итерации метода секущих
На чертеже слева изображены итерации при
, в случае
ив
. Мы видим, что в первом случае меняющаяся точка уже на случае , и итерации начинают первом шаге "перепрыгивает" по другую сторону от корня приближаться к корню с другой стороны. Во втором случае последовательные точки приближаются к корню, оставаясь всё время с одной стороны от него. (Исследуйте сами, как выглядит процесс в случае
, то есть когда функция
убывает.)
Достаточное условие сходимости, которое нам даёт теорема 9.3, таково:
Это неравенство можно записать в виде откуда получаем, что сходимость гарантируется, когда, во-первых,
так как
(тем самым проясняется смысл выбора знака числа
), а во-
при всех на всём рассматриваемом отрезке, окружающем вторых, когда корень. Это второе неравенство заведомо выполнено, если
где . Таким образом, угловой коэффициент не должен быть слишком мал по абсолютной величине: при малом угловом коэффициенте уже на первом шаге может выскочить из рассматриваемой окрестности корня точка итераций к корню может быть нарушена.
, и сходимость
Метод Ньютона (метод касательных) Рассмотрение предыдущего метода позволяет предположить, что итерации станут приближаться к корню ещё быстрее, если мы будем выбирать касательную вместо секущей не только на первом, а на каждом шаге. Ясно, что тогда формула итераций будет иметь вид (1)
(сравните с формулой метода одной касательной). Этот метод называется методом касательных, или методом Ньютона. Действительно, последовательные приближения метода Ньютона сходятся гораздо быстрее, чем в общем методе итераций (скорость сходимости приближений в котором, напомним, та же, что у геометрической прогрессии со знаменателем
при
).
Поскольку для метода Ньютона
то
В точке
получаем
пересекает прямую быстрой сходимости итераций к
, так как
. Тем самым, в этом методе график
в точности по горизонтали, что приводит к очень . Именно, имеет место оценка (2)
где
-- некоторая постоянная (не зависящая от ). Если начальное приближение
взято достаточно близко от корня
, то можно взять
.
Заметим, что по сравнению с общей оценкой метода итераций
постоянная величину
заменяется в оценке метода Ньютона (2) на стремящуюся к 0 ; отсюда и высокая скорость сходимости.
Доказательство оценки (9.2) можно найти в учебниках, специально посвящённых численным методам, например, [Амосов А. А., Дубинский Ю. А., Копченова Н. В. Вычислительные методы для инженеров. -- М.: Высш. шк., 1994], [Бахвалов Н. С., Жидков Н. П., Кобельков Г. М. Численные методы. -- М.: Наука, 1987], [Ортега Дж., Пул У. Введение в численные методы решения дифференциальных уравнений. -- М.: Наука, 1986]. Скорость сходимости итераций, которая задаётся формулой (2), называется квадратичной. Квадратичная скорость сходимости означает, примерно говоря, что число верных знаков в приближённом значении
удваивается с каждой итерацией.
,и , то . Это и означает, Действительно, если , что число верных знаков при переходе к следующему приближению возросло с до то есть удвоилось. Геометрический смысл метода Ньютона состоит в том, что на каждом шаге мы строим в точке очередного последовательного приближения
,
берём точку пересечения этой касательной с осью а за следующее приближение Тем самым наклон прямой подстраивается на каждом шаге наилучшим образом (ведь кривизну графика, связанную с второй производной, мы не учитываем, и поэтому неизвестно, в какую сторону от касательной отклонится график).
.
касательную к графику
Последовательные приближения метода Ньютона
Заметим, что по-другому идею метода Ньютона мы можем описать так: на каждом шаге мы решаем приближённое, линеаризованное в точке
вместо исходного уравнения уравнение
в котором левая часть -- это многочлен Тейлора первого порядка для функции
в
, то есть линейная функция
точке
Решением линеаризованного уравнения
служит следующее приближение
, в то время как решением исходного точного уравнения корень .
служит искомый
Идея замены точной (но сложной) задачи последовательностью более простых линеаризованных задач весьма продуктивна в приближённых методах; например, такая идея даёт эффективный способ решения многомерных задач с ограничениями (метод Франка - Вулфа в нелинейном программировании, см., например, [Киселёв В.Ю., Экономико-математические методы и модели. -- Иваново: изд. ИГЭУ, 1998]). Пример 7 Решим методом Ньютона всё то же уравнение
,
взяв в качестве начального приближения и задав точность (ту же, что была взята при решении этого уравнения методом одной касательной). Поскольку , то итерационная формула метода Ньютона будет такой:
Применяя эту формулу, последовательно находим:
с точностью . Как мы видим, значение корня с нужной нам так что точностью было получено уже на третьем шаге. (Четвёртый шаг понадобился для того, чтобы можно было убедиться, что с нужной нам точностью значение перестало изменяться.) Упражнение 2 Найдите тот же корень, начав с . (Заметим, что итерационную формулу при этом менять не надо, в отличие от метода одной касательной.) Сколько потребуется итераций для достижения той же точности? Обратите
внимание на то, что сначала приближения ( но затем
быстро сходятся к
и
) окажутся даже вне отрезка
с той же стороны, что в примере.
Ответ: Потребуется 6 итераций.
,