Министерство образования Российской Федерации ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Кафедра информатики
О.Г. Габдулл...
13 downloads
155 Views
875KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Министерство образования Российской Федерации ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Кафедра информатики
О.Г. Габдуллина
МЕТОДИЧЕСКИЕ УКАЗАНИЯ для студентов дневной формы обучения по дисциплине «Информатика» (раздел −Основы теории вероятностей и математической статистики)
Оренбург 2000
ББК 22.17 я 7 Г 12 УДК 519.2 (07) Методические указания предназначены для студентов специальностей 150200, 230100 дневной формы обучения в качестве вспомогательного материала при изучении основ теории вероятностей и математической статистики. Могут использоваться для создания и реализации алгоритмов решения прикладных задач в среде Excel.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ для студентов дневной формы обучения по дисциплине «Информатика» (раздел −Основы теории вероятностей и математической статистики) 1 Определение вероятностей событий. Вероятностные расчеты при многократных испытаниях 1.1Определение вероятности. Основные теоремы. Формула полной вероятности. Формула Бейеса Вероятностью события называется численная мера степени объективной возможности этого события. Если результаты опыта сводятся к схеме случаев, то вероятность события А вычисляется по формуле : P (A)= m/n, где m - число случаев, благоприятствующих А; n - число всех случаев. Несколько событий образуют полную группу, если в результате испытания появится хотя бы одно из них. Относительной частотой события называют отношение числа испытаний, в которых событие появилось к общему числу фактически произведенных испытаний: r = m/n, где m - число появлений события, n - общее число испытаний. Теорема сложения вероятностей несовместных событий. Вероятность появления одного из двух несовместных событий, безразлично какого, равна сумме вероятностей этих событий: P (A + B) = P (A) + P (B). Следствие. Вероятность появления одного из нескольких попарно несовместных событий, безразлично какого, равна сумме вероятностей этих событий: P (A1 + A2 + … + An = P (A 1 ) + P (A2 ) + … + P (An). 2
Теорема сложения вероятностей совместных событий. Вероятность появления хотя бы одного из двух совместных событий равна сумме вероятностей этих событий без вероятностей их совместного появления: P (A + B) = P (A) + P (B) - P (A B). Теорема может быть распространена на любое количество событий. Теорема умножения вероятностей. вероятность совместного появления двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную в предположении, что первое событие уже наступило: P (A B) = P (A) P(АB). Для независимых событий вероятность их совместного появления совместного появления равна: P (A B) = P (A) P (B). Условной вероятностью события А при наличии В называется вероятность события А, вычисленная при условии, что событие В произошло. Эта вероятность обозначается P(AB). Теорема умножения вероятностей для нескольких событий.. P(A1A2…An)=P(A1)P(A2A1)( A3 A1 A2)…( An A1 A2 …An-1) Если об обстановке опыта можно сделать n исключающих друг друга предположений (гипотез) Н1 , Н2,…, Нn и если событие А может появиться только при одной из этих гипотез, то вероятность события А вычисляется по формуле полной вероятности: P(A)=P(Н1)P(A Н1) + P(Н2)P(A Н2) + …+ P(Нn)P(A Нn) Если в результате опыта появилось события А, то с учетом этого события новые вероятности гипотез вычисляют по формуле Бейеса: Р (H ) = A i
P( H ) P ( A) i H i
P( A)
(i = 1,2,..., n)
1.2 Задания к лабораторной работе №1 1 Образуют ли полную группу следующие группы событий: опыт - бросание монеты; события: А1 -появление герба; А2 - появление цифры. 2 Игральная кость бросается два раза. Найти вероятность того, что оба раза появятся одинаковое число очков. 3 Назвать противоположные для следующих событий: А - Выпадение двух гербов при бросании двух монет; В - Появление белого шара при вынимании одного шара из урны, в которой 2 белых, 3 черных и 4 красных шара; С - три попадания при трех выстрелах. 3
4 Группа студентов состоит из а - отличников, в - хорошистов и с занимающихся слабо. Для сдачи экзамена вызывается наугад один студент. Найти вероятность того, что он получит хорошую или отличную оценку. 5 Прибор состоит из n блоков. Надежность в течении времени Т первого блока равна р, второго р, и т.д. Блоки отказывают независимо друг от друга. При отказе любого блока отказывает прибор. Найти вероятность того, что прибор откажет за время Т. 6 Для повышения надежности прибора он дублируется другим точно таким же прибором; надежность (вероятность безотказной работы) каждого прибора равна р. При выходе из строя первого прибора происходит мгновенное переключение на второй (надежность переключающего устройства равна единице). Определить надежность системы двух дублирующих друг друга приборов. 7 Число грузовых автомашин, проезжающих по шоссе, на котором стоит бензоколонка относится к числу легковых машин, проезжающих по тому же шоссе как 3:2. Вероятность того, что будет заправляться грузовая машина, равна 0,1; для легковой машины эта вероятность равна 0,2. К бензоколонке подъехала для заправки машина. Найти вероятность того, что это грузовая машина. 8Отел технического контроля проверяет партию из 10 деталей. Вероятность того, что каждый из образцов будет признан годным к продаже, равна 0,6. Найти наивероятнейшее число образцов, которые товаровед признает годными к продаже. 1.3 Вопросы по теме 1 Классическое определение вероятности. Относительная частота. 2 Виды случайных событий. Вероятность достоверного события. Вероятность невозможного события. 3 Теорема сложения вероятностей несовместных событий. 4 Теорема сложения вероятностей совместных событий. 5 Противоположные события. Сумма вероятностей противоположных событий. 6 Произведение событий. Условная вероятность. Теорема умножения вероятностей. 7 Независимые события. Теорема умножения вероятностей для независимых событий. 4
8 Формула полной вероятности. 9 Вероятность гипотез. Формула Бейеса. 10 Формула Бернулли. 11 Повторение испытаний. Локальная теорема Лапласа. 12 Повторение испытаний. Интегральная теорема Лапласа.
2 Случайные величины. Законы распределения случайных величин. Числовые характеристики непрерывных случайных величин 2.1 Дискретные случайные величины. Законы биномиальный и Пуассона. Числовые характеристики случайных величин Фундаментальным понятием в теории вероятностей является понятие случайной величины. Например, количество автомобилей подъезжающих к городу в течение одного часа, подвержено колебаниям и принимает то или иное значение в зависимости от многих обстоятельств. Число автомобилей данного парка, вышедших из стоя в определенный период времени Т, также представляет собой случайную величину и зависит от многих разных причин (например, условий эксплуатации, носящий случайный характер). Случайной величиной называется переменная величина, значения которой зависят от случайных обстоятельств и для которой определена функция распределения вероятностей. Дискретная случайная величина - это случайная величина, которая может принимать конечное или счетное множество возможных значений.Случайные величины обозначают прописными буквами − X,Y,Z, а их возможные значения − соответствующими строчными буквами x,y,z . Законом распределения дискретной случайной величины называют соответствие между возможными значениями и их вероятностями; его можно задавать таблично, аналитически и графически. Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность наступления события во всех испытаниях постоянна и равна p. Вероятность возможного значения Х=к вычисляют по формуле Бернулли: Pn ( k ) = Cnk p q q n − q .
5
Распределение вероятностей, определяемое формулой Бернулли, называют биномиальным. Если число испытаний велико, а вероятность p появления события в каждом испытании очень мала, то используют приближенную формулу Pn (k ) = λk e − λ / k!,
где κ - число появлений события в n независимых испытаниях, λ= np (среднее число появлений события в n испытаниях). Эта формула выражает закон Пуассона вероятностей массовых (n велико) и редких (p мало) событий. Закон распределения полностью характеризует случайную величину. Однако часто закон распределения неизвестен и приходится ограничиваться числами, которые описывают случайную величину суммарно. Такие числа называются числовыми характеристиками случайной величины. Характеристикой среднего значения случайной величины служит математическое ожидание, которое равно сумме произведений всех ее возможных значений на их вероятности: M ( X ) = x1 p1 + x2 p2 + ... + xn pn .
Математическое ожидание биномиального распределения равно произведению числа испытаний на вероятность появления события в одном испытании: M ( X ) = np.
Свойства математического ожидания 1. Математическое ожидание постоянной величины равно самой постоянной: M (C ) = C . 2. Постоянный множитель можно выносить за знак математического ожидания: M (CX ) = CM ( X ).
3.Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий: M(XY)=M(X)M(Y). 4. Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых: M(X+Y)=M(X)+M(Y) Характеристиками рассеяния возможных значений случайной величины вокруг математического ожидания служат дисперсия и среднее квадратическое отклонение Дисперсией случайной величины Х называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания: D ( X ) = M [ X − M ( X )]2
Дисперсию удобно вычислять по формуле: D( X ) = M ( X 2 ) − [ M ( X )]2 .
6
Свойства дисперсии 1. Дисперсия постоянной величины С равна нулю: D(C ) = 0
2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат: D(CX ) = C 2 D( X ).
3. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин: D( X + Y ) = D( X ) = D(Y ).
4. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий: D( X − Y ) = D( X ) + D(Y ).
Дисперсия числа появлений события А в n независимых испытаниях, в каждом из которых вероятность появления события постоянна, равна произведению числа испытаний на вероятности появления и непоявления события в одном испытании: D( X ) = npq
Средним квадратическим отклонением случайной величины Х называют квадратный корень из дисперсии: σ ( X ) = D( X ).
Кроме математического ожидания и дисперсии дискретной случайной величины вычисляют теоретические моменты. Начальным моментом порядка k случайной величины Х называют математическое ожидание величины Xk 2.2 Функции и плотности распределения случайных величин. Числовые характеристики непрерывных случайных величин Функцией распределения называют функцию F(x), определяющую вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х: F ( x) = P( X < x).
Геометрически это равенство можно истолковать так: F(x) есть вероятность того, что случайная величина примет значение, которое изображается на числовой оси точкой, лежащей левее точки х. Случайную величину называют непрерывной, если ее функция распределения есть непрерывная, кусочно-дифференцируемая функция с непрерывной производной. Свойства функции распределения 1. Значения функции распределения принадлежат отрезку [0,1] 0 ≤ F ( x) ≤ 1.
2. F(x) - неубывающая функция, т.е. F ( x ) ≥ F ( x ), если 2
1
x > x. 2
1
3. Вероятность того, что случайная величина примет значение, 7
заключенное в интервале (a,b) равна приращению функции распределения на этом интервале: Р (а ≤ b) = F (b) − F (a ).
4.Вероятность того, что непрерывная случайная величина Х примет одно определенное значение, равна нулю. 5. Если все возможные значения случайной величины принадлежат интервалу (a,b) , то 1) F(x) =0 при х≤ а ; 2) F(x)=1 при x ≥ b. Плотностью распределения вероятностей непрерывной случайной величины Х называют первую производную от функции распределения F(x): f(x)=F′(x). Зная плотность распределения, можно вычислить вероятность того, что непрерывная случайная величина примет значение, принадлежащее заданному интевалу(a,b): b Р ( a < X < b) =
∫ f ( x)dx.
a
Свойства плотности распределения 1. Плотность распределения - неотрицательная функция: f(x) ≥ 0. 2. Несобственный интеграл от плотности распределения в пределах от -∞ до ∞ равен единице:
∞
∫ f ( x)dx = 1.
−∞
Числовые характеристики непрерывных случайных величин. Математическим ожиданием непрерывной случайной величины Х, возможные значения которой принадлежат отрезку[a, b] , называют определенный интеграл b M ( X ) = ∫ xf ( x)dx. a
Дисперсией непрерывной случайной величины называют математическое ожидание квадрата ее отклонения. Если возможные значения Х принадлежат отрезку (a, b), то b
D( X ) = ∫ [ x − M ( X )]2 f ( x)dx; a
если возможные значения принадлежат всей оси х, то ∞ D( X ) = ∫ [ x − M ( X )]2 f ( x)dx. −∞
8
2.3 Задания к лабораторной работе №2 1. Дискретная случайная величина Х задана законом распределения: Х 1 3 6 8 Р 0,2 0,1 0,4 0,3 Построить многоугольник распределения. Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 2. Устройство состоит из 1000 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течении времени Т равна 0,002. Найти вероятность того, что за время Т откажут ровно три элемента. 3. Дана функция распределения непрерывной случайной величины при x ≤ 0 0 Х: F ( X ) = sin 2 x при 0 < x ≤ π / 4 1 при х > π / 4
Найти плотность распределения f(x). 4. Дискретная случайная величина Х задана законом распределения: Х 1 3 Р 0,6 0,4 Построить многоугольник распределения .Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 5. Устройство состоит из 1500 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течении времени Т равна 0,003. Найти вероятность того, что за время Т откажут ровно четыре элемента. 6. Дана
плотность
распределения
непрерывной
случайной
величины
при x ≤ 1 0 Х: F ( X ) = x − 1 / 2 при 1 < x ≤ 2 Найти функцию распределения F(x). 1 при х > 2
7. Дискретная случайная величина Х задана законом распределения: Х 1 2 4 Р 0,1 0,3 0,6 Построить многоугольник распределения .Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 8. Устройство состоит из 1000 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течении времени Т равна 9
0,004. Найти вероятность того, что за время Т откажут ровно пять элементов. 9. Дискретная случайная величина Х задана законом распределения: Х 2 4 7 Р 0,5 0,2 0,3 Построить многоугольник распределения. Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 10. Устройство состоит из 1100 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течении времени Т равна 0,001. Найти вероятность того, что за время Т откажут ровно три элемента. 11. Дана функция распределения непрерывной случайной величиныХ: при x ≤ 0 0 F ( X ) = sin 2 x при 0 < x ≤ π / 4 Найти плотность распределения f(x). 1 при х > π / 4
12. Дискретная случайная величина Х задана законом распределения Х 2 4 5 6 Р 0,3 0,1 0,2 0,4 Построить многоугольник распределения. Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 13. Написать биномиальный закон распределение дискретной случайной величиныХ - числа появления «герба» при двух бросаниях монеты. Найти плотность распределения f(x) 14. Дискретная случайная величина Х задана законом распределения : Х 10 15 20 Р 0,1 0,7 0,2 Построить многоугольник распределения. Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график 15. Устройство состоит из 12000 элементов, работающих независимо один от другого. Вероятность отказа любого элемента в течении времени Т равна 0,003. Найти вероятность того, что за время Т откажут ровно 2 элемента. 16. Дискретная случайная величина Х задана законом распределения Х 0 1 2 3 Р 0,729 0,243 0,027 0,001 Построить многоугольник распределения .Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 10
17. Устройство состоит из пяти независимо работающих элементов. Вероятность отказа каждого элемента в одном опыте равна 0,2. Составить закон распределения числа отказавших элементов. Найти функцию распределения F(x). 18. Дискретная случайная величина Х задана законом распределения: Х 0,21 0,54 0,61 Р 0,1 0,5 0,4 Построить многоугольник распределения. Найти математическое ожидание случайной величины Х, дисперсию и среднее квадратическое отклонение. Найти начальные и центральные моменты первого, второго и третьего порядков. Найти функцию распределения и начертить ее график. 2.4 Законы распределения случайных величин 2.4.1 Закон равномерного распределения вероятностей
Если на интервале, которому принадлежат все возможные значения случайной величины плотность распределения сохраняет постоянное значение, то такое распределение называют равномерным: 1 f ( x) = β − α 0
при
x ∈ (α , β ),
при
x ∉ (α , β ).
0 при х < a; х − a F ( x) = при х ∈ [a, b]; b a − 1 при х > b.
Математическое ожидание и дисперсия равномерно распределенной случайной величины соответственно равны: М ( x) = (a + b) / 2,
D( x) = (b − a) 2 / 12 .
Вероятность попадания случайной величины Х в отрезок [α,β]∈[a,b] определяется по формуле: P ( X ∈ [α , β ]) = F ( β ) − F (α ) =
β −α b−a
.
(1)
Пример - Информация о выходе из строя бульдозера, работающего на твердом глинистом грунте распределена по закону равномерной плотности; при этом ее поступление возможно в любой момент времени Т в интервале 8 часов работы. Определить вероятность получения указанной информации в течение третьего часа работы. Решение - Применяя формулу (1) получаем P (T ∈ [α , β ]) =
β −α b−a
=
3− 2 = 0,125. 8−0
2.4.2 Нормальное распределение
11
Нормальным называют распределение вероятностей непрерывной случайной величины, которое описывается плотностью: f ( x) =
1
σ 2π
2 2 e − ( x − a ) / 2σ
Параметр а есть математическое ожидание, σ - среднее квадратическое отклонение нормального распределения. Вероятность попадания нормальной случайной величины в заданный интервал равна:
β −а α − а Р(α < X < β ) = Ф − Ф . σ σ
Пример - Скорость движения автомобилей на участке МоскваСимферополь распределена по нормальному закону и характеризуется математическим ожиданием х = 90 и средним квадратическим отклонением σ х = 10 . Требуется определить вероятность попадания случайной величины в интервал от а=100 до b=105. Решение -
100 − 90 105 − 90 Р(100 < X < 105) = Ф = Ф(1,5) − Ф(1) = 0,933 − 0,841 = 0, − Ф 10 10 2.4.3 Показательное распределение
Показательным называют распределение вероятностей непрерывной случайной величины, которое описывается плотностью 0 f ( x ) = − λx λe
при
x < 0,
при
x ≥ 0,
где λ - постоянная положительная величина .Функция распределения показательного закона : 0 F ( x) = − λx 1 − e
при
x < 0,
при
x ≥ 0.
Вероятность попадания в заданный интервал (a,b) показательно распределенной случайной величины Х равна: Р (a < X < b) = e − λa − e − λb .
Математическое ожидание и дисперсия показательного распределения равны: M ( x) = 1 / λ ,
D( x) = 1 / λ2 .
Среднее квадратическое математическому ожиданию:
отклонение
показательного
закона
равно
σ ( x) = 1 / λ.
Показательное распределение находит широкое применение при решении 12
различных экономических и технических задач, связанных с исследованием эффективности функционирования автомобильно-дорожных средств и систем. Так, например: - при определении надежности деталей автомобиля, когда единичные повреждения приводят к отказу изделия. Такие условия возникают при превышении нагрузки, например, при ударе (приводящем к поломке изделия); при превышении электрического напряжения, приводящему к перегоранию конденсаторов, перегоранию ламп и т.п.; - при определении параметров систем массового обслуживания, например, при диагностике состояний автомобилей, смазке, регулировке их механизмов, т.е. при техническом обслуживании и ремонте автомобилей, расходуемое время на выполнение указанных операций распределено в большинстве случаев по показательному закону; - время между двумя автомобилями, прибывающими на станцию обслуживания, также описывается с помощью показательного закона. Пример Время обслуживания автомобилей на станции технического обслуживания распределено по показательному закону с параметром λ=3 автомобилей в час. Определить сколько автомобилей будет обслужено за время от t=0,13 до t=0,7. Решение. P(0,13 < x < 0,7) = −e−3*0,13 − e−3*0,7 = 0,553. 2.5 Задания к лабораторной работе№3 1. Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (2,8). 2. Математическое ожидание нормально распределенной случайной величины Х равно а=3 и среднее квадратическое отклонение σ=2. Написать плотность вероятности Х. 3. Непрерывная случайная величина Х распределена по показательному закону, заданному плотностью вероятности −3 x f ( x) = 3e при x ≥ 0; при x < 0 f ( x) = 0 . Найти вероятность того, что в результате испытания Х попадает в интервал (0,13;0,7). 4. Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (4,9). 5. Математическое ожидание и среднее квадратическое отклонение нормально распределенной случайной величины Х соответственно равны 10 и 2. Найти вероятность того, что в результате испытания Х примет значение, заключенное в интервале(12,14). 6. Найти математическое ожидание показательного распределения, заданного при х ≥ 0 :а) плотностью распределения; х ≥ 0 : f ( x) = 6e−6 x б) функцией распределения F ( x) = 1 − e−0,2 x . 7. Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (1,5). 13
8. Написать плотность и функцию распределения показательного закона, если параметр λ=6. 9. Найти дисперсию и среднее квадратическое отклонение показательного распределения, заданного плотностью вероятности f ( x) = 7e−7 x 1.Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (2,9). 10. Математическое ожидание и среднее квадратическое отклонение нормально распределенной случайной величины Х соответственно равны 10 и 2. Найти вероятность того, что в результате испытания Х примет значение, заключенное в интервале(12,14). 11. Непрерывная случайная величина Х распределена по показательному закону, заданному плотностью вероятности f ( x) = 9e −9 x при x ≥ 0; при x < 0 f ( x) = 0 . Найти вероятность того, что в результате испытания Х попадает в интервал (0,13;0,7). 12. Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (1,6). 13. Математическое ожидание нормально распределенной случайной величины Х равно а=3 и среднее квадратическое отклонение σ=2. Написать плотность вероятности Х. 14. Найти дисперсию и среднее квадратическое отклонение показательного распределения, заданного плотностью вероятности f ( x) = 8e −8 x 15. Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (12,24). 16. Математическое ожидание и среднее квадратическое отклонение нормально распределенной случайной величины Х соответственно равны 10 и 2. Найти вероятность того, что в результате испытания Х примет значение, заключенное в интервале(12,14). 17. Найти математическое ожидание показательного распределения, заданного при х ≥ 0 :а) плотностью распределения; х ≥ 0 : f ( x) = 5e −5 x ,б) функцией распределения F ( x) = 1 − e −0,1x 18. Найти математическое ожидание случайной величины Х, равномерно распределенной в интервале (21,48). 19. .Написать плотность и функцию распределения показательного закона, если параметр λ=3,5. 20. Найти дисперсию и среднее квадратическое отклонение показательного распределения, заданного плотностью вероятности f ( x) = 8e −8 x
2.6 Вопросы по теме 1 Приведите пример равномерного распределения вероятностей. 2 Математическое ожидание нормально распределенной случайной величины. 14
3 Какими параметрами определяется нормальное распределение? 4 Как влияют параметры нормального распределения на форму нормальной кривой? 5 Какими параметрами определяется показательное распределение? 6 Чему равно математическое ожидание показательного закона распределения? 7 Законы распределения биномиальный и Пуассона. 8 Определение дискретной случайной величины. 9 Определение непрерывной случайной величины. 10 Математическое ожидание дискретной случайной величины. 11 Математическое ожидание непрерывной случайной величины. 12 Дисперсия дискретной случайной величины. 13 Дисперсия и среднее квадратическое отклонение непрерывной случайной величины.
3 Выборочный метод. Статистические оценки параметров распределения 3.1 Статистическое распределение выборки. Эмпирическая функция распределения. Полигон и гистограмма Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать в виде последовательности интервалов и соответствующих им частот. Эмпирической функцией распределения называют функцию F ∗ (x) , определяющую для каждого значения х относительную частоту события Х<х: F ∗ ( x) =
nx n
,
где nx - число вариант, меньших x; n - объём выборки. Для наглядности строят различные графики статистического распределения. Полигоном частот называют ломаную, отрезки которой соединяют точки (xi , n i). Полигоном относительных частот называют ломаную, отрезки которой соединяют точки(xi,wi). В случае непрерывного признака строят гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала n i - сумму частот вариант, попавших в i-й интервал. Площадь гистограммы относительных частот равна 1.
15
3.2 Определение числовых характеристик статистического ряда Выборочной средней признака выборки:
называют
среднее
арифметическое
значение
n х = ∑ хi ni / n, i =1
Для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения, вводят сводную характеристику - выборочную дисперсию: Dв = x 2 − [ x]2 .
Если в качестве оценки генеральной средней принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Несмещенной оценкой генеральной дисперсии является исправленная дисперсия: s2 =
n . n − 1 DВ
Все оценки, рассмотренные выше, являются точечными, т.е. они определяются одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра. По этой причине следует пользоваться интервальными оценками, которые определяются двумя числами - концами интервала. Надежностью(доверительной вероятностью) оценки θ поθ* называют вероятностьγ, с которой осуществляется неравенство: θ-θ*< δ. Обычно надежность задается наперед, например 0,95; 0,999. Доверительным называют интервал (θ*-δ,θ* +δ), который покрывает неизвестный параметр с заданной надежностьюγ. Если количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое σ этого распределения известно, то с надежностьюγ можно утверждать, что доверительный интервал ( х − tσ / n , x − tσ / n ) покрывает неизвестный параметр а; точность оценки δ = tσ / n . Число t определяется из равенства Ф(t)=γ/2; по таблице функции Лапласа находят аргумент t, которому соответствует значение функции Лапласа, равное γ/2. Вычисление числовых характеристик статистического ряда трудоемкий процесс, поэтому целесообразнее проводить вычисления в табличном процессоре Excel. Рассмотрим пример. Выборка задана в виде распределения частот: xi 4 11 15 20 ni 18 20 25 37 Найти распределение относительных частот. 16
Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленное среднее квадратическое отклонение. Решение. x2
В строки a1:d1;a2:d2 запишем наблюдаемые значения признака x и соответствующие им частоты ni. В клетке e2 найдем число наблюдений: =СУММ(a2:d2). В ячейку а3 запишем формулу для вычисления относительных частот: = a1/$e$2 и скопируем ее в ячейки b3:d3. Сумма относительных частот равна единице (клетка е3 =СУММ(a3:d3)). В ячейку a5 записываем формулу a2*a1 и копируем ее в b5:d5 .В e5 заносим формулу =СУММ(a5:d5).В e4 найдем n
выборочное среднее х = ∑ хi ni / n , (=e5/e2).В строке a6:d6 найдем значения x2 i =1
,размножив формулу =a1^2. В клетках a7:d7 подсчитаем ni xi2 .В клетку a7 2 запишем формулу = a2*a6; в e8- =e7/e2 ( x 2 ); в d4 - = e4^2 ( х ). В клетке d8 найдем дисперсию; в клетке e9 – исправленную дисперсию- =e2/(e2-1)*d8. И в клетках e10 и e11 среднее квадратическое отклонение и исправленное среднее квадратическое отклонение по формулам в e10 =КОРЕНЬ(d8); в e11=КОРЕНЬ(e9). (см. таблицу1). Таблица1 A 1 4 2 18 3 0,18 4 5 72 6 16 7 288 8 9 10 11
B 11 20 0,2
C 15 25 0,25
220 121 2420
375 225 5625
D 20 37 0,37 197,9649 740 400 14800 33,3651
E 100 1 14,07 1407 23133 231,33 33,70212 5,776253 5,805353
С помощью встроенной функции Мастер диаграмм можно построить полигон частот. Для этого следует выделить строки a1:d2; вызвать Мастера диаграмм, выбрать тип- точечная. ( рисунок1)
17
полигон частот
частоты
40 30 20 10 0 0
5
10
15
20
25
значения признака
Рисунок1 Аналогично строится полигон относительных частот. 3.3 Задания к лабораторной работе №4 1. Выборка задана в виде распределения частот: xi 2 5 7 ni 1 3 6 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 2. Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение σ=5, выборочная средняя х в = 14 и объем выборки n=25. 3. Выборка задана в виде распределения частот: xi 65 70 75 80 85 ni 2 5 25 15 3 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 4. Выборка задана в виде распределения частот: xi 6 8 11 13 1 20 13 18
ni
1 9 6
6
5 4
1
Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 5. Найти доверительный интервал для оценки с надежностью 0.99 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если известны генеральное среднее квадратическое отклонение σ=5, выборочная средняя х В =16,8 и объем выборки n=25. 6. Выборка задана в виде распределения частот: xi 5 11 17 23 ni 18 20 25 37 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 7. Выборка задана в виде распределения частот: xi 12 15 17 18 20 22 ni 1 8 6 15 2 4 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 8. Найти доверительный интервал для оценки с надежностью0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение σ=5, выборочная средняя х в = 14 и объем выборки n=100. 9. Выборка задана в виде распределения частот: xi 2 3 7 9 11 12 16 18 23 25 26 ni 1 3 6 2 10 13 4 8 20 9 4 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. 19
Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 10 Найти доверительный интервал для оценки с надежностью0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение σ=2,4 , выборочная средняя х в = 14 и объем выборки n=30. 11. Выборка задана в виде распределения частот: xi 0 1 2 3 4 5 6 7 ni 199 169 87 31 9 3 1 1 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот, гистограмму относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 12. Найти доверительный интервал для оценки с надежностью0,95 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если генеральное среднее квадратическое отклонение σ=5, выборочная средняя х в = 16 и объем выборки n=50. 13. Выборка задана в виде распределения частот: xi 12 15 17 18 20 22 ni 1 8 6 15 2 4 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 14.По данным десяти независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений х В = 30,1 и исправленное среднее квадратическое отклонение s=4. Оценить истинное значение измеряемой величины с помощью доверительного интервала с надежностьюγ=0,99. Предполагается, что результаты измерений распределены нормально. 15. Выборка задана в виде распределения частот: 1 2 3 4 5 6 7 xi 0 20
ni 199 169 87 31 9
3
1
1
Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 16.По данным 16 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений х В = 42,8 и исправленное среднее квадратическое отклонение s=8. Оценить истинное значение измеряемой величины с помощью доверительного интервала с надежностью γ=0,999. Предполагается, что результаты измерений распределены нормально. 17. Выборка задана в виде распределения частот: xi 2 3 7 9 11 12 16 18 23 25 26 ni 1 3 6 2 10 13 4 8 20 9 4 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот, гистограмму относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию. 18.Найти доверительный интервал для оценки с надежностью 0.99 неизвестного математического ожидания а нормально распределенного признака Х генеральной совокупности, если известны генеральное среднее квадратическое отклонение σ=5, выборочная средняя х В =16,8 и объем выборки n=25. 19. Выборка задана в виде распределения частот: xi 12 15 17 18 20 22 ni 1 8 6 15 2 4 Найти - распределение относительных частот; - эмпирическую функцию распределения. Построить полигон частот, полигон относительных частот, гистограмму относительных частот. Найти несмещенную оценку генеральной средней; выборочную дисперсию; исправленную выборочную дисперсию.
21
20. По данным 20 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений х В = 42,8 и исправленное среднее квадратическое отклонение s=3. Оценить истинное значение измеряемой величины с помощью доверительного интервала с надежностью γ=0,999. Предполагается, что результаты измерений распределены нормально. 3.4 Вопросы по теме 1 Какая статистическая оценка называется несмещенной? 2 Генеральная и выборочная совокупности. 3 Повторная и бесповторная выборки. Репрезентативная выборка. 4 Способы отбора. 5 Эмпирическая функция распределения. 6 В чем состоит свойство устойчивости выборочных средних? 7 Какие оценки называют точечными? 8 Доверительный интервал и доверительная вероятность.
4 Статистическая проверка статистических гипотез 4.1 Основные сведения Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений. Нулевой (основной) называют выдвинутую гипотезу H0 .Конкурирующей(альтернативной) называют гипотезу H1, которая противоречит нулевой. Выдвинутая гипотеза может быть правильной или неправильной. Поэтому возникает необходимость ее проверки. В итоге статистической проверки могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность совершить ошибку первого рода принято обозначать через α, ее называют уровнем значимости. Например, α=0,05 -означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода. Для проверки нулевой гипотезы используют специально подобранную случайную величину К, распределение которой известно. Ее называют статистическим критерием. Наблюдаемым значением критерия К, называют 22
значение критерия, вычисленное по выборкам. После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества, одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая - при которых она принимается. Критической областью называют совокупность значений критерия, при которых гипотезу принимают. 4.2 Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи различных критериев: критерия согласия Пирсона, Колмогорова, Смирнова и т.д. Рассмотрим применение критерия Пирсона к проверке статистической гипотезы о нормальном распределении генеральной совокупности. Для того чтобы при уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности, надо: 1. Вычислить выборочную среднюю х и выборочное среднее квадратическое отклонениеσв ,причем в качестве вариант x* принимают i
среднее арифметическое концов интервала: xi* = ( xi + xi +1) / 2. 2. Перейти к случайной величине Z = ( X − x* ) / σ * ,и вычислить концы интервалов
:
z i = ( xi − x * ) / σ * ,
z i +1 = ( xi +1 − x * ) / σ * , причем
наименьшее
значение Z полагают равным − ∞ , а наибольшее полагают равным ∞ . 3. Вычислить теоретические частоты ni′ = nPi , где n - объем выборки(сумма всех частот); Pi = Ф( zi +1 ) − Ф( zi ) вероятности попадания Х в интервалы ( хi , xi +1) ,Ф(Z) - функция Лапласа. 4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Наблюдаемое значение критерия находят по формуле: 2 χ набл = ∑ (n − n′ ) 2 / n ′. i i i
По таблице критических точек распределения χ 2 , по заданному уровню значимости α числу степеней свободы k=s-3 (s - число интервалов выборки) находят критическую точку правосторонней критической областиχ2кр(α,k). Если χ2набл<χ2кр - нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Если χ2набл>χ2кр -гипотезу отвергают. 23
Пример - Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности Х с эмпирическим распределением выборки объема n=100.Вычисления проведем, пользуясь табличным процессором EXCEL .(Таблица2). Таблица2 Номер интервала i 1 2 3 4 5 6 7
Границы интервала
Частота,ni
0-2 2-4 4-6 6-8 8-10 10-12
3 18 59 45 34 9 n=100
Решение - 1.Вычислим выборочную среднюю и выборочное среднее квадратическое отклонение. Для этого перейдем от заданного интервального распределения к распределению равноотстоящих вариант, приняв в качестве варианты хi* среднее арифметическое концов интервала: хi∗ = ( xi + xi +1) / 2 . В итоге получим распределение: х i* 1 3 5 7 9 11 ni 3 18 59 45 34 11 6,02 3.22 Вычислим выборочную среднюю и
среднее
квадратическое
отклонение: xв• = 6,02, σ * = 3,22 2. Найдем интервалы
( z = ( x − x* ) / σ *, i i
z = (x − x* ) / σ ) i +1 i +1 *
и вычислим
теоретические вероятности Рi и теоретические частоты. Составим расчетную таблицу 3. Таблица 3 A 1 xi 2 0 3 2 4 4 4 6 6 8 7 10 8 ∑ 24
B Xi+1 2 4 6 8 10 12
C zi -1,24845 -0,62733 -0,00621 0,614907 1,236025
D zi+1 -1,24845 -0,62733 -0,00621 0,614907 1,236025
E Ф(zi) -0,5 -0,3925 -0,2357 -0,004 0,2324 0,3944
F Ф(zi+1) -0,3944 -0,2324 -0,004 0,2324 0,3944 0,5
G Рi 0,1056 0,1601 0,2317 0,2364 0,162 0,1056
H n i′ 17,74 26,90 38,93 39,72 27,22 17,74 168,24
3. Сравним эмпирические и теоретические частоты, используя критерий Пирсона. Для этого составим расчетную таблицу 4. Таблица 4 A
B
C
D
1
I
ni
n i′
(ni -ni′)2/ ni′
2 3 4 5 6 7 8
1 2 3 4 5 6 χ2набл
3 18 59 45 34 9
17,74 26,9 38,92 39,72 27,22 17,74
12,24733 2,94461 10,35988 0,701873 1,688773 4,305953 32,24841
По таблице критических точек распределения χ2, по уровню значимости α=0,05 и числу степеней свободы k=6-3=3 находим критическую точку правосторонней критической областиχ2кр(0,05,3)=7,8. Так как χ2набл>χ2кр - отвергаем гипотезу о нормальном распределении генеральной совокупностиХ .Т.е. эмпирические и теоретические частоты различаются значимо. Это означает, что данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности. 4.3 Задания к лабораторной работе №5 Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности Х с эмпирическим распределением выборки объема n. Таблица 5 Номер варианта 1 1
2
25
Границы интервала 2 0-3 3-6 6-9 9-12 0-2 2-4 4-6 6-8
Частота ni 3 11 38 48 12 1 5 46 26
8-10 10-12 0-2 2-4 4-6 6-8 8-10 10-12 0-2 2-4 4-6 6-8 8-10 10-12
12 2 2 15 47 56 20 9 10 21 13 7 2 3
Продолжение таблицы 5 1 2 0-2 2-4 4-6 6-8 8-10 5 10-12 0-2
3 4 12 55 57 13 3
3
4
6
7
8
26
2-4 4-6 6-8 8-10 10-12 0-2 2-4 4-6 6-8 8-10 10-12 0-2 2-4 4-6 6-8 8-10
7 8 33 54 41 12 10 12 25 28 11 3 3 16 42 45 38
10-12 0-2 2-4 4-6 6-8 8-10 10-12 0-3 3-6 6-9 9-12 0-3 3-6 6-9 9-12
14 20 25 33 41 23 12 1 5 58 8 5 8 16 7
Продолжение таблицы 5 1 2 0-3 12 3-6 6-9 9-12 0-3 13 3-6 6-9 9-12 0-2 2-4 4-6 14 6-8 8-10 10-12 0-2 2-4 4-6 15 6-8 8-10 10-12
3 5 11 17 3 4 12 45 7 1 45 56 24 12 3 1 14 16 58 46 13
9
10
11
4.4 Вопросы по теме
27
1 Нулевая и конкурирующая гипотезы. 2 В чем состоит ошибка первого рода? 3 В чем состоит ошибка второго рода? 4 Статистические критерии. Наблюдаемое значение критерия. 5 Область принятия гипотезы. 6 Основной принцип проверки статистических гипотез. 7 Границы критерия. 8 Критерий Пирсона.
Список использованных источников 1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. Москва.: Высшая школа,1997.-400с. 2. Вентцель Е.С., Овчаров Л.А. Задачи и упражнения по теории вероятностей.-М.: Высш.шк.,2000.-366с. 3. Завадский Ю.В. Статистическая обработка эксперимента в задачах автомобильного транспорта.-Москва:ВИНИТИ,1982.-с.134.
28