Ваш репетитор, справочник и друг!

Ваш репетитор, справочник и друг!

Практикум по теории вероятностей

Научись решать в считанные дни!



2.5.3. Нормальный закон распределения вероятностей


Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма. Перед вами принципиальный вид функции плотности нормального распределения вероятностей:

Какие можно примести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов…, снова пришёл на ум грустный пример, и поэтому скажу время «жизни» лампочек :) Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

Более того, даже дискретные распределения бывают близкИ к нормальному, и в конце урока мы раскроем важную предпосылку «нормальности». А сейчас математика, математика, математика, которая в древности не зря считалась философией!

Непрерывная случайная величина , распределённая по нормальному закону, имеет функцию плотности  (не пугаемся) и однозначно определяется параметрами  и .

Эта функция получила фамилию некоронованного короля математики, К.Ф. Гаусса и в своё время была изображена вместе с его портретом на купюре в 10 немецких марок. Для функции Гаусса выполнены общие свойства плотности, а именно  (почему?) и , откуда следует, что нормально распределённая случайная величина достоверно примет одно из действительных значений. Теоретически – какое угодно, практически – узнаем позже.

Следующие замечательные факты я тоже приведу без доказательства:

 – то есть, математическое ожидание нормально распределённой случайной величины в точности равно «а», а среднее квадратическое отклонение в точности равно «сигме»: .

Эти значения выводятся с помощью общих формул, и желающие могут найти подробные выкладки в учебной литературе.
Ну а мы переходим к насущным практическим вопросам. Практики будет много, и она будет интересна не только «чайникам», но и более подготовленным читателям:

Задача 118
Нормально распределённая случайная величина задана параметрами . Записать её функцию плотности и построить график.

Несмотря на кажущуюся простоту задания, в нём существует немало тонкостей.

Первый момент касается обозначений. Они стандартные: матожидание обозначают буквой  (реже  или  («мю»)), а стандартное отклонение – буквой . Кстати, обратите внимание, что в условии ничего не сказано о сущности параметров «а» и «сигма», и несведущий человек может только догадываться, что это такое.

Решение начнём шаблонной фразой: функция плотности нормально распределённой случайной величины имеет вид  . В данном случае  и:

Первая, более лёгкая часть задачи выполнена. Теперь график. Вот на нём-то, на моей памяти, студентов «заворачивали» десятки раз, причём, многих неоднократно. По той причине, что график функции Гаусса обладает несколькими принципиальными особенностями, которые нужно обязательно отобразить на чертеже.

Сначала полная картина, затем комментарии:

На первом шаге декартову систему координат. При выполнении чертежа от руки во многих случаях оптимален следующий масштаб:

по оси абсцисс: 2 тетрадные клетки = 1 ед.,
по оси ординат: 2 тетрадные клетки = 0,1 ед., при этом саму ось следует расположить из тех соображений, что в точке  функция достигает максимума, и вертикальная прямая  (на чертеже её нет) является линией симметрии графика.

И логично, что в первую очередь удобно найти максимум функции:

Отмечаем вершину графика (красная точка).
Далее вычислим значения функции при , а точнее только одно из них – в силу симметрии графика они равны:

Отмечаем синим цветом.

Внимание!  и  – это точки перегиба нормальной кривой. На интервале  график является выпуклым вверх, а на крайних интервалах – вогнутым вниз.

Далее отклоняемся от центра влево и право ещё на одно стандартное отклонение  и рассчитываем высоту:

Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота, и «залезать» за неё категорически нельзя!

Поговорим о том, как меняется форма нормальной кривой в зависимости от значений  и .

При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо или влево соответственно. Так, при  (уменьшили «а» на 3) функция принимает вид  и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:

Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная; её функция плотности  –  чётная, и график симметричен относительно оси ординат.

В случае изменения «сигмы» (при постоянном «а»), график «остаётся на месте», но меняет форму. При увеличении  он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении  график становится более узким и высоким – как «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза:  предыдущий график сужается и вытягивается вверх в два раза:

Нормальное распределёние с единичным значением «сигма» называется нормированным, а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным. Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа: . Стандартное распределение нашло широкое применение, и очень скоро мы окончательно поймём его предназначение.

И как-то незаслуженно осталась в тени функция распределения вероятностей. Вспоминаем её определение:
 – вероятность того, что случайная величина  примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

Внутри интеграла используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению  ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала . Почти все значения  не поддаются абсолютно точному расчету, но с современными вычислительными мощностями с этим нет никаких трудностей (ролик на Ютубе).
Так, например, график функции  стандартного распределения  имеет следующий вид:

На чертеже хорошо видно выполнение всех свойств функции распределения, и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .
Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти   вероятность того, что нормальная случайная величина  примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

но каждый раз вымучивать приближенное значение   неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу:

! Вспоминает также, что:

Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы свести решение к стандартному распределению:
, где 

Зачем это нужно? Дело в том, что значения  скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений функции Лапласа:
, и с этой функцией и этой таблицей (см. Приложение Таблицы) мы уже имели дело в интегральной теореме Лапласа.

Итак, вероятность того, что нормальная случайная величина  с параметрами  и  примет значение из интервала , можно вычислить по формуле:
, где  – функция Лапласа.

Таким образом, наша задача становится чуть ли не устной! Порой, здесь хмыкают и говорят, что метод устарел. Может быть…, но парадокс состоит в том, что «устаревший метод» очень быстро приводит к результату!

И ещё в этом заключена большая мудрость – если вдруг пропадёт электричество или восстанут машины, то у человечества останется возможность заглянуть в бумажные таблицы и спасти мир =) Классика жанра:

Задача 119
Из пункта  ведётся стрельба из орудия вдоль прямой . Предполагается, что дальность полёта распределена нормально с математическим ожиданием 1000 м и средним квадратическим отклонением 5 м. Определить (в процентах) сколько снарядов упадёт с перелётом от 5 до 70м.

Решение: в задаче рассматривается нормально распределённая случайная величина  – дальность полёта снаряда, и по условию .

Так как речь идёт о перелёте за цель, то . Вычислим вероятность  – того, что снаряд упадёт в пределах этой дистанции.

Если в вашей методичке дана таблица значений функции , то используйте формулу :

Для самопроверки можно «забить»  и затем  в Пункт 9 Калькулятора, и кроме того, для стандартного нормального распределения в Экселе существует прямая функция =НОРМСТРАСП(z).

Но гораздо чаще, и в этом курсе в частности, встречается таблица значений функции Лапласа , поэтому решаем через неё:

Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета.

Напоминаю, что . Всегда контролируйте, таблица КАКОЙ функции перед вашими глазами.

Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

– с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

Тренируемся самостоятельно:

Задача 120
Диаметр подшипников, изготовленные на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, в этой задаче корректнее будет включить концы интервала в рассмотрение.

И уже в этом примере нам встретился особый случай – когда интервал  симметричен относительно математического ожидания.  В такой ситуации его можно записать в виде  и, пользуясь нечётностью функции Лапласа , упростить рабочую формулу :

Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство удобно «упаковать» с помощью модуля:

 – вероятность того, что значение случайной величины  отклонится от математического ожидания менее чем на .

Таким, образом задача про подшипники решается гораздо короче:
 – вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На этот вопрос отвечает так называемое правило «трех сигм».

Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина  примет значение из промежутка . И в самом деле, вероятность отклонения от матожидания менее чем на  составляет:
 или 99,73%
В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.
Продолжаем решать суровые советские задачи:

Задача 121
Случайная величина  ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

Решение очень простое. По условию,  и сразу заметим, что по правилу «трёх сигм», при очередном взвешивании (чего-то или кого-то) мы почти 100% получим погрешность менее 9 грамм. Но в задаче фигурирует более узкое отклонение  и по формуле :

 – вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

Ответ:

Этот пример принципиально отличается от вроде бы похожей задачи параграфа о равномерном распределении. Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте), а также по вине самого экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки механических весов.

Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически, ведь можно обсчитать :) Однако, в любом случае, случайной такая «ошибка» не будет, и её матожидание отлично от нуля.

…срочно разрабатываю курс по подготовке продавцов =)

Самостоятельно решаем обратную задачу:

Задача 122
Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно  мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью  попадет длина диаметра валика.

Пункт 5* Калькулятора в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

Задача 123
Нормально распределенная случайная величина  задана своими параметрами  (математическое ожидание) и  (среднее квадратическим отклонение). Требуется:

а) записать плотность вероятности и схематически изобразить ее график;
б) найти вероятность того, что  примет значение из интервала  ;
в) найти вероятность того, что  отклонится по модулю от  не более чем на ;
г) применяя правило «трех сигм», найти значения случайной величины .

Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании таблицы ;) После чего мы разберём заключительный пример:

Задача 124
Плотность распределения вероятностей случайной величины  имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

Решение: прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение. И поэтому «нормальность» распределения ещё нужно обосновать:

функция  определена при любом действительном значении , и если её удастся привести к виду , то случайная величина  распределена по нормальному закону.

Пробуем привести. Для этого выделяем полный квадрат и организуем трёхэтажную дробь:

Обязательно выполняем проверку, возвращая показатель в исходный вид:

, что мы и хотели увидеть.

Таким образом, мы действительно имеем дело с нормальным распределением:
 – по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид  и , то:
, откуда выражаем  и подставляем в нашу функцию:
, после чего ещё раз пробежим глазами и убедимся, что полученная функция имеет вид .

Построим график плотности:

и график функции распределения :

Пару слов на счёт ручного построения последнего графика – на случай отсутствия под рукой Экселя или даже обычного калькулятора. В точке  функция распределения принимает значение  и здесь находится перегиб графика (малиновая точка).
Кроме того, для более или менее приличного чертежа желательно найти ещё хотя бы пару точек. Берём традиционное значение  и стандартизируем его по формуле . Далее по таблице значений функции Лапласа находим:  – жёлтая точка на чертеже. С симметричной оранжевой точкой никаких проблем:  и:
.

После чего аккуратно проводим интегральную кривую, не забывая о перегибе и двух горизонтальных асимптотах.

Да, и ещё нужно вычислить:

  – вероятность того, что случайная величина  примет значение из данного отрезка.

Задача была непростой, и посему блеснём академичным стилем, ответ:

А теперь обещанный секрет:

понятие о центральной предельной теореме.

которую также называют теоремой Ляпунова. Её суть состоит в том, что если случайная величина  является суммой очень большого числа взаимно независимых случайных величин , влияние каждой из которых на всю сумму ничтожно мало, то  имеет распределение, близкое к нормальному.

В окружающем мире условие теоремы Ляпунова выполняется очень часто, и поэтому нормальное распределение встречается буквально на каждом шагу.

Так, например, молекул воздуха очень и очень много, и каждая из них своим движением оказывает ничтожно малое влияние на всю совокупность. Поэтому скорость молекул воздуха распределена нормально.

Большая популяция некоторых особей. Каждая из них (или подавляющее большинство) оказывает несущественное влияние на жизнь всей популяции, следовательно, продолжительность жизни этих особей тоже распределена по нормальному закону.

Теперь вернёмся к знакомой задаче, где проводится  независимых испытаний, в каждом из которых некое событие  может появиться с постоянной вероятностью . Эти испытания можно считать попарно независимым случайными величинами , и при достаточно большом значении «эн» биномиальное распределение случайной величины  – числа появлений события  в  испытаниях – очень близко к нормальному распределению.
Уже при  и  в многоугольнике биномиального распределения хорошо просматривается нормальная кривая:

И чем больше , тем ближе будет сходство. Причём, вероятность  может быть любой, но не слишком малой.

Именно этот факт мы и использовали в теоремах Лапласа – когда приближали  биномиальные вероятности соответствующими значениями функций нормального распределения.

Подчёркиваю, что теорема Ляпунова носит статус теоремы, а значит, строго доказана  в теории.

И в заключение книги хочется ответить на один философский вопрос: имеет ли в нашей жизни значение случайность? Безусловно! Везение играет немаловажную, а порой, и огромную роль: встретить хороших друзей, встретить «своего» человека, найти деятельность по душе и т.д. – всё это нередко происходит благодаря случаю….

Но, с другой стороны, гораздо более важнА системная и упорная деятельность, после которой следуют закономерные результаты. Желательно, полезные, конечно J

Дополнительную информацию можно найти в соответствующем разделе портала mathprofi.ru (ссылка на карту раздела). Из учебной литературы рекомендую:

Гмурман В. Е. Теория вероятностей и математическая статистика (уч. пособие);

Гмурман В. Е. Руководство к решению задач по теории вероятности (задачник с примерами решений).

 

Везения в главном!

2.5.2. Показательное распределение вероятностей

| Оглавление |



Полную и свежую версию этой книги в pdf-формате,
а также курсы по другим темам можно найти после Оглавления.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

С наилучшими пожеланиями, Александр Емелин



  © mathprofi.ru - mathter.pro, 2010-2024, сделано в Блокноте.