Случайная величина Х имеет нормальное распределение (или распределение по закону Гаусса), если ее плотность вероятности имеет вид:
,
где параметры а – любое действительное число и σ >0.
График дифференциальной функции нормального распределения называют нормальной кривой (кривой Гаусса). Нормальная кривая (рис. 2.12) симметрична относительно прямой х =а , имеет максимальную ординату , а в точках х = а ± σ – перегиб.

Рис. 2.12
Доказано, что параметр а является математическим ожиданием (также модой и медианой), а σ – средним квадратическим отклонением. Коэффициенты асимметрии и эксцесса для нормального распределения равны нулю:As = Ex = 0.
Установим теперь, как влияет изменение параметров а и σ на вид нормальной кривой. При изменении параметра а форма нормальной кривой не изменяется. В этом случае, если математическое ожидание (параметр а ) уменьшилось или увеличилось, график нормальной кривой сдвигается влево или вправо (рис. 2.13).
При изменении параметра σ изменяется форма нормальной кривой. Если этот параметр увеличивается, то максимальное значение функции убывает, и наоборот. Так как площадь, ограниченная кривой распределения и осью Ох , должна быть постоянной и равной 1, то с увеличением параметра σ кривая приближается к оси Ох и растягивается вдоль нее, а с уменьшением σ кривая стягивается к прямой х = а (рис. 2.14).

Рис. 2.13 Рис. 2.14
Функция плотности нормального распределения φ(х ) с параметрами а = 0, σ = 1 называется плотностью стандартной нормальной случайной величины , а ее график – стандартной кривой Гаусса.
Функция плотности нормальной стандартной величины определяется формулой , а ее график изображен на рис. 2.15.
Из свойств математического ожидания и дисперсии следует, что для величины , D(U )=1, M (U ) = 0. Поэтому стандартную нор мальную кривую можно рассматривать как кривую распределения случайной величины , где Х – случайная величина, подчиненная нормальному закону распределения с параметрами а и σ.
Нормальный закон распределения случайной величины в интегральной форме имеет вид
(2.10)
Полагая в интеграле (3.10) , получим
,
где . Первое слагаемое равно 1/2 (половине площади криволинейной трапеции, изображенной на рис. 3.15). Второе слагаемое
(2.11)
называется функцией Лапласа , а также интегралом вероятности.
Поскольку интеграл в формуле (2.11) не выражается через элементарные функции, для удобства расчетов составлена для z ≥ 0 таблица функции Лапласа. Чтобы вычислить функцию Лапласа для отрицательных значений z , необходимо воспользоваться нечетностью функции Лапласа: Ф(–z ) = – Ф(z ). Окончательно получаем расчетную формулу

Отсюда получаем, что для случайной величины Х , подчиняющейся нормальному закону, вероятность ее попадания на отрезок [ α, β] есть
(2.12)
С помощью формулы (2.12) найдем вероятность того, что модуль отклонения нормального распределения величины Х от ее центра распределения а меньше 3σ. Имеем
Р(|x – a | < 3 s) =P(а –3 s< X < а +3 s)= Ф(3) – Ф(–3) = 2Ф(3) »0,9973.
Значение Ф(3) получено по таблице функции Лапласа.
Принято считать событие практически достоверным , если его вероятность близка к единице, и практически невозможным, если его вероятность близка к нулю.
Мы получили так называемое правило трех сигм : для нормального распределения событие (|x –a | < 3σ) практически достоверно.
Правило трех сигм можно сформулировать иначе: хотя нормальная случайная величина распределена на всей оси х , интервал ее практически возможных значений есть (a –3σ, a +3σ) .
Нормальное распределение имеет ряд свойств, делающих его одним из самых употребительных в статистике распределений.
Если предоставляется возможность рассматривать некоторую случайную величину как сумму достаточно большого числа других случайных величин, то данная случайная величина обычно подчиняется нормальному закону распределения. Суммируемые случайные величины могут подчиняться каким угодно распределениям, но при этом должно выполняться условие их независимости (или слабой независимости). Также ни одна из суммируемых случайных величин не должна резко отличаться от других, т.е. каждая из них должна играть в общей сумме примерно одинаковую роль и не иметь исключительно большую по сравнению с другими величинами дисперсию.
Этим и объясняется широкая распространенность нормального распределения. Оно возникает во всех явлениях, процессах, где рассеяния случайной изучаемой величины вызывается большим количеством случайных причин, влияние каждой из которых в отдельности на рассеяние ничтожно мало.
Большинство встречающихся на практике случайных величин (таких, например, как количества продаж некоторого товара, ошибка измерения; отклонение снарядов от цели по дальности или по направлению; отклонение действительных размеров деталей, обработанных на станке, от номинальных размеров и т.д.) может быть представлено как сумма большого числа независимых случайных величин, оказывающих равномерно малое влияние на рассеяние суммы. Такие случайные величины принято считать нормально распределенными. Гипотеза о нормальности подобных величин находит свое теоретическое обоснование в центральной предельной теореме и получила многочисленные практические подтверждения.
Представим себе, что некоторый товар реализуется в нескольких торговых точках. Из–за случайного влияния различных факторов количества продаж товара в каждой точке будут несколько различаться, но среднее всех значений будет приближаться к истинному среднему числу продаж.
Отклонения числа продаж в каждой торговой точке от среднего образуют симметричную кривую распределения, близкую к кривой нормального распределения. Любое систематическое влияние какого-либо фактора проявится в асимметрии распределения.
Задача . Случайная величина распределена нормально с параметрами а = 8, σ = 3.Найти вероятность того, что случайная величина в результате опыта примет значение, заключенной в интервале (12,5; 14).
Решение . Воспользуемся формулой (2.12). Имеем

Задача . Число проданного за неделю товара определенного вида Х можно считать распределенной нормально. Математическое ожидание числа продаж тыс. шт. Среднее квадратическое отклонение этой случайной величины σ = 0,8 тыс. шт. Найти вероятность того, что за неделю будет продано от 15 до 17 тыс. шт. товара.
Решение. Случайная величина Х распределена нормально с параметрами а = М(Х ) = 15,7; σ = 0,8. Требуется вычислить вероятность неравенства 15 ≤ X ≤ 17. По формуле (2.12) получаем

Можно выделить наиболее часто встречающиеся законы распределения дискретных случайных величин:

Биномиальный закон распределения
Пуассоновский закон распределения
Геометрический закон распределения
Гипергеометрический закон распределения

Для данных распределений дискретных случайных величин расчет вероятностей их значений, а также числовых характеристик (математическое ожидание, дисперсия, и т.д.) производится по определенных «формулам». Поэтому очень важно знать данные типы распределений и их основные свойства.

1. Биномиальный закон распределения.

Дискретная случайная величина $X$ подчинена биномиальному закону распределения вероятностей, если она принимает значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=C^k_n\cdot p^k\cdot {\left(1-p\right)}^{n-k}$. Фактически, случайная величина $X$ - это число появлений события $A$ в $n$ независимых испытаний . Закон распределения вероятностей случайной величины $X$:

$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\end{array}$

Для такой случайной величины математическое ожидание $M\left(X\right)=np$, дисперсия $D\left(X\right)=np\left(1-p\right)$.

Пример . В семье двое детей. Считая вероятности рождения мальчика и девочки равными $0,5$, найти закон распределения случайной величины $\xi $ - числа мальчиков в семье.

Пусть случайная величина $\xi $ - число мальчиков в семье. Значения, которые может принимать $\xi:\ 0,\ 1,\ 2$. Вероятности этих значений можно найти по формуле $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot {\left(1-p\right)}^{n-k}$, где $n=2$ - число независимых испытаний, $p=0,5$ - вероятность появления события в серии из $n$ испытаний. Получаем:

$P\left(\xi =0\right)=C^0_2\cdot {0,5}^0\cdot {\left(1-0,5\right)}^{2-0}={0,5}^2=0,25;$

$P\left(\xi =1\right)=C^1_2\cdot 0,5\cdot {\left(1-0,5\right)}^{2-1}=2\cdot 0,5\cdot 0,5=0,5;$

$P\left(\xi =2\right)=C^2_2\cdot {0,5}^2\cdot {\left(1-0,5\right)}^{2-2}={0,5}^2=0,25.$

Тогда закон распределения случайной величины $\xi $ есть соответствие между значениями $0,\ 1,\ 2$ и их вероятностями, то есть:

$\begin{array}{|c|c|}
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\end{array}$

Сумма вероятностей в законе распределения должна быть равна $1$, то есть $\sum _{i=1}^{n}P(\xi _{{\rm i}})=0,25+0,5+0,25=1 $.

Математическое ожидание $M\left(\xi \right)=np=2\cdot 0,5=1$, дисперсия $D\left(\xi \right)=np\left(1-p\right)=2\cdot 0,5\cdot 0,5=0,5$, среднее квадратическое отклонение $\sigma \left(\xi \right)=\sqrt{D\left(\xi \right)}=\sqrt{0,5}\approx 0,707$.

2. Закон распределения Пуассона.

Если дискретная случайная величина $X$ может принимать только целые неотрицательные значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.

Замечание . Особенность этого распределения заключается в том, что мы на основании опытных данных находим оценки $M\left(X\right),\ D\left(X\right)$, если полученные оценки близки между собой, то у нас есть основание утверждать, что случайная величина подчинена закону распределения Пуассона.

Пример . Примерами случайных величин, подчиненных закону распределения Пуассона, могут быть: число автомашин, которые будут обслужены завтра автозаправочной станцией; число бракованных изделий в произведенной продукции.

Пример . Завод отправил на базу $500$ изделий. Вероятность повреждения изделия в пути равна $0,002$. Найти закон распределения случайной величины $X$, равной числу поврежденных изделий; чему равно $M\left(X\right),\ D\left(X\right)$.

Пусть дискретная случайная величина $X$ - число поврежденных изделий. Такая случайная величина подчинена закону распределения Пуассона с параметром $\lambda =np=500\cdot 0,002=1$. Вероятности значений равны $P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.

$P\left(X=0\right)={{1^0}\over {0!}}\cdot e^{-1}=0,368;$

$P\left(X=1\right)={{1^1}\over {1!}}\cdot e^{-1}=0,368;$

$P\left(X=2\right)={{1^2}\over {2!}}\cdot e^{-1}=0,184;$

$P\left(X=3\right)={{1^3}\over {3!}}\cdot e^{-1}=0,061;$

$P\left(X=4\right)={{1^4}\over {4!}}\cdot e^{-1}=0,015;$

$P\left(X=5\right)={{1^5}\over {5!}}\cdot e^{-1}=0,003;$

$P\left(X=6\right)={{1^6}\over {6!}}\cdot e^{-1}=0,001;$

$P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$

Закон распределения случайной величины $X$:

$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & {{{\lambda }^k}\over {k!}}\cdot e^{-\lambda } \\
\hline
\end{array}$

Для такой случайной величины математическое ожидание и дисперсия равным между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda =1$.

3. Геометрический закон распределения.

Если дискретная случайная величина $X$ может принимать только натуральные значения $1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=p{\left(1-p\right)}^{k-1},\ k=1,\ 2,\ 3,\ \dots $, то говорят, что такая случайная величина $X$ подчинена геометрическому закону распределения вероятностей. Фактически, геометрическое распределения представляется собой испытания Бернулли до первого успеха.

Пример . Примерами случайных величин, имеющих геометрическое распределение, могут быть: число выстрелов до первого попадания в цель; число испытаний прибора до первого отказа; число бросаний монеты до первого выпадения орла и т.д.

Математическое ожидание и дисперсия случайной величины, подчиненной геометрическому распределению, соответственно равны $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right)/p^2$.

Пример . На пути движения рыбы к месту нереста находится $4$ шлюза. Вероятность прохода рыбы через каждый шлюз $p=3/5$. Построить ряд распределения случайной величины $X$ - число шлюзов, пройденных рыбой до первого задержания у шлюза. Найти $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.

Пусть случайная величина $X$ - число шлюзов, пройденных рыбой до первого задержания у шлюза. Такая случайная величина подчинена геометрическому закону распределения вероятностей. Значения, которые может принимать случайная величина $X:$ 1, 2, 3, 4. Вероятности этих значений вычисляются по формуле: $P\left(X=k\right)=pq^{k-1}$, где: $p=2/5$ - вероятность задержания рыбы через шлюз, $q=1-p=3/5$ - вероятность прохода рыбы через шлюз, $k=1,\ 2,\ 3,\ 4$.

$P\left(X=1\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^0={{2}\over {5}}=0,4;$

$P\left(X=2\right)={{2}\over {5}}\cdot {{3}\over {5}}={{6}\over {25}}=0,24;$

$P\left(X=3\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^2={{2}\over {5}}\cdot {{9}\over {25}}={{18}\over {125}}=0,144;$

$P\left(X=4\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^3+{\left({{3}\over {5}}\right)}^4={{27}\over {125}}=0,216.$

$\begin{array}{|c|c|}
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end{array}$

Математическое ожидание:

$M\left(X\right)=\sum^n_{i=1}{x_ip_i}=1\cdot 0,4+2\cdot 0,24+3\cdot 0,144+4\cdot 0,216=2,176.$

Дисперсия:

$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2=}0,4\cdot {\left(1-2,176\right)}^2+0,24\cdot {\left(2-2,176\right)}^2+0,144\cdot {\left(3-2,176\right)}^2+$

$+\ 0,216\cdot {\left(4-2,176\right)}^2\approx 1,377.$

Среднее квадратическое отклонение:

$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{1,377}\approx 1,173.$

4. Гипергеометрический закон распределения.

Если $N$ объектов, среди которых $m$ объектов обладают заданным свойством. Случайных образом без возвращения извлекают $n$ объектов, среди которых оказалось $k$ объектов, обладающих заданным свойством. Гипергеометрическое распределение дает возможность оценить вероятность того, что ровно $k$ объектов в выборке обладают заданным свойством. Пусть случайная величина $X$ - число объектов в выборке, обладающих заданным свойством. Тогда вероятности значений случайной величины $X$:

$P\left(X=k\right)={{C^k_mC^{n-k}_{N-m}}\over {C^n_N}}$

Замечание . Статистическая функция ГИПЕРГЕОМЕТ мастера функций $f_x$ пакета Excel дает возможность определить вероятность того, что определенное количество испытаний будет успешным.

$f_x\to $ статистические $\to $ ГИПЕРГЕОМЕТ $\to $ ОК . Появится диалоговое окно, которое нужно заполнить. В графе Число_успехов_в_выборке указываем значение $k$. Размер_выборки равен $n$. В графе Число_успехов_в_совокупности указываем значение $m$. Размер_совокупности равен $N$.

Математическое ожидание и дисперсия дискретной случайной величины $X$, подчиненной геометрическому закону распределения, соответственно равны $M\left(X\right)=nm/N$, $D\left(X\right)={{nm\left(1-{{m}\over {N}}\right)\left(1-{{n}\over {N}}\right)}\over {N-1}}$.

Пример . В кредитном отделе банка работают 5 специалистов с высшим финансовым образованием и 3 специалиста с высшим юридическим образованием. Руководство банка решило направить 3 специалистов Для повышения квалификации, отбирая их в случайном порядке.

а) Составьте ряд распределения числа специалистов с высшим финансовым образованием, которые могут быть направлены на повышение квалификации;

б) Найдите числовые характеристики этого распределения.

Пусть случайная величина $X$ - число специалистов с высшим финансовым образованием среди трех отобранных. Значения, которые может принимать $X:0,\ 1,\ 2,\ 3$. Данная случайная величина $X$ распределена по гипергеометрическому распределению с параметрами: $N=8$ - размер совокупности, $m=5$ - число успехов в совокупности, $n=3$ - размер выборки, $k=0,\ 1,\ 2,\ 3$ - число успехов в выборке. Тогда вероятности $P\left(X=k\right)$ можно рассчитать по формуле: $P(X=k)={C_{m}^{k} \cdot C_{N-m}^{n-k} \over C_{N}^{n} } $. Имеем:

$P\left(X=0\right)={{C^0_5\cdot C^3_3}\over {C^3_8}}={{1}\over {56}}\approx 0,018;$

$P\left(X=1\right)={{C^1_5\cdot C^2_3}\over {C^3_8}}={{15}\over {56}}\approx 0,268;$

$P\left(X=2\right)={{C^2_5\cdot C^1_3}\over {C^3_8}}={{15}\over {28}}\approx 0,536;$

$P\left(X=3\right)={{C^3_5\cdot C^0_3}\over {C^3_8}}={{5}\over {28}}\approx 0,179.$

Тогда ряд распределения случайной величины $X$:

$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end{array}$

Рассчитаем числовые характеристики случайной величины $X$ по общим формулам гипергеометрического распределения.

$M\left(X\right)={{nm}\over {N}}={{3\cdot 5}\over {8}}={{15}\over {8}}=1,875.$

$D\left(X\right)={{nm\left(1-{{m}\over {N}}\right)\left(1-{{n}\over {N}}\right)}\over {N-1}}={{3\cdot 5\cdot \left(1-{{5}\over {8}}\right)\cdot \left(1-{{3}\over {8}}\right)}\over {8-1}}={{225}\over {448}}\approx 0,502.$

$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{0,502}\approx 0,7085.$

Функция распределения в этом случае согласно (5.7), примет вид:

где: m – математическое ожидание, s– среднеквадратическое отклонение.

Нормальное распределение называют еще гауссовским по имени немецкого математика Гаусса . Тот факт, что случайная величина имеет нормальное распределение с параметрами: m,, обозначают так: N (m,s), где: m =a =M ;

Достаточно часто в формулах математическое ожидание обозначают через а . Если случайная величина распределена по закону N(0,1), то она называется нормированной или стандартизированной нормальной величиной. Функция распределения для нее имеет вид:

График плотности нормального распределения, который называют нормальной кривой или кривой Гаусса, изображен на рис.5.4.

Рис. 5.4. Плотность нормального распределения

Определение числовых характеристик случайной величины по её плотности рассматривается на примере.

Пример 6 .

Непрерывная случайная величина задана плотностью распределения:.

Определить вид распределения, найти математическое ожидание M(X) и дисперсию D(X).

Сравнивая заданную плотность распределения с (5.16) можно сделать вывод, что задан нормальный закон распределения с m =4. Следовательно, математическое ожидание M(X)=4, дисперсия D(X)=9.

Среднее квадратическое отклонение s=3.

Функция Лапласа, имеющая вид:

связана с функцией нормального распределения (5.17), cоотношением:

F 0 (x) = Ф(х) + 0,5.

Функции Лапласа нечётная.

Ф(-x )=-Ф(x ).

Значения функции Лапласа Ф(х) табулированы и берутся из таблицы по значению х (см. Приложение 1).

Нормальное распределение непрерывной случайной величины играет важную роль в теории вероятностей и при описании реальности, имеет очень широкое распространение в случайных явлениях природы. На практике очень часто встречаются случайные величины, образующиеся именно в результате суммирования многих случайных слагаемых. В частности, анализ ошибок измерения показывает, что они являются суммой разного рода ошибок. Практика показывает, что распределение вероятностей ошибок измерения близко к нормальному закону.

С помощью функции Лапласа можно решать задачи вычисления вероятности попадания в заданный интервал и заданного отклонения нормальной случайной величины.

Нормальный закон распределения вероятностей

Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма:

Перед вами принципиальный вид функции плотности нормального распределения вероятностей, и я приветствую вас на этом интереснейшем уроке.

Какие можно привести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов, например, время забега стометровки или превращения смолы в янтарь. Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

Далее отклоняемся от центра ещё на одно стандартное отклонение и рассчитываем высоту:

Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость ! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота , и «залезать» за неё категорически нельзя!

При электронном оформлении решения график легко построить в Экселе, и неожиданно для самого себя я даже записал короткий видеоролик на эту тему. Но сначала поговорим о том, как меняется форма нормальной кривой в зависимости от значений и .

При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо / влево соответственно. Так, например, при функция принимает вид и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:

Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная ; её функция плотности – чётная , и график симметричен относительно оси ординат.

В случае изменения «сигмы» (при постоянном «а») , график «остаётся на месте», но меняет форму. При увеличении он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении график становится более узким и высоким – получается «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза: предыдущий график сужается и вытягивается вверх в два раза:

Всё в полном соответствии с геометрическими преобразованиями графиков .

Нормальное распределёние с единичным значением «сигма» называется нормированным , а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным . Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа : . Стандартное распределение нашло широкое применение на практике, и очень скоро мы окончательно поймём его предназначение.

Ну а теперь смотрим кино:

Да, совершенно верно – как-то незаслуженно у нас осталась в тени функция распределения вероятностей . Вспоминаем её определение :
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

Внутри интеграла обычно используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала .

Почти все значения не поддаются точному расчету, но как мы только что видели, с современными вычислительными мощностями с этим нет никаких трудностей. Так, для функции стандартного распределения соответствующая экселевская функция вообще содержит один аргумент:

=НОРМСТРАСП(z)

Раз, два – и готово:

На чертеже хорошо видно выполнение всех свойств функции распределения , и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .

Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти –вероятность того, что нормальная случайная величина примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

но каждый раз вымучивать приближенное значение неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу :
.

! Вспоминает также , что

Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы стандартизировать значения «альфа» и «бета», то есть свести решение к стандартному распределению:

Примечание : функцию легко получить из общего случая с помощью линейной замены . Тогда и:

и из проведённой замены как раз следует формула перехода от значений произвольного распределения – к соответствующим значениям стандартного распределения.

Зачем это нужно? Дело в том, что значения скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений , с которой мы уже имели дело в интегральной теореме Лапласа :

Если же в нашем распоряжении есть таблица значений функции Лапласа , то решаем через неё:

Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета .

Напоминаю, что , и во избежание путаницы всегда контролируйте , таблица КАКОЙ функции перед вашими глазами.

Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

– с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

Тренируемся самостоятельно:

Пример 3

Диаметр подшипников, изготовленных на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, здесь можно включить концы интервала в рассмотрение. Впрочем, это не критично.

И уже в этом примере нам встретился особый случай – когда интервал симметричен относительно математического ожидания. В такой ситуации его можно записать в виде и, пользуясь нечётностью функции Лапласа, упростить рабочую формулу:

Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство можно «упаковывать» с помощью модуля :

– вероятность того, что значение случайной величины отклонится от математического ожидания менее чем на .

Хорошо то решение, которое умещается в одну строчку:)
– вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На поставленный вопрос отвечает так называемое

правило «трех сигм»

Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина примет значение из промежутка .

И в самом деле, вероятность отклонения от матожидания менее чем на составляет:
или 99,73%

В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.

В практических исследованиях правило «трёх сигм» обычно применяют в обратном направлении: если статистически установлено, что почти все значения исследуемой случайной величины укладываются в интервал длиной 6 стандартных отклонений, то появляются веские основания полагать, что эта величина распределена по нормальному закону. Проверка осуществляется с помощью теории статистических гипотез .

Продолжаем решать суровые советские задачи:

Пример 4

Случайная величина ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

Решение очень простое. По условию, и сразу заметим, что при очередном взвешивании (чего-то или кого-то) мы почти 100% получим результат с точностью до 9 грамм. Но в задаче фигурирует более узкое отклонение и по формуле :

– вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

Ответ :

Прорешанная задача принципиально отличается от вроде бы похожего Примера 3 урока о равномерном распределении . Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте) , а также по вине экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки тех же весов.

Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически ведь можно обсчитать. Однако, в любом случае, случайной такая ошибка не будет, и её матожидание отлично от нуля.

…срочно разрабатываю курс по подготовке продавцов =)

Самостоятельно решаем обратную задачу:

Пример 5

Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью попадет длина диаметра валика.

Пункт 5* расчётного макета в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

Пример 6

Нормально распределенная случайная величина задана своими параметрами (математическое ожидание) и (среднее квадратическое отклонение). Требуется:

а) записать плотность вероятности и схематически изобразить ее график;
б) найти вероятность того, что примет значение из интервала ;
в) найти вероятность того, что отклонится по модулю от не более чем на ;
г) применяя правило «трех сигм», найти значения случайной величины .

Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании бумажных таблиц;)

Ну а я разберу пример повышенной сложности:

Пример 7

Плотность распределения вероятностей случайной величины имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

Решение : прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение . И поэтому «нормальность» распределения ещё нужно обосновать:

Так как функция определена при любом действительном значении , и её можно привести к виду , то случайная величина распределена по нормальному закону.

Приводим. Для этого выделяем полный квадрат и организуем трёхэтажную дробь :

Обязательно выполняем проверку, возвращая показатель в исходный вид:

, что мы и хотели увидеть.

Таким образом:
– по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид и , то:
, откуда выражаем и подставляем в нашу функцию:
, после чего ещё раз пробежимся по записи глазами и убедимся, что полученная функция имеет вид .

Построим график плотности:

и график функции распределения :

Если под рукой нет Экселя и даже обычного калькулятора, то последний график легко строится вручную! В точке функция распределения принимает значение и здесь находится

Нормальный закон распределения наиболее часто встречается на практике. Главная особенность, выделяющая его среди других законов, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях (см. гл. 6).

Определение. Непрерывная случайная величина X имеет нормальный закон распределения (закон Гаусса) с параметрами а и а 2 , если ее плотность вероятности имеет вид

Термин «нормальный» не совсем удачный. Многие признаки подчиняются нормальному закону, например, рост человека, дальность полета снаряда и т.п. Но если какой-либо признак подчиняется другому, отличному от нормального, закону распределения, то это вовсе не говорит о «ненормальности» явления, связанного с этим признаком.

Кривую нормального закона распределения называют нормальной , или гауссовой , кривой. На рис. 4.6, а , 6 приведены нормальная кривая фд, (х) с параметрами йио 2 , т.е. И[а а 2), и график функции распределения случайной величины X , имеющей нормальный закон. Обратим внимание на то, что нормальная кривая симметрична относительно прямой х = а, имеет максимум в точке х = а ,

равный , т.е.

И две точки перегиба х = а±

с ординатой

Можно заметить, что в выражении плотности нормального закона параметры обозначены буквами а и ст 2 , которыми мы обозначаем математическое ожидание М(Х ) и дисперсию О(Х). Такое совпадение неслучайно. Рассмотрим теорему, устанавливающую теоретико-вероятностный смысл параметров нормального закона.

Теорема. Математическое ожидание случайной величины X, распределенной по нормальному закону, равно параметру а этого закона, т.е.

а ее дисперсия - параметру а 2 , т.е.

Математическое ожидание случайной величины X:

Произведем замену переменной, положив

Тогда пределы интегрирования не меняются

и, следовательно,

(первый интеграл равен нулю как интеграл от нечетной функции по симметричному относительно начала координат промежутку, а второй интеграл - интеграл Эйлера - Пуассона).

Дисперсия случайной величины X:

Сделаем ту же замену переменной х = а + о^2 t, как и при вычислении предыдущего интеграла. Тогда

Применяя метод интегрирования по частям, получим

Выясним, как будет меняться нормальная кривая при изменении параметров а и с 2 (или а). Если а = const, и меняется параметр а {а х а 3), т.е. центр симметрии распределения, то нормальная кривая будет смещаться вдоль оси абсцисс, не меняя формы (рис. 4.7).

Если а = const и меняется параметр а 2 (или а), то меняется ордината

максимума кривой При увеличении а ордината максимума

кривой уменьшается, но так как площадь под любой кривой распределения должна оставаться равной единице, то кривая становится более плоской, растягиваясь вдоль оси абсцисс; при уменьшении су, напротив, нормальная кривая вытягивается вверх, одновременно сжимаясь с боков. На рис. 4.8 показаны нормальные кривые с параметрами а 1(о 2 и а 3 , где о, а (он же математическое ожидание) характеризует положение центра, а параметр а 2 (он же дисперсия) - фор м у нормальной кривой.

Нормальный закон распределения случайной величины X с параметрами а = 0, ст 2 = 1, г.е. X ~ N(0; 1), называется стандартным или нормированным, а соответствующая нормальная кривая - стандартной или нормированной.

Сложность непосредственного нахождения функции распределения случайной величины, распределенной по нормальному закону, по формуле (3.23) и вероятности ее попадания на некоторый промежуток по формуле (3.22) связана с гем, что интеграл от функции (4.26) является «нсберу- щимся» в элементарных функциях. Поэтому их выражают через функцию

- функцию (интеграл вероятностей) Лапласа, для которой составлены таблицы. Напомним, что функция Лапласа уже встречалась нам при рассмотрении интегральной теоремы Муавра - Лапласа (см. параграф 2.3). Там же были рассмотрены ее свойства. Геометрически функция Лапласа Ф(.с) представляет собой площадь под стандартной нормальной кривой на отрезке [-х; х ] (рис. 4.9) 1 .

Рис. 4.10

Рис. 4.9

Теорема. Функция распределения случайной величины X, распределенной по нормальному закону, выражается через функцию Лапласа Ф(х) по формуле

По формуле (3.23) функция распределения:

Сделаем замену переменной, полагая при X -> -оо? -» -00, поэтому

1 Наряду с интегралом вероятностей вида (4.29), представляющим функцию Ф(х), в литературе используется его выражения и в виде других табулированных функций:

представляющих собой площади иод стандартной нормальной кривой соответственно на интервалах (0; х], (-оо; х], [-х>/2; Хл/2.

Первый интеграл

(в силу четности подынтегральной функции и того, что интеграл Эйлера - Пуассона равен [к ).

Второй интеграл с учетом формулы (4.29) составляет

Геометрически функция распределения представляет собой площадь под нормальной кривой на интервале (-со, х) (рис. 4.10). Как видим, она состоит из двух частей: первой, на интервале (-оо, а), равной 1/2, т.е. половине всей площади под нормальной кривой, и второй, на интервале (я, х),

равной

Рассмотрим свойства случайной величины, распределенной по нормальному закону.

1. Вероятность попадания случайной величины X, распределенной по нормальному закону, в интервал [х 1(х 2 ], равна

Учитывая, что согласно свойству (3.20) вероятность Р(х,

где и Г 2 определяются по формуле (4.33) (рис. 4.11). ?

2. Вероятность того, что отклонение случайной величины X, распределенной по нормальному закону, от математического ожидания а не превысит величину А > 0 (по абсолютной величине), равна

а также свойство нечетности функции Лапласа, получим

где? =Д/о (рис. 4.12). ?

На рис. 4.11 и 4.12 приведена геометрическая интерпретация свойств нормального закона .

Замечание. Рассмотренная в гл. 2 приближенная интегральная формула Муавра - Лапласа (2.10) следует из свойства (4.32) нормально распределенной случайной величины при х { = а, х 2 = Ь } а = пр и так

как биномиальный закон распределения случайной величины X = т с параметрами п и р, для которого получена эта формула, при п -> ос стремится к нормальному закону (см. гл. 6).

Аналогично и следствия (2.13), (2.14) и (2.16) интегральной формулы Муавра - Лапласа для числа X = т появления события в п независимых испытаниях и его частости т/п вытекают из свойств (4.32) и (4.34) нормального закона.

Вычислим по формуле (4.34) вероятности Р(Х-а д) при различных значениях Д (используем табл. II приложений). Получим

Отсюда вытекает «правило трех сигм».

Если случайная величина X имеет нормальный закон распределения с параметрами а и а 2 , т.е. М(а; а 2), то практически достоверно, что ее значения заключены в интервале (а - За, а + За).

Нарушение «правила трех сигм», т.е. отклонение нормально распределенной случайной величины X больше, чем на За (но абсолютной величине), является событием практически невозможным, так как его вероятность весьма мала:

Заметим, что отклонение Д в, при котором , называется

вероятным отклонением. Для нормального закона Д в « 0,675а, т.е. на интервал (а - 0,675а, а + 0,675а) приходится половина всей площади под нормальной кривой.

Найдем коэффициент асимметрии и эксцесс случайной величины X, распределенной по нормальному закону.

Очевидно, в силу симметрии нормальной кривой относительно вертикальной прямой х = а, проходящей через центр распределения а = М(Х), коэффициент асимметрии нормального распределения Л = 0.

Эксцесс нормально распределенной случайной величины X найдем по формуле (3.37), т.е.

где учли, что центральный момент 4-го порядка, найденный по формуле (3.30) с учетом определения (4.26), т.е.

(вычисление интеграла опускаем).

Таким образом, эксцесс нормального распределения равен нулю и крутость других распределений определяется по отношению к нормальному (об этом мы уже упоминали в параграфе 3.7).

О Пример 4.9. Полагая, что рост мужчин определенной возраст-ной группы есть нормально распределенная случайная величинах X с параметрами а = 173 и а 2 =36:

1) Найти: а) выражение плотности вероятности и функции распределения случайной величины X; б) доли костюмов 4-го роста (176-182 см) и 3-го роста (170-176 см), которые нужно предусмотреть в общем объеме производства для данной возрастной группы; в) квантиль х 07 и 10%-ную точку случайной величины X.
2) Сформулировать «правило трех сигм» для случайной величины X. Решение. 1, а) По формулам (4.26) и (4.30) запишем

1, б) Доля костюмов 4-го роста (176-182 см) в общем объеме производства определится по формуле (4.32) как вероятность

(рис. 4.14), так как по формулам (4.33)

Долю костюмов 3-го роста (170-176 см) можно было определить аналогично но формуле (4.32), но проще это сделать по формуле (4.34), если учесть, что данный интервал симметричен относительно математического ожидания а = М(Х) = 173, т.е. неравенство 170 X Х -173|

(см. рис. 4.14;.

1, в) Квантиль х 07 (см. параграф 3.7) случайной величины X найдем из уравнения (3.29) с учетом формулы (4.30):

откуда

По табл. 11 приложений находим I- 0,524 и

Это означает, что 70% мужчин данной возрастной группы имеют рост до 176 см.

10%-ная точка - эго квантиль х 09 = 181 см (находится аналогично), т.е. 10% мужчин имеют рост не менее 181 см.
2) Практически достоверно, что рост мужчин данной возрастной группы заключен в границах от а - Зет = 173 - 3 6 = 155 до а + Зет = 173 + 3 - 6 = = 191 (см), т.е. 155
В силу особенностей нормального закона распределения, отмеченных в начале параграфа (и в гл. 6), он занимает центральное место в теории и практике вероятностно-статистических методов. Большое теоретическое значение нормального закона состоит в том, что с его помощью получен ряд важных распределений, рассматриваемых ниже.
- Стрелками на рис. 4.11-4.13 отмечены условно п л о щ а д и соответствующих фигурпод нормальной кривой.
- Значения функции Лапласа Ф(х) определяем но табл. II приложений.