Линейный закон распределения. Нормальный закон распределения вероятностей

Принцип электродуговой сварки основан на использовании температуры электрического разряда, возникающего между сварочным электродом и металлической заготовкой.

Дуговой разряд образуется вследствие электрического пробоя воздушного промежутка. При возникновении этого явления происходит ионизация молекул газа, повышение его температуры и электропроводности, переход в состояние плазмы.

Горение сварочной дуги сопровождается выделением большого количества световой и особенно тепловой энергии, вследствие чего резко повышается температура, и происходит локальное плавление металла заготовки. Это и есть сварка.

В процессе работы, для того, чтобы возбудить дуговой разряд, производится кратковременное касание заготовки электродом, то есть, создание короткого замыкания с последующим разрывом металлического контакта и установлением требуемого воздушного зазора. Таким способом выбирается оптимальная длина сварочной дуги.

При очень коротком разряде электрод может прилипать к заготовке, плавление происходит чересчур интенсивно, что может привести к образованию наплывов. Длинная дуга отличается неустойчивостью горения и недостаточно высокой температурой в зоне сварки.

Неустойчивость и видимое искривление формы сварочной дуги часто можно наблюдать при работе промышленных сварочных агрегатов с достаточно массивными деталями. Это явление называется магнитным дутьем.

Суть его заключается в том, что сварочный ток дуги создает некоторое магнитное поле, которое взаимодействует с магнитным полем, создаваемым током, протекающим через массивную заготовку.

То есть, отклонение дуги вызывается магнитными силами. Дутьем процесс назван потому, что дуга отклоняется, как будто под воздействием ветра.

Радикальных способов борьбы с этим явлением нет. Для уменьшения влияния магнитного дутья применяют сварку укороченной дугой, а также располагают электрод под определенным углом.

Среда горения

Существует несколько различных сварочных технологий, использующих электродуговые разряды, отличающиеся свойствами и параметрами. Электрическая сварочная дуга имеет следующие разновидности:

  • открытая. Горение разряда происходит непосредственно в атмосфере;
  • закрытая. Образующаяся при горении высокая температура вызывает обильное выделение газов от сгорающего флюса. Флюс содержится в обмазке сварочных электродов;
  • в среде защитных газов. В этом варианте, в зону сварки подается газ, чаще всего, это гелий, аргон или углекислый газ.

Защита зоны сварки необходима для предотвращения активного окисления плавящегося металла под воздействием кислорода воздуха.

Слой окисла препятствует образованию сплошного сварного шва, металл в месте соединения приобретает пористость, в результате чего снижается прочность и герметичность стыка.

В какой-то мере дуга сама способна создавать микроклимат в зоне горения за счет образования области повышенного давления, препятствующего притоку атмосферного воздуха.

Применение флюса позволяет более активно выдавливать воздух из зоны сварки. Использование среды защитных газов, подаваемых под давлением, решает эту задачу практически полностью.

Продолжительность разряда

Кроме критериев защищенности, дуговой разряд классифицируется по продолжительности. Существуют процессы, в которых горение дуги происходит в импульсном режиме.

В таких устройствах сварка осуществляется короткими вспышками. За время вспышки, температура успевает возрасти до величины, достаточной для локального расплавления небольшой зоны, в которой образуется точечное соединение.

Большинство же применяемых сварочных технологий использует относительно продолжительное по времени горение дуги. В течение сварочного процесса происходит постоянное перемещение электрода вдоль соединяемых кромок.

Область повышенной температуры, создающая , перемещается вслед за электродом. После перемещения сварочного электрода, следовательно, и дугового разряда, температура пройденного участка снижается, происходит кристаллизация сварочной ванны и образование прочного сварного шва.

Структура дугового разряда

Область дугового разряда условно принято делить на три участка. Участки, непосредственно прилегающие к полюсам (аноду и катоду), называют соответственно, анодным и катодным.

Центральную часть дугового разряда, расположенную между анодной и катодной областями, называют столбом дуги. Температура в зоне сварочной дуги может достигать нескольких тысяч градусов (до 7000 °C).

Хотя тепло не полностью передается металлу, его вполне хватает для расплавления. Так, температура плавления стали для сравнения составляет 1300-1500 °C.

Для обеспечения устойчивого горения дугового разряда необходимы следующие условия: наличие тока порядка 10 Ампер (это минимальное значение, максимум может достигать 1000 Ампер), при поддержании напряжения дуги от 15 до 40 Вольт .

Падение этого напряжения происходит в дуговом разряде. Распределение напряжения по зонам дуги происходит неравномерно. Падение большей части приложенного напряжения происходит в анодной и катодной зонах.

Экспериментальным путем установлено, что при , наибольшее падение напряжения наблюдается в катодной зоне. В этой же части дуги наблюдается наиболее высокий градиент температуры.

Поэтому, при выборе полярности сварочного процесса, катод соединяют с электродом, когда хотят добиться наибольшего его плавления, повысив его температуру. Наоборот, для более глубокого провара заготовки, катод присоединяют к ней. В столбе дуги падает наименьшая часть напряжения.

При производстве сварочных работ неплавящимся электродом, катодное падение напряжения меньше анодного, то есть, зона повышенной температуры смещена к аноду.

Поэтому, при этой технологии, заготовка подключается к аноду, чем обеспечивается хороший ее прогрев и защита неплавящегося электрода от излишней температуры.

Температурные зоны

Следует заметить, что при любом виде сварки, как плавящимся, так и неплавящимся электродом, столб дуги (его центр) имеет самую высокую температуру – порядка 5000-7000 °C, а иногда и выше.

Зоны наиболее низкой температуры располагаются в одной из активных областей, катодной или анодной. В этих зонах может выделяться 60-70% тепла дуги.

Кроме интенсивного повышения температуры заготовки и сварочного электрода, разряд излучает инфракрасные и ультрафиолетовые волны, способные оказывать вредное влияние на организм сварщика. Это обусловливает необходимость применения защитных мер.

Что касается сварки переменным током, понятие полярности там не существует, так как положение анода и катода изменяется с промышленной частотой 50 колебаний в секунду.

Дуга в этом процессе обладает меньшей устойчивостью по сравнению с постоянным током, ее температура скачет. К преимуществам сварочных процессов на переменном токе, можно отнести только более простое и дешевое оборудование, да еще практически полное отсутствие такого явления, как магнитное дутье, о котором сказано выше.

Вольт-амперная характеристика

На графике представлены кривые зависимости напряжения источника питания от величины сварочного тока, называемые вольт–амперными характеристиками сварочного процесса.

Кривые красного цвета отображают изменение напряжения между электродом и заготовкой в фазах возбуждения сварочной дуги и устойчивого ее горения. Начальные точки кривых соответствуют напряжению холостого хода источника питания.

В момент возбуждения сварщиком дугового разряда, напряжение резко снижается вплоть до того периода, когда параметры дуги стабилизируются, устанавливается значение тока сварки, зависящее от диаметра применяемого электрода, мощности источника питания и установленной длины дуги.

С наступлением этого периода, напряжение и температура дуги стабилизируются, и весь процесс приобретает устойчивый характер.

В современной промышленности сварка имеет большое значение, она имеет очень широкую область применения во всех отраслях промышленности. Для осуществления сварочного процесса необходима сварочная дуга.

Что такое сварочная дуга, ее определение

Сварочной дугой считается очень большой по величине мощности и длительности электрический разряд, который существует между электродами, на которые подано напряжение, в смеси газов. Ее свойства отличаются высокой температурой и плотностью тока, благодаря которым она способна расплавлять металлы, имеющие температуру плавления выше 3000 градусов. Вообще можно сказать, что электрическая дуга – это проводник из газа, который преобразует электрическую энергию в тепловую. Электрическим зарядом называется прохождение электрического тока через газовую среду.

Существует несколько видов электрического разряда:

  • Тлеющий разряд. Возникает в низком давлении, применяется в люминесцентных лампах и плазменных экранах;
  • Искровой разряд. Возникает, когда давление равно атмосферному, отличается прерывистой формой. Искровому разряду соответствует молния, также применяется для зажигания двигателей внутреннего сгорания;
  • Дуговой разряд. Применяет при сварке и для освещения. Отличается непрерывистой формой, возникает при атмосферном давлении;
  • Коронный. Возникает, когда тело электрода шероховато и неоднородно, второй электрод может отсутствовать, то есть возникает струя. Применяется для очистки газов от пыли;

Природа и строение

Природа сварочной дуги не так уж и сложна, как может показаться на первый взгляд. Электрический ток, проходя через катод, затем проникает в ионизированный газ, происходит разряд с ярким свечением и очень высокой температурой, поэтому температура электрической дуги может достигать 7000 – 10000 градусов. После этого ток перетекает на обрабатываемый свариваемый материал. Так как температура настолько высока дуга выделяет вредное для человеческого организма ультрафиолетовое и инфракрасное излучения, оно может навредить глазам или оставить световые ожоги на коже, поэтому при проведении сварочного процесса необходима надлежащая защита.

Строение сварочной дуги представляет собой три главные области: анодная, катодная и столб дуги. Во время горения дуги на катоде и аноде образуются активные пятна – области, в которых температура достигает самых высоких значений, именно через данные области проходит весь электрический ток, анодные и катодные области представляют собой более большие падения напряжения. А сам столб располагается между этими областями падение напряжения в столбе очень незначительно. Таким образом, длина сварочной дуги представляет собой сумму вышеперечисленных областей, обычно длина равна нескольким миллиметрам, когда анодные и катодные области, соответственно, равны 10-4 и 10-5 см. Самая благоприятная длина примерно равна 4-6мм, при такой длине обеспечивается постоянная и благоприятная температура.

Разновидности

Виды сварочной дуги отличаются схемой подвода сварочного тока и средой, в которой они возникают, наиболее распространенными вариантами являются:

  • Прямое действие. При таком способе сварочный располагается параллельно свариваемой металлической конструкции и дуга возникает под углом девяносто градусов по отношению к электроду и металлу;
  • Сварочная дуга косвенного действия. Возникает, когда используется два электрода, которые располагаются под углом 40-60 градусов к поверхности свариваемой детали, дуга возникает между электродами и сваривает металл;

Также существует классификация в зависимости от атмосферы, в которой они возникают:

  • Открытый тип. Дуга данного типа горит на воздухе и вокруг нее образовывается газовая фаза, содержащая пары свариваемого материала, электродов и их покрытий;
  • Закрытый тип. Горение такой дуги происходит под слоем флюса, в газовую фазу, образовавшуюся вокруг дуги входят пары металла, электрода и флюса;
  • Дуга с подачей газов. В горящую дугу подаются сжатые газы – гелий, аргон, углекислый газ, водород и другие различные смеси газов, подаются они для того, чтобы не окислялся свариваемый металл, их подача способствует восстановительной или нейтральной среде. В газовую фазу вокруг дуги входят – подающийся газ, пары металла и электрода;

Также различают по длительности действия – стационарная (для долгого применения) и импульсная (для однократного), по материалу используемого электрода – угольные, вольфрамовые – неплавящиеся электроды и металлические – плавящиеся. Самый распространенный плавящийся электрод – стальной. На сегодняшний день наиболее часто применяется сварка с неплавящимся электродом. Таким образом, виды сварочных дуг разнообразны.

Условия горения

При стандартных условиях, то есть температуре в 25 градусов и давлении в 1 атмосферу газы не способны проводить электрический ток. Для того, чтобы образовалась дуга необходимо, чтобы газы между электродами были ионизированы, то есть имели в своем составе различные заряженные частицы – электроны или ионы (катионы или анионы). Процесс образования ионизированного газа будет называться ионизацией, а работа, которую необходимо затратить на отрыв электрона у атомной частицы для образования электрона и иона – работой ионизации, которая измеряется в электрон-вольтах и называется потенциалом ионизации. Какую именно энергию необходимо затратить для отрыва электрона от атома зависит от природы газовой фазы, значения могут быть от 3,5 до 25 эВ. Самый маленький потенциал ионизации имеют металлы щелочной и щелочно-земельной группы – калий, кальций и, соответственно, их химический соединения. Такими соединениями покрывают электроды, для того, чтобы они способствовали устойчивому существованию и горению сварочной дуги.

Также для возникновения и горения дуги необходима постоянная температура на катод, которая зависит от природы катода, его диаметра, размера и температуры окружающей среды. Температура электрической дуги поэтому должна быть постоянной и не колебаться, благодаря огромным значениям силы тока температура может достигать 7 тысяч градусов, таким образом, сваркой можно присоединять абсолютно все материалы. Постоянная температура обеспечивается с помощью исправного источника питания, поэтому его выбор при конструировании сварочного аппарата очень важен, он оказывает влияние на свойства дуги.

Возникновение

Она возникает при быстром замыкании, то есть когда электрод соприкасается с поверхность свариваемого материала, из-за колоссальной температуры поверхность материала расплавляется, а между электродом и поверхность образуется небольшая полоса из расплавившегося материала. К моменту расхождения электрода и свариваемого материала образуется шейка из материала, которая моментально разрывается и испаряется из-за высокого значений плотности тока. Газ ионизируется и возникает электрическая дуга. Возбудить ее можно с помощью касания или чирканья.

Особенности

Она имеет следующие особенности по сравнению с другими электрическими зарядами:

  • Высокая плотность тока, которая достигает нескольких тысяч ампер на квадратный сантиметр, благодаря чему достигается очень высокая температура;
  • Неравномерность распределения электрического поля в пространстве между электродами. Вблизи электродов падение напряжения очень велико, когда в столбе – наоборот;
  • Огромная температура, которая достигает самых больших значений в столбе из-за высокой плотности тока. При увеличении длины столба температура уменьшается, а при сужении – наоборот увеличивается;
  • С помощью сварочных дуг можно получать самые различные вольт-амперные характеристики – зависимости падения напряжения от плотности тока при постоянной длине, то есть установившемся горении. На данный момент существует три вольтамперные характеристики.

Первая – падающая, когда при увеличении силы и,соответственно, плотности тока, напряжение падает. Вторая- жесткая, когда изменение силы тока никак не влияет на значение величины напряжения итретья – возрастающая, когда при увеличении силы тока напряжение также увеличивается.

Таким образом, сварочную дугу можно назвать самым лучшим и надежным способом скрепления металлических конструкций. Сварочный процесс оказывает большое влияние на сегодняшнюю промышленность, потому что только высокая температура сварочной дуги способна скреплять большинство металлов. Для получения качественных и надежных швов необходимо правильно и верно учитывать все характеристики дуги, следить за всеми значениями, благодаря этому процедура пройдет быстро и наиболее эффективно. Также необходимо учитывать свойства дуги: плотность тока, температуру и напряжение.

Определение. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью вероятности

Нормальный закон распределения также называется законом Гаусса .

Нормальный закон распределения занимает центральное место в теории вероятностей. Это обусловлено тем, что этот закон проявляется во всех случаях, когда случайная величина является результатом действия большого числа различных факторов. К нормальному закону приближаются все остальные законы распределения.

Можно легко показать, что параметры и, входящие в плотность распределения являются соответственно математическим ожиданием и среднеквадратическим отклонением случайной величиныХ .

Найдём функцию распределения F (x ) .

График плотности нормального распределения называется нормальной кривой или кривой Гаусса .

Нормальная кривая обладает следующими свойствами:

1) Функция определена на всей числовой оси.

2) При всех х функция распределения принимает только положительные значения.

3) Ось ОХ является горизонтальной асимптотой графика плотности вероятности, т.к. при неограниченном возрастании по абсолютной величине аргумента х , значение функции стремится к нулю.

4) Найдём экстремум функции.

Т.к. при y ’ > 0 при x < m и y ’ < 0 при x > m , то в точке х = т функция имеет максимум, равный
.

5) Функция является симметричной относительно прямой х = а , т.к. разность

(х – а ) входит в функцию плотности распределения в квадрате.

6) Для нахождения точек перегиба графика найдем вторую производную функции плотности.

При x = m +  и x = m -  вторая производная равна нулю, а при переходе через эти точки меняет знак, т.е. в этих точках функция имеет перегиб.

В этих точках значение функции равно
.

Построим график функции плотности распределения (рис. 5).

Построены графики при т =0 и трёх возможных значениях среднеквадратичного отклонения  = 1,  = 2 и  = 7. Как видно, при увеличении значения среднего квадратичного отклонения график становится более пологим, а максимальное значение уменьшается.

Если а > 0, то график сместится в положительном направлении, если а < 0 – в отрицательном.

При а = 0 и  = 1 кривая называется нормированной . Уравнение нормированной кривой:

      Функция Лапласа

Найдём вероятность попадания случайной величины, распределенной по нормальному закону, в заданный интервал.

Обозначим

Т.к. интеграл
не выражается через элементарные функции, то вводится в рассмотрение функция

,

которая называется функцией Лапласа или интегралом вероятностей .

Значения этой функции при различных значениях х посчитаны и приводятся в специальных таблицах.

На рис. 6 показан график функции Лапласа.

Функция Лапласа обладает следующими свойствами:

1) Ф(0) = 0;

2) Ф(-х) = - Ф(х);

3) Ф() = 1.

Функцию Лапласа также называют функцией ошибок и обозначают erf x .

Ещё используетсянормированная функция Лапласа, которая связана с функцией Лапласа соотношением:

На рис. 7 показан график нормированной функции Лапласа.

      Правило трёх сигм

При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трёх сигм .

Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины :

Если принять  = 3, то получаем с использованием таблиц значений функции Лапласа:

Т.е. вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю.

Это правило называется правилом трёх сигм .

Не практике считается, что если для какой-либо случайной величины выполняется правило трёх сигм, то эта случайная величина имеет нормальное распределение.

Заключение по лекции:

В лекции мы рассмотрели законы распределения непрерывных величин В ходе подготовки к последующей лекции и практическим занятиям вы должны самостоятельно при углубленном изучении рекомендованной литературы и решения предложенных задач дополнить свои конспекты лекций.

Нормальный закон распределения вероятностей

Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма:


Перед вами принципиальный вид функции плотности нормального распределения вероятностей, и я приветствую вас на этом интереснейшем уроке.

Какие можно привести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов…, снова пришёл на ум грустный пример, и поэтому скажу время «жизни» лампочек:) Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

Далее отклоняемся от центра ещё на одно стандартное отклонение и рассчитываем высоту:

Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость ! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота , и «залезать» за неё категорически нельзя!

При электронном оформлении решения график легко построить в Экселе, и неожиданно для самого себя я даже записал короткий видеоролик на эту тему. Но сначала поговорим о том, как меняется форма нормальной кривой в зависимости от значений и .

При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо / влево соответственно. Так, например, при функция принимает вид и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:


Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная ; её функция плотности чётная , и график симметричен относительно оси ординат.

В случае изменения «сигмы» (при постоянном «а») , график «остаётся на месте», но меняет форму. При увеличении он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении график становится более узким и высоким – получается «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза: предыдущий график сужается и вытягивается вверх в два раза:

Всё в полном соответствии с геометрическими преобразованиями графиков .

Нормальное распределёние с единичным значением «сигма» называется нормированным , а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным . Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа : . Стандартное распределение нашло широкое применение на практике, и очень скоро мы окончательно поймём его предназначение.

Ну а теперь смотрим кино:

Да, совершенно верно – как-то незаслуженно у нас осталась в тени функция распределения вероятностей . Вспоминаем её определение :
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

Внутри интеграла обычно используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала .

Почти все значения не поддаются точному расчету, но как мы только что видели, с современными вычислительными мощностями с этим нет никаких трудностей. Так, для функции стандартного распределения соответствующая экселевская функция вообще содержит один аргумент:

=НОРМСТРАСП(z)

Раз, два – и готово:

На чертеже хорошо видно выполнение всех свойств функции распределения , и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .

Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти –вероятность того, что нормальная случайная величина примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

но каждый раз вымучивать приближенное значение неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу :
.

! Вспоминает также , что

Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы стандартизировать значения «альфа» и «бета», то есть свести решение к стандартному распределению:

Примечание : функцию легко получить из общего случая с помощью линейной замены . Тогда и:

и из проведённой замены как раз следует формула перехода от значений произвольного распределения – к соответствующим значениям стандартного распределения.

Зачем это нужно? Дело в том, что значения скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений , с которой мы уже имели дело в интегральной теореме Лапласа :

Если же в нашем распоряжении есть таблица значений функции Лапласа , то решаем через неё:

Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета .

Напоминаю, что , и во избежание путаницы всегда контролируйте , таблица КАКОЙ функции перед вашими глазами.

Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

– с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

Тренируемся самостоятельно:

Пример 3

Диаметр подшипников, изготовленных на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, здесь можно включить концы интервала в рассмотрение. Впрочем, это не критично.

И уже в этом примере нам встретился особый случай – когда интервал симметричен относительно математического ожидания. В такой ситуации его можно записать в виде и, пользуясь нечётностью функции Лапласа, упростить рабочую формулу:


Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство можно «упаковывать» с помощью модуля :

– вероятность того, что значение случайной величины отклонится от математического ожидания менее чем на .

Хорошо то решение, которое умещается в одну строчку:)
– вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На поставленный вопрос отвечает так называемое

правило «трех сигм»

Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина примет значение из промежутка .

И в самом деле, вероятность отклонения от матожидания менее чем на составляет:
или 99,73%

В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.

В практических исследованиях правило «трёх сигм» обычно применяют в обратном направлении: если статистически установлено, что почти все значения исследуемой случайной величины укладываются в интервал длиной 6 стандартных отклонений, то появляются веские основания полагать, что эта величина распределена по нормальному закону. Проверка осуществляется с помощью теории статистических гипотез , до которых я надеюсь рано или поздно добраться:)

Ну а пока продолжаем решать суровые советские задачи:

Пример 4

Случайная величина ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

Решение очень простое. По условию, и сразу заметим, что при очередном взвешивании (чего-то или кого-то) мы почти 100% получим результат с точностью до 9 грамм. Но в задаче фигурирует более узкое отклонение и по формуле :

– вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

Ответ :

Прорешанная задача принципиально отличается от вроде бы похожего Примера 3 урока о равномерном распределении . Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте) , а также по вине экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки тех же весов.

Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически ведь можно обсчитать. Однако, в любом случае, случайной такая ошибка не будет, и её матожидание отлично от нуля.

…срочно разрабатываю курс по подготовке продавцов =)

Самостоятельно решаем обратную задачу:

Пример 5

Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью попадет длина диаметра валика.

Пункт 5* расчётного макета в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

Пример 6

Нормально распределенная случайная величина задана своими параметрами (математическое ожидание) и (среднее квадратическое отклонение). Требуется:

а) записать плотность вероятности и схематически изобразить ее график;
б) найти вероятность того, что примет значение из интервала ;
в) найти вероятность того, что отклонится по модулю от не более чем на ;
г) применяя правило «трех сигм», найти значения случайной величины .

Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании бумажных таблиц;)

Ну а я разберу пример повышенной сложности:

Пример 7

Плотность распределения вероятностей случайной величины имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

Решение : прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение . И поэтому «нормальность» распределения ещё нужно обосновать:

Так как функция определена при любом действительном значении , и её можно привести к виду , то случайная величина распределена по нормальному закону.

Приводим. Для этого выделяем полный квадрат и организуем трёхэтажную дробь :


Обязательно выполняем проверку, возвращая показатель в исходный вид:

, что мы и хотели увидеть.

Таким образом:
– по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид и , то:
, откуда выражаем и подставляем в нашу функцию:
, после чего ещё раз пробежимся по записи глазами и убедимся, что полученная функция имеет вид .

Построим график плотности:

и график функции распределения :

Если под рукой нет Экселя и даже обычного калькулятора, то последний график легко строится вручную! В точке функция распределения принимает значение и здесь находится

В чем состоит идея вероятностных рассуждений?

Первый, самый естественный шаг вероятностных рассуждений заключается в следующем: если вы имеете некоторую переменную, принимающую значения случайным образом, то вам хотелось бы знать, с какими вероятностями эта переменная принимает определенные значения. Совокупность этих вероятностей как раз и задает распределение вероятностей. Например, имея игральную кость, можно a priori считать, что с равными вероятностями 1/6 она упадет на любую грань. И это происходит при условии, что кость симметричная. Если кость несимметричная, то можно определить большие вероятности для тех граней, которые выпадают чаще, а меньшие вероятности - для тех граней, которые выпадают реже, исходя из опытных данных. Если какая-то грань вообще не выпадает, то ей можно присвоить вероятность 0. Это и есть простейший вероятностный закон, с помощью которого можно описать результаты бросания кости. Конечно, это чрезвычайно простой пример, но аналогичные задачи возникают, например, при актуарных расчетах, когда на основе реальных данных рассчитывается реальный риск при выдаче страхового полиса.

В этой главе мы рассмотрим вероятностные законы, наиболее часто возникающие на практике.

Графики этих распределений можно легко построить в STATISTICA.

Нормальное распределение

Нормальное распределение вероятностей особенно часто используется в статистике. Нормальное распределение дает хорошую модель для реальных явлений, в которых:

1) имеется сильная тенденция данных группироваться вокруг центра;

2) положительные и отрицательные отклонения от центра равновероятны;

3) частота отклонений быстро падает, когда отклонения от центра становятся большими.

Механизм, лежащий в основе нормального распределения, объясняемый с помощью так называемой центральной предельной теоремы, можно образно описать следующим образом. Представьте, что у вас имеются частицы цветочной пыльцы, которые вы случайным образом бросили в стакан воды. Рассматривая отдельную частицу под микроскопом, вы увидите удивительное явление - частица движется. Конечно, это происходит, потому что перемещаются молекулы воды и передают свое движение частицам взвешенной пыльцы.

Но как именно происходит движение? Вот более интересный вопрос. А это движение очень причудливо!

Имеется бесконечное число независимых воздействий на отдельную частицу пыльцы в виде ударов молекул воды, которые заставляют частицу двигаться по весьма странной траектории. Под микроскопом это движение напоминает многократно и хаотично изломанную линию. Эти изломы невозможно предсказать, в них нет никакой закономерности, что как раз и соответствует хаотическим ударам молекул о частицу. Взвешенная частица, испытав удар молекулы воды в случайный момент времени, меняет направление своего движения, далее некоторое время движется по инерции, затем вновь попадает под удар следующей молекулы и так далее. Возникает удивительный бильярд в стакане воды!

Поскольку движение молекул имеет случайное направление и скорость, то величина и направление изломов траектории также совершенно случайны и непредсказуемы. Это удивительное явление, называемое броуновским движением, открытое в XIX веке, заставляет нас задуматься о многом.

Если ввести подходящую систему и отмечать координаты частицы через некоторые моменты времени, то как раз и получим нормальный закон. Более точно, смещения частицы пыльцы, возникающие из-за ударов молекул, будут подчиняться нормальному закону.

Впервые закон движения такой частицы, называемого броуновским, на физическом уровне строгости описал А. Эйнштейн. Затем более простой и интуитивно ясный подход развил Ленжеван.

Математики в XX веке посвятили этой теории лучшие страницы, а первый шаг был сделан 300 лет назад, когда был открыт простейший вариант центральной предельной теоремы.

В теории вероятности центральная предельная теорема, первоначально известная в формулировке Муавра и Лапласа еще в XVII веке как развитие знаменитого закона больших чисел Я. Бернулли (1654-1705) (см. Я. Бернулли (1713), Ars Conjectandi), в настоящее время чрезвычайно развилась и достигла своих высот. в современном принципе инвариантности, в создании которого существенную роль сыграла русская математическая школа. Именно в этом принципе находит свое строгое математическое объяснение движение броуновской частицы.

Идея состоит в том, что при суммировании большого числа независимых величин (ударов молекул о частицы пыльцы) в определенных разумных условиях получаются именно нормально распределенные величины. И это происходит независимо, то есть инвариантно, от распределения исходных величин. Иными словами, если на некоторую переменную воздействует множество факторов, эти воздействия независимы, относительно малы и слагаются друг с другом, то получаемая в итоге величина имеет нормальное распределение.

Например, практически бесконечное количество факторов определяет вес человека (тысячи генов, предрасположенность, болезни и т. д.). Таким образом, можно ожидать нормальное распределение веса в популяции всех людей.

Если вы финансист и занимаетесь игрой на бирже, то, конечно, вам известны случаи, когда курсы акций ведут себя подобно броуновским частицам, испытывая хаотические удары многих факторов.

Формально плотность нормального распределения записывается так:

где а и õ 2 - параметры закона, интерпретируемые соответственно как среднее значение и дисперсия данной случайной величины (ввиду особой роли нормального распределения мы будем использовать специальную символику для обозначения его функции плотности и функции распределения). Визуально график нормальной плотности - это знаменитая колоколообразная кривая.

Соответствующая функция распределения нормальной случайной величины (а,õ 2) обозначается Ф(x; a,õ 2) и задается соотношением:


Нормальный закон с параметрами а = 0 и õ 2 = 1 называется стандартным.

Обратная функция стандартного нормального распределения, примененная к величине z, 0

Воспользуйтесь вероятностным калькулятором STATISTICA, чтобы по х вычислить z и наоборот.

Основные характеристики нормального закона:

Среднее, мода, медиана: Е=x mod =x med =a;

Дисперсия: D=õ 2 ;

Ассиметрия:

Эксцесс:

Из формул видно, что нормальное распределение описывается двумя параметрами:

а - mean - среднее;

õ - stantard deviation - стандартное отклонение, читается: «сигма».

Иногда стандартное отклонение называют среднеквадратическим отклонением , но это уже устаревшая терминология.

Приведем некоторые полезные факты относительно нормального распределения.

Среднее значение определяет меру расположения плотности. Плотность нормального распределения симметрична относительно среднего. Среднее нормального распределения совпадает с медианой и модой (см. графики).

Плотность нормального распределения с дисперсией 1 и средним 1

Плотность нормального распределения со средним 0 и дисперсией 0,01

Плотность нормального распределения со средним 0 и дисперсией 4

При увеличении дисперсии плотность нормального распределения расплывается или растекается вдоль оси ОХ, при уменьшении дисперсии она, наоборот, сжимается, концентрируясь вокруг одной точки - точки максимального значения, совпадающей со средним значением. В предельном случае нулевой дисперсии случайная величина вырождается и принимает единственное значение, равное среднему.

Полезно знать правила 2- и 3-сигма, или 2- и 3-стандартных отклонений, которые связаны с нормальным распределением и используются в разнообразных приложениях. Смысл этих правил очень простой.

Если от точки среднего или, что то же самое, от точки максимума плотности нормального распределения отложить вправо и влево соответственно два и три стандартных отклонения (2- и 3-сигма), то площадь под графиком нормальной плотности, подсчитанная по этому промежутку, будет соответственно равна 95,45% и 99,73% всей площади под графиком (проверьте на вероятностном калькуляторе STATISTICA!).

Другими словами, это можно выразить следующим образом: 95,45% и 99,73% всех независимых наблюдений из нормальной совокупности, например размеров детали или цены акций, лежит в зоне 2- и 3-стандартных отклонений от среднего значения.

Равномерное распределение

Равномерное распределение полезно при описании переменных, у которых каждое значение равновероятно, иными словами, значения переменной равномерно распределены в некоторой области.

Ниже приведены формулы плотности и функции распределения равномерной случайной величины, принимающей значения на отрезке [а, b].

Из этих формул легко понять, что вероятность того, что равномерная случайная величина примет значения из множества [с, d] [а, b], равна (d - c)/(b - a).

Положим а=0,b=1. Ниже показан график равномерной плотности вероятности, сосредоточенной на отрезке .

Числовые характеристики равномерного закона:

Экспоненциальное распределение

Имеют место события, которые на обыденном языке можно назвать редкими. Если Т - время между наступлениями редких событий, происходящих в среднем с интенсивностью X, то величина
T имеет экспоненциальное распределение с параметром (лямбда). Экспоненциальное распределение часто используется для описания интервалов между последовательными случайными событиями, например, интервалов между заходами на непопулярный сайт, так как эти посещения являются редкими событиями.

Это распределение обладает очень интересным свойством отсутствия последействия, или, как еще говорят, марковским свойством, в честь знаменитого русского математика Маркова А. А., которое можно объяснить следующим образом. Если распределение между моментами наступления некоторых событий является показательным, то распределение, отсчитанное от любого момента t до следующего события, также имеет показательное распределение (с тем же самым параметром).

Иными словами, для потока редких событий время ожидания следующего посетителя всегда распределено показательно независимо от того, сколько времени вы его уже ждали.

Показательное распределение связано с пуассоновским распределением: в единичном интервале времени количество событий, интервалы между которыми независимы и показательно распределены, имеет распределение Пуассона. Если интервалы между посещениями сайта имеют экспоненциальное распределение, то количество посещений, например в течение часа, распределено по закону Пуассона.

Показательное распределение представляет собой частный случай распределения Вейбулла.

Если время не непрерывно, а дискретно, то аналогом показательного распределения является геометрическое распределение.

Плотность экспоненциального распределения описывается формулой:

Это распределение имеет только один параметр, который и определяет его характеристики.

График плотности показательного распределения имеет вид:

Основные числовые характеристики экспоненциального распределения:

Распределение Эрланга

Это непрерывное распределение сосредоточено на (0,1) и имеет плотность:

Математическое ожидание и дисперсия равны соответственно

Распределение Эрланга названо в честь А. Эрланга (A. Erlang), впервые применившего его в задачах теории массового обслуживания и телефонии.

Распределение Эрланга с параметрами µ и n является распределением суммы п независимых, одинаково распределенных случайных величин, каждая из которых имеет показательное распределение с параметром nµ

При n = 1 распределение Эрланга совпадает с показательным или экспоненциальным распределением.

Распределение Лапласа

Функция плотности распределения Лапласа, или, как его еще называют, двойного экспоненциального, используется, например, для описания распределения ошибок в моделях регрессии. Взглянув на график этого распределения, вы увидите, что оно состоит из двух экспоненциальных распределений, симметричных относительно оси OY.

Если параметр положения равен 0, то функция плотности распределения Лапласа имеет вид:

Основные числовые характеристики этого закона распределения в предположении, что параметр положения нулевой, выглядят следующим образом:

В общем случае плотность распределения Лапласа имеет вид:

а - среднее распределения; b - параметр масштаба; е - число Эйлера (2,71...).

Гамма-распределение

Плотность экспоненциального распределения имеет моду в точке 0, и это иногда неудобно для практических применений. Во многих примерах заранее известно, что мода рассматриваемой случайной переменной не равна 0, например, интервалы между приходами покупателей в магазин электронной торговли или заходами на сайт имеют ярко выраженную моду. Для моделирования таких событий используется гамма-распределение.

Плотность гамма-распределения имеет вид:

где Г - Г-функция Эйлера, а > 0 - параметр «формы» и b > 0 - параметр масштаба.

В частном случае имеем распределение Эрланга и экспоненциальное распределение.

Основные характеристики гамма-распределения:

Ниже приведены два графика плотности гамма-распределения с параметром масштаба, равным 1, и параметрами формы, равными 3 и 5.

Полезное свойство гамма-распределения: сумма любого числа независимых гамма-распределенных случайных величин (с одинаковым параметром масштаба b)

(a l ,b) + (a 2 ,b) + --- +(a n ,b) также подчиняется гамма-распределению, но с параметрами а 1 + а 2 + + а n и b.

Логнормальное распределение

Случайная величина h называется логарифмически нормальной, или логнормальной, если ее натуральный логарифм (lnh) подчинен нормальному закону распределения.

Логнормальное распределение используется, например, при моделировании таких переменных, как доходы, возраст новобрачных или допустимое отклонение от стандарта вредных веществ в продуктах питания.

Итак, если величина x имеет нормальное распределение, то величина у = е x имеет Логнормальное распределение.

Если вы подставите нормальную величину в степень экспоненты, то легко поймете, что логнормальная величина получается в результате многократных умножений независимых величин, так же как нормальная случайная величина есть результат многократного суммирования.

Плотность логнормального распределения имеет вид:

Основные характеристики логарифмически нормального распределения:


Хи-квадрат-распределение

Сумма квадратов т независимых нормальных величин со средним 0 и дисперсией 1 имеет хи-квадрат-распределение с т степенями свободы. Это распределение наиболее часто используется при анализе данных.

Формально плотность ям-квадрат -распределения с т степенями свободы имеет вид:

При отрицательных х плотность обращается в 0.

Основные числовые характеристики хи -квадрат-распределения:

График плотности приводится на рисунке ниже:

Биномиальное распределение

Биномиальное распределение является наиболее важным дискретным распределением, которое сосредоточено всего лишь в нескольких точках. Этим точкам биномиальное распределение приписывает положительные вероятности. Таким образом, биномиальное распределение отличается от непрерывных распределений (нормального, хи-квадрат и др.), которые приписывают нулевые вероятности отдельно выбранным точкам и называются непрерывными.

Лучше понять биномиальное распределение можно, рассмотрев следующую игру.

Представьте, что вы бросаете монету. Пусть вероятность выпадения герба есть р, а вероятность выпадения решки есть q = 1 - р (мы рассматриваем самый общий случай, когда монета несимметрична, имеет, например, смещенный центр тяжести-в монете сделана дырка).

Выпадение герба считается успехом, а выпадение решки - неудачей. Тогда число выпавших гербов (или решек) имеет биномиальное распределение.

Отметим, что рассмотрение несимметричных монет или неправильных игральных костей имеет практический интерес. Как отметил Дж. Нейман в своей изящной книге «Вводный курс теории вероятностей и математической статистики», люди давно догадались, что частота выпадений очков на игральной кости зависит от свойств самой этой кости и может быть искусственно изменена. Археологи обнаружили в гробнице фараона две пары костей: «честные» - с равными вероятностями выпадения всех граней, и фальшивые - с умышленным смещением центра тяжести, что увеличивало вероятность выпадения шестерок.

Параметрами биномиального распределения являются вероятность успеха р (q = 1 - р) и число испытаний п.

Биномиальное распределение полезно для описания распределения биномиальных событий, таких, например, как количество мужчин и женщин в случайно выбранных компаниях. Особую важность имеет применение биномиального распределения в игровых задачах.

Точная формула для вероятности т успехов в n испытаниях записывается так:

p-вероятность успеха

q равно 1-p, q>=0, p+q==1

n- число испытаний, m =0,1...m

Основные характеристики биноминального распределения:

График этого распределения при различном числе испытаний п и вероятностях успеха р имеет вид:

Биномиальное распределение связано с нормальным распределением и распределением Пуассона (см. ниже); при определенных значениях параметров при большом числе испытаний оно превращается в эти распределения. Это легко продемонстрировать с помощью STATISTICA.

Например, рассматривая график биномиального распределения с параметрами р=0,7,n = 100 (см. рисунок), мы использовали STATISTICA BASIC, - вы можете заметить, что график очень похож на плотность нормального распределения (так оно и есть на самом деле!).

График биномиального распределения с параметрами р=0,05, n= 100 очень похож на график пуассоновского распределения.

Как уже было сказано, биномиальное распределение возникло из наблюдений за простейшей азартной игрой - бросание правильной монеты. Во многих ситуациях эта модель служит хорошим первым приближением для более сложных игр и случайных процессов, возникающих при игре на бирже. Замечательно, что существенные черты многих сложных процессов можно понять, исходя из простой биномиальной модели.

Например, рассмотрим следующую ситуацию.

Отметим выпадение герба как 1, а выпадение решки - минус 1 и будем суммировать выигрыши и проигрыши в последовательные моменты времени. На графиках показаны типичные траектории такой игры при 1 000 бросков, при 5 000 бросков и при 10 000 бросков. Обратите внимание, какие длинные отрезки времени траектория находится выше или ниже нуля, иными словами, время, в течение которого один из игроков находится в выигрыше в абсолютно справедливой игре, очень продолжительно, а переходы от выигрыша к проигрышу относительно редки, и это с трудом укладывается в неподготовленном сознании, для которого выражение «абсолютно справедливая игра» звучит как магическое заклинание. Итак, хотя игра и справедлива по условиям, поведение типичной траектории вовсе не справедливо и не демонстрирует равновесия!

Конечно, эмпирически этот факт известен всем игрокам, с ним связана стратегия, когда игроку не дают уйти с выигрышем, а заставляют играть дальше.


Рассмотрим количество бросков, в течение которых один игрок находится в выигрыше (траектория выше 0), а второй - в проигрыше (траектория ниже 0). На первый взгляд кажется, что количество таких бросков примерно одинаково. Однако (см. захватывающую книгу: Феллер В. «Введение в теорию вероятностей и ее приложения». Москва: Мир, 1984, с.106) при 10 000 бросках идеальной монеты (то есть для испытаний Бернулли с р = q = 0,5, n=10 000) вероятность того, что одна из сторон будет лидировать на протяжении более 9 930 испытаний, а вторая - менее 70, превосходит 0,1.

Удивительно, что в игре, состоящей из 10 000 бросаний правильной монеты, вероятность того, что лидерство поменяется не более 8 раз, превышает 0,14, а вероятность более 78 изменений лидерства приблизительно равна 0,12.

Итак, мы имеем парадоксальную ситуацию: в симметричном блуждании Бернулли «волны» на графике между последовательными возвращениями в нуль (см. графики) могут быть поразительно длинными. С этим связано и другое обстоятельство, а именно то, что для Т n /n (доли времени, когда график находится выше оси абсцисс) наименее вероятными оказываются значения, близкие к 1/2.

Математиками был открыт так называемый закон арксинуса, согласно которому при каждом 0 < а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

Распределение арксинуса

Это непрерывное распределение сосредоточено на интервале (0, 1) и имеет плотность:

Распределение арксинуса связано со случайным блужданием. Это распределение доли времени, в течение которого первый игрок находится в выигрыше при бросании симметричной монеты, то есть монеты, которая с равными вероятностями S падает на герб и решку. По-другому такую игру можно рассматривать как случайное блуждание частицы, которая, стартуя из нуля, с равными вероятностями делает единичные скачки вправо или влево. Так как скачки частицы - выпадения герба или решки - равновероятны, то такое блуждание часто называется симметричным. Если бы вероятности были разными, то мы имели бы несимметричное блуждание.

График плотности распределения арксинуса приведен на следующем рисунке:

Самое интересное - это качественная интерпретация графика, из которой можно сделать удивительные выводы о сериях выигрышей и проигрышей в справедливой игре. Взглянув на график, вы можете заметить, что минимум плотности находится в точке 1/2.« Ну и что?!» - спросите вы. Но если вы задумаетесь над этим наблюдением, то вашему удивлению не будет границ! Оказывается, определенная как справедливая, игра в действительности вовсе не такая справедливая, как может показаться на первый взгляд.

Траектории симметричного случайного, в которых частица равное время проводит как на положительной, так и на отрицательной полуоси, то есть правее или левее нуля, являются как раз наименее вероятными. Переходя на язык игроков, можно сказать, что при бросании симметричной монеты игры, в которых игроки находятся равное время в выигрыше и проигрыше, наименее вероятны.

Напротив, игры, в которых один игрок значительно чаще находится в выигрыше, а другой соответственно в проигрыше, являются наиболее вероятными. Удивительный парадокс!

Чтобы рассчитать вероятность того, что доля времени т, в течение которой первый игрок находится в выигрыше, лежит в пределах от t1 до t2, нужно из значения функции распределения F(t2) вычесть значение функции распределения F(t1).

Формально получаем:

P{t1

Опираясь на этот факт, можно вычислить с помощью STATISTICА, что при 10 000 шагов частица остается на положительной стороне более чем 9930 моментов времени с вероятностью 0,1, то есть, грубо говоря, подобное положение будет наблюдаться не реже чем в одном случае из десяти (хотя, на первый взгляд, оно кажется абсурдным; см. замечательную по ясности заметку Ю. В. Прохорова «Блуждание Бернулли» в энциклопедии «Вероятность и математическая статистика», с. 42-43, М.: Большая Российская Энциклопедия, 1999).

Отрицательное биномиальное распределение

Это дискретное распределение, приписывающее целым точкам k = 0,1,2,... вероятности:

p k =P{X=k}=C k r+k-1 p r (l-p) k ", где 0<р<1,r>0.

Отрицательное биномиальное распределение встречается во многих приложениях.

При целом r > 0 отрицательное биномиальное распределение интерпретируется как распределение времени ожидания r-го «успеха» в схеме испытаний Бернулли с вероятностью «успеха» р, например, количество бросков, которые нужно сделать до второго выпадения герба, в этом случае оно иногда называется распределением Паскаля и является дискретным аналогом гамма-распределения.

При r = 1 отрицательное биномиальное распределение совпадает с геометрическим распределением.

Если Y - случайная величина, имеющая распределение Пуассона со случайным параметром , который, в свою очередь, имеет гамма-распределение с плотностью

То Убудет иметь отрицательно биномиальное распределение с параметрами;

Распределение Пуассона

Распределение Пуассона иногда называют распределением редких событий. Примерами переменных, распределенных по закону Пуассона, могут служить: число несчастных случаев, число дефектов в производственном процессе и т. д. Распределение Пуассона определяется формулой:

Основные характеристики пуассоновской случайной величины:

Распределение Пуассона связано с показательным распределением и с распределением Бернулли.

Если число событий имеет распределение Пуассона, то интервалы между событиями имеют экспоненциальное или показательное распределение.

График распределения Пуассона:

Сравните график пуассоновского распределения с параметром 5 с графиком распределения Бернулли при p=q=0,5,n=100.

Вы увидите, что графики очень похожи. В общем случае имеется следующая закономерность (см. например, превосходную книгу: Ширяев А. Н. «Вероятность». Москва: Наука, с. 76): если в испытаниях Бернулли n принимает большие значения, а вероятность успеха/? относительно мала, так что среднее число успехов (произведение и нар) и не мало и не велико, то распределение Бернулли с параметрами n, р можно заменить распределением Пуассона с параметром = np.

Распределение Пуассона широко используется на практике, например, в картах контроля качества как распределение редких событий.

В качестве другого примера рассмотрим следующую задачу, связанную с телефонными линиями и взятую из практики (см.: Феллер В. Введение в теорию вероятностей и ее приложения. Москва: Мир, 1984, с. 205, а также Molina E. С. (1935) Probability in engineering, Electrical engineering, 54, p. 423-427; Bell Telephone System Technical Publications Monograph B-854). Эту задачу легко перевести на современный язык, например на язык мобильной связи, что и предлагается сделать заинтересованным читателям.

Задача формулируется следующим образом. Пусть имеется две телефонные станции - А и В.

Телефонная станция А должна обеспечить связь 2 000 абонентов со станцией В. Качество связи должно быть таким, чтобы только 1 вызов из 100 ждал, когда освободится линия.

Спрашивается: сколько нужно провести телефонных линий, чтобы обеспечить заданное качество связи? Очевидно, что глупо создавать 2 000 линий, так как длительное время многие из них будут свободными. Из интуитивных соображений ясно, что, по-видимому, имеется какое-то оптимальное число линий N. Как рассчитать это количество?

Начнем с реалистической модели, которая описывает интенсивность обращения абонента к сети, при этом заметим, что точность модели, конечно, можно проверить, используя стандартные статистические критерии.

Итак, предположим, что каждый абонент использует линию в среднем 2 минуты в час и подключения абонентов независимы (однако, как справедливо замечает Феллер, последнее имеет место, если не происходит некоторых событий, затрагивающих всех абонентов, например, войны или урагана).

Тогда мы имеем 2000 испытаний Бернулли (бросков монеты) или подключений к сети с вероятностью успеха p=2/60=1/30.

Нужно найти такое N, когда вероятность того, что к сети одновременно подключается больше N пользователей, не превосходит 0,01. Эти расчеты легко можно решить в системе STATISTICA.

Решение задачи на STATISTICA.

Шаг 1. Откройте модульОсновные статистики . Создайте файл binoml.sta, содержащий 110 наблюдений. Назовите первую переменную БИНОМ , вторую переменную - ПУАССОН .

Шаг 2. БИНОМ , откройте окно Переменная 1 (см. рис.). Введите в окно формулу, как показано на рисунке. Нажмите кнопку ОК .


Шаг 3. Дважды щелкнув мышью на заголовке ПУАССОН , откройте окно Переменная 2 (см. рис.)

Введите в окно формулу, как показано на рисунке. Обратите внимание, что мы вычисляем параметр распределения Пуассона по формуле =n×p. Поэтому = 2000 × 1/30. Нажмите кнопку ОК .


STATISTICA рассчитает вероятности и запишет их в созданный файл.

Шаг 4. Прокрутите построенную таблицу до наблюдений с номером 86. Вы увидите, что вероятность того, что в течение часа из 2000 пользователей сети одновременно работают 86 или более, равна 0,01347, если используется биномиальное распределение.

Вероятность того, что в течение часа из 2000 пользователей сети одновременно работают 86 или более человек, равна 0,01293, если используется пуассоновское приближение для биномиального распределения.

Так как нам нужна вероятность не более 0,01, то 87 линий будет достаточно, чтобы обеспечить нужное качество связи.

Близкие результаты можно получить, если использовать нормальное приближение для биномиального распределения (проверьте это!).

Заметим, что В. Феллер не имел в своем распоряжении систему STATISTICA и использовал таблицы для биномиального и нормального распределения.

С помощью таких же рассуждений можно решить следующую задачу, обсуждаемую В. Феллером. Требуется проверить, больше или меньше линий потребуется для надежного обслуживания пользователей при разбиении их на 2 группы по 1000 человек в каждой.

Оказывается, при разбиении пользователей на группы потребуется дополнительно 10 линий, чтобы достичь качества того же уровня.

Можно также учесть изменение интенсивности подключения к сети в течение дня.

Геометрическое распределение

Если проводятся независимые испытания Бернулли и подсчитывается количество испытаний до наступления следующего «успеха», то это число имеет геометрическое распределение. Таким образом, если вы бросаете монету, то число подбрасываний, которое вам нужно сделать до выпадения очередного герба, подчиняется геометрическому закону.

Геометрическое распределение определяется формулой:

F(x) = p(1-p) x-1

р - вероятность успеха, х = 1, 2,3...

Название распределения связано с геометрической прогрессией.

Итак, геометрическое распределение задает вероятность того, что успех наступил на определенном шаге.

Геометрическое распределение представляет собой дискретный аналог показательного распределения. Если время изменяется квантами, то вероятность успеха в каждый момент времени описывается геометрическим законом. Если время непрерывно, то вероятность описывается показательным или экспоненциальным законом.

Гипергеометрическое распределение

Это дискретное распределение вероятностей случайной величины X, принимающей целочисленные значения т = 0, 1,2,...,n с вероятностями:

где N, М и n - целые неотрицательные числа и М < N, n < N.

Гипергеометрическое распределение обычно связано с выбором без возвращения и определяет, например, вероятность найти ровно т черных шаров в случайной выборке объема n из генеральной совокупности, содержащей N шаров, среди которых М черных и N - М белых (см., например, энциклопедию «Вероятность и математическая статистика», М.: Большая Российская Энциклопедия, с. 144).

Математическое ожидание гипергеометрического распределения не зависит от N и совпадает с математическим ожиданием µ=np соответствующего биномиального распределения.

Дисперсия гипергеометрического распределения не превосходит дисперсии биномиального распределения npq. При моменты любого порядка гипергеометрического распределения стремятся к соответствующим значениям моментов биномиального распределения.

Это распределение чрезвычайно часто возникает в задачах, связанных с контролем качества.

Полиномиальное распределение

Полиномиальное, или мультиномиальное, распределение естественно обобщает распределение. Если биномиальное распределение возникает при бросании монеты с двумя исходами (решетка или герб), то полиномиальное распределение возникает, когда бросается игральная кость и имеется больше двух возможных исходов. Формально - это совместное распределение вероятностей случайных величин X 1 ,...,X k , принимающих целые неотрицательные значения n 1 ,...,n k , удовлетворяющие условию n 1 + ... + n k = n, c вероятностями:

Название «полиномиальное распределение» объясняется тем, что мультиномиальные вероятности возникают при разложении полинома (р 1 + ... + p k) n

Бета-распределение

Бета-распределение имеет плотность вида:


Стандартное бета-распределение сосредоточено на отрезке от 0 до 1. Применяя линейные преобразования, бета-величину можно преобразовать так, что она будет принимать значения на любом интервале.

Основные числовые характеристики величины, имеющей бета-распределение:


Распределение экстремальных значений

Распределение экстремальных значений (тип I) имеет плотность вида:

Это распределение иногда также называют распределением крайних значений.

Распределение экстремальных значении используется при моделировании экстремальных событий, например, уровней наводнений, скоростей вихрей, максимума индексов рынков ценных бумаг за данный год и т. д.

Это распределение используется в теории надежности, например, для описания времени отказа электрических схем, а также в в актуарных расчетах.

Распределения Релея

Распределение Релея имеет плотность вида:

где b - параметр масштаба.

Распределение Релея сосредоточено в интервале от 0 до бесконечности. Вместо значения 0 STATISTICA позволяет ввести другое значение порогового параметра, которое будет вычтено из исходных данных перед подгонкой распределения Релея. Следовательно, значение порогового параметра должно быть меньше всех наблюдаемых значений.

Если две переменные у 1 и у 2 являются независимыми друг от друга и нормально распределены с одинаковой дисперсией, то переменная будет иметь распределение Релея.

Распределение Релея используется, например, в теории стрельбы.


Распределение Вейбулла

Распределение Вейбулла названо в честь шведского исследователя Валодди Вейбулла (Waloddi Weibull), применявшего это распределение для описания времен отказов разного типа в теории надежности.

Формально плотность распределения Вейбулла записывается в виде:

Иногда плотность распределения Вейбулла записывается также в виде:

B - параметр масштаба;

С - параметр формы;

Е - константа Эйлера (2,718...).

Параметр положения. Обычно распределение Вейбулла сосредоточено на полуоси от 0 до бесконечности. Если вместо границы 0 ввести параметр а, что часто бывает необходимо на практике, то возникает так называемое трехпараметрическое распределение Вейбулла.

Распределение Вейбулла интенсивно используется в теории надежности и страховании.

Как описывалось выше, экспоненциальное распределение часто используется как модель, оценивающая время наработки до отказа в предположении, что вероятность отказа объекта постоянна. Если вероятность отказа меняется с течением времени, применяется распределение Вейбулла.

При с =1 или, в другой параметризации, при распределение Вейбулла, как легко видеть из формул, переходит в экспоненциальное распределение, а при - в распределение Релея.

Разработаны специальные методы оценки параметров распределения Вейбулла (см. например, книгу: Lawless (1982) Statistical models and methods for lifetime data, Belmont, CA: Lifetime Learning, где описаны методы оценивания, а также проблемы, возникающие при оценке параметра положения для трехпараметрического распределения Вейбулла).

Часто при проведении анализа надежности необходимо рассматривать вероятность отказа в течение малого интервала времени после момента времени t при условии, что до момента t отказа не произошло.

Такая функция называется функцией риска, или функцией интенсивности отказов, и формально определяется следующим образом:

H(t) - функция интенсивности отказов или функция риска в момент времени t;

f(t) - плотность распределения времен отказов;

F(t) - функция распределения времен отказов (интеграл от плотности по интервалу ).

В общем виде функция интенсивности отказов записывается так:

При функция риска равна константе, что соответствует нормальной эксплуатации прибора (см. формулы).

При функция риска убывает, что соответствует приработке прибора.

При функция риска убывает, что соответствует старению прибора. Типичные функции риска показаны на графике.


Ниже показаны графики плотности распределения Вейбулла с различными параметрами. Нужно обратить внимание на три области значений параметра а:

В первой области функция риска убывает (период настройки), во второй области функция риска равна константе, в третьей области функция риска возрастает.

Вы легко поймете сказанное на примере покупки нового автомобиля: вначале идет период адаптации машины, затем длительный период нормальной эксплуатации, далее детали автомобиля изнашиваются и функция риска выхода его из строя резко возрастает.

Важно, что все периоды эксплуатации можно описать одним и тем же семейством распределения. В этом и состоит идея распределения Вейбулла.


Приведем основные числовые характеристики распределения Вейбулла.


Распределение Парето

В различных задачах прикладной статистики довольно часто встречаются так называемые усеченные распределения.

Например, это распределение используется в страховании или в налогообложении, когда интерес представляют доходы, которые превосходят некоторую величину c 0

Основные числовые характеристики распределения Парето:


Логистическое распределение

Логистическое распределение имеет функцию плотности:

А - параметр положения;

B - параметр масштаба;

Е - число Эйлера (2,71...).


Хотеллинга Т 2 -распределение

Это непрерывное распределение, сосредоточенное на интервале (0, Г), имеет плотность:

где параметры n и k, n >_k >_1, называются степенями свободы.

При k = 1 Хотеллинга Р-распределение сводится к распределению Стьюдента, а при любом k >1 может рассматриваться как обобщение распределения Стьюдента на многомерный случай.

Распределение Хотеллинга строится исходя из нормального распределения.

Пусть k-мерный случайный вектор Y имеет нормальное распределение с нулевым вектором средних и ковариационной матрицей .

Рассмотрим величину

где случайные векторы Z i независимы между собой и Y и распределены так же, как Y.

Тогда случайная величина Т 2 =Y T S -1 Y имеет T 2 -распределение Хотеллинга с n степенями свободы (Y - вектор-столбец, Т - оператор транспонирования).

где случайная величина t n имеет распределение Стьюдента с n степенями свободы (см. «Вероятность и математическая статистика», Энциклопедия, с. 792).

Если Y имеет нормальное распределение с ненулевым средним, то соответствующее распределение называется нецентральным Хотеллинга T 2 -распределением с n степенями свободы и параметром нецентральности v.

Хотеллинга T 2 -распределение используют в математической статистике в той же ситуации, что и ^-распределение Стьюдента, но только в многомерном случае. Если результаты наблюдений X 1 ,..., Х n представляют собой независимые, нормально распределенные случайные векторы с вектором средних µ и невырожденной ковариационной матрицей , то статистика


имеет Хотеллинга T 2 -распределение с n - 1 степенями свободы. Этот факт положен в основу критерия Хотеллинга.

В STATISTICA критерий Хотеллинга доступен, например, в модуле Основные статистики и таблицы (см. приведенное ниже диалоговое окно).


Распределение Максвелла

Распределение Максвелла возникло в физике при описании распределения скоростей молекул идеального газа.

Это непрерывное распределение сосредоточено на (0, ) и имеет плотность:

Функция распределения имеет вид:

где Ф(x) - функция стандартного нормального распределения. Распределение Максвелла имеет положительный коэффициент асимметрии и единственную моду в точке (то есть распределение унимодально).

Распределение Максвелла имеет конечные моменты любого порядка; математическое ожидание и дисперсия равны соответственно и

Распределение Максвелла естественным образом связано с нормальным распределением.

Если Х 1 , Х 2 , Х 3 - независимые случайные величины, имеющие нормальное распределение с параметрами 0 и õ 2 , то случайная величина имеет распределение Максвелла. Таким образом, распределение Максвелла можно рассматривать как распределение длины случайного вектора, координаты которого в декартовой системе координат в трехмерном пространстве независимы и нормально распределены со средним 0 и дисперсией õ 2 .

Распределение Коши

У этого удивительного распределения иногда не существует среднего значения, т. к. плотность его очень медленно стремится к нулю при увеличении x по абсолютной величине. Такие распределения называют распределениями с тяжелыми хвостами. Если вам нужно придумать распределение, не имеющее среднего, то сразу называйте распределение Коши.

Распределение Коши унимодально и симметрично относительно моды, которая одновременно является и медианой, и имеет функцию плотности вида:

где с > 0 - параметр масштаба и а - параметр центра, определяющий одновременно значения моды и медианы.

Интеграл от плотности, то есть функция распределения задается соотношением:

Распределение Стьюдента

Английский статистик В. Госсет, известный под псевдонимом «Стьюдент» и начавший свою карьеру со статистического исследования качества английского пива, получил в 1908 г. следующий результат. Пусть x 0 , x 1 ,.., х m - независимые, (0, s 2) - нормально распределенные случайные величины:


Это распределение, известное теперь как распределение Стьюдента (кратко обозначается как t(m) -распределения, где т, число степеней свободы), лежит в основе знаменитого t-критерия, предназначенного для сравнения средних двух совокупностей.

Функция плотности f t (x) не зависит от дисперсии õ 2 случайных величин и, кроме того, является унимодальной и симметричной относительно точки х = 0.

Основные числовые характеристики распределения Стьюдента:

t-распределение важно в тех случаях, когда рассматриваются оценки среднего и неизвестна дисперсия выборки. В этом случае используют выборочную дисперсию и t-распределение.

При больших степенях свободы (больших 30) t-распределение практически совпадает со стандартным нормальным распределением.

График функции плотности t-распределения деформируется при возрастании числа степеней свободы следующим образом: пик увеличивается, хвосты более круто идут к 0, и кажется, будто графики функции плотности t-распределения сжимается с боков.


F-распределение

Рассмотрим m 1 + m 2 независимых и (0, s 2) нормально распределенных величин

и положим

Очевидно, та же самая случайная величина может быть определена и как отношение двух независимых и соответствующим образом нормированных хи-квадрат-распределенных величин и , то есть

Знаменитый английский статистик Р. Фишер в 1924 году показал, что плотность вероятности случайной величины F(m 1 , m 2) задается функцией:


где Г (у) - значение гамма-функции Эйлера в. точке у, а сам закон называется F-pacпределением с числами степеней свободы числителя и знаменателя, равными соответственно т,1л т7

Основные числовые характеристики F-распределения:


F-распределение возникает в дискриминантом, регрессионном и дисперсионном анализе, а также в других видах многомерного анализа данных.



Понравилась статья? Поделитесь с друзьями!