Закон больших чисел в формулировке чебышева. Понятие центральной предельной теоремы

()

Смысл закона больших чисел Чебышева состоит в следующем. В то время как отдельная случайная величина может принимать значения, очень далекие от своего математического ожидания, средняя арифметическая большого числа случайных величин с вероятностью, близкой к единице, принимает значение, мало отличающееся от среднего арифметического их математических ожиданий.
Частный случай закона больших чисел Чебышева. Пусть - последовательность попарно независимых случайных величин, имеющих ограниченные в совокупности дисперсии, т. е. и одинаковые математические ожидания . Тогда, каково бы нибыло , справедливо соотношение

Это непосредственно следует из формулы (), так как

Замечание. Говорят, что случайная величина сходится по вероятности к числу А , если при сколь угодно малом вероятность неравенства с увеличением n неограниченно приближается к единице. Сходимость по вероятности не означает, что . Действительно, в последнем случае неравенство выполняется для всех достаточно больших значений n . В случае же сходимости по вероятности это неравенство для отдельных сколь угодно больших значений n может не выполняться . Однако невыполнение неравенства для больших значений n есть событие очень редкое (маловероятное). Принимая это во внимание, частный случай закона больших чисел Чебышева можно сформулировать так.
Средняя арифметическая попарно независимых случайных величин , имеющих ограниченные в совокупности дисперсии и одинаковые математические ожидания , сходится по вероятности к а .
Поясним смысл частного случая закона больших чисел Чебышева. Пусть требуется найти истинное значение а некоторой физической величины (например, размер некоторой детали). Для этого будем производить ряд независимых друг от друга измерений. Всякое измерение сопровождается некоторой погрешностью (). Поэтому каждый возможный результат измерения есть случайная величина (индекс i - номер измерения). Предположим, что в каждом измерении нет систематической ошибки, т. е. отклонения от истинного значения а измеряемой величины в ту и другую стороны равновероятны. В этом случае математические ожидания всех случайных величин одинаковы и равны измеряемой величине а , т. е.
Предположим, наконец, что измерения производятся с некоторой гарантированной точностью. Это значит, что для всех измерений . Таким образом, мы находимся в условиях закона больших чисел Чебышева, а потому, если число измерений достаточно велико, то с практической достоверностью можно утверждать, что каково бы ни было , средняя арифметическая результатов измерений отличается от истинного значения а меньше, чем на

В начале курса мы уже говорили о том, что математические законы теории вероятностей получены абстрагированием реальных статистических закономерностей, свойственных массовым случайным явлениям. Наличие этих закономерностей связано именно с массовостью явлений, то есть с большим числом выполняемых однородных опытов или с большим числом складывающихся случайных воздействий, порождающих в своей совокупности случайную величину, подчиненную вполне определенному закону. Свойство устойчивости массовых случайных явлений известно человечеству еще с глубокой древности. В какой бы области оно ни проявлялось, суть его сводится к следующему: конкретные особенности каждого отдельного случайного явления почти не сказываются на среднем результате масс и таких явлений; случайные отклонения от среднего, неизбежные в каждом отдельном явлении, в массе взаимно погашаются, нивелируются, выравниваются. Именно эта устойчивость средних и представляет собой физическое содержание «закона больших чисел», понимаемого в широком смысле слова: при очень большом числе случайных явлений средний их результат практически перестает быть случайным и может быть предсказан с большой степенью определенности.

В узком смысле слова под «законом больших чисел» в теории вероятностей понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа опытов к некоторым определенным постоянным.

В 2.3 мы уже формулировали простейшую из этих теорем - теорему Я. Бернулли. Она утверждает, что при большом числе опытов частота события приближается (точнее - сходится по вероятности) к вероятности этого события. С другими, более общими формами закона больших чисел мы познакомимся в данной главе. Все они устанавливают факт и условия сходимости по вероятности тех или иных случайных величин к постоянным, не случайным величинам.

Закон больших чисел играет важную роль в практических применениях теории вероятностей. Свойство случайных величин при определенных условиях вести себя практически как не случайные позволяет уверенно оперировать с этими величинами, предсказывать результаты массовых случайных явлений почти с полной определенностью.

Возможности таких предсказаний в области массовых случайных явлений еще больше расширяются наличием другой группы предельных теорем, касающихся уже не предельных значений случайных величин, а предельных законов распределения. Речь идет о группе теорем, известных под названием «центральной предельной теоремы». Мы уже говорили о том, что при суммировании достаточно большого числа случайных величин закон распределения суммы неограниченно приближается к нормальному при соблюдении некоторых условий. Эти условия, которые математически можно формулировать различным образом - в более или менее общем виде, - по существу сводятся к требованию, чтобы влияние на сумму отдельных слагаемых было равномерно малым, т. е. чтобы в состав суммы не входили члены, явно преобладающие над совокупностью остальных по своему влиянию на рассеивание суммы. Различные формы центральной предельной теоремы различаются между собой теми условиями, для которых устанавливается это предельное свойство суммы случайных величин.

Различные формы закона больших чисел вместе с различными формами центральной предельной теоремы образуют совокупность так называемых предельных теорем теории вероятностей. Предельные теоремы дают возможность не только осуществлять научные прогнозы в области случайных явлений, но и оценивать точность этих прогнозов.

В данной главе мы рассмотрим только некоторые, наиболее простые формы предельных теорем. Сначала будут рассмотрены теоремы, относящиеся к группе «закона больших чисел», затем - теоремы, относящиеся к группе «центральной предельной теоремы».

Под «законом больших чисел» в теории вероятностей понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа опытов к некоторым определенным постоянным.

В основе- неравенство Чебышева:

Вероятность того, что отклонение случайной величины X от ее математического ожидания по абсолютной величине меньше положительного числа ε, не меньше чем :

Справедливо для дискретных и непрерывных с.в.

53. Теорема Чебышева.

Пусть имеется бесконечная последовательность независимых случайных величин с одним и тем же математическим ожиданием и дисперсиями, ограниченными одной и той же постоянной С:

Тогда каково бы ни было положительное число вероятность события стремится к единице.

54. Теорема Бернулли.

Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А равна р.

55. Понятие о центральной предельной теореме Ляпунова.

Распределение суммы большого числа независимых случайных величин при весьма общих условиях близко к нормальному распределению.

Известно, что нормально распределенные случайные величины широко распределены на практике. Объяснение этому было дано А.М.Ляпуновым в центральной предельной теореме: если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то имеет распределение, близкое к нормальному.

56. Генеральная совокупность и выборка: основные определения и понятия.

Математическая статистика – наука, занимающаяся разработкой методов получения, описания и обработки опытных данных с целью изучения закономерностей случайных массовых явлений.

Задачи математической статистики:

    Оценка неизвестной функции распределения на основании результатов измерений.

    Оценка неизвестных параметров распределения.

    Статическая проверка гипотез.

Пусть изучается некоторый количественный признак x.

Тогда под генеральной совокупностью понимается множество всех его возможных значений.

Для изучения свойств данного признака из генеральной совокупности случайным образом отбирается часть элементов вариантами Xi, которые образуют выборочную совокупность или выборку.

Число элементов совокупности называется ее объектом n.

Выборки: 1) повторная- выборка, при которой отобранный объект(перед отбором следующего0 возвращается в генеральную совокупность.

2) бесповторная- выборка, при которой отобранный объект в генеральную совокупность возвращается.

Чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо чтобы выборка была репрезентативной9представительной)

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект генеральной совокупности должен иметь одинаковую вероятность попасть в выборку.

Если объект генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается.

Перечень вариант, расположенный в возрастающем порядке называется вариационным рядом.

Число наблюдений данной варианты называется ее частотой ni, а отношение частоты ni к объекту выборки n-относительной частоты wi.

Если явление устойчивости средних имеет место в действительности, то в математической модели, с помощью которой мы изучаем случайные явления, должна существовать отражающая этот факт теорема.
В условиях этой теоремы введем ограничения на случайные величины X 1 , X 2 , …, X n :

а) каждая случайная величина Х i имеет математическое ожидание

M (Х i ) = a ;

б) дисперсия каждой случайной величины конечна или, можно сказать, что дисперсии ограничены сверху одним и тем же числом, например С , т. е.

D (Х i ) < C, i = 1, 2, …, n ;

в) случайные величины попарно независимы, т. е. любые две X i и X j при i ¹ j независимы.

Тогда, очевидно

D (X 1 + X 2 + … + X n )= D (X 1) + D (X 2) + ... + D (X n ).

Сформулируем закон больших чисел в форме Чебышева.

Теорема Чебышева: при неограниченном увеличении числа n независимых испытаний «средняя арифметическая наблюдаемых значений случайной величины сходится по вероятности к ее математическому ожиданию », т. е. для любого положительного ε

Р (| а| < ε ) = 1. (4.1.1)

Смысл выражения «средняя арифметическая = сходится по вероятности к a» состоит в том, что вероятность того, что будет сколь угодно мало отличаться от a , неограниченно приближается к 1 с ростом числа n .

Доказательство. Для конечного числа n независимых испытаний применим неравенство Чебышева для случайной величины = :

Р (|– M ()| < ε ) ≥ 1 – . (4.1.2)

Учитывая ограничения а – в, вычислим M ( ) и D ( ):

M ( ) = = = = = = а ;

D ( ) = = = = = = .

Подставляя M ( ) и D ( ) в неравенство (4.1.2), получим

Р (| а| < ε )≥1 .

Если в неравенстве (4.1.2) взять сколь угодно малое ε >0и n ® ¥, то получим

= 1,

что и доказывает теорему Чебышева.

Из рассмотренной теоремы вытекает важный практический вывод: неизвестное нам значение математического ожидания случайной величины мы вправе заменить средним арифметическим значением, полученным по достаточно большому числу опытов. При этом, чем больше опытов для вычисления, тем с большей вероятностью (надежностью) можно ожидать, что связанная с этой заменой ошибка ( – а )не превзойдет заданную величину ε .

Кроме того, можно решать другие практические задачи. Например, по значениям вероятности (надежности) Р = Р (| а| < ε )и максимальной допустимой ошибке ε определить необходимое число опытов n ; по Р и п определить ε; по ε и п определить границу вероятности события | а | < ε.

Частный случай . Пусть при n испытаниях наблюдаются n значений случайной величины X, имеющей математическое ожидание M (X ) и дисперсию D (X ). Полученные значения можно рассматривать как случайные величины Х 1 , Х 2 , Х 3 , ... , Х n ,. Это следует понимать так: серия из п испытаний проводится неоднократно, поэтому в результате i -го испытания, i = l, 2, 3, ..., п , в каждой серии испытаний появится то или иное значение случайной величины X , не известное заранее. Следовательно, i -e значение x i случайной величины, полученное в i -м испытании, изменяется случайным образом, если переходить от одной серии испытаний к другой. Таким образом, каждое значение x i можно считать случайной величиной X i .


Предположим, что испытания удовлетворяют следующим требованиям:

1. Испытания независимы. Это означает, что результаты Х 1 , Х 2 ,
Х 3 , ..., Х n испытаний – независимые случайные величины.

2. Испытания проводятся в одинаковых условиях – это означает, с точки зрения теории вероятностей, что каждая из случайных величин Х 1 , Х 2 , Х 3 , ... , Х n имеет такой же закон распределения, что и исходная величина X , поэтому M (X i ) = M (X D (X i ) = D (X ), i = 1, 2, .... п.

Учитывая вышеуказанные условия, получим

Р (| а| < ε )≥1 . (4.1.3)

Пример 4.1.1. X равна 4. Сколько требуется произвести независимых опытов, чтобы с вероятностью не менее 0,9 можно было ожидать, что среднее арифметическое значение этой случайной величины будет отличаться от математического ожидания менее чем на 0,5?

Решение .По условию задачи ε = 0,5; Р (| а|< 0,5) 0,9. Применив формулу (4.1.3) для случайной величины Х , получим

P (|– M (X )| < ε ) ≥ 1 .

Из соотношения

1 = 0,9

определим

п = = = 160.

Ответ : требуется произвести 160 независимых опытов.

Если предположить, что средняя арифметическая распределена нормально, то получаем:

Р (| а| < ε )= 2Φ () 0,9.

Откуда, воспользовавшись таблицей функции Лапласа, получим
1,645, или ≥ 6,58, т. е. n ≥49.

Пример4.1.2. Дисперсия случайной величины Х равна D(Х ) = 5. Произведено 100 независимых опытов, по которым вычислено . Вместо неизвестного значения математического ожидания а принята . Определить максимальную величину ошибки, допускаемую при этом с вероятностью не менее 0,8.

Решение. По условию задачи n = 100, Р (| а| < ε ) ≥0,8. Применим формулу (4.1.3)

Р (| а| < ε ) ≥1 .

Из соотношения

1 = 0,8

определим ε :

ε 2 = = = 0,25.

Следовательно, ε = 0,5.

Ответ : максимальная величина ошибки ε = 0,5.

4.2. Закон больших чисел в форме Бернулли

Хотя в основе любого статистического вывода лежит понятие вероятности, мы лишь в немногих случаях можем определить вероятность события непосредственно. Иногда эту вероятность можно установить из соображений симметрии, равной возможности и т.п., но универсального метода, который позволял бы для произвольного события указать его вероятность, не существует. Теорема Бернулли дает возможность приближенной оценки вероятности, если для интересующего нас события А можно проводить повторные независимые испытания. Пусть произведено п независимых испытаний, в каждом из которых вероятность появления некоторого события А постоянна и равна р.

Теорема Бернулли. При неограниченном возрастании числа независимых испытаний п относительная частота появления события А сходится по вероятности к вероятности p появления события А ,т. е.

P (½ - p ½≤ ε) = 1, (4.2.1)

где ε – сколь угодно малое положительное число.

Для конечного n при условии, что , неравенство Чебышева для случайной величины будет иметь вид:

P (| – p| < ε ) 1 .(4.2.2)

Доказательство. Применим теорему Чебышева. Пусть X i – число появлений события А в i -ом испытании, i = 1, 2, . . . , n . Каждая из величин X i может принять лишь два значения:

X i = 1 (событие А наступило) с вероятностью p ,

X i = 0 (событие А не наступило) с вероятностью q = 1– p .

Пусть Y n = . Сумма X 1 + X 2 + … + X n равна числу m появлений события А в n испытаниях (0 m n ), а, значит, Y n = – относительная частота появления события А в n испытаниях. Математическое ожидание и дисперсия X i равны соответственно:

M ( ) = 1∙p + 0∙q = p ,



Понравилась статья? Поделитесь с друзьями!