МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
АЗОВСКИЙ РЕГИОНАЛЬНЫЙ ИНСТИТУТ УПРАВЛЕНИЯ
ЗАПОРОЖСКОГО НАЦИОНАЛЬНОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА
Кафедра математики
КУРСОВАЯ РАБОТА
З дисциплины «СТАТИСТИКА»
На тему: «КРИТЕРИИ СОГЛАСИЯ»
студентки 2-го курса
группы 207 факультета управления
Батуры Татьяны Олеговны
Научный руководитель
доцент Косенков О. И.
Бердянск – 2009г.
ВВЕДЕНИЕ
1.2 Критерии согласия χ 2 Пирсона для простой гипотезы
1.3 Критерии согласия для сложной гипотезы
1.4 Критерии согласия χ 2 Фишера для сложной гипотезы
1.5 Другие критерии согласия. Критерии согласия для распределения Пуассона
РАЗДЕЛ II. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ КРИТЕРИЯ СОГЛАСИЯ
ПРИЛОЖЕНИЯ
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
ВВЕДЕНИЕ
В данной курсовой работе рассказано о наиболее распространенных критериях согласия – омега-квадрат, хи-квадрат, Колмогорова и Колмогорова-Смирнова. Особенное внимание уделено случаю, когда необходимо проверить принадлежность распределения данных некоторому параметрическому семейству, например, нормальному. Эта весьма распространенная на практике ситуация из-за своей сложности исследована не до конца и не полностью отражена в учебной и справочной литературе.
Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели. Лучше всего этот вопрос разработан, если наблюдения представляют случайную выборку. Теоретическая модель в этом случае описывает закон распределения.
Теоретическое распределение – это то распределение вероятностей, которое управляет случайным выбором. Представления о нем может дать не только теория. Источниками знаний здесь могут быть и традиция, и прошлый опыт, и предыдущие наблюдения. Надо лишь подчеркнуть, что это распределение должно быть выбрано независимо от тех данных, по которым мы собираемся его проверять. Иначе говоря, недопустимо сначала «подогнать» по выборке некоторый закон распределения, а потом пытаться проверить согласие с полученным законом по этой же выборке.
Простые и сложные гипотезы. Говоря о теоретическом законе распределения, которому гипотетически должны бы следовать элементы данной выборки, надо различать простые и сложные гипотезы об этом законе:
· простая гипотеза прямо указывает некий определенный закон вероятностей (распределение вероятностей), по которому возникли выборочные значения;
· сложная гипотеза указывает на единственное распределение, а какое-то их множество (например, параметрическое семейство).
Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности.
Непараметрические критерии согласия Колмогорова, Смирнова, омега квадрат широко используются. Однако с ними связаны и широко распространенные ошибки в применении статистических методов.
Дело в том, что перечисленные критерии были разработаны для проверки согласия с полностью известным теоретическим распределением. Расчетные формулы, таблицы распределений и критических значений широко распространены. Основная идея критериев Колмогорова, омега квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения.
Приступая к выполнению данной курсовой работы, я поставила себе за цель, узнать какие существуют критерии согласия, разобраться для чего же они нужны. Для осуществления этой цели необходимо выполнить следующие задания:
1. Раскрыть суть понятия “критерии согласия”;
2. Определить какие критерии согласия существуют, изучить их по отдельности;
3. Сделать выводы по проведенной работе.
РАЗДЕЛ I. ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ КРИТЕРИЯ СОГЛАСИЯ
1.1 Критерии согласия Колмогорова и омега-квадрат в случае простой гипотезы
Простая гипотеза. Рассмотрим ситуацию, когда измеряемые данные являются числами, иначе говоря, одномерными случайными величинами. Распределение одномерных случайных величин может быть полностью описано указанием их функций распределения. И многие критерии согласия основаны на проверке близости теоретической и эмпирической (выборочной) функций распределения.
Предположим, что имеем выборку n. Обозначим истинную функцию распределения, которой подчиняются наблюдения, G(х), эмпирическую (выборочную) функцию распределения – F n (х), а гипотетическую функцию распределения – F(х). Тогда гипотеза Н о том, что истинная функция распределения есть F(х), записывается в виде Н: G(·) = F(·).
Как проверить гипотезу H? Если Н верна, то F n и F должны проявлять определенное сходство, и различие между ними должно убывать с увеличением n. Вследствие теоремы Бернулли F n (х) → F(х) при n → ∞. Для количественного выражения сходства функций F n иF используют различные способы.
Для выражения сходства функций можно использовать то или иное расстояние между этими функциями. Например, можно сравнить F n и F в равномерной метрике, т.е. рассмотреть величину:
(1.1)Статистику D n называют статистикой Колмогорова.
Очевидно, что D n
- случайная величина, поскольку ее значение зависит от случайного объекта F n
. Если гипотеза Н 0
справедлива и n → ∞, то F n
(x) → F(x) при всяком х. Поэтому естественно, что при этих условиях D n
→ 0. Если же гипотеза Н 0
неверна, то F n
→ G и G ≠ F, а потому sup -∞ Как всегда при проверке гипотезы, рассуждаем так, как если бы гипотеза была верна. Ясно, что Н 0
должна быть отвергнута, если полученное в эксперименте значение статистики D n
кажется неправдоподобно большим. Но для этого надо знать, как распределена статистика D n
при гипотезе Н: F= G при заданных n и G. Замечательное свойство D n
состоит в том, что если G = F, т.е. если гипотетическое распределение указано правильно, то закон распределения статистики D n
оказывается одним и тем же для всех непрерывных функций G. Он зависит только от объема выборки n. Доказательство этого факта основано на том, что статистика не изменяет своего значения при монотонных преобразованиях оси х. Таким преобразованием любое непрерывное распределение G можно превратить в равномерное на отрезке . При этом F n
(x) перейдет в функцию распределения выборки из этого равномерного распределения. При малых п для статистики D n
при гипотезе Н 0
составлены таблицы процентных точек. При больших п распределение D n
(при гипотезе Н 0) указывает найденная в 1933 г. А.Н.Колмогоровым предельная теорема. Она говорит о статистике Эта сумма очень легко считается в Maple. Для проверки простой гипотезы Н 0: G = F требуется по исходной выборке вычислить значение статистики D n
. Для этого годится простая формула. Проверяемую гипотезу обычно называют нулевой H 0
, правило, по которому гипотеза принимается или отвергается называется статистическим критерием.. Статистические критерии, служащие для проверки гипотез о виде законов распределения называются критериями согласия. Т.е. критерии согласия устанавливают, когда полученные в действительности расхождения между предполагаемыми теоретическим и опытным распределением:несущественно - случайные и когда существенно - неслучайные. Рассмотрим случайную величину, которая характеризует вид или функцию расхождения между предполагаемым теоретическим и опытным распределением признака, тогда по имеющемуся опытному распределению, можно определить значение a
, которое приняла случайная величина, если известен ее закон распределения, то не трудно найти вероятность того, что случайная величина примет значение не меньшее a
. Если величина a
получена как результат наблюдения случайной величины x
, т.е. при распределении рассматриваемого признака, по предполагаемому теоретическому закону, то вероятность не должна быть малой. Если же вероятность оказалась малой, то это объясняется тем, что фактически полученному значение не случайной величины x
, а какой-то другой с другим законом распределения, т.е. изучаемый признак распределен не по предполагаемому закону. Таким образом, в случае, когда не мала -расхождения между эмпирическими и теоретическими распределениями следует признать не существенным- случайным, а опытное и теоретическое распределение не противоречащими, т.е. согласующимися друг с другом. Если вероятность мала, то расхождения между опытным и теоретическим распределениями существенны, объяснить их случайностью нельзя, а гипотезу о распределении признака по предполагаемому теоретическому закону следует считать не подтвердившейся, она не согласуется с опытными данными. Необходимо тщательно изучив опытные данные попытаться найти новый закон о качестве предполагаемого признака, который лучше, полнее бы отражал особенности опытного распределения, такие вероятности считаются малыми и их берут не превосходящими 0,1. Критерии согласия Пирсона или критерии
c 2 .
Пусть анализ опытных данных привел к выбору некоторого закона распределения, в качестве предполагаемого для рассматриваемого признака, а по опытным данным в результате n-наблюдений, найдены параметры (если они не были известны раннее). Обозначим через n i
- эмпирические частоты случайной величины x.
n×P i
-теоретические частоты, представляющие произведение числа наблюдений n
на вероятности P i
- рассчитанные по предполагаемому теоретическому распределению. Критерии согласия c 2
за меру расхождения теоретического и эмпирического рядов частот принимают величину ; c 2
-величина, которую называют c 2
распределение или распределение Пирсона. Она равна 0 лишь при совпадении всех эмпирических и теоретических частот, в остальных случаях отлична от 0 и тем больше, чем больше расхождение между указанными частотами. Доказано, что выбранная характеристика c 2
или статистика при n®¥ имеет распределение Пирсона со степенями свободы k=m-s-
1. где m
-число интервалов эмпирического распределения вариационного ряда или число групп. s
-число параметров теоретического распределения, определяемых по опытным данным, (например в случае нормального распределения число оцениваемых по выборке параметров равно 2). Схема применения критерия сводится к следующему: 1. По опытным данным выбирают в качестве предполагаемого закон распределения признака и находят его параметры. 2. С помощью полученного распределения определяют теоретические частоты, соответствующие опытным частотам. 3. Малочисленные опытные частоты, если они есть, объединяют с соседними, затем по формуле определяют величину c 2
. 4. Определяют число степеней свободы k
. 5. Из таблиц приложения для выбранного уровня значимости a
находят критическое значение при числе степеней свободы равным k
. 6. Формулируем вывод, руководствуясь общим принципом применения критериев согласия, а именно если вероятность >0,01, то имеющиеся расхождения между теоретическими и опытными частотами признаются не существенными. Если фактически наблюдаемое значение больше критического, то H 0
отвергается, если то гипотеза не противоречит опытным данным. Критерий c 2
дает удовлетворительные результаты, если в каждом группировочном интервале достаточное число наблюдений n i
. Замечание: Если в каком-нибудь интервале число наблюдений <5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n i
было не меньше 5. При этом при вычислении числа степеней свободы k
в качестве m
-берется соответственно уменьшенное число интервалов. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в %-тах к предыдущему году). В настоящей заметке χ 2 -распределение используется для проверки согласованности набора данных с фиксированным распределением вероятностей. В критерии согласия часто
ты, принадлежащие определенной категории, сравниваются с частотами, которые являются теоретически ожидаемыми, если бы данные действительно имели указанное распределение. Проверка с помощью критерия согласия χ 2 выполняется в несколько этапов. Во-первых, определяется конкретное распределение вероятностей, которое сравнивается с исходными данными. Во-вторых, выдвигается гипотеза о параметрах выбранного распределения вероятностей (например, о ее математическом ожидании) или проводится их оценка. В-третьих, на основе теоретического распределения определяется теоретическая вероятность, соответствующая каждой категории. В заключение, для проверки согласованности данных и распределения применяется тестовая χ 2 -статистика: где f 0
- наблюдаемая частота, f е
- теоретическая, или ожидаемая частота, k
- количество категорий, оставшихся после объединения, р
- количество оцениваемых параметров. Скачать заметку в формате или , примеры в формате Использование χ 2 -критерия согласия для распределения Пуассона
Для расчета по этой формуле в Excel удобно воспользоваться функцией =СУММПРОИЗВ() (рис. 1). Для оценки параметра λ
можно воспользоваться оценкой
. Теоретическую частоту X
успехов (Х = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 и более), соответствующую параметру λ
= 2,9 можно определить с помощью функции =ПУАССОН.РАСП(Х;;ЛОЖЬ). Умножив пуассоновскую вероятность на объем выборки n
, получим теоретическую частоту f e
(рис. 2). Рис. 2. Фактические и теоретические частоты прибытий в минуту Как следует из рис. 2, теоретическая частота девяти и более прибытий не превосходит 1,0. Для того чтобы каждая категория содержала частоту, равную 1,0 или большему числу, категорию «9 и более» следует объединить с категорией «8». То есть, остается девять категорий (0, 1, 2, 3, 4, 5, 6, 7, 8 и более). Поскольку математическое ожидание распределения Пуассона определяется на основе выборочных данных, количество степеней свободы равно k – р – 1 = 9 – 1 – 1 = 7. Используя уровень значимости, равный 0,05 находим критическое значение χ 2 -статистики, имеющей 7 степеней свободы по формуле =ХИ2.ОБР(1-0,05;7) = 14,067. Решающее правило формулируется следующим образом: гипотеза Н 0
отклоняется, если χ 2 > 14,067, в противном случае гипотеза Н 0
не отклоняется. Для расчета χ 2 воспользуемся формулой (1) (рис. 3). Рис. 3. Расчет χ 2 -критерия согласия для распределения Пуассона Так как χ 2 = 2,277 < 14,067, следует, что гипотезу Н 0
отклонять нельзя. Иначе говоря, у нас нет оснований утверждать, что прибытие клиентов в банк не подчиняется распределению Пуассона. Применение χ 2 -критерия согласия для нормального распределения
В предыдущих заметках при проверке гипотез о числовых переменных использовалось предположение о том, что исследуемая генеральная совокупность имеет нормальное распределение. Для проверки этого предположения можно применять графические средства, например, блочную диаграмму или график нормального распределения (подробнее см. ). При больших объемах выборок для проверки этих предположений можно использовать χ 2 -критерий согласия для нормального распределения. Рассмотрим в качестве примера данные о 5-летней доходности 158 инвестиционных фондов (рис. 4). Предположим, требуется поверить, имеют ли эти данные нормальное распределение. Нулевая и альтернативная гипотезы формулируются следующим образом: Н 0
: 5-летняя доходность подчиняется нормальному распределению, Н 1
: 5-летняя доходность не подчиняется нормальному распределению. Нормальное распределение имеет два параметра - математическое ожидание μ и стандартное отклонение σ, которые можно оценить на основе выборочных данных. В данном случае
= 10,149 и S
= 4,773. Рис. 4. Упорядоченный массив, содержащий данные о пятилетней среднегодовой доходности 158 фондов Данные о доходности фондов можно сгруппировать, разбив, например на классы (интервалы) шириной 5% (рис. 5). Рис. 5. Распределение частот для пятилетней среднегодовой доходности 158 фондов Поскольку нормальное распределение является непрерывным, необходимо определить площадь фигур, ограниченных кривой нормального распределения и границами каждого интервала. Кроме того, поскольку нормальное распределение теоретически изменяется от –∞ до +∞, необходимо учитывать площадь фигур, выходящих за пределы классов. Итак, площадь, лежащая под нормальной кривой слева от точки –10, равна площади фигуры, лежащей под стандартизованной нормальной кривой слева от величины Z, равной Z = (–10 – 10,149) / 4,773 = –4,22 Площадь фигуры, лежащей под стандартизованной нормальной кривой слева от величины Z = –4,22 определяется по формуле =НОРМ.РАСП(-10;10,149;4,773;ИСТИНА) и приближенно равна 0,00001. Для того чтобы вычислить площадь фигуры, лежащей под нормальной кривой между точками –10 и –5, сначала необходимо вычислить площадь фигуры, лежащей слева от точки –5: =НОРМ.РАСП(-5;10,149;4,773;ИСТИНА) = 0,00075. Итак, площадь фигуры, лежащей под нормальной кривой между точками –10 и –5, равна 0,00075 – 0,00001 = 0,00074. Аналогично можно вычислить площадь фигуры, ограниченной границами каждого класса (рис. 6). Рис. 6. Площади и ожидаемые частоты для каждого класса 5-летней доходности Видно, что теоретические частоты в четырех крайних классах (два минимальных и два максимальных) меньше 1, поэтому проведем объединение классов, как показано на рис 7. Рис. 7. Вычисления, связанные с применением χ 2 -критерия согласия для нормального распределения Используем χ 2 -критерий согласия данных с нормальным распределением с помощью формулы (1). В нашем примере после объединения остаются шесть классов. Поскольку математическое ожидание и стандартное отклонение оцениваются на основе выборочных данных, количество степеней свободы равно k
–
p
– 1
= 6 – 2 – 1 = 3. Используя уровень значимости, равный 0,05, находим, что критическое значение χ 2 -статистики, имеющее три степени свободы =ХИ2.ОБР(1-0,05;F3) = 7,815. Вычисления, связанные с применением χ 2 -критерия согласия, приведены на рис. 7. Видно, что χ 2 -статистика = 3,964 < χ U 2 7,815, следовательно гипотезу Н 0
отклонять нельзя. Иначе говоря, у нас нет оснований утверждать, что 5-летняя доходность инвестиционных фондов, ориентированных на быстрый рост, не подчиняется нормальному распределению. В нескольких последних заметках рассмотрены разные подходы к анализу категорийных данных. Описаны методы проверки гипотез о категорийных данных, полученных на основе анализа двух или нескольких независимых выборок. Кроме критериев «хи-квадрат», рассмотрены непараметрические процедуры. Описан ранговый критерий Уилкоксона, который используется в ситуациях, когда не выполняются условия применения t
-критерия для поверки гипотезы о равенстве математических ожиданий двух независимых групп, а также критерий Крускала-Уоллиса, который является альтернативой однофакторному дисперсионному анализу (рис. 8). Рис. 8. Структурная схема методов проверки гипотез о категорийных данных Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 763–769 Критерии для проверки случайности и оценки резко выделяющихся наблюдений Литература Введение В практике статистического анализа экспериментальных данных основной интерес представляет не само по себе вычисление тех или иных статистик а ответы на вопросы такого типа. Соответственно разработано и множество критериев для проверки выдвигаемых статистических гипотез. Все критерии для проверки статистических гипотез делятся на две большие группы: параметрические и непараметрические. Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск Контрольная работа
Использование критериев согласия
Введение
Литература
Введение
В практике статистического анализа экспериментальных данных основной интерес представляет не само по себе вычисление тех или иных статистик, а ответы на вопросы такого типа. Действительно ли среднее генеральной совокупности равно некоторому числу? Значимо ли отличается от нуля коэффициент корреляции? Равны ли дисперсии двух выборок? И таких вопросов в зависимости от конкретной исследовательской задачи может возникать много. Соответственно разработано и множество критериев для проверки выдвигаемых статистических гипотез. Некоторые наиболее употребительные из них мы и рассмотрим. В основном они будут относиться к средним, дисперсиям, коэффициентам корреляции и распределениям численностей.
Все критерии для проверки статистических гипотез делятся на две большие группы: параметрические и непараметрические. Параметрические критерии основаны на предположении о том, что выборочные данные взяты из генеральной совокупности с известным распределением, и основная задача состоит в оценке параметров этого распределения. Для непараметрических критериев не требуется никаких предположений о характере распределения, за исключением предположения о том, что оно непрерывно.
Первыми рассмотрим параметрические критерии. Последовательность проверки будет включать формулирование нуль-гипотезы и альтернативной гипотезы, формулирование делаемых допущений, определение выборочной статистики, используемой при проверке и, образование выборочного распределения проверяемой статистики, определение критических областей для выбранного критерия и построение доверительного интервала для выборочной статистики.
1 Критерии согласия для средних
Пусть проверяемая гипотеза состоит в том, что параметр генеральной совокупности. Необходимость такой проверки может возникнуть, например, в следующей ситуации. Предположим, что на основании обширных исследований установлен диаметр раковины ископаемого моллюска в отложениях из некоторого фиксированного места. Пусть также в нашем распоряжении оказалось некоторое количество раковин, найденных в другом месте, а мы делаем предположение, что конкретное место не оказывает влияния на диаметр раковины, т.е. что среднее значение диаметра раковины для всей популяции моллюсков, когда-то живших в новом месте, равно известному значению, полученному ранее при изучении данного вида моллюсков в первом местообитании.
Если это известное значение равно, то нуль-гипотеза и альтернативная гипотеза записываются следующим образом: Примем, что переменная x в рассматриваемой совокупности имеет нормальное распределение, а величина дисперсии генеральной совокупности неизвестна.
Будем проверять гипотезу с помощью статистики:
, (1) Было показано, что если справедлива, то t в выражении (1) имеет t-распределение Стьюдента с n-1 степенями свободы. Если выбрать уровень значимости (вероятность отбросить правильную гипотезу) равным, то в соответствии с тем, о чем шла речь в предыдущей главе, можно определеить критические значения для проверки =0.
В данном случае, так как распределение Стьюдента симметрично, то (1-) часть площади под кривой этого распределения с n-1 степенями свободы будет заключена между точками и, которые равны друг другу по абсолютной величине. Следовательно, все значения меньше отрицательного и больше положительного значения для t-распределения с заданным числом степеней свободы при выбранном уровне значимости будут составлять критическую область. Попадание выборочного значения t в эту область приводит к принятию альтернативной гипотезы.
Доверительный интервал для строится по описанной ранее методике и определяется из следующего выражения
(2)
Итак, пусть в нашем случае известно, что диаметр раковины ископаемого моллюска равен 18,2 мм. В нашем распоряжении оказалась выборка из 50 вновь найденных раковин, для которых мм, а =2,18 мм. Проверим: =18,2 против Имеем
Если уровень значимости выбрать =0,05 то критическое значение. Отсюда следует, что можно отклонить в пользу на уровне значимости =0,05 . Таким образом, для нашего гипотетического примера можно утверждать (естественно, с некоторой вероятностью), что диаметр раковины ископаемых моллюсков определенного вида зависит от мест, в которых они обитали.
В связи с тем, что t-распределение симметрично, приводятся только положительные значения t этого распределения при выбранных уровнях значимости и числе степеней свободы. Причем учитывается не только доля площади под кривой распределения справа от значения t, но и одновременно слева от значения -t. Это связано с тем, что в большинстве случаев при проверке гипотез нас интересует существенность отклонений сама по себе, независимо от того, в большую или меньшую сторону эти отклонения, т.е. мы проверяем против, а не против: >a или: Вернемся теперь к нашему примеру. Доверительный 100(1-)% интервал для равен
18,92,01
Рассмотрим теперь случай, когда необходимо сравнить между собой средние двух генеральных совокупностей. Проверяемая гипотеза выглядит так: : =0, : 0. Предполагается также, что имеет нормальное распределение со средним и дисперсией, а - нормальное распределение со средним и той же дисперсией. Кроме того, принимаем, что выборки, по которым оцениваются генеральные совокупности, извлекаются независимо друг от друга и имеют объем соответственно и Из независимости выборок следует, что если взять большее их число и для каждой пары рассчитать средние значения, то множество этих пар средних будет полностью некоррелированно.
Проверка нулевой гипотезы проводится с использованием статистики
(3)
где и - оценки дисперсии для первой и второй выборок соответственно. Нетрудно видеть, что (3) представляет собой обобщение (1).
Было показано, что статистика (3) имеет t-распределение Стьюдента с степенями свободы. При равенстве и, т.е. = = формула (3) упрощается и имеет вид
(4)
Рассмотрим пример. Пусть при измерении стеблевых листьев одной и той же популяции растений в течение двух сезонов получены следующие результаты: Будем считать, что условия для использования критерия Стьюдента, т.е. нормальность генеральных совокупностей, из которых взяты выборки, существование неизвестной, но одной и той же дисперсии для этих совокупностей и независимость выборок выполнены. Оценим на уровне значимости =0,01. Имеем
Табличное значение t = 2,58. Поэтому гипотеза о равенстве средних значений длин стеблевых листьев для популяции растений в течение двух сезонов должна быть отвергнута на выбранном уровне значимости.
Внимание!
В качестве нулевой гипотезы в математической статистике выбирается гипотеза об отсутствии значимых различий между сравниваемыми показателями, причем независимо от того, идет ли речь о средних, дисперсиях или других статистиках. И во всех этих случаях, если эмпирическое (вычисленное по формуле) значение критерия больше теоретического (выбранного из таблиц), то отвергается. Если же эмпирическое значение меньше табличного, то принимается.
Для того, чтобы построить доверительный интервал для разности средних этих двух генеральных совокупностей, обратим внимание на то, что критерий Стьюдента, как видно из формулы (3), оценивает значимость разности между средними относительно стандартной ошибки этой разности. В том, что знаменатель в (3) представляет именно эту стандартную ошибку, нетрудно убедиться, используя уже рассмотренные ранее соотношения и сделанные предположения. В самом деле, нам известно, что в общем случае
Если x и y независимы, то и
Взяв вместо x и y выборочные значения и и припомнив сделанное предположение о том, что обе генеральные совокупности имеют одну и ту же дисперсию, получим
(5)
Оценка дисперсии может быть получена из следующего соотношения
(6)
(Мы делим на, потому что по выборкам оцениваются две величины и, и значит, число степеней свободы должно быть уменьшено на два.)
Если теперь подставить (6) в (5) и извлечь квадратный корень, то получится знаменатель в выражении (3).
После этого отступления вернемся к построению доверительного интервала для через -.
Имеем
Сделаем некоторые замечания, связанные с предположениями, используемыми при построении t-критерия. Прежде всего было показано, что нарушения допущения о нормальности для имеют незначительное влияние на уровень значимости и мощность критерия для 30. Несущественно также и нарушение предположения об однородности дисперсий обоих генеральных совокупностей, из которых берутся выборки, но тольков том случае, когда объемы выборок равны. Если же а дисперсии обеих совокупностей отличаются друг от друга, то вероятности ошибок первого и второго рода будут существенно отличаться от ожидаемых.
В этом случае для проверки следует пользоваться критерием
(7)
с числом степеней свободы
. (8)
Как правило, получается дробным числом, поэтому при пользовании таблицами t-распределения необходимо брать табличные значения для ближайших целых значений и проводить интерполяцию для нахождения t, соответствующего полученному.
Рассмотрим пример. При изучении двух подвидов озерной лягушки рассчитывалось отношение длины тела к длине голени. Были взяты две выборки с объемами =49 и =27. Средние и дисперсии интересующего нас отношения оказались равными соответственно =2,34; =2,08; =0,21; =0,35. Если теперь проверять гипотезу с использованием формулы (2), то получим, что
При уровне значимости =0,05 мы должны отвергнуть нулевую гипотезу (табличное значение t=1,995) и считать, что есть статистически достоверные на выбранном уровне значимости различия между средними значениями измеряемых показателей для двух подвидов лягушки.
При использовании же формул (6) и (7) имеем
В данном случае для того же уровня значимости =0,05 табличное значение t=2,015, и нулевая гипотеза принимается.
На этом примере достаточно ясно видно, что пренебрежение условиями, принимаемыми при выводе того или иного критерия, может привести к результатам, прямо противоположным тем, которые имеют место на самом деле. Конечно же, в данном случае, имея выборки разного объема в отсутствии заранее установленного факта о том, что дисперсии измеряемого показателя в обеих популяциях статистически равны, следовало пользоваться формулами (7) и (8), которые и показали отсутствие статистически значимых различий.
Поэтому хочется повторить еще раз, что проверка соблюдения всех предположений, сделанных при выводе того или иного критерия, является совершенно необходимым условием для его корректного использования.
Неизменным требованием в обоих приведенных модификациях t-критерия было требование о независимости между собой выборок. Однако на практике достаточно часто встречаются ситуации, когда это требование не может быть выполнено по объективным причинам. Например, измеряются некоторые показатели на одном и том же животном или участке территории до и после действия внешнего фактора и т.д. И в этих случаях нас может интересовать проверка гипотезы против. Будем по-прежнему предполагать, что обе выборки взяты из нормальных генеральных совокупностей с одинаковой дисперсией.
В этом случае можно воспользоваться тем фактом, что разности между нормально распределенными величинами также имеют нормальное распределение, и поэтому можно воспользоваться критерием Стьюдента в форме (1). Таким образом, будет проверяться гипотеза о том что n разностей есть выборка из нормально распределенной генеральной совокупности со средним, равным нулю.
Обозначив i-ю разность через, имеем
, (9) Рассмотрим пример. Пусть в нашем распоряжении имеются данные о количестве импульсов отдельной нервной клетки за определенный интервал времени до () и после () действия раздражителя:
Отсюда Имея в виду, что (9) имеет t-распределение, и выбрав уровень значимости =0,01, из соответствующей таблицы Приложения найдем, что критическое значение t для n-1=10-1=9 степеней свободы равно 3,25. Сравнение теоретического и эмпирического значений t-статистики показывает, что нулевая гипотеза об отсутствии статистически значимых различий между частотой импульсации до и после подачи стимула должна быть отвергнута. Можно сделать вывод о том, сто используемый раздражитель статистически значимо меняет частоту импульсации.
В экспериментальных исследованиях, как упоминалось выше, зависимые выборки появляются достаточно часто. Тем не менее этот факт иногда игнорируется и t-критерий некорректно используется в форме (3).
В неправомерности этого можно убедиться, рассматривая стандартные ошибки разности между некоррелированными и коррелированными средними. В первом случае
А во втором
Стандартная ошибка разности d равна
С учетом этого знаменатель в (9) будет иметь вид
Теперь обратим внимание на то, что числители выражений (4) и (9) совпадают:
следовательно, различие в величине t в них зависит от знаменателей.
Таким образом, если в задаче с зависимыми выборками будет использована формула (3), и при этом выборки будут иметь положительную корреляцию, то получаемые значения t будут меньше, чем они должны были бы быть при использовании формулы (9), и может возникнуть ситуация, что будет принята нулевая гипотеза, в то время как она неверна. Обратная ситуация может возникнуть, когда между выборками будет существовать отрицательная корреляция, т.е. в этом случае значимыми будут признаваться такие различия, которые на самом деле таковыми не являются.
Вернемся вновь к примеру с импульсной активностью и вычислим для приведенных данных значение t по формуле (3), не обращая внимания на то, что выборки связаны. Имеем: Для числа степеней свободы, равного 18, и уровня значимости =0,01 табличное значение t=2,88 и, на первый взгляд, кажется, что ничего не произошло, даже при использовании непригодной для данных условий формулы. И в этом случае вычисленное значение t приводит к отбрасыванию нулевой гипотезы, т.е. к тому же самому выводу, который был сделан с использованием правильной в данной ситуации формулой (9).
Однако давайте переформируем имеющиеся данные и представим их в следующем виде (2):
Это те же самые значения, и они вполне могли бы быть получены в каком-нибудь из опытов. Так как все значения в обеих выборках сохранены, то использование критерия Стьюдента в формуле (3) дает уже полученное ранее значение =3,32 и приводит к тому же самому выводу, который уже был сделан.
А теперь рассчитаем значение t по формуле (9), которая и должна использоваться в данном случае. Имеем: Критическое значение t при выбранном уровне значимости и девяти степенях свободы равно 3,25. Следовательно, оснований отвергнуть нулевую гипотезу у нас нет, мы ее принимаем, и оказывается, что этот вывод прямо противоположен тому, который был сделан при использовании формулы (3).
На этом примере мы вновь убедились в том, как важно для получения правильных выводов при анализе экспериментальных данных строго соблюдать все требования, которые были положены в основу определения того или иного критерия.
Рассмотренные модификации критерия Стьюдента предназначаются для проверки гипотез относительно средних двух выборок. Однако возникают ситуации, когда появляется необходимость сделать выводы относительно равенства одновременно k средних. Для этого случая тоже разработана определенная статистическая процедура, которая будет рассмотрена в дальнейшем при обсуждении вопросов, связанных с дисперсионным анализом.
2 Критерии согласия для дисперсий
Проверка статистических гипотез относительно дисперсий генеральных совокупностей проводится в той же последовательности, что и для средних. Напомним вкратце эту последовательность.
1. Формулируется нулевая гипотеза (об отсутствии статистически значимых различий между сравниваемыми дисперсиями).
2. Делаются некоторые предположения относительно выборочного распределения статистики, с помощью которой планируется оценивать параметр, входящий в гипотезу.
3. Выбирается уровень значимости для проверкигипотезы.
4. Рассчитывается значение интересующей нас статистики и принимается решение относительно истинности нулевой гипотезы.
А теперь начнем с проверки гипотезы о том, что дисперсия генеральной совокупности =a, т.е. против. Если предположить, что переменная x имеет нормальное распределение, и что выборка объема n извлекается из генеральной совокупности случайно, то для проверки нулевой гипотезы используется статистика
(10)
Вспомнив формулу для расчета дисперсии, перепишем (10) так:
. (11)
Из этого выражения видно, что числитель представляет собой сумму квадратов отклонений нормально распределенных величин от их среднего. Каждое из этих отклонений также распределено нормально. Поэтому в соответствии с известным нам распределением суммы квадратов нормально распределенных величин статистики (10) и (11) имеют -распределение с n-1 степенью свободы.
По аналогии с использованием t-распределения при проверке для выбранного уровня значимости по таблице распределения устанавливают критические точки, соответствующие вероятностям принятия нулевой гипотезы и. Доверительный интервал для при выбранном строится следующим образом:
. (12)
Рассмотрим пример. Пусть на основании обширных экспериментальных исследований установлено, что дисперсия содержания алкалоидов одного вида растений из определенного района равна 4,37 условных единиц. В распоряжение специалиста попадает выборка объемом n = 28 таких растений, предположительно из того же района. Проведенный анализ показал, что для этой выборки =5,01 и нужно убедиться в том, что эта и известная ранее дисперсии статистически неразличимы на уровне значимости =0,1.
По формуле (10) имеем
Полученную величину необходимо сравнить с критическими значениями /2=0,05 и 1--/2=0,95. Из таблицы Приложения для с 27 степенями свободы имеем соответственно 40,1 и 16,2, откуда следует, что нулевая гипотеза может быть принята. Соответствующий доверительный интервал для равен 3,37<<8,35.
В отличии от проверки гипотез относительно выборочных средних с использованием критерия Стьюдента, когда ошибки первого и второго рода несущественно менялись при нарушении предположения о нормальном распределении генеральных совокупностей, в случае гипотез о дисперсиях при невыполнении условий нормальности ошибки меняются существенно.
Рассмотренная выше задача о равенстве дисперсии некоторому фиксированному значению представляет ограниченный интерес, так как довольно редко встречаются ситуации, когда известна дисперсия генеральной совокупности. Значительно больший интерес представляет случай, когда нужно проверить, равны ли дисперсии двух совокупностей, т.е. проверка гипотезы против альтернативы. При этом предполагается, что выборки объемом и случайно извлекаются из генеральных совокупностей с дисперсиями и.
Для проверки нулевой гипотезы используется критерий отношения дисперсий Фишера
(13)
Так как суммы квадратов отклонений нормально распределенных случайных величин от их средних значений имеют распределение, то и числитель и знаменатель (13) представляют собой величины с распределением, поделенные соответственно на и, и следовательно, их отношение имеет F-распределение с -1 и -1 степенями свободы.
Общепринято - и так построены таблицы F-распределения, - что в качестве числителя в (13) берется большая из дисперсий, и поэтому определяется только одна критическая точка, соответствующая выбранному уровню значимости.
Пусть в нашем распоряжении оказались две выборки объемом =11 и =28 из популяций обыкновенных и овальных прудовиков, для которых отношения высоты к ширине имеют дисперсии =0,59 и =0,38. Необходимо проверить гипотезу о равенстве этих дисперсий этих показателей для изучаемых популяций при уровне значимости =0,05. Имеем
В литературе иногда можно встретить утверждение о том, что проверке гипотезы о равенстве средних по критерию Стьюдента должна предшествовать проверка гипотезы о равенстве дисперсий. Это неправильная рекомендация. Более того, она может привести к ошибкам, которых можно избежать, если ей не следовать.
В самом деле, результаты проверки гипотезы о равенстве дисперсий с использованием критерия Фишера в значительной мере зависят от предположения о том, что выборки взяты из совокупностей с нормальным распределением. В то же время критерий Стьюдента малочувствителен к нарушениям нормальности, и если удается получить выборки равного объема, то предположение о равенстве дисперсий также не является существенным. В случае неравных n следует пользоваться для проверки формулами (7) и (8).
При проверке гипотез о равенстве дисперсий возникают некоторые особенности в расчетах, связанных с зависимыми выборками. В этом случае для проверки гипотезы против альтернативы используется статистика
(14)
Если нулевая гипотеза справедлива, то статистика (14) имеет t-распределение Стьюдента с n-2 степенями свободы.
При измерении блеска 35 образцов покрытий была получена дисперсия =134,5. Повторные измерения через две недели показали =199,1. При этом коэффициент корреляции между парными измерениями оказался равным =0,876. Если не обращать внимание на то, что выборки зависимы и воспользоваться критерием Фишера для проверки гипотезы, то получим F=1,48. Если выбрать уровень значимости =0,05, то нулевая гипотеза будет принята, так как критическое значение F-распределения для =35-1=34 и =35-1=34 степеней свободы равно 1,79.
В то же время, если использовать подходящую для данного случая формулу (14), то получим t=2,35, в то время как критическое значение t для 33 степеней свободы и выбранного уровня значимости =0,05 равно 2,03. Следовательно, нулевая гипотеза о равенстве дисперсий в этих двух выборках должна быть отклонена. Таким образом, из этого примера видно, что, как и в случае проверки гипотезы о равенстве средних, использование критерия, не учитывающего специфику экспериментальных данных, приводит к ошибке.
В рекомендуемой литературе можно найти критерий Бартлетта, используемый при проверке гипотез об одновременном равенстве k дисперсий. Кроме того, что вычисления статистики этого критерия довольно трудоемки, основной недостаток этого критерия в том, что он необычайно чувствителен к отклонениям от предположения о нормальности распределений совокупностей из которых извлекаются выборки. Таким образом, при его использовании никогда нельзя быть уверенным в том, что нулевая гипотеза отклонена в самом деле из-за того, что статистически значимо различаются дисперсии, а не из-за того, что выборки не имеют нормального распределения. Поэтому в случае возникновения проблемы сравнения нескольких дисперсий необходимо искать такую постановку задачи, когда можно будет использовать критерий Фишера или его модификации.
3 Критерии согласия относительно долей
Довольно часто приходится анализировать совокупности, в которых объекты могут быть отнесены к одной из двух категорий. Например, по принадлежности к полу в некоторой популяции, по наличию некоторого микроэлемента в почве, по темной или светлой окраске яиц у некоторых видов птиц и т.д.
Долю элементов, обладающих определенным качеством, обозначим через P, где P представляет собой отношение объектов с интересующим нас качеством ко всем объектам в совокупности.
(1.2)
Поделитесь работой в социальных сетях
где - выборочное стандартное отклонение.
где