Статья система максимум минимум управления запасами. Большая энциклопедия нефти и газа

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Постановка задачи

В обычной речи слово «гипотеза» означает предположение. В статистике - это предположение о виде закона распределения («данная генеральная совокупность нормально распределена»), о значениях его параметров («генеральное среднее равно нулю»), об однородности данных («эти две выборки извлечены из одной генеральной совокупности»). Статистическая проверка гипотезы состоит в выяснении того, согласуются ли результаты наблюдений (выборочные данные) с нашим предположением.

Результатом такой проверки может быть отрицательный ответ: выборочные данные противоречат высказанной гипотезе, поэтому от нее следует отказаться. В противном случае мы получаем ответ неотрицательный: выборочные данные не противоречат гипотезе, поэтому её можно принять в качестве одного из допустимых решений (но не единственно верного).

Статистическая гипотеза, которая проверяется, называется основной (нулевой) и обозначается Гипотеза, которая противопоставляется основной, называется альтернативной (конкурирующей) и обозначается Цель статистической проверки гипотез: на основании выборочных данных принять решение о справедливости основной гипотезы или отклонить в ее пользу альтернативной.

Так как проверка осуществляется на основании выборки, а не всей генеральной совокупности, то существует вероятность, возможно, очень малая, ошибочного заключения.

Так, нулевая гипотеза может быть отвергнута, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой первого рода , а её вероятность - уровнем значимости и обозначают Возможно, что нулевая гипотеза принимается, в то время как в генеральной совокупности справедлива альтернативная гипотеза. Такую ошибку называют ошибкой второго рода, а её вероятность обозначают (табл. 6.1).

Таблица 6.1

Результаты проверки статистической гипотезы

Проверка статистических гипотез осуществляется с помощью статистического критерия . Статистический критерий K - это правило (функция от результатов наблюдений), определяющее меру расхождения результатов наблюдений с нулевой гипотезой. Вероятность называют мощностью критерия.

При проверке статистических гипотез принято задавать заранее уровень значимости (стандартные значения: 0.1, 0.05, 0.01, 0.001). Тогда из двух критериев, характеризующихся одной и той же вероятностью выбирают тот, которому соответствует меньшая ошибка 2-го рода, т.е. большая мощность. Уменьшить вероятности обеих ошибок и одновременно можно, увеличив объем выборки.

Значения критерия K разделяются на две части: область допустимых значений (область принятия гипотезы ) и критическую область (область принятия гипотезы ). Критическая область состоит из тех же значений критерия К , которые маловероятны при справедливости гипотезы . Если значение критерия K , рассчитанное по выборочным данным, попадает в критическую область, то гипотеза отвергается в пользу альтернативной в противном случае мы утверждаем, что нет оснований отклонять гипотезу .

Пример. Для подготовки к зачету преподаватель сформулировал 100 вопросов (генеральная совокупность) и считает, что студенту можно поставить «зачтено», если тот знает 60 % вопросов (критерий). Преподаватель задает студенту 5 вопросов (выборка из генеральной совокупности) и ставит «зачтено», если правильных ответов не меньше трех. Гипотеза : «студент курс усвоил», а множество - область принятия этой гипотезы. Критической областью является множество - правильных ответов меньше трех, в этом случае основная гипотеза отвергается в пользу альтернативной «студент курс не усвоил, знает меньше 60 % вопросов».

Студент А выучил 70 вопросов из 100, но ответил правильно только на два из пяти, предложенных преподавателем, - зачет не сдан. В этом случае преподаватель совершает ошибку первого рода.

Студент Б выучил 50 вопросов из 100, но ему повезло, и он ответил правильно на 3 вопроса - зачет сдан, но совершена ошибка второго рода.

Преподаватель может уменьшить вероятность этих ошибок, увеличив количество задаваемых на зачете вопросов.

Чтобы построить критическую область, нужно знать закон распределения статистики K при условии, что гипотеза справедлива. Уровень значимости (вероятность наблюдаемому значению попасть в критическую область) определяет «размер» критической области, а конкурирующая гипотеза - «форму» критической области. Например, если проверяется гипотеза а в качестве альтернативы - то критическая область будет правосторонней (рис. 6.1, а ). При альтернативе критическая область - левосторонняя (рис. 6.1, б ). При альтернативе критическая область - двусторонняя (рис. 6.1, в ). Во всех этих случаях при заданном уровне значимости заштрихованная площадь составляет % от всей площади под кривой плотности распределения статистики K .

Алгоритм проверки статистических гипотез сводится к следующему:

1) сформулировать основную и альтернативную гипотезы;

2) выбрать уровень значимости ;

3) в соответствии с видом гипотезы выбрать статистический критерий для ее проверки, т.е. случайную величину K , распределение которой известно;

4) по таблицам распределения случайной величины K найти границу критической области (вид критической области определить по виду альтернативной гипотезы );

5) по выборочным данным вычислить наблюдаемое значение критерия

6) принять статистическое решение: если попадает в критическую область - отклонить гипотезу в пользу альтернативной ; если попадает в область допустимых значений, то нет оснований отклонять основную гипотезу.

Проверка гипотез о параметрах распределения

ПРОВЕРКА ГИПОТЕЗ О ПАРАМЕТРАХ РАСПРЕДЕЛЕНИЙ

1) Пусть имеется две выборки некоторой одной случайной величины, полученные в разных условиях, или двух разных случайных величин. Требуется проверить, одинаковы ли истинные математические ожидания, соответствующие этим выборкам. Такую ситуацию можно просмотреть на следующем примере.

Имеется две производственные линии, выпускающие одинаковые изделия. Качество изготовленного изделия характеризуется случайной величиной X. Был осуществлён контроль n изделий, изготовленных на первой линии, и получена выборка X n = (x 1 , x 2 , …, x n). По второй линии осуществлён контроль над k изделиями и получена выборка X′ k = (x′ 1 , x′ 2 , …, x′ k). По этим выборкам нужно принять решение о том, одинаковые ли истинные математические ожидания величины X для этих линий.

Будем предполагать, что X имеет нормальное распределение: N(m 1 , σ 1 2) для первой линии и N(m 2 , σ 2 2) для второй линии.

Рассмотрим сначала вариант, когда σ 1 и σ 2 известны . Выдвигаем гипотезу H 0: m 1 = m 2 , т.е. математические ожидания одинаковы. Альтернативной гипотезой будет H 1: m 1 ≠ m 2.

Оценка m 1 * будет иметь нормальное распределение с параметрами m 1 и σ 1 2 /n , а оценка m 2 * – нормальное распределение с параметрами m 2 и σ 2 2 /k . Если гипотеза H 0 верна, то разность m 1 * – m 2 * будет распределена по нормальному закону с параметрами 0 и

Следовательно, величина

, (1)

является центрированной и нормированной нормально распределённой случайной величиной. Найдём двухстороннюю критическую область, пользуясь этим фактом. Положим

функция Лапласа. Таким образом, чтобы найти критическое значение t α , нужно решить уравнение

, (2)

при заданном уровне значимости α, пользуясь таблицей нормального распределения. Критическая область определяется неравенством Отсюда вытекает правило принятия решения: если вычисленное значение t удовлетворяет неравенству – t α < t < t α , то гипотеза H 0 принимается, если, напротив, , то гипотеза H 0 отвергается.

Смысл этого правила состоит в том, что t имеет нормальное эталонное распределение только при равенстве истинных математических ожиданий. Для неравенства задана достаточно малая вероятность α. Если оно реализуется, то это означает, что произошло маловероятное событие. Мы предполагаем, что где-то в наших рассуждениях допущена ошибка. Ошибка может быть только в одном, а именно, в предположении о том, что гипотеза H 0 истинна. Следовательно, гипотезу нужно отвергнуть. Заметим, что в таком случае мы совершаем ошибку с вероятностью α.

Исследуемая величина не обязательно должна иметь нормальное распределение. При больших n и k (порядка десятков) можно применять нормальное распределение, что оправдывается законом больших чисел. Если дисперсии одинаковы σ 1 2 = σ 2 2 = σ 2 и одинаковы объёмы выборок n = k, то вычисление t упрощается:

, (3)

Рассмотрим теперь случай, когда σ 1 и σ 2 неизвестны. Будем считать, что σ 1 2 = σ 2 2 = σ 2 . Вычислим оценки этих дисперсии по первой и второй выборкам S 1 2 и S 2 2:

Если гипотеза H 0 верна, то разность m 1 * – m 2 * будет распределена по нормальному закону с нулевым математическим ожиданием, а величина

будет распределена по закону Стьюдента с n + k – 2 степенями свободы. Таким образом, уравнение

следует решать по таблицам распределения Стьюдента.

Пример 1. На двух заводах выпускаются автомобильные шины одной и той же марки. Были исследованы данные по времени нормальной эксплуатации шин. По 20 шинам первого завода были вычислены m 1 * = 36200 (км. пробега) и S 1 2 = 252400. По 40 шинам второго завода были вычислены m 2 * = 37800(км. пробега) и S 2 2 = 326200. С уровнем значимости α = 0,05 проверить гипотезу о том, что средний пробег шин, изготовленных на этих заводах, одинаков.

Решение. Вычислим S:

Решим уравнение

По таблицам распределения Стьюдента с числом степеней свободы 58 находим t α = 2. Так как

то гипотезу о равенстве среднего пробега шин, изготовленных на разных заводах, следует отвергнуть.

2) Рассмотрим снова две выборки. Первая выборка X n = (x 1 , x 2 , …, x n) X , вторая выборка Y k = (y 1 , y 2 , …, y k) представляет измерения случайной величины Y . Пусть вычислены оценки дисперсий:

Требуется проверить гипотезу о том, что истинные дисперсии этих величин одинаковы. Выдвигаем гипотезу H 0: σ x 2 = σ y 2 , т.е. дисперсии одинаковы. Альтернативной гипотезой будет H 1: σ x 2 ≠ σ y 2 . Если величины X и Y имеют нормальное распределение, то отношение F = S x 2 /S y 2 будет иметь F-распределение (Фишера) со степенями свободы n – 1 и k – 1. Так как F-распределение не является симметричным, то можно построить двухстороннюю критическую область, полагая

P{F ≤ F1} = α/2 и P{F ≥ F2} = α/2.

Решая эти уравнения по таблице F-распределения, находим критические значения F 1 и F 2 .

Правило принятия решения: если F 1 < F < F 2 , то гипотеза о равенстве дисперсий принимается, в противном случае эта гипотеза отвергается.

Удобнее строить одностороннюю критическую область. Для этого в отношении F в знаменателе всегда нужно ставить меньшую оценку из S x 2 и S y 2 . Тогда F будет всегда больше единицы и нижняя граница не потребуется. Полагают

, (5)

и решают уравнение

(6)

используя таблицы F-распределения с учётом чисел степеней свободы. Если F < F α , то гипотеза о равенстве дисперсий принимается, если F ≥ F α , то эта гипотеза отвергается.

Пример 2. По данным примера 1 с уровнем значимости α = 0,05 проверить гипотезу о равенстве истинных дисперсий пробега шин, изготовленных на первом и втором заводах.

Решение . В примере 1 мы предполагали, что они одинаковы. Так ли это?

Так как оценки дисперсий уже вычислены, то строим отношение F по формуле (5):

Решаем по таблицам уравнение P{F ≥ Fα} = 0,05, учитывая, что число степеней свободы меньшей дисперсии равно 19, а большей дисперсии – 39. Находим критическое значение: F α = 2,02. Так как F = 1,3 < 2,02 = F α , то гипотезу о равенстве истинных дисперсий можно принять.



Данный критерий можно применить и для сравнения двух или нескольких математических ожиданий. В частности, этот критерий в таком варианте применяется в дисперсионном анализе.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1. Как находят двухстороннюю критическую область при сравнении математических ожиданий при известных дисперсиях?

2. Как находят двухстороннюю критическую область при сравнении математических ожиданий в случае неизвестных дисперсий?

3. Сформулируйте правило принятия решения при сравнении истинных дисперсий.

4. Как строится двухсторонняя критическая область при сравнении дисперсий?

Проверяется гипотеза H 0: a = a 0 , в качестве альтернативной гипотезы рассмотрим H 1: a a 0 (двусторонняя альтернатива). Выберем уровень значимости .

    При известном отклонении :

Если |U набл | < U kp

    При неизвестном отклонении :

(критическое значение определяется из таблицы распределения Стьюдента по вероятности  и числу степеней свободы (n –1)).

Если |U набл | < U kp , то нет оснований отвергнуть нулевую гипотезу

    Пусть выборка X = (X 1 , …, X n) взята из нормальной совокупности N(a 1 ; 1 2), выборка Y = (Y 1 , …, Y m) взята из нормальной совокупности N(a 2 ; 2 2).

Проверяется гипотеза H 0: a 1 = a 2 , в качестве альтернативной гипотезы рассмотрим H 1: a 1 a 2 (двусторонняя альтернатива). Выберем уровень значимости .

    Дисперсии 1 2 , 2 2 известны:

Если |U набл | < U kp , то нет оснований отвергнуть нулевую гипотезу.

    дисперсии 1 2 , 2 2 неизвестны, но предполагается, что 1 2 = 2 2:

(критическое значение определяется из таблицы распределения Стьюдента по вероятности  и числу степеней свободы (n + m –2)).

Если |U набл | < U kp , то нет оснований отвергнуть нулевую гипотезу.

Для проверки гипотезы о равенстве дисперсий H 0: 1 2 = 2 2 используется критерий Фишера:

(в предположении, что
),

(критическое значение определяется из таблицы распределения Фишера по вероятности  и числу степеней свободы (n –1), (m –1)).

Если F набл < F kp , то нет оснований отвергнуть гипотезу о равенстве дисперсий.

Проверка гипотезы о независимости признаков (критерий 2).

Предположим, что признак A имеет m градаций (уровней): A 1 , …, A m , признак B имеет n градаций: B 1 , …, B n .

Экспериментальные данные содержатся в таблице сопряженности признаков:

q 1

q k

q m

p 1

p s

p n

p s = n 1s +…+ n ks +…+ n mn , s=1, …, n;

q k = n k1 +…+ n ks +…+ n kn , k=1, …, m;

N – общее число наблюдений.

Проверяется гипотеза H 0: признаки А и В независимы.

;



, то нет оснований отвергнуть нулевую гипотезу.

Проверка гипотезы об однородности m выборок (критерий 2).

Предположим, что имеется m выборок. Проверяется гипотеза H 0: выборки однородны, т. е. извлечены из одной и той же генеральной совокупности.

(объем выборки)

1 выборка

q 1

2 выборка

q 2

m выборка

q m

p 1

p 2

p k

Последняя строка и последний столбец получены суммированием:

p 1 = n 11 +n 21 +…+ n m1 ;…;

q 1 = n 11 + n 12 +…+ n 1k , …;

N – общее число наблюдений.

Вычисляется наблюдаемое значение критерия:
;

вычисляется критическое значение
по таблице критических значений 2 ; если
, то нет оснований отвергнуть нулевую гипотезу.

Постановка задачи о проверке статистической гипотезы

Статистическая гипотеза – всякое предположение о виде закона распределения исследуемой переменной или параметрах известного распределения.

Так, например, можно предположить (выдвинуть гипотезу), что изучаемая переменная X распределена по нормальному закону. В этой гипотезе речь идет о виде предполагаемого закона распределения. Достаточно типична и такая ситуация: закон распределения изучаемой переменной известен, но неизвестны параметры этого распределения. Тогда естественно выдвинуть гипотезу о том, что неизвестный параметр принадлежит, например, заданному интервалу.

Таким образом, статистические гипотезы подразделяются на две группы:

· гипотезы о виде закона распределения;

· гипотезы о параметрах известного закона распределения (параметрические гипотезы).

Выдвигаемую гипотезу называют нулевой (основной) и обозначают через . Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу . Гипотезу, которая противоречит нулевой, называют конкурирующей (альтернативной) и обозначают через ( = ).

Выдвинутая гипотеза , как и всякое предположение, в действительности может быть либо верной, либо неверной; поэтому возникает необходимость ее проверки.

Исходным материалом для проверки выдвинутой гипотезы служат выборочные данные (выборка).

Задача проверки гипотезы описательно заключается в следующем: на заданном уровне значимости требуется установить, согласуется ли выдвинутая гипотеза с выборочными данными или противоречит им.

Уровень значимости – вероятность совершить ошибку первого рода ("степень риска"), т.е. вероятность ошибочно отвергнуть верную гипотезу. Уровень значимости назначается исследователем; наиболее часто принимают равным 0,05 (5%) или 0,01 (1%), что соответствует практически ничтожному риску, и тем самым обеспечивают высокую надежность правильного решения задачи.

Основные принципы и необходимые этапы проверки статистической гипотезы

Для проверки выдвинутой гипотезы используется статистический критерий (разрешающее правило), согласно которому на основании данных выборки принимается решение сохранить либо отвергнуть нулевую гипотезу .

В основе критерия лежит его статистика Z – специально подбираемая для выдвинутой гипотезы случайная величина, закон распределения которой достаточно хорошо изучен (имеется таблица квантилей этого распределения).

Обозначим через множество всех возможных значений статистики Z . Это множество разбивается на два непересекающихся подмножества и :

, ,

где – область допустимых значений статистики Z;


– критическая область статистики Z.

Точки, отделяющие от , называются критическими точками статистики Z . Вопрос построения критической области мы здесь рассматривать не будем, отметим лишь только, что .

По выборочным данным (выборке) вычисляется наблюдаемое значение статистики: .

Критерий (разрешающее правило) проверки выдвинутой гипотезы заключается в следующем:

1. Если , то гипотеза отвергается.

2. Если , то гипотеза сохраняется (т.е. она согласуется с выборочными данными).

Заметим, что отвергают гипотезу более решительно, чем принимают. Принимают гипотезу весьма осторожно. Дело в том, что в случае выдвинутая гипотеза еще не доказана (по данным одной ограниченной выборки). На практике для большей уверенности принятия гипотезы повторяют эксперимент, увеличив объем выборки, и еще раз проверяют гипотезу (может быть другими способами).

Итак, необходимыми этапами проверки статистической гипотезы являются:

· формирование выборки;

· выдвижение гипотез и ;

· назначение уровня значимости ;

· выбор подходящей статистики Z для проверки ;

· вычисление по выборке наблюдаемого значения статистики ;

· определение по таблице критических точек статистики Z и построение критической области ;

· принятие решения согласно критерию проверки гипотезы .

Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий Колмогорова

Для изучаемой переменной Cвыдвигается статистическая гипотеза : C имеет нормальный закон распределения. Исходным материалом для проверки являются выборочные данные (выборка). На заданном уровне значимости требуется установить, согласуется ли выдвинутая гипотеза с выборочными данными или противоречит им.

Проверка гипотезы нормальности по критерию Колмогорова основана на сравнении между собой эмпирической функции распределения , полученной по данным выборки объема , и гипотетической (теоретической) функции распределения нормального закона. Близость между ними оценивается статистикой Колмогорова.

Остановимся теперь на примерах статистических критериев, при этом важные критерии относящиеся к корреляционно-регрессионному анализу будут обсуждаться в соответствующих разделах. Здесь мы опишем несколько примеров статистических критериев, предназначенных для проверки простых статистических гипотез относительно числовых параметров анализируемых законов распределения вероятностей.

Общая схема статистической проверки гипотез :

  1. Формулируется основная H 1 и альтернативная H 1 гипотезы.
  2. Выбирается соответствующий уровень значимости a.
  3. Определяется объем выборки n .
  4. Выбирается критерий K для проверки H 0 .
  5. Строится критическая область и область принятия гипотезы (в соответствии с выбранной альтернативной гипотезой).
  6. Вычисляется наблюдаемое значение критерия K набл (по данным выборки).
  7. Принимается статистическое решение (если K набл попадает в область принятия решений, то нет оснований отклонять основную гипотезу, т.е. она принимается, если K набл попадает в критическую область, то основная гипотеза отвергается).

Критерии проверки гипотез о числовых значениях параметров нормального распределения приведены в таблице 3.

Таблица 3.7

H 0 Предположения Статистика критерия H 1 Область принятия решения
a =a 0 s 2 известно a ¹a 0
a >a 0
a <a 0
s 2 неизвестно a ¹a 0
a >a 0
a <a 0
a неизвестно

Проверка статистических гипотез с использованием критериев значимости может быть проведена на основе доверительных интервалов . Для всех параметрических гипотез Для всех параметрических гипотез область принятия гипотезы H 0: q=q 0 на уровне значимости a совпадает с доверительным интервалом для параметра q при доверительной вероятности 1–a. При этом одностороннему критерию значимости соответствует односторонний доверительный интервал, а двухстороннему критерию значимости – двухсторонний доверительный интервал. Гипотеза H 0 принимается, если значение q 0 накрывается соответствующим доверительным интервалом; в противном случае гипотеза H 0 отвергается.



Если проверяется гипотеза H 0:q= q 0 , то рассматривается доверительный интервал для разности q 1 –q 2 . Гипотеза принимается, если доверительный интервал для разности параметров q 1 –q 2 накрывает нулевые значения. Для проверки гипотезы о равенстве двух дисперсий H 0: строится доверительный интервал для отношения дисперсий . В этом случае гипотеза H 0 принимается, если доверительный интервал накрывает значение, равное единице.

Пример 3.11. Утверждается, что шарики, изготовленные станком-автоматом, имеют средний диаметр d 0 =10 мм . В выборке из n =16 шариков средний диаметр оказался равным мм . Проверить нулевую гипотезу H 0: , считая, что дисперсия известна и равна s 2 =1 мм 2 . Считать уровень значимости a=0,05.

Решение. Введем статистический критерий:

который при справедливости нулевой гипотезы H 0 , имеет стандартное нормальное распределениеN (0;1). Пусть альтернативная гипотеза имеет вид H 1: , то критическая область будет иметь двухсторонний вид: (–¥;–Z крит )È(Z крит ;+¥), где Z крит определяется из условия

,

Поскольку

не попадает в критическую область, то нет оснований отклонять нулевую гипотезу, т.е. что шарики, изготовленные станком-автоматом, имеют средний диаметр 10 мм .

Данную задачу можно решить и при помощи доверительных интервалов. Мы уже разбирали, что доверительный интервал для нормального случайной величины при известном s имеет вид

.

Поскольку t 0,95 =1,96, то

Так как d 0 =10Î(9,84; 10,76), то гипотеза H 0 принимается. â

Пример 3.12. Анализируется доход X фирм в отрасли, имеющей нормальное распределение. Предполагается, что средний доход в данной отрасли составляет не менее 1 млн $. По выборке из 49 фирм получены следующие данные: млн $ и s=0,15 млн $. Не противоречат ли эти результаты выдвинутой гипотезе при уровне значимости a=0,01?

Решение. Сформулируем основную и альтернативную гипотезы:

Для проверки гипотезы H 0 строим критерий

.

Критическая область будет левосторонней, поэтому

.

Поскольку T набл =–4,67<–2,404=T крит , то H 0 должна быть отклонена в пользу H 1 , что дает основание считать, что средний доход в отрасли меньше, чем 1 млн $. â

Пример 3.13. Точность работы станка-автомата, заполняющего пакеты порошком, определяется совпадением веса пакетов. Дисперсия веса не должна превышать 25 г 2 . По выборке из 20 пакетов определена дисперсия s 2 =30 г 2 . Определите, требуется ли срочная наладка станка на уровне значимости a=0,05.

Решение.

Рассчитаем наблюдаемое значение критерия

.

Найдем критическое значение критерия

.

Так как , то нет оснований отклонять основную гипотезу H 0 , т.е. имеющиеся данные не дают основания считать, что станок требует срочной наладки. â

3.5.3. Проверка гипотез о сравнении параметров
генеральной совокупности

При анализе многих экономических показателей приходится сравнивать две генеральные совокупности. Например, можно сравнивать уровни жизни в двух странах по размеру дохода на душу населения; можно сравнивать два варианта инвестирования по размерам средних дивидендов; качество знаний студентов двух университетов – по среднему баллу на комплексном тестовом экзамене. В этих случаях логично провести сравнение по схеме анализа равенства математических ожиданий двух генеральных совокупностей X и Y .

Рассмотрим две случайные величины X ~N (a 1 ,s 1) и Y~N (a 2 ,s 2), каждая из которых подчиняется нормальному закону распределения. Пусть имеются две независимые выборки с объемами n 1 и n 2 из генеральных совокупностей X и Y . Необходимо проверить нулевую гипотезу H 0: M[X ]=M[Y ]. Нулевая гипотеза в приведенной формулировке является сложной, поскольку она справедлива при любых a =M[X ]=M[Y ], однако она может быть сведена к простой, если рассматривать разность средних, т.е. H 0: M[X ]–M[Y ]=0.

Относительно параметров и можно выделить четыре варианта предположений:

a) обе дисперсии известны и равны между собой;

b) обе дисперсии известны, но неравны между собой;

c) обе дисперсии неизвестны, но предполагается, что они равны между собой;

d) обе дисперсии неизвестны и их равенство не предполагается.

Критерии проверки гипотез о числовых значениях параметров нормального распределения приведены в таблице 3.8. Отметим, что в таблице 3.8 вариант a) рассматривается как частный случай варианта b). В случае неизвестных дисперсий, равенство которых не предполагается, используется аналог статистики варианта b) с заменой неизвестных дисперсий их оценками

В этой ситуации указать точное распределение введенной статистики затруднительно. Известно, однако, что это распределение близко к распределению Стьюдента с числом степеней свободы, равным

. (3.30)

Критерий проверки устроен так же, как и для варианта c).

Таким образом, для выбора подходящей проверочной статистики в случае, когда генеральные дисперсии неизвестны, необходимо знать, какое предположение принимается. Прежде всего нужно решить, можно ли считать неизвестные генеральные дисперсии равными или нет. Для принятия решения используют F -критерий Фишера (см. далее).

Таблица 3.9

H 0 Предположения Статистика критерия H 1 Область принятия решения
a 1 =a 2 , известны a 1 ¹a 2
a 1 >a 2
a 1 <a 2
, неизвестны, но равны , где a 1 ¹a 2
a 1 >a 2
a 1 <a 2

Зачастую при сравнении двух экономических показателей на первый план выходит анализ разброса значений рассматриваемых случайных величин. Например, при решении вопроса об инвестировании в одну из двух отраслей остро стоит проблема риска вложений. При сравнении уровней жизни в двух странах среднедушевые доходы могут оказаться приблизительно равными. Сопоставив разброс в доходах, мы получаем более точное представление о них. Анализ, аналогичный описанному выше, целесообразно проводить путем сравнения дисперсий исследуемых случайных величин.

Пусть X ~N (a 1 ,s 1) и Y~N (a 2 ,s 2), причем их средне квадратичные отклонения s 1 и s 2 неизвестны. Выдвигается гипотеза о равенстве дисперсий . Однако это гипотеза в приведенной формулировке является сложной, поэтому вместо этой гипотезы рассматривается другая, простая гипотеза об отношении дисперсий, т.е. .

В качестве критерия проверки гипотезы H 0 принимают случайную величину

определяемую отношение большей исправленной выборочной дисперсии к меньшей (). Если нулевая гипотеза H 0 верна, то данная статистика имеет F -распределение Фишера с n 1 =n 1 –1 и n 2 =n 2 –1 степенями свободы. Различные случаи использования этого критерия Фишера приведены в таблице 3.8.

Таблица 3.8

H 0 Предположения Статистика критерия H 1 Область принятия решения
a 1 , a 2 неизвестны , ()

Пример 3.14. Компания по производству сахарного песка имеет производственные линии для наполнения мешочков сахарным песком по 1 кг . Используя данные, собранные в течение долгого периода времени, управляющий оценивает генеральное стандартное отклонение массы мешочков, поставляемых с линии А в 0,02 кг (s 1) и с линии B в 0,04 кг (s 2). Из линии A была взята случайная выборка объемом n 1 =10 мешочков и найдена средняя масса содержимого в мешочках . Подобная выборка объемом n 2 =12 мешочков была взята из линии B и найдена средняя масса . Имеется ли какое-нибудь основание предполагать, что две производственные линии развешивают сахарный песок по мешочкам, средняя масса которых отличается?

Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:

, .

Поскольку генеральные дисперсии ( и ) известны, проверим существенность разности между выборочными средними, используя нормальное распределение на уровне значимости a=0,01. Вычисляем наблюдаемое значение критерия

Поскольку критическая область имеет двухсторонний вид, то критическое значение критерия будет определяется из условия

,

В результате получаем, что |Z набл | крит , т.е. нет оснований отклонять нулевую гипотезу. Следовательно, можно полагать, что мешочки, наполненные сахаром на двух производственных линиях, имеют одинаковую среднюю массу. â

Пример 3.15. Для исследования качества масла были сделаны выборки по 10 единиц из каждой последовательной серии (n 1 и n 2) и определена доля воды в процентах x в каждой выборке. В первой серии средний процент составил с исправленным средним квадратичным отклонением . Для второй серии средний процент воды составил со средним квадратичным отклонением . Имеются ли основания предполагать на 5%-ом уровне значимости, что две серии масла имеют различную массовую долю воды?

Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:

, .

Поскольку генеральные дисперсии ( и ) неизвестны, то следует предварительно проверить о равенстве генеральных дисперсий, т.е. проверяем нулевую гипотезу с соответствующей альтернативной гипотезой:

наблюдаемое значение критерия Фишера:

.

Здесь учено, что . Поскольку, в соответствии с выбранной альтернативной гипотезой, критическая область будет двухсторонней, то определяет критической значение критерия Фишера:

В результате получаем, что F набл крит , т.е. нет оснований отклонять нулевую гипотезу. Следовательно, можно полагать, что две генеральные дисперсии раны друг другу.

Продолжим теперь испытание гипотез о равенстве двух генеральных средних. Для этого вычислим наблюдаемое значение соответствующего критерия Стьюдента:

.

Поскольку критическая область также будет двухсторонней, то соответствующая критическое значение критерия Стьюдента будет равно:

.

В результате получаем, что T набл >T крит , т.е. нулевая гипотеза отклоняется. Следовательно, можно полагать, что две серии проб имеют разное содержание воды (по массе). â

Дополнение 1.
МЕТОД МОМЕНТОВ

Выше мы рассмотрели методы оценки числовых характеристик генеральной совокупности, не привязываясь к какой-либо функции распределения. Однако для полного описания генеральной совокупности нужно знать ее функцию распределения. Если известен вид функции распределения, то остается оценить только ее параметры. Для определения используются различные методы. Один из них – метод моментов , который заключается в следующем. Определяются выборочные моменты (например, математическое ожидание, дисперсию) в количестве, равном числу оцениваемых параметров, и приравниваются соответствующим теоретическим моментам распределения, являющихся функциями от неизвестных параметров.

Пример 3.16. Найти методом моментов оценки параметров a и s нормального распределения:

.

Решение. Для отыскания двух параметров необходимо иметь два уравнения относительно этих параметров. Следуя методу моментов, приравняем, например, начальный теоретический момент 1-го порядка (математическое ожидание): эмпирическому моменту 1-го порядка (среднему значению): , а также центральный теоретический момент
2-го порядка (дисперсию): центральному моменту 2-го порядка (исправленной выборочной дисперсии): . В результате получаем два уравнения:

из которых и находим искомые оценки. â

Пример 3.17. Найти методом моментов оценку параметра l распределения Пуассона:

,

где , l>0.

Решение. Задачу решим двумя способами.

а) Сравним начальные моменты 1-го порядка, т.е. математические ожидания: Поскольку для распределения Пуассона , то получим

б) Сравним начальные моменты 2-го порядка. Для распределения Пуассона , тогда . Тогда

.

Оценки разные. По смыслу параметра распределения Пуассона лучше предпочесть первую оценку.

Как мы видим, неопределенность выбора начальных моментов приводит к получению различных оценок для одного и того же параметра. Однако метод моментов, как правило, приводит к состоятельным оценкам. Это означает, что при достаточно больших выборках различие между разными оценками будет незначительным. Недостаток метода моментов заключается в том, что его оценки (за редким исключением) – неэффективны. Поэтому метод моментов используется на практике только как первое приближение, основываясь на которых можно получить более эффективные оценки. Популярность метода моментов состоит в том, что уравнения метода моментов во многих случаях являются достаточно простыми и их решение не связано большими математическими трудностями. â

Дополнение 2.
МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ

Как мы видели, разные методы оценивания одних и тех же параметров распределения могут давать разные результаты. Когда есть несколько путей к одной цели, естественно, хочется выбрать наилучший. При определенных ограничениях таким методом является метод максимального правдоподобия, основанный на оптимальном использовании имеющейся в выборке информации о параметрах распределения.

Пусть X 1 , X 2 , …, X n возможные результаты независимых наблюдений случайной величины X . Это означает, что X 1 , X 2 , …, X n – независимые случайные величины, причем закон распределения любой из них совпадает с законом распределения величины X . Допустим, что вид распределения величины X задан, но неизвестен параметр q, которым определяется этот закон. Введем функцию

где в случае исходного непрерывного распределения интерпретируется как плотность распределения случайной величины X i , а дискретном случае – как вероятность того, что случайная величина X i примет значение x i . Функцию от случайных величин X i , рассматриваемую как функцию параметра q, называют функцией правдоподобия .

Оценкой метода максимального правдоподобия (ММП-оценкой) параметра q называется такое значение , при котором функция правдоподобия достигает наибольшего возможного значения:

Известно, что точка максимума не изменится, если вместо L (q) использовать lnL (q). Тогда, в соответствии с необходимым условием экстремума функции, получим следующие уравнения правдоподобия :

, (3.14)

для нахождения оценки параметра q.

Пример 3.18. Найти методом максимального правдоподобия оценки параметров a и s нормального распределения.

Решение. Согласно формуле (3.13), функция правдоподобия для нормального распределения будет иметь вид

Логарифмируя ее, получим

Найдем частные производные по a и s:

, .

Приравнивая частные производные нулю, получим систему уравнений:

Из этих уравнений находим:

и .

Установлено, что оценка является состоятельной, несмещенной и эффективной оценкой параметра a , а оценка – состоятельной, смещенной и асимптотически эффективной оценкой параметра s 2 . â

Пример 3.19. Найти методом максимального правдоподобия оценку параметра l распределения Пуассона.

Решение. Логарифмическая функция правдоподобия в данном случае, построенная по выборке x 1 ,x 2 ,…,x n , будет иметь вид

Отсюда после дифференцирования по l получаем уравнение максимального правдоподобия

.

.

Установлено, что эта оценка является состоятельной, несмещенной и эффективной оценкой параметра l. â

Показано, что ММП-оценки являются состоятельными , асимптотически несмещенными , асимптотически нормальными и асимптотически эффективными . Все это сделало метод максимального правдоподобия весьма популярным. Было открыто, что для многих задач самой различной статистической природы ММП дает хорошие результаты. Единственная трудность состоит в сложности решения уравнений правдоподобия (3.14). Поэтому очень долгое время ММП применялся только для теоретических расчетов. Однако в настоящее время в современные статистические пакеты для ЭВМ начинают включать методы ММП, что сильно упрощает практическое использование ММП.

Не следует думать, что ММП-оценки будут наилучшими во всех ситуациях. Во-первых , их хорошие свойства проявляются часто лишь при очень больших объемах выборки (т.е. являются асимптотическими), так что при малых n с ними могут конкурировать (и даже превосходить их) другие методы. Во-вторых , и это, пожалуй, главное «узкое место» данного подхода, для построения ММП-оценок и обеспечения их хороших свойств необходимо точное знание типа анализируемого закона распределения f (x ;q), что в большинстве случаев оказывается практически нереальным. Часто бывает так, что при определенных, хотя и небольших, отклонениях реального распределения от принятого распределения f (x ;q), оценки могут резко терять свои «хорошие» свойства. В связи с этим, в последние годы развиваются т.н. робастные , или устойчивые , методы оценивания, позволяющие находить оценки, хотя и не являющиеся наилучшими в рамках предполагаемого закона распределения, но обладающие достаточно устойчивыми свойствами при отклонении реального закона от предполагаемого. И, в-третьих , ММП-оценки могут не быть даже состоятельными , если число оцениваемых по выборке параметров велико (имеет тот же порядок, что и объем выборки) и растет с увеличение числа наблюдений.

Дополнение 3.
КРИТЕРИИ СОГЛАСИЯ

Часто функция распределения случайной величины бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Во многих случаях из некоторых дополнительных соображений могут быть сделаны предположения о виде функции распределения F (x ). В эконометрике часто используют нормальное распределение, однако в некоторых случаях может возникнуть вопрос о законности использования нормального распределения в том или ином конкретном случае. В таких случаях нужно использовать статистические критерии, которые обосновывали тот или иной выбор распределения.

Любое предположение о виде распределения называется статистической гипотезой и математически выражается соотношением {F (x H 0 }, где H 0 – какое-то множество функций распределения. Если множество H 0 состоит из одного элемента, то гипотеза называется простой. При статистической проверке основной гипотезы H 0 формулируют также альтернативную гипотезу {F (x H 1 }, где H 1 –множество функций распределения, не пересекающееся с множеством H 0 . Если H 1 – множество всех F (x ), не входящих в H 0 , то это множество обычно вообще не упоминают. Множества H 0 и H 1 в каждой задаче определяются логическими, физическими и другими условиями задачи.

Рассмотрим случай простой гипотезы {F (x )=F теор (x )}. Пусть X 1 , X 2 , …, X n – случайная выборка случайной величины X , и пусть – эмпирическая функция распределения. Определим некоторую неотрицательную меру D отклонения эмпирической функции распределения от предполагаемой теоретической функции распределения F теор (x ). Величину D=D {F (x ),F теор (x )} можно определить многими способами, в соответствии с которыми получаются различные критерии для проверки интересующей нас гипотезы: критерий хи-квадрат Пирсона , Колмогорова , омега-квадрат Мизеса , Смирнова и другие.

Наиболее распространенным является критерий, введенный К. Пирсоном, приводящий к распределению c 2 (c 2 –критерий Пирсона ). Рассмотрим этот критерий. Для этого разобьем множество значений случайной величины X на r интервалов S 1 , S 2 , … ,S r без общих точек. Пусть p i – вероятность того, что величина X принадлежит интервалу S i ; n i – количество величин из числа наблюдаемых X 2 , …, X n , принадлежащих интервалу S i . За меру D отклонения эмпирической функции распределения от теоретической F теор (x ) принимают величину

. (3.32)

Величина c 2 случайная и нас интересует ее распределение в предположении, что принятая гипотеза верна, т.е. F (x )=F теор (x ). Ответ на этот вопрос дает теорема Пирсона:

Теорема. Какова бы ни была функция распределения F теор (x) случайной величины X, при n®¥ распределение величины c 2 стремится к c 2 –распределению с (r–1) степенями свободы .

Полностью определенное гипотетическое теоретическое распределение встречается на практике довольно редко. Гораздо чаще теоретическое распределение F теор (x;q 1 ,…,q k ) содержит некоторые неизвестные параметры q 1 ,…,q k , значение которых приходится оценивать по выборке. В результате критерий Пирсона будет иметь вид

. (3.33)

Однако воспользоваться теоремой Пирсона в этом случае уже нельзя, поскольку значения q 1 ,…,q k неизвестны. Если же в приведенном выражении величины q 1 ,…,q k заменить их оценками по выборке, то величины p i (q 1 ,…,q k ) уже будут случайными величинами, поэтому и в этом случае применять теорему Пирсона нельзя.

Отметим, что при n®¥ распределение величины c 2 , если параметры q 1 ,…,q k оцениваются по методу максимального правдоподобия, является распределением c 2 с (r–1-k) степенями свободы (теорема Фишера ). Таким образом, наличие оцениваемых по выборке параметров (если оценка производится по методу максимального правдоподобия) не меняет характера предельного распределения величины c 2 , а лишь уменьшает число степеней свободы этого предельного распределения настолько единиц, каково число оцениваемых параметров. В этом состоит одно из достоинств критерия Пирсона.

Отметим, что критерий Пирсона применяется только при достаточно больших выборках (n t50) и достаточно больших частотах (n i ³5). Если последнее условие не выполняется для какого-либо интервала вариационного ряда, то его объединяют с соседним интервалом, соответственно уменьшая общее число интервалов.

Схема применения критерия согласия Пирсона проверки гипотезы о предполагаемом законе неизвестного распределения:

1) Вычисляются параметры предполагаемого закона распределения.

2) Вычисляются теоретические частоты .

3) Вычисляют величину .

4) По вычисленному числу степеней свободы n=r –1–k , где r – число интервалов выборки, k – число параметров распределения и по выбранному уровню значимости a по таблицам распределения c 2 , находят .

5) Если , то нет оснований отклонять нулевую гипотезу, если – нулевая гипотеза отвергается.

Пример 3.20. По распределению, заданному таблицей (таб. 3.9), выяснить при помощи критерия Пирсона можно ли на уровне значимости a=0,05 считать, что генеральная совокупность имеет нормальное распределение.

Решение. В предположении, что имеет место нормальное распределение, то можно оценить ее два параметра

, .



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: