Чему равен объем информации. Единицы измерения. Кодирование информации и мера ее измерения

Критерий Дарбина-Уотсона (или статистика DW).

Это наиболее известный критерий обнаружения автокорреляции первого порядка. Статистика Дарбина - Уотсона приводится во всех специальных компьютерных программах как одна из важнейших характеристик качества регрессионной модели.

Сначала по построенному эмпирическому уравнению регрессии

определяются значения отклонений Рассчитывается

статистика

0 положительная автокорреляция;

d t зона неопределенности;

d u - d u - автокорреляция отсутствует;

  • 4 - d u
  • 4 - d/ отрицательная автокорреляция.

Можно показать, что статистика (2.64) тесно связана с коэффициентом автокорреляции первого порядка:

Связь выражается формулой:

Отсюда вытекает смысл статистического анализа автокорреляции. Поскольку значения г изменяются от -1 до + 1, DW изменяется от 0 до 4. Когда автокорреляция отсутствует, коэффициент автокорреляции равен нулю, и статистика DW равна 2. Статистика DW, равная 0, соответствует положительной автокорреляции, когда выражение в скобках равно нулю (г= +1). При отрицательной автокорреляции (г= - 1), DW= 4 и выражение в скобках равно двум.

Ограничения критерия Дарбина - Уотсона следующие.

  • 1. Статистика DW применяется лишь для тех моделей, которые содержат свободный член.
  • 2. Предполагается, что случайные отклонения определяются по итерационной схеме
  • 3. Статистические данные должны иметь одинаковую периодичность (не должно быть пропусков в наблюдениях).
  • 4. Критерий Дарбина - Уотсона неприменим к авторегрессионным моделям вида

Для моделей (2.66) предлагается /г-статистика Дарбина:

где р - оценка р первого порядка (2.65);

D(c) - выборочная дисперсия коэффициента при лаговой переменной у, _ ь п - число наблюдений.

При большом п и справедливости нуль-гипотезы Н 0: р = 0 И- статистика имеет стандартное распределение h ~ N{ 0, 1). Поэтому при заданном уровне значимости определяется критическая точка из условия:

и Л-статистика сравнивается с иар.. Если И > иа/ 2 , то нуль-гипотеза об отсутствии автокорреляции должна быть отклонена. В противном случае она не отклоняется.

Обычно значение р рассчитывается в первом приближении по формуле р&1- DIV /2, a D(c) равна квадрату стандартной ошибки т с оценки коэффициента с. Следует отметить, что вычисление /г-статистики невозможно при nD(c) > 1.

Автокорреляция чаще всего вызывается неправильной спецификацией модели. Поэтому следует попытаться скорректировать саму модель, в частности ввести какой-нибудь неучтенный фактор или изменить форму модели, например, с линейной на полулогарифмическую или гиперболическую. Если все эти способы не помогают и автокорреляция вызвана какими-то внутренними свойствами ряда {е,}, можно воспользоваться преобразованием, которое называется авторегрессионной схемой первого порядка AR{ 1).

Рассмотрим /Щ1) на примере парной регрессии:

Тогда соседним наблюдениям согласно (2.68) соответствуют формулы:

Если случайные отклонения определяются выражением (2.65), где коэффициент р известен, то преобразования формул (2.69) и (2.70) дает:

Сделаем в (2.71) замены переменных: получим с учетом выражения (2.65):

Поскольку случайные отклонения у, удовлетворяют предпосылкам МНК, оценки а и b уравнения (2.73) будут обладать свойствами наилучших линейных несмещенных оценок. По преобразованным значениям всех переменных с помощью обычного МНК вычисляются оценки параметров а и Ь, которые затем можно использовать в регрессии (2.68).

Однако способ вычисления преобразованных переменных (2.72) приводит к потере первого наблюдения, если нет информации о предшествующих наблюдениях. Это уменьшает на единицу число степеней свободы, что при больших выборках не очень существенно, однако при малых выборках приводит к потере эффективности. Тогда первое наблюдение восстанавливается с помощью поправки Прайса- Уинстена:


Для преобразования /Щ1), а также при введении поправок (2.74) важно оценить коэффициент авторегрессии р. Это делается несколькими способами. Самое простое - оценить р на основе статистики

где г берется в качестве оценки р.

Формула (2.75) хорошо работает при большом числе наблюдений.

Существуют и другие методы оценивания р: метод Кокрена- Оркатта и метод Хилдрета-Лу. Рассмотрим метод Кокрена-Оркатта пошагово:

  • 1. Сначала к непреобразованным исходным данным применяется обычный МНК, для которого рассчитываются остатки.
  • 2. Затем в качестве приближенного значения коэффициента авторегрессии р берется его МНК-оценка в регрессии (2.65).
  • 3. Проводится преобразование исходных переменных по формулам (2.72), и к преобразованным данным применяется МНК для определения новых оценок параметров а и Ь.
  • 4. Процедура повторяется, начиная с п. 2.

Процесс обычно заканчивается, когда очередное приближение р мало отличается от предыдущего. Иногда просто фиксируется количество итераций. Такая процедура реализована в большинстве эконометрических компьютерных программ.

где Ду, = у, - у 1, Дх, = х, - х,_ 1 - так называемые первые разности (назад).

Из уравнения (2.76) по МНК оценивается коэффициент Ь. Параметр а здесь не определяется непосредственно, однако из МНК известно, что а = у -Ьх.

В случае р = -1, сложив (2.69) и (2.70) с учетом (2.65), получаем уравнение регрессии.

Истинные значения отклонений Et,t = 1,2, ...,T неизвестны. Поэтому выводы об их независимости осуществляются на основе оценок et,t = 1,2, ...,T, полученных из эмпирического уравнения
регрессии. Рассмотрим возможные методы определения автокорреляции.
Обычно проверяется некоррелированность отклонений et,t = 1, 2, ... , T, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность соседних величин et. Соседними обычно считаются соседние во времени (при рассмотрении временных рядов) или по возрастанию объясняющей переменной X (в случае перекрестной выборки) значения et. Для них несложно рассчитать коэффициент корреляции, называемый в этом случае коэффициентом автокорреляции первого порядка:

При этом учитывается, что математическое ожидание остатков M (et) = 0.
На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно связанную с ним
статистику Ларбина-Уотсона (DW) рассчитываемую по формуле1


Очевидно, что при больших T


Нетрудно заметить, что если et=et-1, то rete- 1=1 и DW=0 (положительная автокорреляция). Если et=-et-1, то re^t 1=-1 и DW=4 (отрицательная автокорреляция). Во всех других случаях 0 lt; DW lt; 4 . При случайном поведении отклонений rete- 1=0 и DW=2. Таким
образом, необходимым условием независимости случайных отклонений является близость к двойке значения статистики Дарбина- Уотсона. Тогда, если DW ~ 2, мы считаем отклонения от регрессии случайными (хотя они в действительности могут и не быть таковыми). Это означает, что построенная линейная регрессия, вероятно, отражает реальную зависимость. Скорее всего, не осталось неучтенных существенных факторов, влияющих на зависимую переменную. Какая-либо другая нелинейная формула не превосходит по статистическим характеристикам предложенную линейную модель. В этом случае, даже когда R2 невелико, вполне вероятно, что необъясненная дисперсия вызвана влиянием на зависимую переменную большого числа различных факторов, индивидуально слабо влияющих на исследуемую переменную, и может быть описана как случайная нормальная ошибка.
Возникает вопрос, какие значения DW можно считать статистически близкими к 2? Для ответа на этот вопрос разработаны специальные таблицы критических точек статистики Дарбина-Уотсона, позволяющие при данном числе наблюдений T (или в прежних обозначениях n), количестве объясняющих переменных m и заданном уровне значимости а определять границы приемлемости (критические точки) наблюдаемой статистики DW. Для заданных а,Т, m в таблице указываются два числа: di - нижняя граница и du - верхняя граница.
Общая схема критерия Дарбина-Уотсона следующая:
  1. По построенному эмпирическому уравнению регрессии

определяются значения отклонений et = У, - У, для каждого наблюдения t, t = 1,..., Т.
  1. По формуле (4.4) рассчитывается статистика DW.
  2. По таблице критических точек Дарбина-Уотсона определяются два числа di и du и осуществляют выводы по правилу:
(0 lt; DW lt; di) - существует положительная автокорреляция,
(dі lt; DW lt; du) - вывод о наличии автокорреляции не определен, (ku lt; DW lt; 4 - du) - автокорреляция отсутствует, (4 - du lt; DW lt; 4 - di) - вывод о наличии автокорреляции не определен,
(4 - di lt; DW lt; 4) - существует отрицательная автокорреляция.
Не обращаясь к таблице критических точек Дарбина-Уотсона, можно пользоваться «грубым» правилом и считать, что автокорреляция остатков отсутствует, если 1,5lt; DW lt; 2,5. Для более надежного вывода целесообразно обращаться к табличным значениям. При наличии автокорреляции остатков полученное уравнение регрессии обычно считается неудовлетворительным.
Отметим, что при использовании критерия Дарбина-Уотсона необходимо учитывать следующие ограничения:
  1. Критерий DW применяется лишь для тех моделей, которые содержат свободный член.
  2. Предполагается, что случайные отклонения Et определяются по итерационной схеме: Et = PEt-1 + vt, называемой авторегрессионной схемой первого порядка HR(1). Здесь vt - случайный член, для которого условия Гаусса-Маркова выполняются.
  3. Статистические данные должны иметь одинаковую периодичность (не должно быть пропусков в наблюдениях).
  4. Критерий Дарбина-Уотсона не применим для регрессионных моделей, содержащих в составе объясняющих переменных зависимую переменную с временным лагом в один период, т. е. для так называемых авторегрессионных моделей вида:

В этом случае имеется систематическая связь между одной из объясняющих переменных и одним из компонентов случайного члена. Не выполняется одна из основных предпосылок МНК - объясняющие переменные не должны быть случайными (не иметь случайной составляющей). Значение любой объясняющей переменной должно быть экзогенным (заданным вне модели), полностью определенным. В противном случае оценки будут смещенными даже при больших объемах выборок.
Для авторегрессионных моделей разработаны специальные тесты обнаружения автокорреляции, в частности h-статистика Дарби- на, которая определяется по формуле:
где р - оценка коэффициента р авторегрессии первого порядка?t = PCt-1 + vt (vt - случайный член), D(g) - выборочная дисперсия коэффициента Y при лаговой переменной yt-1, п - число наблюдений.
При большом объеме выборки h распределяется как ф(0,1), т. е. как нормальная переменная со средним значением 0 и дисперсией, равной 1 по нулевой гипотезе отсутствия автокорреляции. Следовательно, гипотеза отсутствия автокорреляции может быть отклонена при уровне значимости 5%, если абсолютное значение h больше, чем 1,96, и при уровне значимости 1%, если оно больше, чем 2,58, при применении двухстороннего критерия и большой выборке. В противном случае она не отклоняется.
Отметим, что обычно значение р рассчитывается по формуле:
р = 1- 0,5DW, а D(g) равна квадрату стандартной ошибки Sg
оценки g коэффициента Y. Поэтому h легко вычисляется на основе данных оцененной регрессии.
Основная проблема при использовании этого теста заключается в невозможности вычисления h при nD (g) gt; 1.
Пример 4.1. Пусть имеются следующие условные данные (X - объясняющая переменная, Y - зависимая переменная, табл. 4.1).
Таблица 4.1
Исходные данные (условные, ден. ед.)

t

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

X

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Y

3

8

6

12

11

17

15

20

16

24

22

28

26

34

31

Линейное уравнение регрессии имеет вид: Y = 2,09 + 2,014X .
Рассчитаем статистику Дарбина-Уотсона (табл. 4.2):

Критерий Дарбина-Уотсона (или DW-критерий) - статистический критерий, используемый для нахождения автокорреляции остатков первого порядка регрессионной модели. Критерий назван в честь Джеймса Дарбина и Джеффри Уотсона. Критерий Дарбина-Уотсона рассчитывается по следующей формуле:

где ρ 1 - коэффициент автокорреляции первого порядка.

В случае отсутствия автокорреляции ошибок d = 2, при положительной автокорреляции d стремится к нулю, а при отрицательной стремится к 4:

На практике применение критерия Дарбина-Уотсона основано на сравнении величины d с теоретическими значениями d L и d U для заданного числа наблюдений n , числа независимых переменных модели k и уровня значимости α.

Если d < d L , то гипотеза о независимости случайных отклонений отвергается (следовательно присутствует положительная автокорреляция);

Если d > d U , то гипотеза не отвергается;

Если d L < d < d U , то нет достаточных оснований для принятия решений.

Когда расчетное значение d превышает 2, то с d L и d U сравнивается не сам коэффициент d , а выражение (4 − d ).

Также с помощью данного критерия выявляют наличие коинтеграции между двумя временными рядами. В этом случае проверяют гипотезу о том, что фактическое значение критерия равно нулю. С помощью метода Монте-Карло были получены критические значения для заданных уровней значимости. В случае, если фактическое значение критерия Дарбина-Уотсона превышает критическое, то нулевую гипотезу об отсутствии коинтеграции отвергают.

Не способен выявлять автокорреляцию второго и более высоких порядков.

Даёт достоверные результаты только для больших выборок ] .

Критерий h Дарбина применяется для выявления автокорреляции остатков в модели с распределёнными лагами:

где n - число наблюдений в модели;

V - стандартная ошибка лаговой результативной переменной.

При увеличении объёма выборки распределение h -статистики стремится к нормальному с нулевым математическим ожиданием и дисперсией, равной 1. Поэтому гипотеза об отсутствии автокорреляции остатков отвергается, если фактическое значение h -статистики оказывается больше, чем критическое значение нормального распределения.

Критерий Дарбина-Уотсона для панельных данных

Для панельных данных используется немного видоизменённый критерий Дарбина-Уотсона:

В отличие от критерия Дарбина-Уотсона для временных рядов в этом случае область неопределенности является очень узкой, в особенности, для панелей с большим количеством индивидуумов.

  1. Методы исключения автокорреляции (отклонений от тренда, последовательных разностей, включения фактора времени).

Сущность всех методов исключения тенденции заключается в том, чтобы устранить воздействие фактора времени на формирование уравнений временного ряда. Основные методы делят на 2 группы:


Основанные на преобразовании уровней ряда в новые переменные, не содержащие тенденции. Полученные переменные используем далее для анализа взаимосвязи изучаемых временных рядов. Эти методы предполагают устранение трендовой компоненты Т из каждого уровня временного ряда. 1.Метод последовательных разностей. 2.Метод отклонения от трендов.

Основанные на изучении взаимосвязей исходных уровней временных рядов при исключении воздействия фактора времени на зависимую и независимые переменные модели: включение в модель регрессии фактора времени.

Критерий Дарбина-Уотсона применяют для обнаружения автокорреляции , подчиняющейся авторегрессионному процессу 1-го порядка. Предполагается, что величина остатков е t в каждом t-м наблюдении не зависит от его значений во всех других наблюдениях. Если коэффициент автокорреляции ρ положительный, то автокорреляция положительна, если ρ отрицательный, то автокорреляция отрицательна. Если ρ = 0, то автокорреляция отсутствует (т.е. четвертая предпосылка нормальной линейной модели выполняется).
Критерий Дарбина-Уотсона сводится к проверке гипотезы:
  • Н 0 (основная гипотеза): ρ = 0
  • Н 1 (альтернативная гипотеза): ρ > 0 или ρ
    Для проверки основной гипотезы используется статистика критерия Дарбина-Уотсона – DW:

    Где e i = y - y(x)

    Проводится с помощью трех калькуляторов:

    1. Уравнение тренда (линейная и нелинейная регрессия)

    Рассмотрим третий вариант. Линейное уравнение тренда имеет вид y = at + b
    1. Находим параметры уравнения методом наименьших квадратов через онлайн сервис Уравнение тренда .
    Система уравнений

    Для наших данных система уравнений имеет вид

    Из первого уравнения выражаем а 0 и подставим во второе уравнение
    Получаем a 0 = -12.78, a 1 = 26763.32
    Уравнение тренда
    y = -12.78 t + 26763.32
    Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.


    Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда
    Средние значения



    Дисперсия


    Среднеквадратическое отклонение

    Индекс детерминации

    , т.е. в 97.01% случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая.

    t y t 2 y 2 t ∙ y y(t) (y-y cp) 2 (y-y(t)) 2 (t-t p) 2 (y-y(t)) : y
    1990 1319 3960100 1739761 2624810 1340.26 18117.16 451.99 148.84 28041.86
    1996 1288 3984016 1658944 2570848 1263.61 10732.96 594.99 38.44 31417.53
    2001 1213 4004001 1471369 2427213 1199.73 817.96 176.08 1.44 16095.92
    2002 1193 4008004 1423249 2388386 1186.96 73.96 36.54 0.04 7211.59
    2003 1174 4012009 1378276 2351522 1174.18 108.16 0.03 0.64 210.94
    2004 1159 4016016 1343281 2322636 1161.4 645.16 5.78 3.24 2786.55
    2005 1145 4020025 1311025 2295725 1148.63 1552.36 13.17 7.84 4155.05
    2006 1130 4024036 1276900 2266780 1135.85 2959.36 34.26 14.44 6614.41
    2007 1117 4028049 1247689 2241819 1123.08 4542.76 36.94 23.04 6789.19
    2008 1106 4032064 1223236 2220848 1110.3 6146.56 18.51 33.64 4758.73
    20022 11844 40088320 14073730 23710587 11844 45696.4 1368.3 271.6 108081.77

    Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда .

    y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
    1319 1340.26 -21.26 451.99 0
    1288 1263.61 24.39 594.99 2084.14
    1213 1199.73 13.27 176.08 123.72
    1193 1186.96 6.04 36.54 52.19
    1174 1174.18 -0.18 0.03 38.75
    1159 1161.4 -2.4 5.78 4.95
    1145 1148.63 -3.63 13.17 1.5
    1130 1135.85 -5.85 34.26 4.95
    1117 1123.08 -6.08 36.94 0.05
    1106 1110.3 -4.3 18.51 3.15
    1368.3 2313.41


    Критические значения d 1 и d 2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m.
    Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.
    d 1 < DW и d 2 < DW < 4 - d 2 .

    Пример . По данным за 24 месяца построено уравнение регрессии зависимости прибыли сельскохозяйственной организации от производительности труда (x1): y = 300 + 5x .
    Получены следующие промежуточные результаты:
    ∑ε 2 = 18500
    ∑(ε t - ε t-1) 2 = 41500
    Рассчитайте критерий Дарбина-Уотсона (при n=24 и k=1 (число факторов) нижнее значение d = 1,27, верхнее d = 1,45. Сделайте выводы.

    Решение.
    DW = 41500/18500 = 2,24
    d 2 = 4- 1,45 =2,55
    Поскольку DW > 2,55, то следовательно, имеются основания считать, что автокорреляция отсутствует. Это является одним из подтверждений высокого качества полученного уравнения регрессии y = 300 + 5x .

Рассматриваем уравнение регрессии вида:

где k - число независимых переменных модели регрессии.

Для каждого момента времени t = 1: n значение определяется по формуле

Изучая последовательность остатков как временной ряд в , можно построить график их зависимости от времени. В соответствии с предпосылками метода наименьших квадратов остатки должны быть случайными (а). Однако при моделировании временных рядов иногда встречается ситуация, когда остатки содержат тенденцию (б и в) или циклические колебания (г). Это говорит о том, что каждое следующее значение остатков зависит от предыдущих. В этом случае имеется автокорреляция остатков.

Причины автокорреляции остатков

Автокорреляция остатков может возникать по несколькими причинами:

Во-первых, иногда автокорреляция связана с исходными данными и вызвана наличием ошибок измерения в значениях Y.

Во-вторых, иногда причину следует искать в формулировке модели. В модель может быть не включен фактор, оказывающий существенное воздействие на результат, но влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными . Зачастую этим фактором является фактор времени t.

Иногда, в качестве существенных факторов могут выступать лаговые значения переменных , включенных в модель. Либо в модели не учтено несколько второстепенных факторов, совместное влияние которых на результат существенно ввиду совпадения тенденций их изменения или циклических колебаний.

Методы определения автокорреляции остатков

Первый метод - это построение графика зависимостей остатков от времени и визуальное определение наличия автокорреляции остатков.

Второй метод — расчет критерия Дарбина — Уотсона

Т.е. Критерий Дарбина — Уотсона определяется как отношение суммы квадратов разностей последовательных значений остатков к сумме квадратов остатков. Практически во всех задачах по эконометрике значение критерия Дарбина - Уотсона указывается наряду с коэффициентом корреляции, значениями критериев Фишера и Стьюдента

Коэффициент автокорреляции первого порядка определяется по формуле

Соотношение между критерием Дарбина - Уотсона и коэффициентом автокорреляции остатков (r1) первого порядка определяется зависимостью

Т.е. если в остатках существует полная положительная автокорреляция r1 = 1, а d = 0, Если в остатках полная отрицательная автокорреляция, то r1 = - 1, d = 4. Если автокорреляция остатков отсутствует, то r1 = 0, d = 2. Следовательно,

Алгоритм выявления автокорреляции остатков по критерию Дарбина - Уотсона

Выдвигается гипотеза об отсутствии автокорреляции остатков . Альтернативные гипотеэы о наличии положительной или отрицательной автокорреляции в остатках. Затем по таблицам определяются критические значения критерия Дарбина - Уотсона dL и du для заданного числа наблюдений и числа независимых переменных модели при уровня значимости а (обычно 0,95). По этим значениям промежуток разбивают на пять отрезков.

Если расчетное значение критерия Дарбина — Уотсона попадает в зону неопределенности , то подтверждается существование автокорреляции остатков и гипотезу отклоняют



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: