Flatik.ru

Перейти на главную страницу

Поиск по ключевым словам:

страница 1страница 2страница 3

17. Требования к исходным данным при построении многофакторных моделей.

Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требова­ниям.



  1. Они должны быть количественно измеримы. Если необхо­димо включить в модель качественный фактор, не имеющий ко­личественного измерения, то ему нужно придать количествен­ную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов не­движимости учитывается место нахождения недвижимости: рай­оны могут быть проранжированы).

  2. Факторы не должны быть мультикоррелированы и тем более находиться в точной функциональной связи.

Включение в модель мультиколлениарный факторов, когда Ryx1 < Rx1x2 для зависимости у = а + b1х1 + b2 х2 + е может привести к нежелательным последствиям - система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются не­интерпретируемыми. Так, в уравнении у = а + b1х{ + b2 х2 + е предполагается, что факторы х, и х2 независимы друг от друга, т. е. rx1x2 = 0. Тогда можно говорить, что параметр b1 измеряет си­лу влияния фактора х1 на результат у при неизменном значении фактора х2. Если же rx1x2 =1, то с изменением фактора х1 фактор х2 не может оставаться неизменным. Отсюда b1 и b2 нельзя интер­претировать как показатели раздельного влияния х, и х2 и на у.



18. Нахождение коэффициентов многофакторной линейной модели прогнозирования.

Линейная модель множественной регрессии. У=а01х1+ а2х2+…+ аmхm+e

Параметры определяются с помощью методов наименьших квадратов.

Для этого проведем все рассуждения в матричной форме. Введем следующие матричные обозначения:



;

где У вектор n значений результативного показателя.

Х – матрица n значений m независимых переменных; а матрица параметров

У=Х∙а+ε.


Заметим, что а – выборочные оценки совокупности.

Итак, метод наименьших квадратов требует мин-ии суммы квадратов отклонений исходных модели значений



,

Далее:

Из матричной алгебры известно, что , тогда:

1 – это есть матрица размерностью 1Х1, т.е. число-скаляр, а скаляр при трансформировании не меняется, поэтому

Согласно условию экстремума S по а =0

;

ТY+2aXTX=0

XTY=aXTX

Для погашения а умножим обе части этого уравнения на (ХТХ)-1, тогда

а= (XTХ)-1∙XTY

Решение задачи нахождения матицы, а возможно лишь в том случае, если строки и столбцы матрицы Х линейно независимы.



19. Система нормальных уравнений для многофакторных моделей прогнозирования.

Параметры уравнения множественной регрессии оценивают­ся, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки пара­метров регрессии.




Так, для уравнения



система нормальных уравнений составит
Ее решение может быть осуществлено методом определителей:

где Δ– определитель системы; Δа,Δb1,…,Δbp– частные определители.






20. Линейное уравнение множественной регрессии, вычисление статистических характеристик.


















21. Оценка адекватности уравнения множественной регрессии.

Для оценки качества модели множественной регрессии вычисляют к-т монж.корреляции R и детерминации R2.



; показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

Чем ближе к 1 значение этих характеристик, тем выше качество модели. В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает к-т детерминации. Следовательно, к-т детерминации д.б. скорректирован с учетом числа независимых переменных. Скорректированный R2 рассчитывается так:



, где n– число наблюдений, k– число независимых переменных.

Для проверки значимости модели регрессии исп-ся F-критерий Фишера: Если расчетное значение с t1=k и t2=(n-k-1) степенями свободы, где k– количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.



22. Оценка значимости факторов по к-там эластичности и к-там корреляции.

К-т эластичности: . Он показывает, на сколько % изменяется зависимая переменная при изменении фактора j на 1%.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множ.корреояции м.б. найден как индекс множ.корреляции:

где – общ.дисперсия результативн.признака, – остаточная досперсия для уравнения. Границы его измерения: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов.

Частные к-ты (индексы) корреляции хар-т тесноту связи между результатом и соотв.фактором при устранении влияния др факторов, включенных в уравнение регрессии.




23. Построение точечного прогноза для многофакторных моделей.

Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии ожидаемой величины фактора х. данный прогноз называется точечным. Значение независимой переменной хпрогн не должно значительно отличаться от входящих в исследуемую выборку, по которой вычислено уравнение регрессии.

Доверительный интервал прогноза рассчитывается след.образом:




24. К-ты эластичности и бета-к-ты, их смысл.

К-т эластичности: . Он показывает, на сколько % изменяется зависимая переменная при изменении фактора j на 1%.

Бета-к-т:

, где ;– среднеквадратические отклонения.

Бета-к-т показывает, на какую часть величины среднего квадратического отклонения Sy тзменится зависимая переменная Y с изменением соответствующий независимой переменной Xj на величину среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных переменных.




25. Вычисление к-та эластичности и бета-к-та.

К-т эластичности: . Он показывает, на сколько % изменяется зависимая переменная при изменении фактора j на 1%.

Бета-к-т:

, где ;– среднеквадратические отклонения.

Бета-к-т показывает, на какую часть величины среднего квадратического отклонения Sy тзменится зависимая переменная Y с изменением соответствующий независимой переменной Xj на величину среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных переменных.



26. К-т детерминации и его смысл

показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

Чем ближе к 1 значение этих характеристик, тем выше качество модели. В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает к-т детерминации. Следовательно, к-т детерминации д.б. скорректирован с учетом числа независимых переменных. Скорректированный R2 рассчитывается так:



, где n– число наблюдений, k– число независимых переменных.
27. Оценка устойчивости факторов по к-ту эластичности и бета-к-ту.

К-т эластичности: . Он показывает, на сколько % изменяется зависимая переменная при изменении фактора j на 1%.

Бета-к-т:

, где ;– среднеквадратические отклонения.

Бета-к-т показывает, на какую часть величины среднего квадратического отклонения Sy тзменится зависимая переменная Y с изменением соответствующий независимой переменной Xj на величину среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных переменных.




28. Проверка выполнения предпосылок регрессионного анализа.

Проверка выполнения предпосылок регрессионного анализа выполняется на основе анализа остаточной компоненты. Анализ остатков позволяет получить представление, насколь­ко хорошо подобрана сама модель и насколько правильно вы­бран метод оценки коэффициентов. Согласно общим предполо­жениям регрессионного анализа остатки должны вести себя как независимые (в действительности почти независимые) одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков. Исследование остатков полезно начинать с изучения их гра­фика. Он может показать наличие какой-то зависимости, не учтенной в модели. Скажем, при подборе простой линейной зависимости между У и X график остатков может показать необходимость перехода к нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или включения в модель периодических компонент. График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения — выбросы. Подобным аномальным набдениям надо уделять особо пристальное внимание, так как их присутствие может грубо искажать значения оценок. Устранение эффектов выбросов может проводиться либо с помощью удаления их точек из анализируемых данных (эта процедура называется цензурированием), либо с помощью применения методов оцени­вания параметров, устойчивых к подобным грубым отклонениям.

Независимость остатков проверяется с помощью критерия Дарбина—Уотсона.

Корреляционная зависимость между текущими уровнями не­которой переменной и уровнями этой же переменной, сдвину­тыми на несколько шагов, называется автокорреляцией.

Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.

Наличие (отсутствие) автокорреляции в отклонениях проверя­ют с помощью критерия Дарбина—Уотсона. Численное значение коэффициента равно



Значение dw статистики близко к величине 2(1 - г(1)), где г(1) — выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина—Уотсона распределено в интервале 0—4. Соответственно идеальное значе­ние статистики — 2 (автокорреляция отсутствует). Меньшие зна­чения критерия соответствуют положительной автокорреляции остатков, большие значения — отрицательной. Статистика учи­тывает только автокорреляцию первого порядка. Оценки, полу­чаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа неза­висимых переменных модели. Значения этих границ для уровня значимости α = 0,05 даны в специальных таблицах. При сравнении расчетного значения dw статистики с табличным могут возникнуть такие ситуации: d2 < dw < 2 — ряд остатков не коррелирован; dw < d} — остатки содержат автокорреляцию; d1 < dw < d2 — область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существова­нии автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с таб­личными значениями dw критерий следует преобразовать по формуле dw' = 4 – dw.

Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (d1 < dw< d2 ) применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции

Для принятия решения о наличии или отсутствии автокорре­ляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности до­пустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента авто­корреляции меньше табличного, то гипотеза об отсутствии ав­токорреляции в ряду может быть принята, а если фактическое значение больше табличного — делают вывод о наличии автокор­реляции в ряду динамики.

Обнаружение гетероскедастичности. Для обнаружения гетеро-скедастичности обычно используют три теста, в которых делают­ся различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда— Квандта и тест Глейзера.

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Голдфельда— Квандта.

Данный тест используется для проверки такого типа гетеро­скедастичности, когда дисперсия остатков возрастает пропорци­онально квадрату фактора. При этом делается предположение, что случайная составляющая распределена нормально.

Чтобы оценить нарушение гомоскедастичности по тесту Голд­фельда— Квандта, необходимо выполнить следующие шаги.



  1. Упорядочение п наблюдений по мере возрастания перемен­ной х.

  2. Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии.

  1. Определение остаточной суммы квадратов для первой регрессии и второй регрессии

  2. Вычисление отношений (или наоборот) в числителе д.б. сумма квадратов. Полученное отношение имеет F распределение со степенями свободы k1=n1–m и k2=n–n1–m (где m – число оцениваемых парметров в уравнении регрессии).

Если , то гетероскедастичность имеет место.

Чем больше величина F превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.



29. Проверка гипотезы о случайности ряда остатков.

Первая предпосылка МНК– проверка случайного характера остатков. С этой целью строится график зависимости остатков от теоретических значений результативного признака.


Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения результативного признака хорошо аппроксимируют фактические значения у. возможны следующие случаи: если остатки зависят от теоретических значений результирующей переменной:

– остатки не случайны (рис. 3,3а)

– остатки не имеют постоянной дисперсии (в)

– остатки носят систематический характер (б), в данном случае отрацательные значения остатков соответствуют низким теоретическим значениям у, а положительные – высоким значениям. В случаях а), б), в) (рис. 3.3) необходимо либо применять дру­гую функцию, либо вводить дополнительную информацию и за­ново строить уравнение регрессии до тех пор, пока остатки е, не будут случайными величинами.


30. Проверка гипотезы о нормальном распределении ряда остатков.

Нормальность распределения ряда остатков означает однородность дисперсий наблюдения. Определяется с помощью R/S-критерия:



; если нормальный закон распределения остатков выполняется.

31. d-критерий Дарбина-Уотсона.

Независимость остатков проверяется с помощью критерия Дарбина—Уотсона.

Корреляционная зависимость между текущими уровнями не­которой переменной и уровнями этой же переменной, сдвину­тыми на несколько шагов, называется автокорреляцией.

Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.

Наличие (отсутствие) автокорреляции в отклонениях проверя­ют с помощью критерия Дарбина—Уотсона. Численное значение коэффициента равно

Значение dw статистики близко к величине 2(1 - г(1)), где г(1) — выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина—Уотсона распределено в интервале 0—4. Соответственно идеальное значе­ние статистики — 2 (автокорреляция отсутствует). Меньшие зна­чения критерия соответствуют положительной автокорреляции остатков, большие значения — отрицательной. Статистика учи­тывает только автокорреляцию первого порядка. Оценки, полу­чаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа неза­висимых переменных модели. Значения этих границ для уровня значимости α = 0,05 даны в специальных таблицах. При сравнении расчетного значения dw статистики с табличным могут возникнуть такие ситуации: d2 < dw < 2 — ряд остатков не коррелирован; dw < d} — остатки содержат автокорреляцию; d1 < dw < d2 — область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существова­нии автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с таб­личными значениями dw критерий следует преобразовать по формуле dw' = 4 – dw.

Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (d1 < dw< d2 ) применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции

Для принятия решения о наличии или отсутствии автокорре­ляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности до­пустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента авто­корреляции меньше табличного, то гипотеза об отсутствии ав­токорреляции в ряду может быть принята, а если фактическое значение больше табличного — делают вывод о наличии автокор­реляции в ряду динамики.



<предыдущая страница | следующая страница>


1. Функциональная и корреляционная зависимости

Рассматривая зависимости между признаками, необходимо выделить прежде всего две категории зависимости: 1 функцио­нальные и 2 корреляционные

386.89kb.

23 09 2014
3 стр.


Отчет о научной деятельности

При этом наибольшие значения завихренности достигаются в вихревых нитях. Исходя из полученных решений, вычислена парная корреляционная функция. Показано, что она подчиняется закону

584.15kb.

18 12 2014
6 стр.


Структурно-функциональная организация палеоамигдалы: фундаментальные закономерности и прикладные аспекты 03. 00. 25 гистология, цитология и клеточная биология

Структурно-функциональная организация палеоамигдалы: фундаментальные закономерности и прикладные аспекты

876.41kb.

09 09 2014
5 стр.


7 Фотогетеродинирование и корреляционная спектроскопия

Фабри-Перо. С "толстым" интерферометром (d~10 см) при идеальной настройке и хороших зеркалах можно получить а~10-5 нм, что будет соответствовать частотному интервалу ~108 c Мож

80.14kb.

07 10 2014
1 стр.


Чуть-чуть остановиться не бывает

Как бороться против зависимости – с помощью лекарств или с помощью психотерапии? В амстердамской Клинике Йеллинек дневное лечение алкогольной зависимости при необходимости сочетает

41.03kb.

14 10 2014
1 стр.


Цель – изучить уровень интерлейкина-18 (ил-18), ил-10 у пациентов с артериальной гипертензией (АГ) в зависимости от наличия предиабета и сахарного диабета (СД) 2-го типа. Материал и методы

Интерлейкинемия в зависимости от гликемического профиля пациентов с артериальной гипертензией

19.2kb.

11 09 2014
1 стр.


2. Кто такой человек ?

«человек», в древние времена всегда подразумевали «мозг», так как только мозг обладает свойством изменения генетического или хромосомного набора в зависимости от образа жизни, кото

80.62kb.

09 10 2014
1 стр.


Методическая разработка для аудиторной работы №4-11 по теме Векторная кинематика

Точка 1 движется согласно уравнениям (м), а точка 2 согласно уравнениям (м). Записать зависимости. По характеру зависимости и определить тип движения. Встретятся ли эти точки, если

47.03kb.

02 10 2014
1 стр.