Перейти на главную страницу
Российская экономическая академия имени Г.В. Плеханова
“ЭКОНОМЕТРИКА”
Москва 2002
Авторы: д-р экон. наук Н.П. Тихомиров
канд. экон. наук Е.Ю.Дорохина
Учебник по дисциплине “Эконометрика” / Н.П. Тихомиров, Е.Ю. Дорохина. – М.: Изд-во Рос. экон. акад., 2002. 640 с.
Для студентов экономико-математического факультета.
Каждая из перечисленных дисциплин играет свою роль в эконометрическом исследовании. Экономическая теория занимается вопросами разработки концепций относительно законов развития исследуемых процессов с учетом их взаимосвязей; социально-экономическая статистика и теория измерений – выражением количественных и качественных состояний этих процессов (как правило, в последовательные периоды (моменты) времени) в виде набора логически непротиворечивых и содержательных показателей; методы экономико-математического моделирования – разработкой моделей взаимосвязей между рассматриваемыми процессами, адекватно отражающими экономические концепции в рамках выбранной системы показателей; математическая статистика – собственно построением самих моделей (т. е. оценкой их параметров), проверками гипотез относительно их адекватности тенденциям процессов, значимости взаимосвязей между ними, оценками неопределенности в полученных результатах, вызванной систематическими и случайными ошибками и т. п.
При этом обычно предполагается, что систематические ошибки в результатах возникают вследствие использования неадекватной тенденциям исследуемых процессов концепции относительно их взаимосвязей, систематических ошибок измерений их уровней, неправильно выбранной спецификации модели и ряда других причин объективного и субъективного характера.
Причинами существования случайной ошибки модели, как правило, являются случайные ошибки измерения процессов, невозможность учета в модели случайных воздействий множества незначимых с точки зрения экономической теории факторов и другие подобные причины.
Таким образом, при эконометрическом исследовании имеют место две стороны проблемы обеспечения высокого качества его результатов – качественная и количественная. Качественная заключается в установлении соответствия между построенной эконометрической моделью и лежащей в ее основе концепцией, а количественная – в точности аппроксимации (подгонки) имевшихся количественных и качественных характеристик рассматриваемых процессов данными модельных расчетов.
В конкретных научных исследованиях “концептуальные” и собственно “вычислительные”, прикладные аспекты эконометрии нередко отделяются друг от друга. В каждом из них имеют место свои проблемы, нерешенные задачи. Основной задачей “вычислительной” эконометрии является собственно построение адекватной тенденциям рассматриваемых процессов эконометрической модели. Исследованию проблем построения таких моделей в данной работе и будет уделено основное внимание.
В эконометрических исследованиях обычно предполагается, что закономерности моделируемого процесса складываются под влиянием ряда других явлений, факторов. Обобщенная форма эконометрической модели, описывающей закономерности развития такого процесса, обозначенного переменной у, в зависимости от уровней, воздействующих на него внешних явлений, факторов хi, i=1, 2,..., n, может быть представлена следующим уравнением:
Заметим, что в некоторых эконометрических исследованиях значения зависимой переменной yt и факторов хit, t=1, 2,..., Т; i=1, 2,..., n; отражают распределение их уровней на совокупности однородных объектов. В этом случае индекс t выражает порядковый номер объекта (территории, предприятия и т. п.), а модель (1.1) – распределение переменной у на совокупности однородных объектов под влиянием факторов, характеризующих их специфические свойства.
Факторы хi , i=1, 2,..., n, называют независимыми, подчеркивая их независимость от переменной у в смысле отсутствия обратного влияния у на хi. В связи с этим факторы хi часто именуют экзогенными (внешними) переменными, а переменную у – эндогенной (внутренней) переменной модели. Здесь термин “внутренний” подчеркивает также то обстоятельство, что функционал f (a, xt) играет основную роль при определении расчетных значений зависимой переменной , после того как с использованием того или иного метода будут найдены количественные значения оценок ai параметров модели i, i=0, 1,..., n; a=(a0, a1,..., an ) – вектор оценок параметров модели. Термин “внешний” отражает тот факт, что значения переменных хit определяются вне модели (задаются только в качестве исходных данных).
В этой связи следует иметь в виду, что эконометрика допускает различные предположения относительно “статистического” содержания внешних переменных хit, в то время как переменная у согласно (1.1) всегда рассматривается как случайная величина.
Можно указать на три основные варианта статистической интерпретации независимых переменных. Достаточно часто их значения интерпретируются как детерминированные величины. В этом случае при ошибке модели, обладающей свойствами “белого шума”*, наблюдаемые значения yt можно рассматривать как условное распределение переменной у при заданных значениях хit, i=1, 2,..., n; t =1, 2,..., Т. Математическим ожиданием такого распределения является функционал f(a, x). Иными словами, в этом случае можно записать:
Согласно другой интерпретации независимых переменных хi их значения хit рассматриваются как случайные величины. Например, предполагается, что измеренное значение хit характеризует i-е свойство t-го объекта, случайным образом извлеченного из генеральной совокупности однородных объектов. В этом случае значение Т характеризует объем выборки и для каждого i предполагается, что значения хit имеют многомерную плотность распределения gi(хi1, хi2,..., хiT) и для каждого t условные распределения yt при заданных хit, i=1, 2,..., n; являются независимыми между собой.
Согласно третьей интерпретации переменных хi предполагается, что значения хit определены с ошибкой (ошибка измерения), т. е. их можно представить в следующем виде:
где – истинное значение фактора хi в момент t, а uit – ошибка, допущенная при измерении. В отношении свойств этой ошибки выдвигаются определенные предположения. Заметим, что и в отношении исходных значений yt может быть выдвинуто предположение, что они содержат ошибку измерения.
Использование той или иной интерпретации значений независимых переменных эконометрических моделей, как правило, не вносит принципиальные изменения в процедуры их построения, в методы оценки их параметров, но часто сказывается на свойствах полученных результатов.
В этой связи еще раз следует отметить, что выражение (1.1) определяет лишь общий вид эконометрической модели. В конкретных эконометрических исследованиях могут использоваться также специальные типы моделей, каждый из которых имеет свои характерные особенности. Эти типы обычно можно классифицировать на основе двух признаков. Во-первых, по виду экзогенных факторов хi и, во-вторых, по свойствам ошибки модели t.
В частности, в моделях регрессии классического типа обычно используются факторы, независимые между собой и с ошибкой модели, в предположении, что ошибка модели имеет свойства “белого шума” – процесса с нулевым математическим ожиданием, постоянной конечной дисперсией и нулевой корреляцией между ее разновременными значениями (рядами t и t–1, t и t–2 и т. д., t=1, 2,..., Т). Это означает, что в ряду ошибки t отсутствуют автокорреляционные связи.
В моделях с лаговыми независимыми переменными в качестве факторов используются разновременные значения хотя бы одной из переменных х, т. е. значения хit, хi,t–1, хi,t–2,... Аналогично в моделях с лаговыми зависимыми переменными в качестве экзогенных факторов рассматриваются значения переменной у в прошедшие моменты времени, т. е. значения уt–1, уt–2,...
Кроме того, модели могут различаться и по свойствам их ошибок. Ряд ошибки может иметь свойства процесса белого шума, характеризоваться непостоянством дисперсии на различных участках интервала t=1, 2,..., Т; наличием автокорреляционных связей между соседними значениями t и t–1 и т. д. Наконец, ошибка может характеризоваться корреляционными связями с экзогенными переменными хit, как это имеет место, например, в системах эконометрических моделей, а также обладать другими специфическими свойствами.
В моделях с главными компонентами факторы формируются как линейные комбинации первоначально выбранных экзогенных переменных, т. е. фактор , где bij – коэффициенты.
Специальные типы эконометрических моделей временных рядов (стационарных и нестационарных), получившие широкое применение в исследованиях динамики финансовых показателей и ряда других явлений, описывают процессы, тенденции которых предопределены их внутренними закономерностями. В таких моделях в качестве факторов обычно используются либо прошлые значения независимой переменной уt–1, уt–2,..., либо значения ошибки t–1, t–2,..., либо те и другие совместно.
К особым типам моделей относятся и системы взаимозависимых эконометрических уравнений, которые характеризуются следующими особенностями. Во-первых, как это следует из названия, такие модели состоят из нескольких уравнений типа (1.1), в каждом из которых используется своя зависимая переменная уit. Во-вторых, зависимая переменная, например, i-го уравнения выступает уже в качестве независимого фактора в других уравнениях системы. Присутствие таких переменных в системе уравнений делает их взаимозависимыми между собой, что, в свою очередь, предопределяет наличие у таких систем особых свойств.
Модели могут различаться и по характеру связей факторов с переменной у. По этому признаку их разделяют на линейные и нелинейные.
Эконометрические модели могут также различаться по свойствам своих параметров (модели с постоянной и переменной структурой) и целому ряду других признаков.
Характерной особенностью эконометрического исследования является то обстоятельство, что зачастую априорно, наиболее подходящий для рассматриваемого процесса тип модели определить не представляется возможным. Однако, при этом, как правило, на основе содержательного анализа рассматриваемого явления обычно удается выделить приемлемые его альтернативные варианты и сформировать их исходные предпосылки. По результатам этапов эконометрического исследования эти варианты уточняются, и среди них выбирается тот, который в большей степени соответствует рассматриваемому процессу, явлению.
В общем случае процедуру построения эконометрической модели можно разделить на несколько взаимосвязанных между собой этапов. Основные среди них имеют следующее содержание.
1. Анализ специфических свойств рассматриваемых явлений и процессов и обоснование класса моделей, наиболее подходящих для их описания.
Отметим, что в общем случае целями этого этапа являются:
1.1. Выбор рационального состава включаемых в модель переменных и определение количественных характеристик, отражающих их уровни в прошлые периоды времени (на однородных объектах некоторой совокупности – территориях, предприятиях и т. п.).
1.2. Обоснование типа и формы модели, выражаемой математическим уравнением (системой уравнений), связывающим включенные в модель переменные.
2. Оценка параметров выбранного варианта модели на основании исходных данных, выражающих уровни показателей (переменных) в различные моменты времени или на совокупности однородных объектов.
3. Проверка качества построенной модели и обоснование вывода о целесообразности ее использования в ходе дальнейшего эконометрического исследования.
4. При выводе о нецелесообразности использования построенной эконометрической модели в дальнейших исследованиях следует вернуться к первому (или какому-либо другому этапу) и попытаться построить более качественную модификацию модели (другой вариант модели).
Здесь следует отметить, что совокупности методов содержательного анализа и методов количественного анализа используются, дополняя друг друга, но с разными “удельными весами”, на всех этапах построения моделей. При этом несомненно, что центральное место в эконометрическом исследовании занимает этап оценки параметров модели. По его результатам конкретизируется ее уравнение, полученные оценки параметров которого играют ведущую роль и при проверке качества модели и при обосновании направлений ее дальнейшей модификации. Основную нагрузку на этапе оценки параметров модели несут методы теории вероятностей и математической статистики, которые имеют определенные специфические особенности в зависимости от типа рассматриваемой модели.
Вообще говоря, выделенные этапы построения моделей достаточно условны. Состав используемых на них процедур, приемов и методов, их очередность зависят от типа разрабатываемой эконометрической модели, особенностей исследуемых процессов, свойств исходных данных и т. п.
В первой главе изложены основные, достаточно общие для всех типов моделей, подходы к решению проблем, возникающих на различных этапах их построения, на примере наиболее широко используемого на практике класса линейных моделей, выражаемых единственным уравнением, аддитивно связывающим рассматриваемый процесс (зависимую переменную) с рядом определяющих закономерности его развития внешних факторов (независимых переменных). При этом мы не будем выдвигать никаких предварительных предпосылок относительно других возможных “внутренних” свойств этого процесса, поскольку при рассмотрении общих вопросов их роль не столь существенна.
Дело в том, что в практических исследованиях на предварительном этапе вид функционала эконометрической модели (1.1) и точный состав включенных в нее факторов могут быть априорно не известны. Часто имеются несколько альтернативных их вариантов, среди которых необходимо выбрать наиболее “приемлемый”. При этом “приемлемость” может отражать как требования экономической теории, так и необходимые ограничения по точности аппроксимации функционалом f(a, xt) исходного ряда зависимой переменной yt, t =1, 2,..., Т.
В этой связи прежде чем подойти к решению задач первого этапа, необходимо сформировать хотя бы предварительные исходные предпосылки относительно конкретного состава независимых переменных хi, вида функционала, связывающего их с зависимой переменной у. При этом исследователь может использовать различного рода “теоретические гипотезы”, как экономического, так и математического содержания в отношении вида функционала, свойств процессов yt , хit и t.
Состав переменных хi и форма функционала f могут отражать либо экономическую концепцию, лежащую в основе взаимосвязи между зависимой и независимыми переменными, либо эмпирические (т. е. выявленные в ходе конкретных исследований) взаимосвязи между ними.
Исходными данными, необходимыми для построения эконометрической модели, являются известные наборы (массивы) значений зависимой переменной у и независимых факторов хi. При этом могут использоваться два принципиально различных типа исходных информационных массивов – статический и динамический. Статический массив представляет собой значения результирующей (зависимой, объясняемой и т.п.) переменной у и влияющих на нее факторов (независимых, объясняющих переменных) хi, имевших место у объектов однородной совокупности в определенный период времени. Примером таких объектов являются однотипные промышленные предприятия (заводы одной отраслевой направленности). В качестве у в практических исследованиях часто рассматриваются показатели производительности труда, объемов выпускаемой продукции и некоторые другие. В качестве хi – влияющие на уровень этих показателей факторы – объемы используемых фондов, численность и квалификация рабочей силы и т.п.
Приведем другой пример статической информации, характерной для социальных исследований. В качестве у рассматриваются показатели заболеваемости (смертности) населения в регионах страны. Их уровень в каждом из регионов определяют значения независимых факторов, отражающих достигнутый материальный уровень жизни, климатические условия, состояние окружающей среды и т. п. В этом случае необходимая для построения эконометрической модели информация собирается по совокупности регионов страны за фиксированный промежуток времени (год).
В общем случае будем считать, что необходимая для построения эконометрической модели базового типа (1.1) статическая информация выражается следующими массивами взаимосоответствующих наборов данных:
y1 х11 х21 ... хi1 ... хn1 ;
y2 х12 х22 ... хi2 ... хn2;
— — — — — — — — —
— — — — — — — — —
В общем случае эконометрическая модель, использующая динамическую информацию, связывает значения некоторой зависимой переменной yt в моменты времени t cо значениями независимых переменных (факторов) хit, рассматриваемых в те же моменты времени (или в предшествующие)*, t=1,2,..., Т. Такая информация может отражать, например, уровни производительности труда на одном из заводов и определяющих их значения факторов в последовательные периоды времени.
Исходная информация для построения эконометрических моделей может быть и смешанного типа. Например, она выражает уровни интересующих переменных по группе заводов за ряд лет.
Несложно заметить, что принципиального различия между статическим, динамическим и смешанным массивами не существует. Индекс t, в частности, может обозначать единицу совокупности (объект), так что набор y1, y2,..., yT может рассматриваться как выборка из Т заводов (регионов) и наоборот, индекс j=1, 2,..., N может обозначать время. Это же относится и к независимым переменным хij и хit. Вследствие этого в дальнейшем при изложении материала (если это не оговорено специально) для определенности будем использовать динамические индексы.
При формировании исходной информации для эконометрической модели чрезвычайно важной проблемой является выбор показателей, адекватных сущности исследуемых явлений. И здесь следует обратить внимание на определенную подмену понятий, которая обычно происходит на первом этапе построения модели при переходе от содержательного анализа явлений к формированию отражающих их уровни количественных характеристик (показателей).
В ходе содержательного анализа явление часто рассматривается на качественном уровне. При этом специалисты оперируют достаточно обобщенными понятиями, например, заболеваемость, уровень медицинского обслуживания, качество и уровень жизни, климат, качество рабочей силы и т. п. В этой связи, заметим, что часто эконометрическая модель строится именно для выражения закономерности, существующей между явлениями. Однако при построении модели используется исходная информация, наборы показателей, которые выражают эти явления, их свойства, тенденции в виде количественных характеристик. Вследствие этого желательно, чтобы такое «выражение» было в некотором смысле как можно более “точным”.
Для традиционных направлений исследований проблема обоснования состава показателей обычно считается решенной. Например, в исследованиях производительности труда, макроэкономическом анализе обычно рассматриваются уже устоявшиеся наборы показателей, значения которых публикуются в статистических сборниках, научных отчетах и т. п. Их примером являются выработка на одного работающего как показатель, выражающий явление “производительность труда”, объемы ВВП (показатель результативности экономики), объем основных фондов (показатель уровня материальной обеспеченности производственного процесса, экономики) и т.д.
Вместе с тем, в ряде областей эконометрических исследований такие системы показателей не могут быть сформированы столь однозначно. Часто одно и то же явление может быть выражено альтернативными вариантами показателей. Например, общий показатель заболеваемости в регионе за год может быть выражен суммарным числом заболеваний населения в течение этого периода времени. С другой стороны, в качестве меры заболеваемости может выступать и показатель, выраженный в виде суммарного количества дней продолжительности болезней.
Однако в обоих этих случаях не учитывается степень тяжести болезни. Попытка такого учета приводит к необходимости расчета средневзвешенного показателя заболеваемости, но здесь сразу возникает проблема обоснования адекватных “весов”. Тяжесть болезни может определяться, например, по степени ее опасности, рассчитываемой как доля обусловленных ею смертных случаев в общем их количестве; на основании субъективного показателя “дискомфортности” состояния больного и т. п.
Аналогичные проблемы должны быть решены при обосновании показателей климата. Для этих целей обычно используются средняя температура воздуха, влажность, число солнечных дней в году и т. п., а также построенные на их основе некоторые комплексные характеристики.
Заметим, что в отсутствие объективных данных в эконометрических исследованиях допускается замена одного показателя другим, косвенно отражающим то же явление. Например, среднедушевой доход как показатель материального уровня жизни может быть заменен на среднегодовой товарооборот на одного жителя региона и т. п.
Неправильный выбор показателя, представляющего рассматриваемое явление в модели, может существенно повлиять на ее качество. В этой связи к проблеме обоснования состава показателей (переменных) эконометрической модели на практике следует относиться с предельным вниманием.
Предположим, что общее число независимых факторов, которые целесообразно включить в модель, равно n, i=1, 2,..., n, и на основе измеренных значений всех переменных в моменты времени t=1, 2,..., T был сформирован массив исходных данных, который будет рассматриваться в качестве информационной основы для построения эконометрической модели.
Данный массив образован вектором-столбцом значений зависимой переменной y=(y1, y2, ... , yT)** и матрицей значений независимых переменных
Рассматривая проблему выбора конкретного вида функционала f(, xt) из выражения (1.1) заметим, что в практике эконометрических исследований используется достаточно широкий круг функциональных зависимостей между переменными. Приведем некоторые, наиболее часто используемые, их виды:
1) линейная
yt =0 +1 х1t +...+n хnt +t, (1.2)
2) правая полулогарифмическая
yt=0 +1 lnx1t +...+n lnхnt +t, (1.3)
3) степенная
4) гиперболическая
5) логарифмическая гиперболическая
где и – также параметры функции.
где 1,..., n – также параметры функции.
На практике могут встретиться и комбинации рассмотренных выше зависимостей. Например,
и т. п.
В практических исследованиях часто, используя преобразование ui=lnхi и z=lny, степенную модель (1.4) преобразуют к линейному виду, связывающему логарифмы переменных у и хi. Однако заметим, что в данном случае с точки зрения математики такое преобразование не совсем корректно из-за “аддитивности” ошибки в выражении (1.4). Вследствие этого значения коэффициентов линейной относительно логарифмов переменных модели нельзя в общем случае полагать равными соответствующим значениям степенного аналога.
На примере линейной эконометрической модели покажем еще одну возможную форму представления моделей такого типа – моделей, в которых отсутствует свободный коэффициент 0. В общем случае такая модель представляется в следующем виде:
Найдем взаимосвязи между переменными yt и , хit и и определим, чему равен коэффициент 0. Для этого просуммируем по индексу t правую и левую части модели (1.2). Получим
Поскольку что отражает свойство равенства нулю математического ожидания ошибки (M[t]= ), то, разделив правые и левые части этого выражения на Т, получим
откуда следует, что
Вычтем 0 из уравнения (1.2). Получим для всех t
Из (1.12) непосредственно вытекает, что
Операция (1.13) определяет так называемые центрированные переменные и называется операцией центрирования. Отметим, что для центрированных переменных справедливы следующие очевидные соотношения:
Использование центрированных переменных иногда значительно упрощает процедуры получения некоторых результатов, делает более наглядной их интерпретацию.
При этом следует помнить, что исходная информация для такой модели (вектор и матрица ) получается путем вычитания из каждого элемента каждого столбца соответствующего среднего (по столбцу) значения.
Как было отмечено выше, конкретный вид функциональной зависимости f(, xt) может выражать какую-либо содержательную концепцию, отражающую предполагаемый характер взаимосвязей между процессами yt и хit, i=1, 2,..., n.
В основе использования степенной функции (1.4), например, обычно лежит концептуальное допущение о постоянстве частной эластичности выпуска у по каждому ресурсу (фактору) хi. Напомним, что частная эластичность в точке t показывает, на сколько процентов изменится зависимая переменная уt при изменении фактора хti на 1% при условии постоянства значений остальных факторов в этой точке. Частная эластичность определяется следующим выражением:
Подставим вместо уt в правую часть выражения (1.15) функцию . Учитывая, что получим
Эi = i . (1.16)
Таким образом, коэффициент модели (1.4) i сразу определяет значение эластичности у по фактору хi на всем интервале (1,Т).
Удобство экономической интерпретации параметров модели (1.4), относительная простота ее записи и послужили причиной ее широкого использования особенно в макроэкономических исследованиях.
Особую известность получили различные модификации двухфакторной функции Кобба-Дугласа
которые обычно применяется в макроэкономических исследованиях при анализе взаимосвязи между объемом полученного валового внутреннего продукта (y) и используемыми ресурсами (х1 – основные фонды и х2 – затраты живого труда). Между собой эти модификации, в основном, различаются ограничениями, накладываемыми на значения коэффициентов 1 и 2, а также способом выражения и содержательной интерпретацией коэффициента 0. Например, “классический” вариант функции (1.17) предполагает, что значения 1 и 2 удовлетворяют следующим ограничениям: 1+2=1; 1, 20. В других вариантах этой функции дополнительно вводят сомножитель еt, выражающий влияние на валовый продукт временного фактора, характеризующего научно-технический прогресс и т. п.
Функция (1.8) обычно используется в предположении о постоянстве эластичности замещения одного фактора другим. Например, если речь идет о замене фактора “труд”(L) фактором “капитал” (K), то значение коэффициента эластичности замещения показывает, на сколько процентов измениться капиталовооруженность (K/L) при изменении предельной нормы замещения труда капиталом (NKL =–dK /dL) на 1% при условии, что зависимая переменная не изменится. Значения всех других факторов при этом предполагаются также неизменными. В общем случае, эластичность замещения i-го фактора j-м определяется выражением:
Предельная норма замещения i-го фактора j-м Nji показывает количество j-го фактора, которое требуется для замены одной единицы i-го фактора при сохранении постоянных уровня зависимой переменной и значений остальных независимых переменных.
Проводя расчеты по формуле (1.18) для функции (1.8), получим, что для всех i и j и для всех значений t=1,2,..., Т эластичность замещения прироста одного фактора соответствующим изменением другого является постоянной:
Во многих практических исследованиях столь строгие теоретические концепции, предварительные допущения о содержательных сторонах взаимодействия между явлениями отступают на второй план. Для них главным является построение уравнения, достаточно точно выражающего взаимосвязи, адекватные тенденциям изменений переменных у и хi, i=1, 2,...,n; на временном интервале (1,Т). Более того, часто именно “удачная” форма уравнения эконометрической модели кладется в основу разрабатываемой теоретической концепции, которая затем находит свое применение в последующем анализе. Очевидно, что наиболее “подходящая” форма обеспечивает наилучшее приближение теоретических (расчетных) значений = f(a, xt) к действительным значениям уt.
Обычно выбор такой формы осуществляется на основе графического анализа тенденций развития соответствующих процессов. Например, если переменная y и переменная хi изменялись во времени согласно графикам, представленным на рис. 1.1, то логично предположить, что у~1/хit .
Для графиков, представленных на рис. 1.2, характерной является логарифмическая зависимость уt ~lnхit.
В этих и во многих других случаях, как правило, в качестве функции f(, xt), выражающей взаимосвязи между включенными в модель независимыми переменными хi, i=1, 2,..., n, выбирается либо линейная форма (1.2), либо степенная (1.4). Заметим, что значение частной эластичности y по фактору хi, рассчитанное на основе выражения (1.15) для функции (1.2) равно:
и, таким образом, этот показатель изменяется во времени в соответствии с изменениями переменных у и хi.
и ее значение также зависит от соотношения уровней рассматриваемых факторов в каждый момент времени.
Проблема выбора “оптимальных” факторов обычно решается на основе содержательного и количественного (статистического) анализа тенденций рассматриваемых процессов.
На этапе содержательного анализа решается вопрос о целесообразности включения в модель тех или иных факторов, исходя из “здравого” смысла. В макроэкономических исследованиях состав факторов, как правило, определяется на основании допущений экономической теории. Пример – двухфакторные производственные функции типа Кобба-Дугласа, постоянной эластичности замены, которые строятся в предположении, что объем выпуска (производства) экономической системы в основном зависит от размеров используемых основных фондов и количества затраченного труда. Далее, как это было отмечено в разделе 1.2, производственная функция типа Кобба-Дугласа учитывает предположение о постоянной эластичности выпуска по каждому из факторов, а функция постоянной эластичности замены – свойство постоянства замещения изменения одного из этих факторов изменением другого.
Здесь следует иметь в виду, что на этапе содержательного анализа обычно решается проблема установления самого факта наличия взаимосвязей между явлениями. Однако, как было отмечено в разделе 1.2, каждое из явлений может быть выражено разными факторами и даже их комбинациями. Поэтому в ряде исследований на основании содержательного анализа однозначно состав независимых переменных модели определить практически невозможно. Могут существовать их альтернативные наборы. Например, для исследования закономерностей динамики производительности труда на заводе могут быть отобраны, исходя из содержательной целесообразности, следующие факторы: объем основных фондов, электровооруженность труда, фондовооруженность труда, численность рабочей силы, ее квалификация. При этом квалификация как явление может выражаться разными показателями, например, средним уровнем образования работников, их усредненным квалификационным разрядом и т. п. Кроме того, можно ожидать, что показатели электровооруженности, фондовооруженности труда, объема основных фондов характеризуют одно и то же явление – изменение материально-технической оснащенности производственного процесса. Таким образом, некоторые из рассматриваемых в таком исследовании показателей, выражающих количественные характеристики независимых переменных, относятся к сходным явлениям.
Аналогично, в исследованиях заболеваемости населения каждая из определяющих это явление причин может быть количественно отображена разными факторами. Например, уровень жизни – среднедушевым доходом, обеспеченностью жильем, розничным товарооборотом в расчете на одного жителя и т. п.; климатические условия – среднегодовой температурой, числом солнечных дней в году, влажностью и рядом других показателей; качество окружающей среды – среднегодовыми объемами выбросов и сбросов загрязняющих веществ, среднегодовыми уровнями их концентрации в воздухе, воде и почве и т. д., уровень медицинского обслуживания – количеством медицинских работников в расчете на одного жителя; числом койко-мест в лечебных заведениях на одного жителя и другими показателями.
Несложно заметить, что факторы, выражающие одну и ту же причину, могут быть тесно взаимосвязаны между собой. Так, например, уровень розничного товарооборота в основном зависит от среднедушевого дохода; концентрация загрязняющих веществ – от объемов их выбросов; наблюдается взаимосвязь между обеспеченностью населения медицинским персоналом и койко-местами в лечебных учреждениях и т. д. Вследствие этого, одновременное включение таких факторов в модель вряд ли целесообразно, поскольку таким образом одна и та же причина будет учтена дважды.
В результате в общем случае на этапе обоснования эконометрической модели исследователи могут столкнуться с проблемой выбора наиболее предпочтительного состава независимых факторов среди ряда альтернативных вариантов. Можно выделить два основных подхода к решению этой проблемы. Первый из них предполагает априорное (до построения модели) исследование характера и силы взаимосвязей между рассматриваемыми переменными, по результатам которого в модель включаются факторы, наиболее значимые по своему “непосредственному” влиянию на зависимую переменную уt. И, наоборот, из модели исключаются факторы, которые, либо малозначимы с точки зрения силы своего влияния на переменную уt, либо их сильное влияние на нее можно трактовать как индуцированное взаимосвязями с другими экзогенными переменными.
Второй подход к отбору независимых факторов можно назвать апостериорным. Он предполагает первоначально включить в модель все отобранные на этапе содержательного анализа факторы. Уточнение их состава в этом случае производится на основе анализа характеристик качества построенной модели, одной из групп которых являются и показатели, выражающие силу влияния каждого из факторов на зависимую переменную уt.
Рассмотрим особенности процедуры отбора факторов на основе использования каждого из этих подходов более подробно.
В основе “априорного” подхода лежат следующие предположения.
1. Сильное влияние фактора на зависимую переменную должно подтверждаться и определенными количественными характеристиками, важнейшей из которых является их парный линейный коэффициент корреляции, выборочное значение которого рассчитывается на основании имеющейся информации по формуле:
где – средние значения соответствующих переменных, а – их среднеквадратические отклонения.
Логика использования коэффициента парной корреляции при отборе значимых факторов на практике состоит в следующем. Если значение достаточно велико, т. е. >1, где 1 – некоторый эмпирический рубеж (на практике 10,5-0,6), то можно говорить о наличии существенной линейной связи между переменными у и хi или о достаточно сильном влиянии хi на у. Чем больше абсолютное значение , тем сильнее это влияние (положительное или отрицательное, в зависимости от знака r).
Здесь следует иметь в виду, что значение должно рассчитываться с учетом формы преобразования у и хi в модели. Например, если у~1/хi, то и коэффициент корреляции определяется между у и ui =1/хi и т.п.
2. Если два и более факторов выражают одно и то же явление (см. рассмотренные выше примеры), то, как правило, между ними также должна существовать достаточно сильная взаимосвязь. На это может указать выборочное значение их парного коэффициента корреляции
На практике взаимосвязь между факторами признается существенной, если >2, где 2 0,8–0,9. В таких ситуациях один из этих факторов целесообразно исключить из модели, с тем, чтобы одна и та же причина не учитывалась дважды. Однако повторим, что такое исключение следует проводить только в тех случаях, когда факторы выражают одно и то же явление.
Отметим, что приведенные рубежные значения (в первом случае – 0,5–0,6; во втором – 0,8–0,9) достаточно условны. В каждом конкретном случае они устанавливаются индивидуально. При их выборе существенную роль играет интуиция исследователя. Обычно считается, что, если для фактора хi 0,5, то при большом числе других достаточно значимых факторов, информацией, которую содержит в себе фактор хi относительно изменчивости переменной у, можно пренебречь. Иногда же, наоборот, если состав факторов не слишком широк, и фактор хi выражает существенное с точки зрения теории явление, то исследователь, стремясь не потерять информацию о закономерностях изменчивости переменной у, может оставить его в модели и при меньшем значении выборочного коэффициента корреляции ( =0,3–0,4).
Здесь следует еще раз подчеркнуть, что при таком отборе, основанном на эмпирике и интуиции, обычно не принимается во внимание точность оценки выборочных коэффициентов корреляции, которая растет с увеличением выборки, т. е. значения Т. При фиксированном значении Т точность оценок всех коэффициентов примерно одинакова. Логика такого отбора в большей степени ориентирована на содержательную сторону проблемы учета взаимосвязей между переменными модели.
Значительно усложняет проблему отбора факторов явление ложной корреляции, которое характеризуется достаточно высокими по абсолютной величине значениями коэффициентов парной корреляции у процессов, с содержательной точки зрения между собой никак не связанных. Иными словами, большие значения парных коэффициентов корреляции могут иметь место и в тех случаях, когда тенденции рассматриваемых процессов совпали случайно, при отсутствии между ними логически обоснованной взаимосвязи.
Примерами ложных корреляций являются совпадающие тенденции роста потребительских расходов в постоянных ценах и роста потребительских цен, роста выпуска продукции и потребления алкоголя и т. п.
Ложная корреляция может помешать при построении “правильной” модели по двум причинам. Во-первых, в модель случайно могут быть введены незначимые с содержательной точки зрения факторы, характеризующиеся значимыми величинами . Во-вторых, из модели могут быть исключены значимые с точки зрения влияния на у факторы, в отношении которых ошибочно признана гипотеза о том, что они выражают то же явление, что и другой фактор (факторы), уже включенный в эту модель.
Среди основных причин включения в модель переменных с ложной корреляцией часто называют ненадежность информации, используемой при определении значений факторов в различные моменты времени, трудности формализации факторов, имеющих качественный характер, неустойчивость тенденций изменения рассматриваемых переменных, неправильную форму взаимосвязи между ними и т. п.
Еще раз отметим, что основной путь, придерживаясь которого можно избежать ошибок, связанных с понятием “ложной корреляции”, связан с проведением качественного анализа проблемы, направленного на обоснование адекватного ей содержания и формы модели. При этом можно предложить и некоторые общие рекомендации, которых целесообразно придерживаться, следуя этим путем:
1. Число факторов, включаемых в модель, не должно быть слишком велико. Их увеличение может свести к минимуму ее практическую ценность, так как в этом случае модель начинает отражать не закономерность развития на фоне случайности, а саму случайность.
2. Простота модели в значительной степени является гарантией ее адекватности, поскольку более сложные зависимости часто априорно трудно уловимы на ограниченном временном интервале, но в то же время они допускают аппроксимацию достаточно простыми функциями. Иными словами, сложная модель может в большей степени выражать второстепенные взаимосвязи между переменными в ущерб основным.
При апостериорном подходе уточнение состава факторов эконометрической модели осуществляется на основе анализа значений ряда качественных характеристик уже построенного ее варианта. Одну из групп таких характеристик, являющихся наиболее важными при отборе факторов, образуют значения критерия Стьюдента, рассчитываемые для коэффициентов при каждом из факторов модели. С помощью этого критерия проверяется гипотеза о значимости влияния фактора на зависимую переменную у.
Здесь следует отметить, что окончательное решение о целесообразности оставления фактора или его удаления из модели принимается на основе анализа всего комплекса ее характеристик качества с учетом содержательной стороны проблемы взаимосвязей между зависимой и независимыми переменными. Вопросы их расчета и логика принятия такого решения будут изложены в разделе 1.4. Критерий Стьюдента лишь указывает на те факторы, которые с точки зрения статистики являются возможными (целесообразными) кандидатами на удаление.
Заметим, что ответ на вопрос о целесообразности включения в число факторов-кандидатов на удаление каждой из независимых переменных хi, i=1, 2,..., n, при апостериорном подходе решается уже после того, как оценены значения коэффициентов модели и определены некоторые дополнительные характеристики точности полученных оценок. Вопросы определения этих характеристик рассмотрены в главе II.
Будем считать, что с помощью какого-либо из методов, рассмотренных в главе II, например, метода наименьших квадратов, найдены численные значения оценок параметров a0, a1,..., an линейной эконометрической модели (1.2)*. Как будет показано в главе II, эти оценки являются выборочными (определенными по наблюдаемой выборке исходных данных). Согласно этому они рассматриваются как случайные величины, распределенные «приблизительно» по нормальному закону с соответствующими математическими ожиданиями и дисперсиями (среднеквадратическими отклонениями). Методы оценивания параметров позволяют определить и значения дисперсий полученных оценок (ai ).
Логика использования критерия Стьюдента при выявлении факторов-кандидатов на удаление из уже построенного варианта модели основывается на следующих его свойствах. Напомним, что случайная величина , определенная согласно выражению
распределена по закону Стьюдента с k степенями свободы, k – объем выборки; – выборочное среднее некоторой случайной величины z; – ее математическое ожидание (среднее по генеральной совокупности); – среднеквадратическое отклонение выборочного среднего.
Таким образом, с помощью критерия Стьюдента может быть проверена гипотеза о равенстве найденного выборочного среднего предполагаемому значению математического ожидания. На практике обычно эта гипотеза принимается, если оказывается, что для расчетного значения критерия Стьюдента выполняется следующее соотношение *( k), где *( k) – табличное значение критерия Стьюдента, соответствующее доверительной вероятности р* и числу степеней свободы k*.
При определении значимости (незначимости) i-го фактора принимаются во внимание следующие обстоятельства. Оценка соответствующего ему коэффициента ai, полученная с использованием выбранного метода оценивания параметров, приравнивается к выборочному среднему . Для незначимого фактора логично предположить, что истинное значение i равно нулю, т. е. математическое ожидание оценки равно нулю М[ai ]=0.
С учетом этого расчетное значение критерия Стьюдента при проверке гипотезы о значимости i-го фактора определяется по следующей формуле:
где ai– абсолютное значение оценки коэффициента i в модели, характеризующее степень влияния i-го фактора на результирующий показатель; (ai) – среднеквадратическая ошибка оценки этого коэффициента, определяемая на этапе его расчета (см. главу II).
«Эконометрика» сөзі «экономика» және «метрика» (гректің «метрон» деген сөзінен шыққан). Бұл термин эконометриканың мазмұның ғылым ретінде қабылдайды
13 09 2014
1 стр.
Эконометрика позволяет найти количественное подтверждение либо опровержение того или иного экономического закона либо гипотезы. Одним из важнейших направлений эконометрики является
18 12 2014
1 стр.
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080100. 62 специальности «Экономика» подготовки бакалавра, изучаю
18 12 2014
1 стр.
17 12 2014
12 стр.
18 12 2014
3 стр.
«Математические и статистические математической экономики и методы в экономике» эконометрики
06 10 2014
1 стр.
Финансовая эконометрика, взаимные и хедж-фонды, развивающиеся финансовые рынки, риск-менеджмент
14 09 2014
1 стр.
Создание эконометрического общества и институционализация эконометрического знания
17 12 2014
1 стр.