Эконометрика

Министерство образования Российской Федерации

Российская экономическая академия имени Г.В. Плеханова

“ЭКОНОМЕТРИКА”

Москва 2002

Авторы: д-р экон. наук Н.П. Тихомиров

канд. экон. наук Е.Ю.Дорохина

Учебник по дисциплине “Эконометрика” / Н.П. Тихомиров, Е.Ю. Дорохина. – М.: Изд-во Рос. экон. акад., 2002. 640 с.

Для студентов экономико-математического факультета.

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

Термин эконометрия (эконометрика) был введен в научную литературу в 1930 году норвежским статистиком Рагнаром Фришем для обозначения нового направления научных исследований, возникшего из необходимости научно-обоснованного подтверждения и доказательства концепций и выводов экономической теории результатами количественного анализа рассматриваемых процессов. В этой связи можно сказать, что основная задача эконометрики состоит в построении моделей специфического типа (эконометрических моделей), описывающих взаимообусловленное развитие социально-экономических процессов, на основе информации, отражающей распределение их уровней во времени или (и) в пространстве однородных объектов. Эти модели используются в анализе и прогнозировании общих закономерностей и конкретных количественных характеристик рассматриваемых процессов, определении управляющих воздействий. Вследствие этого в самом широком толковании эконометрию можно рассматривать как объединение ряда дисциплин – экономической теории (включая микро- и макроэкономику, социальную сферу), социально-экономической статистики и теории измерения общественных процессов, математической статистики и методов экономико-математического моделирования.

Каждая из перечисленных дисциплин играет свою роль в эконометрическом исследовании. Экономическая теория занимается вопросами разработки концепций относительно законов развития исследуемых процессов с учетом их взаимосвязей; социально-экономическая статистика и теория измерений – выражением количественных и качественных состояний этих процессов (как правило, в последовательные периоды (моменты) времени) в виде набора логически непротиворечивых и содержательных показателей; методы экономико-математического моделирования – разработкой моделей взаимосвязей между рассматриваемыми процессами, адекватно отражающими экономические концепции в рамках выбранной системы показателей; математическая статистика – собственно построением самих моделей (т. е. оценкой их параметров), проверками гипотез относительно их адекватности тенденциям процессов, значимости взаимосвязей между ними, оценками неопределенности в полученных результатах, вызванной систематическими и случайными ошибками и т. п.

При этом обычно предполагается, что систематические ошибки в результатах возникают вследствие использования неадекватной тенденциям исследуемых процессов концепции относительно их взаимосвязей, систематических ошибок измерений их уровней, неправильно выбранной спецификации модели и ряда других причин объективного и субъективного характера.

Причинами существования случайной ошибки модели, как правило, являются случайные ошибки измерения процессов, невозможность учета в модели случайных воздействий множества незначимых с точки зрения экономической теории факторов и другие подобные причины.

Таким образом, при эконометрическом исследовании имеют место две стороны проблемы обеспечения высокого качества его результатов – качественная и количественная. Качественная заключается в установлении соответствия между построенной эконометрической моделью и лежащей в ее основе концепцией, а количественная – в точности аппроксимации (подгонки) имевшихся количественных и качественных характеристик рассматриваемых процессов данными модельных расчетов.

В конкретных научных исследованиях “концептуальные” и собственно “вычислительные”, прикладные аспекты эконометрии нередко отделяются друг от друга. В каждом из них имеют место свои проблемы, нерешенные задачи. Основной задачей “вычислительной” эконометрии является собственно построение адекватной тенденциям рассматриваемых процессов эконометрической модели. Исследованию проблем построения таких моделей в данной работе и будет уделено основное внимание.

ГЛАВА I. ПРОБЛЕМЫ ПОСТРОЕНИЯ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ
1.1. Основные этапы построения эконометрической модели

Построение эконометрической модели является центральной проблемой любого эконометрического исследования, поскольку ее “качество” непосредственно определяет достоверность и обоснованность результатов анализа тенденций развития, прогнозов рассматриваемых социально-экономических процессов, а также вытекающих из них выводов, в том числе и по вопросам разработки необходимых управленческих мероприятий.

В эконометрических исследованиях обычно предполагается, что закономерности моделируемого процесса складываются под влиянием ряда других явлений, факторов. Обобщенная форма эконометрической модели, описывающей закономерности развития такого процесса, обозначенного переменной у, в зависимости от уровней, воздействующих на него внешних явлений, факторов х_i, i=1, 2,..., n, может быть представлена следующим уравнением:

y_t=f(, x_t)+_t, (1.1)
где f(, x_t) – функционал, выражающий вид и структуру взаимосвязей между уровнями переменных y_tи х_itв моменты времени t=1, 2,..., Т (или на интервалах (t, t+1)); x_t = (х₁_t, х₂_t,..., х_nt) – вектор значений независимых переменных (факторов) в момент t; =(₀, ₁,..., _n) – вектор параметров модели; параметр _i выражает степень влияния фактора x_iна переменную y на всем рассматриваемом интервале (1, Т); ₀ – постоянная модели; _t – случайная ошибка модели в момент t, в отношении свойств и характеристик которой, как это будет показано далее, обычно выдвигаются некоторые дополнительные предположения.

Заметим, что в некоторых эконометрических исследованиях значения зависимой переменной y_t и факторов х_it, t=1, 2,..., Т; i=1, 2,..., n; отражают распределение их уровней на совокупности однородных объектов. В этом случае индекс t выражает порядковый номер объекта (территории, предприятия и т. п.), а модель (1.1) – распределение переменной у на совокупности однородных объектов под влиянием факторов, характеризующих их специфические свойства.

Факторы х_i, i=1, 2,..., n, называют независимыми, подчеркивая их независимость от переменной у в смысле отсутствия обратного влияния у на х_i. В связи с этим факторы х_i часто именуют экзогенными (внешними) переменными, а переменную у – эндогенной (внутренней) переменной модели. Здесь термин “внутренний” подчеркивает также то обстоятельство, что функционал f(a, x_t) играет основную роль при определении расчетных значений зависимой переменной , после того как с использованием того или иного метода будут найдены количественные значения оценок a_i параметров модели _i, i=0, 1,..., n; a=(a₀, a₁,..., a_n) – вектор оценок параметров модели. Термин “внешний” отражает тот факт, что значения переменных х_itопределяются вне модели (задаются только в качестве исходных данных).

В этой связи следует иметь в виду, что эконометрика допускает различные предположения относительно “статистического” содержания внешних переменных х_it, в то время как переменная у согласно (1.1) всегда рассматривается как случайная величина.

Можно указать на три основные варианта статистической интерпретации независимых переменных. Достаточно часто их значения интерпретируются как детерминированные величины. В этом случае при ошибке модели, обладающей свойствами “белого шума”^{^*}, наблюдаемые значения y_t можно рассматривать как условное распределение переменной у при заданных значениях х_it, i=1, 2,..., n; t =1, 2,..., Т. Математическим ожиданием такого распределения является функционал f(a, x). Иными словами, в этом случае можно записать:

Согласно другой интерпретации независимых переменных х_i их значения х_it рассматриваются как случайные величины. Например, предполагается, что измеренное значение х_it характеризует i-е свойство t-го объекта, случайным образом извлеченного из генеральной совокупности однородных объектов. В этом случае значение Т характеризует объем выборки и для каждого i предполагается, что значения х_it имеют многомерную плотность распределения g_i(х_i₁, х_i₂,..., х_iT) и для каждого t условные распределения y_t при заданных х_it, i=1, 2,..., n; являются независимыми между собой.

Согласно третьей интерпретации переменных х_i предполагается, что значения х_it определены с ошибкой (ошибка измерения), т. е. их можно представить в следующем виде:

где – истинное значение фактора х_i в момент t, а u_it – ошибка, допущенная при измерении. В отношении свойств этой ошибки выдвигаются определенные предположения. Заметим, что и в отношении исходных значений y_t может быть выдвинуто предположение, что они содержат ошибку измерения.

Использование той или иной интерпретации значений независимых переменных эконометрических моделей, как правило, не вносит принципиальные изменения в процедуры их построения, в методы оценки их параметров, но часто сказывается на свойствах полученных результатов.

В этой связи еще раз следует отметить, что выражение (1.1) определяет лишь общий вид эконометрической модели. В конкретных эконометрических исследованиях могут использоваться также специальные типы моделей, каждый из которых имеет свои характерные особенности. Эти типы обычно можно классифицировать на основе двух признаков. Во-первых, по виду экзогенных факторов х_i и, во-вторых, по свойствам ошибки модели _t.

В частности, в моделях регрессии классического типа обычно используются факторы, независимые между собой и с ошибкой модели, в предположении, что ошибка модели имеет свойства “белого шума” – процесса с нулевым математическим ожиданием, постоянной конечной дисперсией и нулевой корреляцией между ее разновременными значениями (рядами _t и _t_–₁, _t и _t_–₂ и т. д., t=1, 2,..., Т). Это означает, что в ряду ошибки _t отсутствуют автокорреляционные связи.

В моделях с лаговыми независимыми переменными в качестве факторов используются разновременные значения хотя бы одной из переменных х, т. е. значения х_it, х_i_,_t_–₁, х_i_,_t_–₂,... Аналогично в моделях с лаговыми зависимыми переменными в качестве экзогенных факторов рассматриваются значения переменной у в прошедшие моменты времени, т. е. значения у_t_–₁, у_t_–₂,...

Кроме того, модели могут различаться и по свойствам их ошибок. Ряд ошибки может иметь свойства процесса белого шума, характеризоваться непостоянством дисперсии на различных участках интервала t=1, 2,..., Т; наличием автокорреляционных связей между соседними значениями _t и _t_–₁ и т. д. Наконец, ошибка может характеризоваться корреляционными связями с экзогенными переменными х_it, как это имеет место, например, в системах эконометрических моделей, а также обладать другими специфическими свойствами.

В моделях с главными компонентами факторы формируются как линейные комбинации первоначально выбранных экзогенных переменных, т. е. фактор , где b_ij – коэффициенты.

Специальные типы эконометрических моделей временных рядов (стационарных и нестационарных), получившие широкое применение в исследованиях динамики финансовых показателей и ряда других явлений, описывают процессы, тенденции которых предопределены их внутренними закономерностями. В таких моделях в качестве факторов обычно используются либо прошлые значения независимой переменной у_t_–₁, у_t_–₂,..., либо значения ошибки _t_–₁, _t_–₂,..., либо те и другие совместно.

К особым типам моделей относятся и системы взаимозависимых эконометрических уравнений, которые характеризуются следующими особенностями. Во-первых, как это следует из названия, такие модели состоят из нескольких уравнений типа (1.1), в каждом из которых используется своя зависимая переменная у_it. Во-вторых, зависимая переменная, например, i-го уравнения выступает уже в качестве независимого фактора в других уравнениях системы. Присутствие таких переменных в системе уравнений делает их взаимозависимыми между собой, что, в свою очередь, предопределяет наличие у таких систем особых свойств.

Модели могут различаться и по характеру связей факторов с переменной у. По этому признаку их разделяют на линейные и нелинейные.

Эконометрические модели могут также различаться по свойствам своих параметров (модели с постоянной и переменной структурой) и целому ряду других признаков.

Характерной особенностью эконометрического исследования является то обстоятельство, что зачастую априорно, наиболее подходящий для рассматриваемого процесса тип модели определить не представляется возможным. Однако, при этом, как правило, на основе содержательного анализа рассматриваемого явления обычно удается выделить приемлемые его альтернативные варианты и сформировать их исходные предпосылки. По результатам этапов эконометрического исследования эти варианты уточняются, и среди них выбирается тот, который в большей степени соответствует рассматриваемому процессу, явлению.

В общем случае процедуру построения эконометрической модели можно разделить на несколько взаимосвязанных между собой этапов. Основные среди них имеют следующее содержание.

1. Анализ специфических свойств рассматриваемых явлений и процессов и обоснование класса моделей, наиболее подходящих для их описания.

Отметим, что в общем случае целями этого этапа являются:

1.1. Выбор рационального состава включаемых в модель переменных и определение количественных характеристик, отражающих их уровни в прошлые периоды времени (на однородных объектах некоторой совокупности – территориях, предприятиях и т. п.).

1.2. Обоснование типа и формы модели, выражаемой математическим уравнением (системой уравнений), связывающим включенные в модель переменные.

2. Оценка параметров выбранного варианта модели на основании исходных данных, выражающих уровни показателей (переменных) в различные моменты времени или на совокупности однородных объектов.

3. Проверка качества построенной модели и обоснование вывода о целесообразности ее использования в ходе дальнейшего эконометрического исследования.

4. При выводе о нецелесообразности использования построенной эконометрической модели в дальнейших исследованиях следует вернуться к первому (или какому-либо другому этапу) и попытаться построить более качественную модификацию модели (другой вариант модели).

Здесь следует отметить, что совокупности методов содержательного анализа и методов количественного анализа используются, дополняя друг друга, но с разными “удельными весами”, на всех этапах построения моделей. При этом несомненно, что центральное место в эконометрическом исследовании занимает этап оценки параметров модели. По его результатам конкретизируется ее уравнение, полученные оценки параметров которого играют ведущую роль и при проверке качества модели и при обосновании направлений ее дальнейшей модификации. Основную нагрузку на этапе оценки параметров модели несут методы теории вероятностей и математической статистики, которые имеют определенные специфические особенности в зависимости от типа рассматриваемой модели.

Вообще говоря, выделенные этапы построения моделей достаточно условны. Состав используемых на них процедур, приемов и методов, их очередность зависят от типа разрабатываемой эконометрической модели, особенностей исследуемых процессов, свойств исходных данных и т. п.

В первой главе изложены основные, достаточно общие для всех типов моделей, подходы к решению проблем, возникающих на различных этапах их построения, на примере наиболее широко используемого на практике класса линейных моделей, выражаемых единственным уравнением, аддитивно связывающим рассматриваемый процесс (зависимую переменную) с рядом определяющих закономерности его развития внешних факторов (независимых переменных). При этом мы не будем выдвигать никаких предварительных предпосылок относительно других возможных “внутренних” свойств этого процесса, поскольку при рассмотрении общих вопросов их роль не столь существенна.

1.2. Особенности обоснования формы эконометрической модели

Основные подходы к решению проблем первого этапа исследования в значительной степени базируются на методах содержательного анализа закономерностей рассматриваемых процессов, подкрепляемых по мере необходимости методами общей и математической статистики.

Дело в том, что в практических исследованиях на предварительном этапе вид функционала эконометрической модели (1.1) и точный состав включенных в нее факторов могут быть априорно не известны. Часто имеются несколько альтернативных их вариантов, среди которых необходимо выбрать наиболее “приемлемый”. При этом “приемлемость” может отражать как требования экономической теории, так и необходимые ограничения по точности аппроксимации функционалом f(a, x_t) исходного ряда зависимой переменной y_t, t =1, 2,..., Т.

В этой связи прежде чем подойти к решению задач первого этапа, необходимо сформировать хотя бы предварительные исходные предпосылки относительно конкретного состава независимых переменных х_i, вида функционала, связывающего их с зависимой переменной у. При этом исследователь может использовать различного рода “теоретические гипотезы”, как экономического, так и математического содержания в отношении вида функционала, свойств процессов y_t, х_it и _t.

Состав переменных х_i и форма функционала f могут отражать либо экономическую концепцию, лежащую в основе взаимосвязи между зависимой и независимыми переменными, либо эмпирические (т. е. выявленные в ходе конкретных исследований) взаимосвязи между ними.

Исходными данными, необходимыми для построения эконометрической модели, являются известные наборы (массивы) значений зависимой переменной у и независимых факторов х_i. При этом могут использоваться два принципиально различных типа исходных информационных массивов – статический и динамический. Статический массив представляет собой значения результирующей (зависимой, объясняемой и т.п.) переменной у и влияющих на нее факторов (независимых, объясняющих переменных) х_i, имевших место у объектов однородной совокупности в определенный период времени. Примером таких объектов являются однотипные промышленные предприятия (заводы одной отраслевой направленности). В качестве у в практических исследованиях часто рассматриваются показатели производительности труда, объемов выпускаемой продукции и некоторые другие. В качестве х_i – влияющие на уровень этих показателей факторы – объемы используемых фондов, численность и квалификация рабочей силы и т.п.

Приведем другой пример статической информации, характерной для социальных исследований. В качестве у рассматриваются показатели заболеваемости (смертности) населения в регионах страны. Их уровень в каждом из регионов определяют значения независимых факторов, отражающих достигнутый материальный уровень жизни, климатические условия, состояние окружающей среды и т. п. В этом случае необходимая для построения эконометрической модели информация собирается по совокупности регионов страны за фиксированный промежуток времени (год).

В общем случае будем считать, что необходимая для построения эконометрической модели базового типа (1.1) статическая информация выражается следующими массивами взаимосоответствующих наборов данных:

y₁ х₁₁ х₂₁... х_i₁... х_n₁;

y₂ х₁₂ х₂₂... х_i₂... х_n₂;

— — — — — — — — —

y_j х₁_j х₂_j... х_ij... х_nj;

— — — — — — — — —

y_N х₁_N х₂_N... х_iN... х_nN,
где y_j – уровень зависимой переменной на j-м объекте совокупности; х_ij– уровень фактора i-го фактора на j-м объекте совокупности; i=1, 2,..., n; j=1, 2,..., N.

В общем случае эконометрическая модель, использующая динамическую информацию, связывает значения некоторой зависимой переменной y_t в моменты времени t cо значениями независимых переменных (факторов) х_it, рассматриваемых в те же моменты времени (или в предшествующие)^{^*}, t=1,2,..., Т. Такая информация может отражать, например, уровни производительности труда на одном из заводов и определяющих их значения факторов в последовательные периоды времени.

Исходная информация для построения эконометрических моделей может быть и смешанного типа. Например, она выражает уровни интересующих переменных по группе заводов за ряд лет.

Несложно заметить, что принципиального различия между статическим, динамическим и смешанным массивами не существует. Индекс t, в частности, может обозначать единицу совокупности (объект), так что набор y₁, y₂,..., y_T может рассматриваться как выборка из Т заводов (регионов) и наоборот, индекс j=1, 2,..., N может обозначать время. Это же относится и к независимым переменным х_ij и х_it. Вследствие этого в дальнейшем при изложении материала (если это не оговорено специально) для определенности будем использовать динамические индексы.

При формировании исходной информации для эконометрической модели чрезвычайно важной проблемой является выбор показателей, адекватных сущности исследуемых явлений. И здесь следует обратить внимание на определенную подмену понятий, которая обычно происходит на первом этапе построения модели при переходе от содержательного анализа явлений к формированию отражающих их уровни количественных характеристик (показателей).

В ходе содержательного анализа явление часто рассматривается на качественном уровне. При этом специалисты оперируют достаточно обобщенными понятиями, например, заболеваемость, уровень медицинского обслуживания, качество и уровень жизни, климат, качество рабочей силы и т. п. В этой связи, заметим, что часто эконометрическая модель строится именно для выражения закономерности, существующей между явлениями. Однако при построении модели используется исходная информация, наборы показателей, которые выражают эти явления, их свойства, тенденции в виде количественных характеристик. Вследствие этого желательно, чтобы такое «выражение» было в некотором смысле как можно более “точным”.

Для традиционных направлений исследований проблема обоснования состава показателей обычно считается решенной. Например, в исследованиях производительности труда, макроэкономическом анализе обычно рассматриваются уже устоявшиеся наборы показателей, значения которых публикуются в статистических сборниках, научных отчетах и т. п. Их примером являются выработка на одного работающего как показатель, выражающий явление “производительность труда”, объемы ВВП (показатель результативности экономики), объем основных фондов (показатель уровня материальной обеспеченности производственного процесса, экономики) и т.д.

Вместе с тем, в ряде областей эконометрических исследований такие системы показателей не могут быть сформированы столь однозначно. Часто одно и то же явление может быть выражено альтернативными вариантами показателей. Например, общий показатель заболеваемости в регионе за год может быть выражен суммарным числом заболеваний населения в течение этого периода времени. С другой стороны, в качестве меры заболеваемости может выступать и показатель, выраженный в виде суммарного количества дней продолжительности болезней.

Однако в обоих этих случаях не учитывается степень тяжести болезни. Попытка такого учета приводит к необходимости расчета средневзвешенного показателя заболеваемости, но здесь сразу возникает проблема обоснования адекватных “весов”. Тяжесть болезни может определяться, например, по степени ее опасности, рассчитываемой как доля обусловленных ею смертных случаев в общем их количестве; на основании субъективного показателя “дискомфортности” состояния больного и т. п.

Аналогичные проблемы должны быть решены при обосновании показателей климата. Для этих целей обычно используются средняя температура воздуха, влажность, число солнечных дней в году и т. п., а также построенные на их основе некоторые комплексные характеристики.

Заметим, что в отсутствие объективных данных в эконометрических исследованиях допускается замена одного показателя другим, косвенно отражающим то же явление. Например, среднедушевой доход как показатель материального уровня жизни может быть заменен на среднегодовой товарооборот на одного жителя региона и т. п.

Неправильный выбор показателя, представляющего рассматриваемое явление в модели, может существенно повлиять на ее качество. В этой связи к проблеме обоснования состава показателей (переменных) эконометрической модели на практике следует относиться с предельным вниманием.

Предположим, что общее число независимых факторов, которые целесообразно включить в модель, равно n, i=1, 2,..., n, и на основе измеренных значений всех переменных в моменты времени t=1, 2,..., T был сформирован массив исходных данных, который будет рассматриваться в качестве информационной основы для построения эконометрической модели.

Данный массив образован вектором-столбцом значений зависимой переменной y=(y₁, y₂, ... , y_T)^{^**} и матрицей значений независимых переменных

Х =
размерностью Tn, таким образом, что каждому элементу y_t вектора y соответствует строка матрицы Х.

Рассматривая проблему выбора конкретного вида функционала f(, x_t) из выражения (1.1) заметим, что в практике эконометрических исследований используется достаточно широкий круг функциональных зависимостей между переменными. Приведем некоторые, наиболее часто используемые, их виды:

1) линейная
y_t=₀+₁х₁_t+...+_n х_nt+_t, (1.2)
2) правая полулогарифмическая
y_t=₀+₁lnx₁_t+...+_n lnх_nt+_t, (1.3)
3) степенная

4) гиперболическая

y_t=₀+₁/х₁_t+...+_n /х_nt+_t, (1.5)

5) логарифмическая гиперболическая

lny_t=₀+₁/х₁_t+...+_n /х_nt+_t, (1.6)
6) обратная линейная (функция Торнквиста)
1/y_t=₀+₁/х₁_t+...+_n /х_nt+_t, (1.7)
7) функция с постоянной эластичностью замены

где  и  – также параметры функции.

8) экспоненциальная функция

где ₁,..., _n – также параметры функции.

На практике могут встретиться и комбинации рассмотренных выше зависимостей. Например,

и т. п.

Здесь необходимо отметить, что большинство функций f(, x_t) с помощью определенного набора преобразований могут быть приведены к линейной форме (1.2). Например, если у и х_i связаны зависимостью у~1/х_i (выражение (1.5)), то, введя переменные u_i=1/х_i, получим выражение (1.2) с точностью до преобразования исходных факторов.

В практических исследованиях часто, используя преобразование u_i=lnх_iи z=lny, степенную модель (1.4) преобразуют к линейному виду, связывающему логарифмы переменных у и х_i. Однако заметим, что в данном случае с точки зрения математики такое преобразование не совсем корректно из-за “аддитивности” ошибки в выражении (1.4). Вследствие этого значения коэффициентов линейной относительно логарифмов переменных модели нельзя в общем случае полагать равными соответствующим значениям степенного аналога.

На примере линейной эконометрической модели покажем еще одну возможную форму представления моделей такого типа – моделей, в которых отсутствует свободный коэффициент ₀. В общем случае такая модель представляется в следующем виде:

Найдем взаимосвязи между переменными y_t и , х_itи и определим, чему равен коэффициент ₀. Для этого просуммируем по индексу t правую и левую части модели (1.2). Получим

Поскольку что отражает свойство равенства нулю математического ожидания ошибки (M[_t]= ), то, разделив правые и левые части этого выражения на Т, получим

откуда следует, что

Вычтем ₀ из уравнения (1.2). Получим для всех t

Из (1.12) непосредственно вытекает, что

Операция (1.13) определяет так называемые центрированные переменные и называется операцией центрирования. Отметим, что для центрированных переменных справедливы следующие очевидные соотношения:

Использование центрированных переменных иногда значительно упрощает процедуры получения некоторых результатов, делает более наглядной их интерпретацию.

При этом следует помнить, что исходная информация для такой модели (вектор и матрица ) получается путем вычитания из каждого элемента каждого столбца соответствующего среднего (по столбцу) значения.

Как было отмечено выше, конкретный вид функциональной зависимости f(, x_t) может выражать какую-либо содержательную концепцию, отражающую предполагаемый характер взаимосвязей между процессами y_tи х_it, i=1, 2,..., n.

В основе использования степенной функции (1.4), например, обычно лежит концептуальное допущение о постоянстве частной эластичности выпуска у по каждому ресурсу (фактору) х_i. Напомним, что частная эластичность в точке t показывает, на сколько процентов изменится зависимая переменная у_t при изменении фактора х_ti на 1% при условии постоянства значений остальных факторов в этой точке. Частная эластичность определяется следующим выражением:

Подставим вместо у_tв правую часть выражения (1.15) функцию . Учитывая, что получим

Э_i = _i. (1.16)
Таким образом, коэффициент модели (1.4) _i сразу определяет значение эластичности у по фактору х_i на всем интервале (1,Т).

Удобство экономической интерпретации параметров модели (1.4), относительная простота ее записи и послужили причиной ее широкого использования особенно в макроэкономических исследованиях.

Особую известность получили различные модификации двухфакторной функции Кобба-Дугласа

которые обычно применяется в макроэкономических исследованиях при анализе взаимосвязи между объемом полученного валового внутреннего продукта (y) и используемыми ресурсами (х₁– основные фонды и х₂– затраты живого труда). Между собой эти модификации, в основном, различаются ограничениями, накладываемыми на значения коэффициентов ₁ и ₂, а также способом выражения и содержательной интерпретацией коэффициента ₀. Например, “классический” вариант функции (1.17) предполагает, что значения ₁ и ₂ удовлетворяют следующим ограничениям: ₁+₂=1; ₁, ₂0. В других вариантах этой функции дополнительно вводят сомножитель е^^t, выражающий влияние на валовый продукт временного фактора, характеризующего научно-технический прогресс и т. п.

Функция (1.8) обычно используется в предположении о постоянстве эластичности замещения одного фактора другим. Например, если речь идет о замене фактора “труд”(L) фактором “капитал” (K), то значение коэффициента эластичности замещения показывает, на сколько процентов измениться капиталовооруженность (K/L) при изменении предельной нормы замещения труда капиталом (N_KL =–dK /dL) на 1% при условии, что зависимая переменная не изменится. Значения всех других факторов при этом предполагаются также неизменными. В общем случае, эластичность замещения i-го фактора j-м определяется выражением:

Предельная норма замещения i-го фактора j-м N_ji показывает количество j-го фактора, которое требуется для замены одной единицы i-го фактора при сохранении постоянных уровня зависимой переменной и значений остальных независимых переменных.

Проводя расчеты по формуле (1.18) для функции (1.8), получим, что для всех i и j и для всех значений t=1,2,..., Т эластичность замещения прироста одного фактора соответствующим изменением другого является постоянной:

Во многих практических исследованиях столь строгие теоретические концепции, предварительные допущения о содержательных сторонах взаимодействия между явлениями отступают на второй план. Для них главным является построение уравнения, достаточно точно выражающего взаимосвязи, адекватные тенденциям изменений переменных у и х_i, i=1, 2,...,n; на временном интервале (1,Т). Более того, часто именно “удачная” форма уравнения эконометрической модели кладется в основу разрабатываемой теоретической концепции, которая затем находит свое применение в последующем анализе. Очевидно, что наиболее “подходящая” форма обеспечивает наилучшее приближение теоретических (расчетных) значений = f(a, x_t) к действительным значениям у_t.

Обычно выбор такой формы осуществляется на основе графического анализа тенденций развития соответствующих процессов. Например, если переменная y и переменная х_i изменялись во времени согласно графикам, представленным на рис. 1.1, то логично предположить, что у~1/х_it.

Для графиков, представленных на рис. 1.2, характерной является логарифмическая зависимость у_t ~lnх_it.

В этих и во многих других случаях, как правило, в качестве функции f(, x_t), выражающей взаимосвязи между включенными в модель независимыми переменными х_i, i=1, 2,..., n, выбирается либо линейная форма (1.2), либо степенная (1.4). Заметим, что значение частной эластичности y по фактору х_i, рассчитанное на основе выражения (1.15) для функции (1.2) равно:

и, таким образом, этот показатель изменяется во времени в соответствии с изменениями переменных у и х_i.

y х_i

t t

Рис. 1.1
y х_i

t t

Рис. 1.2
Аналогично можно показать, что предельная норма замещения факторов i и j для функции (1.17) также является переменной величиной

и ее значение также зависит от соотношения уровней рассматриваемых факторов в каждый момент времени.

1.3. Методы отбора факторов

“Оптимальный” состав факторов, включаемых в эконометрическую модель, является одним из основных условий ее “хорошего” качества, понимаемого и как соответствие формы модели теоретической концепции, выражающей содержание взаимосвязей между рассматриваемыми переменными, и как точность предсказания на рассматриваемом интервале времени t=1, 2,..., Т наблюдаемых значений переменной у_t уравнением f(, x_t).

Проблема выбора “оптимальных” факторов обычно решается на основе содержательного и количественного (статистического) анализа тенденций рассматриваемых процессов.

На этапе содержательного анализа решается вопрос о целесообразности включения в модель тех или иных факторов, исходя из “здравого” смысла. В макроэкономических исследованиях состав факторов, как правило, определяется на основании допущений экономической теории. Пример – двухфакторные производственные функции типа Кобба-Дугласа, постоянной эластичности замены, которые строятся в предположении, что объем выпуска (производства) экономической системы в основном зависит от размеров используемых основных фондов и количества затраченного труда. Далее, как это было отмечено в разделе 1.2, производственная функция типа Кобба-Дугласа учитывает предположение о постоянной эластичности выпуска по каждому из факторов, а функция постоянной эластичности замены – свойство постоянства замещения изменения одного из этих факторов изменением другого.

Здесь следует иметь в виду, что на этапе содержательного анализа обычно решается проблема установления самого факта наличия взаимосвязей между явлениями. Однако, как было отмечено в разделе 1.2, каждое из явлений может быть выражено разными факторами и даже их комбинациями. Поэтому в ряде исследований на основании содержательного анализа однозначно состав независимых переменных модели определить практически невозможно. Могут существовать их альтернативные наборы. Например, для исследования закономерностей динамики производительности труда на заводе могут быть отобраны, исходя из содержательной целесообразности, следующие факторы: объем основных фондов, электровооруженность труда, фондовооруженность труда, численность рабочей силы, ее квалификация. При этом квалификация как явление может выражаться разными показателями, например, средним уровнем образования работников, их усредненным квалификационным разрядом и т. п. Кроме того, можно ожидать, что показатели электровооруженности, фондовооруженности труда, объема основных фондов характеризуют одно и то же явление – изменение материально-технической оснащенности производственного процесса. Таким образом, некоторые из рассматриваемых в таком исследовании показателей, выражающих количественные характеристики независимых переменных, относятся к сходным явлениям.

Аналогично, в исследованиях заболеваемости населения каждая из определяющих это явление причин может быть количественно отображена разными факторами. Например, уровень жизни – среднедушевым доходом, обеспеченностью жильем, розничным товарооборотом в расчете на одного жителя и т. п.; климатические условия – среднегодовой температурой, числом солнечных дней в году, влажностью и рядом других показателей; качество окружающей среды – среднегодовыми объемами выбросов и сбросов загрязняющих веществ, среднегодовыми уровнями их концентрации в воздухе, воде и почве и т. д., уровень медицинского обслуживания – количеством медицинских работников в расчете на одного жителя; числом койко-мест в лечебных заведениях на одного жителя и другими показателями.

Несложно заметить, что факторы, выражающие одну и ту же причину, могут быть тесно взаимосвязаны между собой. Так, например, уровень розничного товарооборота в основном зависит от среднедушевого дохода; концентрация загрязняющих веществ – от объемов их выбросов; наблюдается взаимосвязь между обеспеченностью населения медицинским персоналом и койко-местами в лечебных учреждениях и т. д. Вследствие этого, одновременное включение таких факторов в модель вряд ли целесообразно, поскольку таким образом одна и та же причина будет учтена дважды.

В результате в общем случае на этапе обоснования эконометрической модели исследователи могут столкнуться с проблемой выбора наиболее предпочтительного состава независимых факторов среди ряда альтернативных вариантов. Можно выделить два основных подхода к решению этой проблемы. Первый из них предполагает априорное (до построения модели) исследование характера и силы взаимосвязей между рассматриваемыми переменными, по результатам которого в модель включаются факторы, наиболее значимые по своему “непосредственному” влиянию на зависимую переменную у_t. И, наоборот, из модели исключаются факторы, которые, либо малозначимы с точки зрения силы своего влияния на переменную у_t, либо их сильное влияние на нее можно трактовать как индуцированное взаимосвязями с другими экзогенными переменными.

Второй подход к отбору независимых факторов можно назвать апостериорным. Он предполагает первоначально включить в модель все отобранные на этапе содержательного анализа факторы. Уточнение их состава в этом случае производится на основе анализа характеристик качества построенной модели, одной из групп которых являются и показатели, выражающие силу влияния каждого из факторов на зависимую переменную у_t.

Рассмотрим особенности процедуры отбора факторов на основе использования каждого из этих подходов более подробно.

В основе “априорного” подхода лежат следующие предположения.

1. Сильное влияние фактора на зависимую переменную должно подтверждаться и определенными количественными характеристиками, важнейшей из которых является их парный линейный коэффициент корреляции, выборочное значение которого рассчитывается на основании имеющейся информации по формуле:

где – средние значения соответствующих переменных, а – их среднеквадратические отклонения.

Логика использования коэффициента парной корреляции при отборе значимых факторов на практике состоит в следующем. Если значение достаточно велико, т. е. >₁, где ₁ – некоторый эмпирический рубеж (на практике ₁0,5-0,6), то можно говорить о наличии существенной линейной связи между переменными у и х_i или о достаточно сильном влиянии х_i на у. Чем больше абсолютное значение , тем сильнее это влияние (положительное или отрицательное, в зависимости от знака r).

Здесь следует иметь в виду, что значение должно рассчитываться с учетом формы преобразования у и х_i в модели. Например, если у~1/х_i, то и коэффициент корреляции определяется между у и u_i =1/х_iи т.п.

2. Если два и более факторов выражают одно и то же явление (см. рассмотренные выше примеры), то, как правило, между ними также должна существовать достаточно сильная взаимосвязь. На это может указать выборочное значение их парного коэффициента корреляции

На практике взаимосвязь между факторами признается существенной, если >₂, где ₂0,8–0,9. В таких ситуациях один из этих факторов целесообразно исключить из модели, с тем, чтобы одна и та же причина не учитывалась дважды. Однако повторим, что такое исключение следует проводить только в тех случаях, когда факторы выражают одно и то же явление.

Отметим, что приведенные рубежные значения (в первом случае – 0,5–0,6; во втором – 0,8–0,9) достаточно условны. В каждом конкретном случае они устанавливаются индивидуально. При их выборе существенную роль играет интуиция исследователя. Обычно считается, что, если для фактора х_i0,5, то при большом числе других достаточно значимых факторов, информацией, которую содержит в себе фактор х_i относительно изменчивости переменной у, можно пренебречь. Иногда же, наоборот, если состав факторов не слишком широк, и фактор х_iвыражает существенное с точки зрения теории явление, то исследователь, стремясь не потерять информацию о закономерностях изменчивости переменной у, может оставить его в модели и при меньшем значении выборочного коэффициента корреляции (=0,3–0,4).

Здесь следует еще раз подчеркнуть, что при таком отборе, основанном на эмпирике и интуиции, обычно не принимается во внимание точность оценки выборочных коэффициентов корреляции, которая растет с увеличением выборки, т. е. значения Т. При фиксированном значении Т точность оценок всех коэффициентов примерно одинакова. Логика такого отбора в большей степени ориентирована на содержательную сторону проблемы учета взаимосвязей между переменными модели.

Значительно усложняет проблему отбора факторов явление ложной корреляции, которое характеризуется достаточно высокими по абсолютной величине значениями коэффициентов парной корреляции у процессов, с содержательной точки зрения между собой никак не связанных. Иными словами, большие значения парных коэффициентов корреляции могут иметь место и в тех случаях, когда тенденции рассматриваемых процессов совпали случайно, при отсутствии между ними логически обоснованной взаимосвязи.

Примерами ложных корреляций являются совпадающие тенденции роста потребительских расходов в постоянных ценах и роста потребительских цен, роста выпуска продукции и потребления алкоголя и т. п.

Ложная корреляция может помешать при построении “правильной” модели по двум причинам. Во-первых, в модель случайно могут быть введены незначимые с содержательной точки зрения факторы, характеризующиеся значимыми величинами . Во-вторых, из модели могут быть исключены значимые с точки зрения влияния на у факторы, в отношении которых ошибочно признана гипотеза о том, что они выражают то же явление, что и другой фактор (факторы), уже включенный в эту модель.

Среди основных причин включения в модель переменных с ложной корреляцией часто называют ненадежность информации, используемой при определении значений факторов в различные моменты времени, трудности формализации факторов, имеющих качественный характер, неустойчивость тенденций изменения рассматриваемых переменных, неправильную форму взаимосвязи между ними и т. п.

Еще раз отметим, что основной путь, придерживаясь которого можно избежать ошибок, связанных с понятием “ложной корреляции”, связан с проведением качественного анализа проблемы, направленного на обоснование адекватного ей содержания и формы модели. При этом можно предложить и некоторые общие рекомендации, которых целесообразно придерживаться, следуя этим путем:

1. Число факторов, включаемых в модель, не должно быть слишком велико. Их увеличение может свести к минимуму ее практическую ценность, так как в этом случае модель начинает отражать не закономерность развития на фоне случайности, а саму случайность.

2. Простота модели в значительной степени является гарантией ее адекватности, поскольку более сложные зависимости часто априорно трудно уловимы на ограниченном временном интервале, но в то же время они допускают аппроксимацию достаточно простыми функциями. Иными словами, сложная модель может в большей степени выражать второстепенные взаимосвязи между переменными в ущерб основным.

При апостериорном подходе уточнение состава факторов эконометрической модели осуществляется на основе анализа значений ряда качественных характеристик уже построенного ее варианта. Одну из групп таких характеристик, являющихся наиболее важными при отборе факторов, образуют значения критерия Стьюдента, рассчитываемые для коэффициентов при каждом из факторов модели. С помощью этого критерия проверяется гипотеза о значимости влияния фактора на зависимую переменную у.

Здесь следует отметить, что окончательное решение о целесообразности оставления фактора или его удаления из модели принимается на основе анализа всего комплекса ее характеристик качества с учетом содержательной стороны проблемы взаимосвязей между зависимой и независимыми переменными. Вопросы их расчета и логика принятия такого решения будут изложены в разделе 1.4. Критерий Стьюдента лишь указывает на те факторы, которые с точки зрения статистики являются возможными (целесообразными) кандидатами на удаление.

Заметим, что ответ на вопрос о целесообразности включения в число факторов-кандидатов на удаление каждой из независимых переменных х_i, i=1, 2,..., n, при апостериорном подходе решается уже после того, как оценены значения коэффициентов модели и определены некоторые дополнительные характеристики точности полученных оценок. Вопросы определения этих характеристик рассмотрены в главе II.

Будем считать, что с помощью какого-либо из методов, рассмотренных в главе II, например, метода наименьших квадратов, найдены численные значения оценок параметров a₀, a₁,..., a_n линейной эконометрической модели (1.2)^{^*}. Как будет показано в главе II, эти оценки являются выборочными (определенными по наблюдаемой выборке исходных данных). Согласно этому они рассматриваются как случайные величины, распределенные «приблизительно» по нормальному закону с соответствующими математическими ожиданиями и дисперсиями (среднеквадратическими отклонениями). Методы оценивания параметров позволяют определить и значения дисперсий полученных оценок (a_i).

Логика использования критерия Стьюдента при выявлении факторов-кандидатов на удаление из уже построенного варианта модели основывается на следующих его свойствах. Напомним, что случайная величина , определенная согласно выражению

распределена по закону Стьюдента с k степенями свободы, k – объем выборки; – выборочное среднее некоторой случайной величины z; – ее математическое ожидание (среднее по генеральной совокупности); – среднеквадратическое отклонение выборочного среднего.

Таким образом, с помощью критерия Стьюдента может быть проверена гипотеза о равенстве найденного выборочного среднего предполагаемому значению математического ожидания. На практике обычно эта гипотеза принимается, если оказывается, что для расчетного значения критерия Стьюдента выполняется следующее соотношение _*( k), где _*( k) – табличное значение критерия Стьюдента, соответствующее доверительной вероятности р_* и числу степеней свободы k^{^*}.

При определении значимости (незначимости) i-го фактора принимаются во внимание следующие обстоятельства. Оценка соответствующего ему коэффициента a_i, полученная с использованием выбранного метода оценивания параметров, приравнивается к выборочному среднему . Для незначимого фактора логично предположить, что истинное значение _i равно нулю, т. е. математическое ожидание оценки равно нулю М[a_i]=0.

С учетом этого расчетное значение критерия Стьюдента при проверке гипотезы о значимости i-го фактора определяется по следующей формуле:

где a_i– абсолютное значение оценки коэффициента _i в модели, характеризующее степень влияния i-го фактора на результирующий показатель; (a_i) – среднеквадратическая ошибка оценки этого коэффициента, определяемая на этапе его расчета (см. главу II).

следующая страница>

ВВЕДЕНИЕ

ГЛАВА I. ПРОБЛЕМЫ ПОСТРОЕНИЯ ЭКОНОМЕТРИЧЕСКИХ МОДЕЛЕЙ

1.1. Основные этапы построения эконометрической модели

1.2. Особенности обоснования формы эконометрической модели

1.3. Методы отбора факторов