ÌÈÍÈÑÒÅÐÑÒÂÎ ÎÁÐÀÇÎÂÀÍÈß È ÍÀÓÊÈ ÐÎÑÑÈÉÑÊÎÉ ÔÅÄÅÐÀÖÈÈ Ãîñóäàðñòâåííîå îáðàçîâàòåëüíîå ó÷ðåæäåíèå âûñøåãî ïðîôåññèîíàëüíîãî îáðàçîâàíèÿ ÑÀÍÊÒ-ÏÅÒÅÐÁÓÐÃÑÊÈÉ ÃÎÑÓÄÀÐÑÒÂÅÍÍÛÉ ÓÍÈÂÅÐÑÈÒÅÒ ÀÝÐÎÊÎÑÌÈ×ÅÑÊÎÃÎ ÏÐÈÁÎÐÎÑÒÐÎÅÍÈß
М. А. Нарбут, М. В. Соколовская
ЭКОНОМЕТРИКА Текст лекций
Ñàíêò-Ïåòåðáóðã 2004 1
УДК 3304 ББК 65в6 Н 28 Нарбут М. А., Соколовская М. В. Н28 Эконометрика: Текст лекций /СПб ГУАП. СПб., 2004. 40 с.: ил. Текст лекций посвящен методам исследования взаимосвязей экономических показателей, даются основные понятия, состав и анализ исходной информации, эконометрические модели и оценка их качества. Текст лекций может быть использован при чтении курса «Эконометрика» для специальностей: 061800 «Математические методы в экономике»; 060400 «Финансы и кредит»; 060500 «Бухгалтерский учет, анализ и аудит»; 060600 «Мировая экономика». Предназначено для студентов экономических специальностей факультета заочного обучения.
Рецензенты: кафедра экономической кибернетики Санкт-Петербургского государственного университета; доктор физико-математических наук, профессор кафедры высшей математики Санкт-Петербургского государственного политехнического университета В. М. Чистяков
Утверждено редакционно-издательским советом университета в качестве текста лекций
© ГОУ ВПО “ Санкт-Петербургский государственный университет авиационного приборостроения”, 2004 2
ПРЕДИСЛОВИЕ Курс эконометрики появился в учебных планах по экономическим специальностям совсем недавно. Как видно из названия курса (“эконо” – экономика, “-метрика” – измерение), он посвящен проблемам измерения экономических величин и процессов. Впрочем, некоторые авторы предпочитают название курса “эконометрия”. В более широком смысле слова эконометрика занимается применением математических методов (в частности, методов теории вероятностей и математической статистики) в экономической теории. В системе западного экономического образования курс эконометрики наряду с микроэкономикой и макроэкономикой рассматривается как важнейшая составляющая курса экономической теории. В России до недавнего времени вопросы, относящиеся к эконометрике, изучались в курсах статистики (экономической статистики), а также в курсе математической статистики. Владение методами математической статистики является совершенно необходимым при изучении эконометрики, и мы будем далее часто о них напоминать. Для повторения основных понятий теории вероятностей и математической статистики можно обратиться к учебнику В. Е. Гмурмана [3]. Что же касается собственно курса эконометрики, то для более полного его изучения можно, в первую очередь, рекомендовать учебные пособия [4, 5, 8]. Предложенный текст лекций по дисциплине «Эконометрика» содержит основные положения и может быть взят за основу при изучении данного курса студентами экономических специальностей заочного вида обучения. В первом разделе приведены математические модели, аппроксимирующие взаимосвязи экономических показателей и явлений, анализируются возможности их применения для прогнозирования реальных экономических процессов. Особое внимание уделено анализу исходной информации: источникам ее получения, классификации, методам переработки, точности. 3
Особенно подробно рассмотрены временные ряды, как один из наиболее распространенных методов аппроксимации экономических явлений. При анализе составляющих временных рядов используется аппарат теории вероятностей, рассматривающий их как случайные величины, и тригонометрические ряды Фурье. Отдельный раздел посвящен оценке качества спецификации созданной математической модели, анализу ошибок аппроксимации. Как уже говорилось, в лекциях даются лишь основные положения – за уточнениями следует обращаться к рекомендуемой литературе. Авторы надеются, что данный текст лекций окажется полезным в учебном процессе и с благодарностью примут замечания и пожелания читателей. Авторы считают своим приятным долгом выразить глубокую благодарность первому проректору ГУАП В. И. Хименко и сотрудникам кафедры компьютерной математики и программирования за поддержку и помощь в работе.
4
Введение Проблема изучения взаимосвязей экономических показателей является одной из важнейших в экономическом анализе. Эта проблема является центральной в эконометрике и решается построением эконометрической модели и определением возможностей ее использования для описания, анализа и прогнозирования реальных экономических процессов. Экономическая политика заключается в регулировании этих процессов с помощью выявленных взаимосвязей параметров и переменных. Эконометрика – это самостоятельная научная дисциплина, объединившая совокупность теоретических результатов, приемов, методов и моделей, предназначенных для того чтобы на базе экономической теории, экономической статистики и математико-статистического инструментария придавать конкретное количественное выражение общим экономическим закономерностям, вскрываемым экономической теорией. Можно сказать, что суть эконометрики – синтез экономики, экономической статистики и математики [1]. Осуществление радикальных реформ при переходе к рыночной экономике требует проведения эконометрических расчетов, позволяющих прогнозировать результаты хозяйственной деятельности и обосновать выбранный путь их достижения. Целью эконометрики является прогнозирование динамики макро- и микроэкономических факторов хозяйственной деятельности. Прогнозная информация должна давать возможность принимать решения в зависимости от хозяйственной конъюнктуры. Эконометрические расчеты выступают эффективным средством совершенствования управления хозяйственной деятельностью, без них невозможно достижение высоких экономических результатов. В новых условиях хозяйствования руководителям предприятий часто приходится принимать решения в ситуации неопределенности, требующей применения специфических математических методов. Задачами, решаемыми эконометрикой, являются: – оценка ситуации при интерпретации экономических явлений и их предвидении; 5
– определение стратегии хозяйственной деятельности, как на ближайшую, так и на отдаленную перспективу; – обоснование процесса принятия управленческих решений; – оптимизация различных вариантов управленческих решений. Конечные прикладные цели
Имитация возможных сценариев социально - экономического развития системы, когда статистически выявленные взаимосвязи используются для прослеживания того, как планируемые изменения скажутся на значениях «выходных» параметров экономической системы
Прогноз экономических и социально-экономических состояние и развитие экономической системы
Рис. 1. Задачи, решаемые для достижения прикладных целей
Уровни иерархии
Макроуровень (страна в целом) Модели национальной экономики
Мезоуровень Модели региональной экономики, отрасли, корпораций
Микроуровень Модели поведения потребителя, семьи, фирмы, предприятия
Рис. 2. Задачи уровней иерархии
П р о ф и л ь
Проблемы производства
Проблемы контроля и учета
Проблемы рынка
Проблемы инвестиционной, финансовой политики и т.п.
Рис. 3. Профильные задачи 6
Проблемы управления
Классификацию целей и задач, решаемых эконометрикой, можно рассматривать с трех точек зрения: – конечных прикладных целей; – уровня иерархии; – профиля. На рис. 1–3 представлены перечни задач, решаемых эконометрикой. Моделирование взаимосвязей экономических явлений и процессов производится с помощью математических моделей. Математическая модель – это абстракция реального мира, в которой отношения между реальными элементами заменены отношениями между математическими категориями. Эти отношения, как правило, могут быть представлены в форме уравнений и (или) неравенств между показателями (переменными), характеризующими функционирование моделируемой реальной системы. Искусство построения математической модели состоит в том, чтобы совместить наибольшую лаконичность в ее математическом описании с достаточной точностью модельного воспроизводства анализируемой реальности. Круг задач эконометрики и ее связь с экономической теорией поясним на двух примерах, взятых из микро- и макроэкономики. Пример 1 Как известно, спрос и предложение относятся к основным понятиям микроэкономики. Пусть переменная X определяет количество товара, рыночная цена которого равна p (price – цена). Спрос на данный товар – это количество товара X, которое потребители готовы купить по цене p, т. е. это функция X = D(p). Как правило, функция спроса D(p) (Demand – спрос) является убывающей. В экономике принято по оси абсцисс отp кладывать количество товара X, а по оси ординат – цену p S (рис. 4). В первом приближеE нии функцию спроса X = D(p) pe можно считать линейной: X = D =α − βp, (β > 0). Предложение – это количеX Xe ство товара X, которое производители готовы продать по цене p, т. е. это функция Рис.4. Графики функций спроса и предложения X=S(p). Как правило, функция 7
предложения (Supply – предложение) является возрастающей и может быть аппроксимирована линейной зависимостью: X = a+bp, (b > 0). Изобразим графики функций D(p) и S(p) на одном чертеже (рис.4). Точка E пересечения этих графиков (Xe, pe) (equilibrium – равновесие) отвечает состоянию рыночного равновесия. Если бы цена товара была ниже равновесной (p < pe), то спрос на данный товар превышал бы предложение, возник бы дефицит товара. Напротив, если p > pe, то предложение превышает спрос и товар не раскупается полностью. В обоих случаях давление рынка должно приводить к установлению равновесной цены pe. Изменение рыночной цены p(t) = pt представляет собой процесс, разворачивающийся во времени, анализ динамики рыночных цен мы здесь не рассматриваем. Отметим только, во-первых, что задачей эконометрических исследований является оценка постоянных α, β, a, b по данным экономической статистики, социологических опросов и т. п. И, во-вторых, что при определении предложения на данный товар X = Xt в ряде случаев следует учитывать не только его цену p = pt в рассматриваемый момент времени t, но и например цену pt–1 в некоторый предыдущий момент времени (t-1) (здесь единицей времени может быть год, месяц, день – в зависимости от конкретной задачи). Тогда закон предложения запишется в виде X tS = a + bpt + cpt −1 , и задачей эконометрики будет определение констант a, b, c. Пример 2 В качестве примера из макроэкономики рассмотрим кривую Филлипса, устанавливающую зависимость между изменением уровня инф∆ πt
ляции πt =
x0
1
Рис.5. Кривая Филлипса 8
x
pt − pt −1 и занятосpt
тью на рынке труда x = L/Lпред (Labour – труд, рабочая сила), где Lпред – предельное значение предложения труда; L – требуемая рабочая сила. Если x < 1, то существует безработица. Если x = 1, ее нет, при этом L = Lпред. Данные статистики многих капиталистических стран свидетельствуют о существовании зависи-
мости между ∆πt = πt − πt−1 и x (рис.5). Из рис. 5 видно, что существует такой уровень занятости x0, при котором инфляция не растет (сам Филлипс рассматривал вместо изменения инфляции ∆πt изменение заработной платы рабочих). Количественная оценка зависимости между ∆πt и x представляет собой типичную задачу эконометрики. Основные этапы эконометрического моделирования следующие: – априорный анализ экономической сущности изучаемого явления; – определение конечных целей исследования, набор участвующих в нем факторов и показателей, выявление их роли; – моделирование, т. е. выбор общего вида модели, состава и формы входящих в нее связей; – формирование и формализация априорной информации, относящейся к природе исходных статистических данных и случайных составляющих; – сбор необходимой статистической информации: регистрация значений участвующих в модели факторов и показателей на различных временных и пространственных интервалах функционирования явления; – анализ модели и статистическое оценивание найденных параметров модели.
9
1. АНАЛИЗ ДАННЫХ 1.1. Состав исходной информации Основной базой исходной информации для эконометрических исследований служат данные статистики либо данные бухгалтерского учета. Исследуемые эконометрикой взаимосвязи стохастичны по своей природе, т. е. позволяют устанавливать лишь вероятностные соотношения между значениями x и y, являющимися случайными величинами. В эконометрической модели любого типа все участвующие в ней переменные, поддающиеся измерению, разделяются на: – «входные» переменные, так называемые экзогенные («внешние», автономные), объясняющие – в определенной степени управляемые; – «выходные» переменные, так называемые эндогенные (формируются в процессе и «внутри» социально-экономической системы) – объясняемые переменные; – латентные (скрытые, т. е. не поддающиеся непосредственному измерению) случайные «остаточные» переменные [1]. Кроме того, вводится понятие предопределенных переменных, формирующихся из всех экзогенных переменных («привязанных» к прошлым, текущему и будущим моментам времени) и так называемых лаговых эндогенных переменных (эндогенных переменных, значения которых уже вычислены в прошлые, по отношению к текущему, моменты времени, т. е. уже известных, заданных). Следовательно, эконометрическая модель служит для получения эндогенных переменных в зависимости от значений экзогенных и лаговых эндогенных переменных. Схема взаимосвязи переменных в эконометрических моделях представлена на рис. 6. Эндогенные переменные Экзогенные переменные
Лаговые переменные
Расчетные промежуточные переменные
Результирующие показатели
Предопределенные переменные
Рис. 6. Схема взаимосвязи переменных
В эконометрической модели используется два типа исходных данных: 10
– данные, характеризующие совокупность различных объектов в определенный момент (период) времени; – данные, характеризующие один объект за ряд последовательных моментов (периодов) времени. Модели, построенные по информации первого типа, называются пространственными моделями. Модели, построенные на основе информации второго типа – называются моделями временных рядов. 1.2. Интерполяционный полином Лагранжа Интерполяционная формула сопоставляет с функцией y(x) функцию известного класса Y(x) = Y(x; a0,a1,…an), зависящую от n+1 параметров aj, выбранных так, чтобы значения Y (x) совпадали со значениями y(x) для данного множества n+1 значений аргумента xk (узлов интерполяции) Y(xk) = y(xk) = yk Пусть имеется зависимость y = f(x) между величинами x и y, для которой нам известны отдельные точки (xi,yi), i = 0,1,2,..., n. Многочлен y = a0+a1x+a2x2+...+anxn, график которого проходит через все данные точки, и будет интерполяционным многочленом. Определение этого многочлена по методу Лагранжа начнем с простейших случаев. 1. Через одну точку (x0, y0) можно провести пучок прямых y = y0+b(x–x0)
(2.1)
(а также вертикальную прямую x = x0). Действительно, уравнение прямой с угловым коэффициентом имеет вид y = a+bx, при этом выполняется равенство y0 = a+bx0. Вычитая второе равенство из первого, получим уравнение (2.2) y–y0 = b(x–x0), равносильное уравнению (2.1). 2.Через две различные точки (x0, y0), (x1, y1) проходит одна и только одна прямая. Если x0 ≠ x1, то ее уравнение имеет вид y − y0 x − x0 = y1 − y0 x1 − x0 .
(2.3)
Оно получается почленным делением уравнения (2.2) на равенство y1 – y0 = b(x1 – x0). 11
Уравнение (2.3) приводится к виду y = y0
x − x0 x − x1 + y1 x0 − x1 x1 − x0 .
(2.4)
Вместе с тем можно непосредственно убедиться в том, что уравнение (2.4) определяет линейную зависимость между величинами y и x и графиком этой зависимости является прямая линия, которая проходит через точки (x0,y0) и (x1,y1). 3. Многочлен второй степени (квадратичная функция), график которой проходит через три точки (x0, y0), (x1, y1), (x2, y2), представляется в виде y = y0
( x − x0 )( x − x2 ) ( x − x0 )( x − x1 ) ( x − x1 )( x − x2 ) + y1 + y2 ( x0 − x1 )( x0 − x2 ) ( x1 − x0 )( x1 − x2 ) ( x2 − x0 )( x2 − x1 ) .(2.5)
Заметим, что дроби при величине yi (i = 0, 1, 2) обращаются в единицу, если x = xi,, и равны нулю при x = xk (k ≠ i ). n. Теперь ясно, что интерполяционный полином Лагранжа n-й степени, график которого проходит через n+1-ю точку (xi, yi), i = 0, 1, 2,..., n, можно записать в виде y( x) =
n
∑ yk Lk ( x) ,
k =0
где Lk ( x ) =
( x − x0 )( x − x1 )...( x − xk −1 )( x − xk +1 )...( x − xn ) ( xk − x0 )( xk − x1 )...( xk − xk −1 )( xk − xk +1 )...( xk − xn ) .
При этом функция Lk (x) равна 1 при x = xk и равна нулю в остальных узлах xj (j ≠ k). Заметим, однако, что в эконометрике необходимость в использовании интерполяционного многочлена степени выше второй встречается y крайне редко. Как правило, эмпирические данные (xi, yi) соответствуют какой-нибудь простой зависимости между переменными, например, линейной, но содержат ошибки измерений, вследствие x чего точки (xi, yi) не лежат на одРис. 7. Пример эмпирических данных ной прямой (рис. 7). 12
1.3. Парная линейная регрессия. Метод наименьших квадратов Самой простой математической моделью, описывающей взаимосвязь экономических показателей и процессов, является линейная регрессия. Пусть имеется n пар чисел (xi, yi), i = 1,2,..., n, относительно которых предполагается, что они отвечают линейной зависимости между величинами x и y y=a+bx,
(3.1)
возможно, с некоторой ошибкой εi, так что yi=a+bxi+εi, i = 1, 2,..., n.
(3.2)
Какими должны быть наилучшие значения параметров a и b? Смысл метода наименьших квадратов заключается в том, чтобы сумма квадратов ошибок εi была наименьшей: n
∑ εi2 → min.
(3.3)
i=1
Подставляя значения εi из (3.2) в (3.3), получим функцию Φ ( a , b) =
n
∑ (a + bxi − yi )2 → min. i =1
Необходимым условием минимума этой функции, как известно, является равенство нулю ее частных производных по a и b
∂Φ = 0 , ∂Φ = 0 . ∂b ∂a Вычисляя производные, приходим к системе уравнений n (a + bxi − yi ) = 0, i =1 n (a + bx − y ) x = 0. i i i i =1
∑
∑
(3.4)
Заметим, что уравнения (3.4) можно записать короче в виде 13
n εi = 0, i =1 n ε x = 0. i i i =1
∑
(3.5)
∑
Если раскрыть скобки в уравнениях (3.4), то после простых преобразований получим систему na + b∑ xi = ∑ yi , 2 a ∑ xi + b∑ xi = ∑ xi yi , решение которой находится без большого труда:
(3.6)
yi ∑ xi2 − ∑ x i ∑ xi yi ∑ , a= n ∑ xi2 − (∑ xi )2
(3.7)
b=
n ∑ xi yi − ∑ xi ∑ yi n ∑ xi2 − (∑ xi )2
.
(3.8)
Введем обозначения:
s x2 =
1 n
n
∑
x=
1 xi , n i =1
y=
1 yi , n i =1
n
(3.9)
∑
∑ ( xi − x )2 = n1 ∑ xi2 − x 2 ,
∑
(3.10)
∑
1 1 xi yi − xy . ( xi − x )( yi − y ) = (3.11) n n В курсах математической статистики величины x , y называются выборочными средними; s x2 – выборочной дисперсией; c xy – выборочной ковариацией. Теперь формулу (3.8) можно переписать в виде c xy =
b= 14
c xy s x2
,
(3.12)
а выражение для a получается из первого уравнения (3.6): a = y − bx .
(3.13)
Из формулы (3.13) видно, что точка ( x , y ) лежит на прямой y=a+bx (при найденных значениях a и b). Поэтому функцию (3.1) можно записать также в виде y − y = b( x − x ) , где параметр b определяется по формуле (3.12). Предположим теперь, что зависимость y от x не является линейной и выражается формулой yi = a+bf(xi)+εi, i = 1, 2,..., n.
(3.14)
Введем обозначения 1 F1 y1 ε1 1 F2 y2 ε ε= 2 Y = θ = a F = ... , ... , ... ... , b, 1 Fn yn εn
где n – число измеренных значений фактора x, а Fi = f(xi). В матричной форме система уравнений (3.14) принимает стандартный вид Y = Fθ+ε.
(3.15)
Для определения параметров a и b, объединенных в вектор θ, можно применить метод наименьших квадратов (отметим, что относительно искомых параметров формула (3.14) осталась линейной). В следующем подразделе показано, что решение этой задачи имеет вид θ = (FTF)–1FTY.
(3.16)
1.4. Множественная линейная регрессия Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Но существует обычно несколько факторов, которые оказывают существенное влияние (например, на потребление того или иного товара влияют такие факторы, как цена товара, размер семьи, ее состав, доход и т. д.). В этом случае следует попытаться выявить влияние этих факторов, введя их в модель, т. е. построить уравнение множественной регрессии. 15
Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям: – Факторы должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность. Например, если анализируется спрос на мороженое летом и зимой, то фактор сезонности можно учесть бинарной переменной, принимающей значения 1 и 0. Аналогичным образом учитывается наличие балкона, этаж, тип здания (кирпичный или блочный дом) на рынке недвижимости и т. п. – Факторы не должны быть коррелированны и тем более находиться в точной функциональной связи. В случае учета влияния нескольких факторов линейная зависимость величины y от m переменных x1, x2,..., xm примет вид: y = θ1x1+θ2x2+...+θmxm.
(4.1)
Конкретные значения независимых переменных будем отмечать двумя индексами: xi1, xi2,…, xim, (i = 1,2,... ,n). Тогда можно записать уравнения yi =
m
∑ θk xik + εi , k =1
(4.2)
где m – число рассматриваемых факторов. Зависимость (4.2) будем называть множественной линейной регрессией. Если зависимость величины y от переменных x1, x2,…, xm имеет вид yi =
m
∑ θk fk ( xi ) + εi , i =1, 2,…, n k =1
(4.3)
то, введя обозначение Fik=fk(xi), запишем формулу (4.3) в виде yi =
m
∑ Fik θk + εi . k =1
(4.4)
В качестве примеров зависимости типа (4.3) отметим квадратичную функцию y=a+bx+cx2, полином третьей степени y=a+bx+cx2 +dx3, тригонометрический полином y=θ1 sinx+θ2 sin2x+…+θm sin mx и др. 16
Сравнив формулы (4.2) и (4.4), нетрудно убедиться в том, что они отличаются только обозначениями заданных коэффициентов Fik и xik. В матричном виде имеем формулу y = Fθ + ε,
(4.5)
где y1 ε1 F11 θ1 y2 ε2 F θ2 y = , θ = , ε = , F = 21 ... ... ... ... y ε F θ n n n1 m
F12 ... F1m F22 ... F2m . .... .... ... Fn 2 ... Fnm
Для определения коэффициентов θk в формулах (4.2) или (4.4) воспользуемся методом наименьших квадратов: Φ=
n
m
∑ (∑ Fik θk − yi )2 → min. i =1 k =1
Необходимое условие экстремума функции F = F (θ1,θ2,…,θт) ∂Φ = 0 , p = 1, 2,…, m ∂θ p
дает уравнение n
m
∑ (∑ Fik θk − yi )Fip = 0 .
(4.6)
i =1 k =1
В уравнении (4.6) переставим порядок суммирования: m
n
n
∑ (∑ Fik Fip )θk = ∑ yi Fip . k =1 i =1
(4.7)
i =1
В матричной форме система уравнений (4.7) относительно неизвестных значений переменной θk имеет вид FTFθ = FTy.
(4.8)
Полагая, что матрица FTF неособенная, получим решение системы (4.8) θ = (FTF)–1FTy.
(4.9)
В случае парной регрессии (3.1) вектор параметров θ имеет вид 17
a θ = ; b переменную x1 следует принять равной 1, а переменную x2=x; тогда матрица F принимает вид 1 x1 1 x2 F = 1 x3 . ... ... 1 x n
Произведение матриц
∑ ∑
1 x1 n xi 1 ... 1 FT F = ... ... = xi2 x1 ... xn 1 x xi n представляет собой матрицу коэффициентов системы (3.6), а свободный член в формуле (4.8)
∑
1 FT y = x1
y1 ... 1 y2 = ... xn ... y n
∑ yi ∑ xi yi
совпадает со свободными членами уравнений (3.6). Точно также в случае множественной линейной регрессии для уравнения y = θ0+θ1x1+θ2x2 первый столбец матрицы F состоит из 1, второй столбец – из заданных значений переменной x1, а третий – из значений x2: 1 x11 1 x21 F= ... ... 1 xn1
x12 x22 . ... xn 2
Вектор параметров принимает вид θ0 θ = θ1 . θ2 18
1.5. Нелинейные модели Мы изучили применение метода наименьших квадратов для определения параметров, которые входят в функциональные зависимости линейно. Поэтому для них в подразд. 1.3 и 1.4 получились системы линейных уравнений (3.6), (4.8). Однако в эконометрике приходится иметь дело и с такими функциональными зависимостями, неизвестные параметры которых входят в эти зависимости нелинейно. Например, параметр a в зависимостях (5.1) y=axα, y=aεαx
(5.2)
в случае двух величин (x, y), параметры α1, α2, …, αm в зависимости y = ax1α1 x2α 2 ... xmα m
(5.3)
и др. Типичным примером является функция Кобба – Дугласа y=aLαKβ, где a > 0, 0 < α < 1, 0 < β < 1, обычно принимают также условие α + β = 1. Эта функция выражает зависимость произведенной продукции y от объема привлеченных трудовых ресурсов (число рабочих, человеко-часы и т.п.) L и объема основных фондов K. При определении параметров в формуле (5.1), (5.2) или параметров α1, α2, …, αm в формуле (5.3) методом наименьших квадратов их следует предварительно прологарифмировать. Например, логарифмирование степенной функции y=axa дает уравнение ln y = ln a + αln x, линейное относительно величин A = ln a и α. Сделав замену переменных: Y = ln y, A = ln a, X = ln x, получим соотношение Y = A + αX, определение параметров которого по методу наименьших квадратов приведет к системе линейных уравнений. Линеаризация формулы (5.3) также достигается логарифмированием: ln y = ln a + α1ln x1 + α2ln x2 +…+ αmln xm, Замена переменных: Y = ln y, A = ln a, Xi = lg xi приводит к модели линейной множественной регрессии Y = A + α1X1 + α2X2 +…+ αmXm. 19
Есть модели, которые не могут быть приведены к линейному по коэффициентам виду. 1 ) + ε . Для оценки пара1 − xb метров таких моделей используются итеративные процедуры, успешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Однако гораздо большее распространение получили модели, приводимые к линейному виду. Оценка параметров такого типа моделей реализована в стандартных пакетах прикладных программ EXCEL, STATISTICA и др. Таким образом, если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью нелинейных функций. Различают два класса нелинейных моделей: – модели, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам; – модели, нелинейные по оцениваемым параметрам. Примерами нелинейных моделей первого класса могут служить следующие функции: – полиномы разных степеней: y=a0+a1x+a2x2+…+anxn;
Например: y = a + bx c + ε, или y = a (1 −
– гиперболическая зависимость: y = a +
b ; x
– тригонометрические полиномы y=a 1sinx+b 1 cosx+a 2 sin2x+b 2 cos2x+…+a msinmx+b mcosmx. К нелинейным моделям второго класса относятся функции: – степенная: y = axb; – показательная: y = abx; – экспоненциальная: y = e a +bx . 1.6. Системы одновременных эконометрических уравнений Объектом статистического изучения в социально-экономических науках являются сложные системы. Измерение тесноты связей между переменными, построение изолированных уравнений регрессии недостаточно для описания таких систем и объяснения механизма их функционирования. При использовании отдельных уравнений регрессии предполагается, что факторы можно изменять независимо друг от друга. Практически изменение одной переменной, как правило, влечет за со20
бой изменение во всей системе взаимосвязанных признаков, поэтому в последнее время важное место заняла проблема описания структуры связей между переменными системой одновременных уравнений, называемых также структурными уравнениями. Такая система уравнений может быть построена по-разному [5]. Возможна система независимых уравнений, когда каждая зависимая переменная y рассматривается как функция одного и того же набора факторов x: y1 = a11 x1 + a12 x2 + … + a1m xm + ε1 y2 = a21 x1 + a22 x2 + … + a2m xm + ε2 ................ y = a x + a n1 1 n 2 x2 + … + anm xm + ε n . n
Набор факторов xj в каждом уравнении может варьироваться. Так, модель вида y1 = f ( x1, x2 , x3 , x4 , x5 ), y2 = f ( x1, x3 , x4 , x5 ), y3 = f ( x2 , x3 , x5 ), y4 = f ( x3 , x4 , x5 )
является системой независимых уравнений. Каждое уравнение системы независимых уравнений может рассматриваться самостоятельно. Для нахождения его параметров может использоваться МНК. По существу каждое уравнение этой системы является уравнением регрессии. Если зависимая переменная y одного уравнения выступает в виде фактора x в другом уравнении, то можно строить модель в виде системы рекурсивных уравнений: y1 = a11 x1 + a12 x2 + … + a1m xm + ε1 y2 = b21 y1 + a21 x1 + a22 x2 + … + a2m xm + ε2 y2 = b31 y1 + b32 y2 + a21 x1 + a22 x2 + … + a2m xm + ε2 ................ y = b y + b y + ... + b n1 1 n2 2 mn −1 yn -1 + an1 x1 + an 2 x2 + … + anm xm + ε n . n
В данной системе зависимая переменная y включает в каждое последующее уравнение в качестве факторов все зависимые переменные предшествующих уравнений наряду с набором собственных факторов x. Каж21
дое уравнение этой системы может также рассматриваться самостоятельно и его параметры определяются МНК. Наибольшее распространение получила система взаимозависимых уравнений. В ней одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую часть: y1 = b12 y2 + b13 y3 + ... + b1n yn + an1 x1 + an 2 x2 + … + anm xm + ε1 y = b y + b y + ... + b y + a x + a x + … + a x + ε 2 21 1 23 3 2n n n1 1 n2 2 nm m 2 ................................ yn = bn1 y1 + bn 2 y2 + ... + bmn −1 yn -1 + an1 x1 + an 2 x2 + … + anm xm + εn .
Такая система получила название системы совместных одновременных уравнений или структурной формой модели. В отличие от предыдущих систем каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для нахождения его параметров традиционный МНК не применим. С этой целью используются специальные приемы оценивания [8].
22
2. ВРЕМЕННЫЕ РЯДЫ 2.1. Составляющие временного ряда Временной ряд x(t) – это множество значений величины x, отвечающих последовательности моментов времени t, т. е. это функция t→x(t), которая обычно считается случайной. Обсуждению свойств временного ряда как случайной функции, или случайного процесса мы посвятим подразд. 2.3. Пока же будем рассматривать одну из реализаций случайного процесса x(t) как функцию, заданную на некотором промежутке времени, например, на промежутке [0,Т] или же в отдельных дискретных точках t = tk (k = 0, 1, 2,…). Во многих случаях можно принять шаг по времени ∆t=τ постоянным, при этом значение величины x(t), отвечающее моменту времени tk = kτ, будем обозначать символом xk или xt (t = 0, 1,…, N). Значения временного ряда формируются под воздействием большого числа факторов, которые условно можно разделить на три группы: – факторы, формирующие тенденцию ряда – тренд; – факторы, формирующие циклические колебания ряда; – случайные факторы. В большинстве случаев временной ряд можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой временной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда (Y=T+S+E). Модель, в которой временной ряд представлен как произведение перечисленных компонент, называется мультипликативной моделью временного ряда (Y=T×S×E). Основная задача эконометрического исследования – выявление и придание количественного выражения каждой из перечисленных компонент, с тем чтобы использовать полученную информацию для прогнозирования будущих значений временного ряда или при построении модели взаимосвязи двух или более временных рядов. При наличии во временном ряде тренда и циклических колебаний последующие значения временного ряда зависят от предыдущих. Корреляционную зависимость между последовательными значениями временного ряда называют автокорреляционной. Определение корреляционной функции временного ряда будет сформулировано в подразд. 2.3. 23
2.2. Определение составляющих временного ряда Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость последовательных значений ряда от времени, или тренда. Этот способ называется аналитическим выравниванием временного ряда. Для построения трендов чаще всего применяются следующие функции: – линейная y=a+bt; b ; t – экспоненциальная y = ea +bt ; – степенная: y=at b ; – многочлен n-го порядка: y=a+b 1 t+b 2 t 2 +…+b n t n . Параметры каждого из перечисленных трендов можно определить методом наименьших квадратов, используя в качестве независимой переменной время t, а в качестве зависимой переменной – фактические значения временного ряда yt. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации. Существует несколько способов определения типа тенденции. К числу наиболее распространенных относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости значений ряда от времени. Для анализа периодической составляющей временного ряда можно использовать аппарат тригонометрических рядов Фурье
– гиперболическая y = a +
x (t ) =
a0 ∞ k πt k πt + ak cos + b k sin , 2 k =1 T T
∑
(8.1)
где T – полупериод, т. е. x(t + 2T) = x(t), а коэффициенты ряда ak, bk вычисляются по формулам: 1 ak = T bk = 24
1 T
T
∫ x(t ) cos
−T T
∫ x(t )sin
−T
k πt dt, T
k πt dt. T
(8.2)
В частности, при Т=π получаем тригонометрический ряд a0 ∞ x (t ) = + ak cos kt + bk sin kt . 2 k =1
∑
(8.3)
при этом коэффициенты ak, bk будут равны ak = bk =
1 π 1 π
π
∫ x(t ) cos ktdt,
−π π
∫ x(t )sin ktdt.
−π
Если функция x(t) четная, т. е. выполняется равенство x(-t)=x(t), то в (8.1), (8.3) b k =0, а для коэффициента ak получим формулу: T
ak =
2 k πt x(t ) cos dt . T T
∫ 0
Если же функция x(t) нечетная, так что x(-t)=-x(t), то a k =0, а для коэффициента bk получим T
bk =
2 k πt x(t )sin dt . T T
∫ 0
Если функция x(t) задана только в промежутке (0, T), то ее можно продолжить в промежуток (-T, T) четным или нечетным образом и следовательно, представить в виде ряда Фурье только по косинусам a0 ∞ k πt x (t ) = + ak cos 2 k =1 T
∑
или только по синусам x (t ) =
∞
∑ b k sin kTπt . k =1
2.3. Временной ряд как случайный процесс Пусть значение экономического показателя x(t) в любой момент времени t представляет собой случайную величину X(t). Предположим, 25
что случайная величина X (t) является непрерывной. Тогда существует плотность вероятности f (x, t), по которой определяется вероятность случайного события b
P(a < X (t ) < b) = ∫ f ( x, t )dx . a
Рассмотрим также математическое ожидание ∞
µ(t ) = EX (t ) =
∫ xf ( x, t )dx
(9.1)
−∞
и дисперсию ∞
σ2 (t ) = DX (t ) =
∫ [ x − µ(t )]
2
f ( x, t )dx .
(9.2)
−∞
Если плотность вероятности f(x, t)=f(x) не зависит от времени, то математическое ожидание и дисперсия будут постоянными величинами. Рассмотрим два произвольных момента времени t1 и t2. Случайные величины X(t1) и X(t2) характеризуются плотностью совместного распределения вероятностей f(x 1 ,t 1 ;x 2 ,t 2 ). При этом ковариация cov(X(t 1 ),X(t 2 )) вычисляется по формуле cov( X (t1 ), X (t2 )) = E ( X (t1 ) − µ(t1 ))( X (t2 ) − µ(t2 )) = ∞ ∞
=
∫ ∫ ( x1 − µ(t1 ))( x2 − µ(t2 )) f ( x1, t1; x2 , t2 )dx1dx2
.
−∞ −∞
Аналогично рассматривается значение случайного процесса X(t) в трех, четырех и более точках tk, при этом вводится многомерная плотность распределения f(x 1 ,t 1 ; x 2 ,t 2 ; …,x m ,t m ,). Случайный процесс называется стационарным, если при сдвиге по времени на произвольную величину T функция распределения (а значит и плотность) не изменится. В этом случае плотность f(x, t) не зависит от времени: f(x,t) = f(x,t+T) = f(x,0), а двумерная плотность f(x 1 ,t 1 ; x 2 ,t 2 ) зависит от разности τ = t 1 –t 2 . Введя автокорреляционную функцию случайного процесса K(t)=cov(X(t),X(t+t)), можно доказать, что для нее выполняются следующие свойства: 1) K(–τ) = K(τ); 26
2) |K(τ)| ≤ K(0); 3) K (0) = DX. Иногда функцию K(τ) называют автоковариационной, а термин «автокорреляция» связывают с нормированной величиной ρ(τ) = K(τ)/K(0). Напомним, что для стационарного случайного процесса математическое ожидание µ = EX(t) и дисперсия DX = E(X(t) – µ)2 являются постоянными величинами. Если о случайном процессе известно, что EX и DX постоянны, а корреляционная функция зависит только от τ (и не зависит от t), то случайный процесс называется стационарным в широком смысле. Пусть значения временного ряда xt (t = 1, 2,..., n) являются равноотстоящими по времени значениями стационарного случайного процесса X(t) с математическим ожиданием µ = EX(t) и корреляционной функцией K(τ) = E(X(t),X(t+τ)), при этом дисперсия DX = K(0) ≡ σ2. Несмещенной оценкой величины µ является среднее по времени n
∑
1 xt . n t =1
x =
В качестве оценки корреляционной функции K(τ) при τ = 0, 1, 2,..., n–1 принимается величина K τ =
1 n−τ
n −τ
∑ xt xt +τ . t =1
Важной характеристикой стационарного случайного процесса является спектральная плотность ∞
S (ω) =
∫ K ( τ) e
−iωτ
−∞
dτ .
(9.3)
Из (9.3) следует, что 1 K ( τ) = 2π
∞
∫ S (ω)e
−∞
iωt
dω .
Вследствие четности функции K(τ) справедлива формула ∞
∫
S (ω) = 2 K ( τ)cos ωτd τ 0
27
Для S(ω) принимается оценка n −1
S (ω) = 2 ∑ K j cos ωj W j , j =0
где весовые коэффициенты Wj вводятся для сглаживания случайных осцилляций вычисляемых значений S(ω). На практике вычисление корреляционных функций и спектральной плотности выполняется с использованием статистических компьютерных пакетов, например, системы STATISTICA. 2.4. Модели ARIMA В эконометрике анализ временных рядов с использованием оценки спектральной плотности (спектральный анализ) играет, как правило, вспомогательную роль, помогая установить периоды характерных циклов. Наибольшее распространение получили параметрические модели стационарных случайных процессов – модели авторегрессии и скользящего среднего. Пусть Xt – значения стационарного случайного процесса, µ = EXt, xt = Xt – µ. Введем случайный процесс ξ(τ)∈N(0,σ 2 ), для которого Eξt = 0, Dξt = σ2 , Eξtξt–τ = 0 (τ ≠ 0). Случайный процесс ξt будем называть белым шумом. В шкале непрерывного времени ему отвечает обобщенный случайный процесс ξ(t), спектр плотности которого S(τ) = const, при этом корреляционная функция K(τ ) = 0 при τ ≠ 0. При τ = 0 корреляционная функция принимает бесконечно большое значение, точнее, K(τ)=σ 2 δ(τ), где δ(τ) – функция Дирака. Модель авторегрессии – скользящего среднего (АРСС или ARMA, английское – Auto Regression – Moving Average) имеет вид x t +a 1 x t–1 +a 2 x t–2 +….+a m x t–m =ξt +b 1 ξ t–1 +…+b n ξ t–n ,
(10.1)
числа m и n определяют порядок модели ARMA (m,n). Равенство (10.1) можно записать короче, используя оператор сдвига по времени Qξt = ξt–1, Qsξt = ξt–s и операторы-многочлены в (10.1) a(Q)=1+a 1 Q+a 2 Q 2 +…+a m Q m, b(Q)=1+b 1 Q+b 2 Q 2 +…+b n Q n . В этих обозначениях модель (10.1) запишется в виде a(Q)x t = b(Q)ξ t. 28
(10.2)
Рассмотрим важные частные случаи. Модель AR(1) авторегрессии I-го порядка имеет вид (10.3) x t +a 1 x t–1 = ξ t . Этой дискретной статистической модели соответствует дифференциальное уравнение I порядка в шкале непрерывного времени dx + a1 x = ξ(t ) . dt
Модель AR(2) авторегрессии II порядка имеет вид xt+a1xt–1+ a2xt–2= ξt.
(10.4)
Ее аналогом в непрерывной шкале будет дифференциальное уравнение II порядка d 2x dx + a1 + a2 x = ξ(t ) . 2 dt dt Можно показать, что процесс xt, вычисляемый по дискретной модели (10.3), (10.4), будет стационарным при условии, что корни функций комплексного переменного z= x+iy, составленных по правилам ϕ 1 (z)=1+a 1 z для AR(1) и ϕ 2 (z)=1+a 1 z+a 2 z 2 для AR(2), удовлетворяют условию |z| > 1. После замены z=1/ζ получим уравнения
ζ+a 1 = 0; ζ 2 +b 1 ζ+b 2 = 0, корни которых должны лежать внутри круга единичного радиуса |ζ|<1 (иначе процесс не будет стационарным). В общем случае модели ARMA (m,n) условие стационарности |z| > 1 должно выполняться для корней функции ϕ( z ) = 1 +
m
∑ ak z k k =1
При изучении нестационарных временных рядов часто используется более общая модель ARIMA (m,d,n) – модель авторегрессии–проинтегрированного скользящего среднего, в русской аббревиатуре – АРПСС. По сравнению с ранее обсуждавшимися моделями модель ARIMA предполагает d-кратное применение оператора конечных разностей (10.5) xt = yt – yt–1 = (1–Q) yt 29
к исходному временному ряду. Операция (10.5) устраняет линейный тренд. Действительно, если yt = а + bt, то yt–1 = а + b(t–1) и xt = b. Повторяя эту операцию несколько раз, можно получить (с некоторым приближением) стационарный временной ряд, который описывает модель ARMA. При восстановлении исходного ряда производится суммирование его членов, что соответствует интегрированию в непрерывном времени. Последнее обстоятельство проясняет смысл названия модели ARIMA. 2.5. Учет сезонных составляющих Обобщение модели ARIMA, позволяющее учесть периодические (сезонные) составляющие временного ряда, было предложено Дж. Боксом и Г. Дженкинсом [2]. Этот метод реализован в системе статистической обработки данных STATISTICA, поэтому мы коротко его опишем. Пусть ряд xt имеет период S, так, что xt = xt–s. Модель Бокса-Дженкинса имеет вид (11.1) A(Q S )∇ D S x t =B(Q S )ζ t a(Q)∇ d x t =b(Q)ξ t ,
(11.2)
где Q S x t = xt–s , ∇ S xt = xt –x t–s = (1–Q S )x t , A(Q)=1+A 1 Q+A 2 Q 2 +…A M Q M B(Q)=1+B 1 Q+B 2 Q 2 +…B N Q N Из формул (11.1), (11.2) видно, что модели характеризуются двумя тройками чисел (M,D,N) и (m,d,n). Ряд ζt введен для удобства, в принципе его можно исключить. Например, пусть M=m=0, N=n=1, D=d=1, S=12. Модель (11.1), (11.2) примет вид ∇ 12 x t =ζ t +B 1 ζ t–12 , ∇ζ t = ξ t +b 1 ξ t–1 .
(11.3)
Но ∇ 12 x t =x t –x t–12 , ∇ζ t =ζ t –ζ t–1 . Поэтому x t –x t–12 =ζ t +B 1 ζ t–12 x t–1 –x t–13 = ζ t–1 +B 1 ζ t–13 Теперь вычтем (11.5) из равенства (11.4): x t –x t–12 –x t–1 +x t–13 =ζ t –ζ t–1 +B 1 (ζ t–12 –ζ t–13 ). 30
(11.4) (11.5)
Используя формулу (11.3), получим окончательно x t – x t–12 – x t–1 + x t–13 =ξ t + b 1 ξ t–1 + B 1 (ξ t–12 + b 1 ξ t–13 ). Коэффициенты b1, B1 можно подобрать по данным xt. В примере, приведенном в книге [2], оказалось, что b1 = – 0,4; B1 = – 0,6.
31
3. ОЦЕНКА КАЧЕСТВА СПЕЦИФИКАЦИИ МОДЕЛИ 3.1. Анализ погрешностей исходной информации Значения экономических показателей обычно известны неточно, с некоторой погрешностью. Рассмотрим основные правила обработки данных, содержащих погрешности, или ошибки измерений. Пусть число a представляет точное (неизвестное нам) значение некоторой величины, а xi (i=1,2,…, n) – известные приближенные значения той же величины, при этом (12.1) xi = a+ε i, где εi – погрешность i-го измерения. Значения погрешностей ε i нам неизвестны, так как неизвестно точное значение a, но, как правило, удается оценить модуль разности (12.2) | xi –a| < ε. Величину ε > 0 называют предельной абсолютной погрешностью, или короче, абсолютной погрешностью. Если a≠0, то можно ввести относительную погрешность δ=ε/|a|. На практике величину относительной погрешности вычисляют по формуле δ=ε/| x |, полагая x=
n
∑
1 xi . n i =1
(12.3)
Принято использовать запись a=x±ε как условную запись неравенства x–ε
Различают погрешности (ошибки) систематические и случайные. Если часы спешат или отстают, то они показывают время с некоторой систематической ошибкой. Для ее устранения нужно узнать точное время и поставить часы по эталону. В общем случае для устранения систематической ошибки либо заменяют измерительный прибор на более точный, либо вводят поправку на систематическую ошибку (в астрономии, навигации и т. п.). Анализ случайных ошибок проводится с применением методов теории вероятности и математической статистики. Пусть величина ε i в равенстве (12.1) является случайной величиной, распределенной по нормальному закону с математическим ожиданием Eεi = 0 и дисперсией Dε i = σ 2 , что принято записывать как εi ∈ N(0,σ2). Измеренные значения xi также являются случайными величинами, при этом Ex i =a, Dx i =σ 2 . Интуиция подсказывает нам, что среднее арифметическое (12.3) является лучшей оценкой для величины a, чем отдельные наблюдения xi. Действительно, Ex = a – оценка является неσ2 при n→∞ стремится к нулю. n 2 Величину дисперсии измерений σ можно оценить по данным xi известными формулами
смещенной, а дисперсия среднего Dx =
S x2 =
n
∑
1 ( xi − x )2 n i =1
(12.5)
или S x2 =
n
∑
1 ( xi − x )2 n − 1 i =1
(12.6)
При этом оценка (12.5) является смещенной оценкой дисперсии σ2, n −1 2 σ . Оценка (12.6) несмещентак как известно [3], что ES x2 = n 1 ная: ES x2 = σ2 . В теории ошибок величину S x = ∑ ( xi − x )2 назыn −1 вают средней квадратичной ошибкой серии наблюдений {xi}, а величину S x =
Sx 1 = (n − 1)n n
∑ ( xi − x )2
– средней квадратичной ошибкой
среднего арифметического. 33
3.2. Доверительные интервалы Введем случайную величину x −a n. σ Нетрудно проверить, что ξ ∈ N(0,1), вследствие чего ξ=
(13.1)
k
P( ξ < k ) =
∫
2 1 e − x / 2 dx . 2π − k
Полагая P( ξ < k ) = α , получим после элементарных преобразований, что с вероятностью α выполняется неравенство x −k
σ σ
(13.2)
Интервал ( x − k σ , x + k σ ) называется доверительным интерваn n лом, отвечающим доверительной вероятности α. Если, к примеру, k = 2, доверительная вероятность α=0,955. Значению k = 3 отвечает вероятность α=0,997 (правило «трех сигм»). Но для использования указанных доверительных интервалов на практике нужно знать стандартное отклонение σ. Если значение σ неизвестно, для его оценки используется величина S x . В этом случае можно ввести случайную величину η=
x −a x −a n= n −1 , Sx Sx
которая имеет распределение Стьюдента с n–1 степенью свободы [3]. Не выписывая здесь соответствующей функции распределения, приведем несколько значений доверительной вероятности α(k,n), отвечающих доверительному интервалу Sx S
34
Регрессионные модели мы строим по данным наблюдениям (xi,yi), i=1, 2,..., n. Пусть значения x = x ∗ не совпадают с xi. Чему будет равна величина y = y ∗ и с какой погрешностью ее можно найти? Попытаемся ответить на этот вопрос для случая парной линейной регрессии с нулевым свободным членом yi = bxi + εi, где ε i ∈ N(0,σ), i=1, 2,..., n. Параметр b оцениваем методом наименьших квадратов:
Σε = Σ(bx – y ) → min, Σ(bx – y )x = 0, 2 i
i
i
b =
i
i
2
i
∑ xi yi . ∑ xi2
(13.4)
Из формулы (13.4) следует, что оценка b является гауссовой случайной величиной с математическим ожиданием E b =
∑ xi Eyi = ∑ xibyi ∑ xi2 ∑ xi2
= b.
(оценка несмещенная) и дисперсией D b =
(
1 xi2 ) 2
∑
∑
σ2 . xi2
xi2 σ2 =
(13.5)
∑
Величина σ2, как правило, неизвестна и ее следует оценить. Для этого составим сумму квадратов ошибок
Σε = Σ(bx – y ) = Σ(bx – b x + b x – y ) = = Σx (b– b ) + Σ( b x –y ) + 2Σx (b– b )( b x – y ). Математическое ожидание EΣε = ΣЕε = nσ . 2 i
2 i
i
2
i
2
i
i
i
2 i
2
i
i
i
2 i
i
i
2
i
(13.6)
2
Вычисление математического ожидания в правой части равенства (13.6) дает 35
Σx D b +EΣ( b x –y ) , 2 i
i
2
i
так как математическое ожидание последнего слагаемого равно нулю. Поэтому nσ 2 =
Σx
i
2 D b +E
Σ( b x –y ) . i
i
2
С учетом формулы (13.5) получим (n–1)σ 2 = E
Σ( b x –y ) i
i
2.
Теперь ясно, что величина
Σ
1 ( b x i –y i ) 2 (13.7) n −1 будет несмещенной оценкой для σ2. Множитель (n–1) указывает на то, что, располагая только одним наблюдением (x1, y1), нельзя получить оценку S 2, так как возникает неопределенность вида 0/0. Для определения доверительного интервала оценки b , отвечающего доверительной вероятности α, рассмотрим случайную величину
S2 =
ξ = (b – b )
∑ xi2
η = (b – b )
∑ xi2
, σ имеющую нормальное распределение N(0,1). Заменив σ оценкой S, придем к случайной величине , S имеющей распределение Стьюдента с (n–1) степенями свободы. Для прогнозируемого значения y* регрессионная модель дает значение y* = b x* + ε, при этом
Ey * = bx * ,
Dy *
= (x * ) 2 D b +Dε
( x* ) 2
=
у2
∑
Заменим дисперсию σ2 оценкой S2 из (13.7): ( x* ) 2 + 1 . (S y * ) 2 = S 2 xi2
∑
36
+ 1 . xi2
Доверительный интервал для прогнозируемых величин y* будет определяться распределением Стьюдента. Его границы вычисляются по формуле y = y* ± Sy*t (n – 1, 1 – α/2), где α – доверительная вероятность (например, α = 0,95), (n–1) – число степеней свободы. Статистические пакеты вычисляют эти границы и дают их графическое представление. Совершенно аналогично рассматривается общий случай множественной линейной регрессии y = Fθ + ε. Можно показать, что Dy ∗ =(x ∗ ) T Θ x ∗ +σ 2 , где x i =(x 1 ,x 2 ,...x n ) ∗ ; Θ=covθ=σ 2 (F T F) –1 . Поэтому Dy * =σ 2 [(x * ) T (F T F) –1 x * +1]. Несмещенной оценкой для σ2 является число
1 )2 . ( yi − a − bx i ∑ n−m Поэтому оценка среднеквадратичного отклонения y* будет S2 =
(13.8)
S y * = S[(x * ) T (F T F) –1 x * +1] 1/2 , а граница доверительного интервала y = y * ± S y * t(n–m, 1– α/2). 3.3. Расчет погрешностей Эмпирические данные часто подвергаются математической обработке – над ними выполняются арифметические операции сложения, вычитания, умножения и деления, в некоторых случаях производится логарифмирование, возведение в степень и др. Как это может сказаться на погрешности результата? Покажем, что абсолютная погрешность суммы не превосходит суммы абсолютных погрешностей слагаемых. Пусть S = x+y, причем слагаемые x, y известны с абсолютной погрешностью εx, εy, так что x − a ≤ εx , y − b ≤ ε y , 37
где a и b – точные значения слагаемых. Для вычисления абсолютной погрешности суммы S оценим разность x + y − ( a + b) = ( x − a ) + ( y − b) ≤ x − a + y − b ≤ ε x + ε y .
Ясно, что в качестве предельной абсолютной погрешности суммы можно принять величину (14.1) εS = εx+εy. Аналогично проверяется, что абсолютная погрешность разности двух чисел d = x – y равна сумме абсолютных погрешностей уменьшаемого и вычитаемого: εd = εx+ εy. Заметим, что если числа x и y мало отличаются между собой, относительная погрешность их разности δd = εd / |x – y| может оказаться весьма большой. При вычислении суммы S=x1+x2+…+xn большого числа слагаемых, имеющих одинаковую абсолютную погрешность ε, в соответствии с формулой (14.1) имеем εS = nε.
(14.2)
При n>>1 величина εS может оказаться довольно большой. Но эта оценка получается в предположении, что ошибки всех слагаемых максимальны и имеют одинаковый знак, что представляется мало вероятным. Более естественным выглядит предположение, что ошибка ε является случайной и распределена по нормальному закону ε ∈ N (0, σ2x ) , причем ошибки отдельных слагаемых являются независимыми случайными величинами. По правилу вычисления дисперсии суммы независимых случайных величин находим, что: DS = nDxi
или σ2S = nσ2x , так что σ S = σ x n . При больших n (например, n=100) статистическая оценка дает значительно меньшее значение, чем предельная (14.2). Напомним, что отклонение случайной величины S от истинного значения более чем на 2σS возможно с вероятностью 0,045 (4,5%), а на 3σS – с вероятностью 0,003 или 0,3%. Для вычисления погрешности произведения и частного двух положительных чисел x, y рассмотрим сначала общий случай функции двух переменных u=f(x,y) (аналогично рассматривается случай функций мно38
гих переменных). Пусть переменная x известна с погрешностью εx, переменная y – с погрешностью εy. Приращение функции ∆u заменим дифференциалом du =
∂f ∂f dx + dy , ∂x ∂y
(14.3)
полагая величины εx и εy достаточно малыми. Отсюда следует, что абсолютная погрешность εu функции u оценивается по формуле εu =
∂f ∂f εx + εy . ∂x ∂y
(14.4)
В статистической теории предполагают ошибки εx и εy независимыми случайными величинами. Для дисперсии величины du имеем формулу σu2 =
2
2
∂f ∂f σ2x + σ2y . ∂x ∂y
(14.5)
В случае произведения двух положительных чисел u = xy формула (14.4) дает оценку εu = y ε x + xε y ,
(14.6)
σu2 = y 2 σ2x + x 2 σ2y .
(14.7)
а по формуле (14.5) получим Для относительной погрешности произведения δ u = ε u /xy из формулы (14.6) следует, что δ u =δ x +δ y ,
(14.8)
δu = δ2x + δ2y .
(14.9)
а из формулы (14.7):
Пусть надо перемножить n положительных чисел x1, x2, …, xn, заданных с одинаковой относительной погрешностью δ. Формула (14.8) дает оценку δu= nδ, а по формуле (14.9) получаем δu = δ n . Нетрудно убедиться в том, что для относительной погрешности частного U=x/y двух положительных чисел x, y также справедливы формулы (14.8) и (14.9). 39
Если требуется найти значение функции U = f(x) одной переменной x, то вместо формулы (14.3) имеем (в первом приближении) du = f ′( x )dx , так что εu = f ′( x ) ε x . Такой же результат следует из статистического анализа: σu = f ′( x ) σ x .
3.4. Коэффициент детерминации Коэффициент детерминации R 2 характеризует качество регрессионной модели. Значения различных величин, полученных расчетами, будем в дальнейшем обозначать «~». . Имеет место раРассмотрим случай парной регрессии y i = a + bx i венство yi − y = yi − y i + y i − y . Для суммы квадратов отклонений yi от среднего y TSS =
n
∑ ( yi − y )2
(TSS – total sum of squares) имеем TSS =
i =1 n
RSS+ESS, где RSS =
∑ ( yi − y )2 – сумма квадратов отклонений, объясi =1
ненная регрессией (RSS — regression sum of squares); ESS =
n
∑ ( yi − yi )2 i =1
– остаточная сумма квадратов отклонений (ESS – error sum of squares). Коэффициент детерминации определяется по формуле. R2 =
RSS ESS = 1− . TSS TSS
(15.1)
Из (15.1) видно, что R2∈[0,1] и чем меньше R2 отличается от 1, тем лучше регрессионная модель. В математической статистике вводится выборочный коэффициент корреляции r = Напомним, что S x2 =
1 n
C xy Sx S y
∑ ( xi − x )2 = n1 ∑ xi2 − x 2 , C xy =
40
между данными наблюдений (xi, yi), i=1, 2, …, n.
S 2y =
1 n
∑ ( yi − y )2 = n1 ∑ yi2 − y 2 ,
1 1 ( xi − x )( yi − y ) = ∑ xi yi − xy . ∑ n n
C S Поскольку b = xy , величину r можно представить в виде r = b x . 2 Sy Sx , y = a + bx , откуда следует, что С другой стороны, y i = a + bx i RSS =
n
∑ ( yi − y ) 2 = b 2 ∑ ( xi − x )2 = nb 2 S 2x . i =1
Поэтому R 2 =
2 2 RSS nb S x = = r 2 , т. е. коэффициент детерминации 2 TSS nS y
равен квадрату выборочного коэффициента корреляции. 3.5. Средняя ошибка аппроксимации Фактические значения интересующей нас величины отличаются от рассчитанных по уравнению регрессии. Чем меньше это отличие, чем ближе рассчитанные значения подходят к эмпирическим данным, тем лучше качество модели. Величина отклонений фактических и расчетных значений переменной величины по каждому наблюдению представляет собой ошибку аппроксимации. Поскольку отклонение может быть величиной как положительной, так и отрицательной, то ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю. Отклонения ( y − y x ) рассматриваются как абсолютная ошибка аппроксимации, тогда
y − y x × 100 – относительная ошибка аппроксиy
мации. Средняя ошибка аппроксимации определяется как среднее арифметическое A = 1 n
∑
( y − y x ) × 100 . Иногда пользуются определением y
средней ошибки аппроксимации, имеющим вид A =
100 y
∑ ( y − y x )2 . n
41
3.6. Принцип максимального правдоподобия. Построение регрессионных моделей при гетероскедастичности ошибок Для нахождения неизвестных величин по результатам измерений, содержащих случайные погрешности, служит метод наименьших квадратов (МНК). Определяемые величины обычно связаны уравнениями, образующими избыточную систему. Метод наименьших квадратов строит оценки на основе минимизации суммы квадратов остатков. Для его применения необходимо выполнение следующих пяти условий: – случайный характер остатков; – нулевая средняя величина остатков, не зависящих от независимой переменной; – гомоскедастичность – дисперсия каждого отклонения ei одинакова для всех значений переменной; отсутствие автокорреляции остатков; Значения εi распределены независимо друг от друга; – остатки подчиняются нормальному распределению. Для возможности применения МНК необходимо проверить характер остатков εi по всем пяти условиям. Если величины εi являются случайными величинами, распределенными по нормальному закону – ε i ∈N(0,σ 2 ), так что Eε i = 0, Dε i = σ 2 и некоррелированы – cov(ε i ,ε j )=0 (i ≠ j), а значит, и независимы, то можно применить МНК. Постоянство σ2 для всех εi означает равноточность задания величины yi; величины xi мы считаем заданными точно. Свойство равноточности измерения yi иначе называется гомоскедастичностью. Если же Dεi = σi2 и σi различны, то говорят о гетероскедастичности регрессионной модели. Пусть эмпирические данные наблюдений (x1, x2, …, xn) характеризуют случайную величину x∈N(µ, σ2), для которой математическое ожидание µ=Ex и дисперсия σ2=Dx неизвестны и их требуется оценить. Выпишем функции плотности нормального распределения ( x −µ )2
− 2 1 f ( x ) ≡ f ( x; µ, σ2 ) = e 2σ . Согласно принципу максимального σ 2π правдоподобия предполагаем, что функция L= f(x1)f(x2)…f(xn) принима-
42
ет наибольшее значение при истинных значениях параметров µ и σ2. Удобнее иметь дело с ln L =
n
∑ ln f ( xi ) → max . i =1
В нашем примере ln f ( xi ) = − 1 ln σ2 − 1 2 ( xi − µ)2 + const , поэтому 2 2σ n 1 ln L = − ln σ2 − 2 2 2σ
n
∑ ( xi − µ)2 + const. i =1
Выпишем необходимые условия экстремума функции ln L (и L): ∂ ln L = 0, ∂µ
∂ ln L = 0. ∂σ2
Решение этой системы уравнений после простых преобразований приводит к оценкам
1 µ = ∑ xi = x , n 1 σ 2 = ∑ ( xi − µ)2 = S x2 . n Заметим, что n − 1 2 , lim ES 2 = σ2 . σ x n →∞ n Пример показывает, что принцип максимального правдоподобия не обязательно приводит к несмещенной оценке искомых параметров. Воспользуемся принципом максимального правдоподобия для анализа гетероскедастичности. В этом случае модель парной линейной регрессии имеет вид y i = a+ bxi+ εi, где Eεi = 0, Dεi = σi2, так что ε i ∈N(0, σ i 2 ). Соответствующие плотности вероятностей ES x2 =
f (εi ;0, σi 2 ) =
1 e σi 2 π
ε2 − i 2 2σi
. Логарифмическая функция правдоподобия
43
ln L = −
n
∑
ln σi −
i =1
εi2 → max . 2 i =1 2σi n
∑
Теперь ясно, как модифицировать МНК в случае гетероскедастичности ошибки εi: n
ε2
i=1
i
∑ σi2 → min . В случае гомоскедастичности дисперсии σi равны и мы получаем классическую формулировку МНК. Часто вводятся веса наблюдений Wi = λσi−2 , при этом число λ выбирается так, чтобы веса наблюдений были целыми числами. МНК сводится к минимизации взвешенных сумм квадратов: n
∑Wi ( yi − a − bxi )2 → min . i =1
3.7. Статистические гипотезы В предыдущих подразделах рассматривалась методика моделирования взаимосвязей экономических показателей и процессов. С помощью полученных уравнений регрессии моделировалась эта связь. Качество выбранной модели оценивалось коэффициентом детерминации; ее соответствие фактической, реально существующей связи, – коэффициентом аппроксимации. Эти оценки необходимо дополнить оценкой значимости полученной модели в целом и отдельных ее параметров. Оценка значимости модели в целом производится с помощью F–критерия Фишера, а отдельных ее параметров – посредством t–критерия Стьюдента. Для получения искомых оценок формулируются и проверяются статистические гипотезы: основная или нулевая гипотеза (обозначается Н0) и альтернативная Н1. Суть нулевой гипотезы заключается в том, что делается предположение об отсутствии связи между рассматриваемыми экономическими показателями или явлениями, т. е. о несущественности рассматриваемой связи. Альтернативная гипотеза Н1 утверждает наличие связи между анализируемыми величинами и явлениями. По оценке «истинности» или «ложности» нулевой гипотезы делается вывод о значимости модели. 44
Нулевая гипотеза (Н0)
ложна
истинна
Принимается
Отвергается
Принимается
Ошибка 1- го рода
Ошибка 2-го рода
Отвергается
Рис. 8. Схема вариантов нулевой гипотезы
Как уже отмечалось, количественные оценки исходной информации носят случайный характер и, следовательно, параметры разработанных моделей носят элементы случайности. В связи с этим «истинность» или «ложность» нулевой гипотезы может быть принята лишь с определенной степенью вероятности. Вероятность отвергнуть правильную гипотезу, т. е. совершить ошибку 1-го рода, называется уровнем значимости нулевой гипотезы, обозначается α и обычно принимается равной 0,05 или 0,01. Если нулевая гипотеза «ложна», но принимается, то совершается ошибка 2-го рода, вероятность которой обозначается β. Число (1–β) называется мощностью критерия, являясь вероятностью того, что справедлива альтернативная гипотеза Н1. Схема возможных вариантов осуществления метода нулевой гипотезы приведена на рис. 8. 3.8. F-статистика Значимость регрессионной модели определяется с помощью F-критерия Фишера. Для этого вычисляется отношение F =
RSS / m R2 = ESS /(n − m − 1) 1 − R2
(n − m − 1) , m
(19.1)
45
где n – число парных наблюдений; m – число независимых переменных xi; R2 – коэффициент детерминации; RSS – сумма квадратов отклонений yi от среднего y , объясненная регрессией; ESS – остаточная сумма квадратов отклонений (см. подразд. 3.4). Для парной регрессии m = 1, поэтому формула (19.1) примет вид: RSS /1 R2 (n − 2) . = (19.2) ESS /(n − 1 − 1) 1 − R 2 Можно сказать, что F-критерий определяет отношение факторной и остаточной дисперсии, рассчитанных на одну степень свободы. Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии мало отличаются друг от друга. Для опровержения нулевой гипотезы необходимо, чтобы факторная дисперсия превышала остаточную в несколько раз. Величина F имеет распределение Фишера с ν1 = m и ν2 = n–m–1 степенями свободы [3]. Задавая уровень значимости α (в частности, принимая α=0,05) и находя из таблиц или с помощью пакетов EXCEL, STATISTICA и др. величину Fтабл (ν1, ν2, α), сравниваем F и Fтабл. Табличное значение Fтабл (критерия) – это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении для данного уровня вероятности и при условии, что нулевая гипотеза справедлива. Если F >Fтабл, то уровень регрессии признается статистически значимым и нулевая гипотеза отвергается. Если же F < Fтабл, то нулевая гипотеза принимается, т. е. зависимость между x и y признается несущественной. F=
3.9. t-статистика Для оценки значимости отдельных параметров регрессионной модели y = a + bx + ε их величина сравнивается с их стандартной ошибкой. При этом рассчитывается так называемый t-критерий Стьюдента
tb =
b a r , ta = , t r = , sb sa sr
(20.1)
где a, b – параметры модели; σa, sb – ошибки параметров; r – линейный коэффициент корреляции; σr – ошибка линейного коэффициента корреляции. Значение t-критерия сравнивается с табличным значением при определенном уровне α и числом степеней свободы. 46
Ошибки параметров модели определяются по следующим формулам: sa =
∑ ( yi − yi ) /(n − 2) ∑ xi 2 / n ∑ ( xi − x )2 sb =
∑ ( yi − yi ) /(n − 2) ∑ ( xi − x )2
=
=
∑
S 2 ∑ xi 2 / n
∑ ( xi − x )2 S2 , ( xi − x )2
, (20.2)
(20.3)
где S2 – оценка (13.8) при m = 2. Ошибка линейного коэффициента корреляции r, введенного в подразд. 3.4, определяется по формуле
1 − r2 . (20.4) n−2 По формулам (20.1) – (20.4) рассчитываются значения t-критерия. Величины t имеют распределение Стьюдента. Задавая уровень значимости α при числе степеней свободы ν = n – 2 и находя из таблиц или с помощью пакетов EXCEL, STATISTICA и т. п. величину tтабл(ν, α), сравниваем t и tтабл. Если t > tтабл, то соответствующий параметр признается статистически значимым (при уровне ошибки α) и нулевая гипотеза, утверждающая, что данный параметр равен нулю, отвергается. Если же t < tтабл, то нулевая гипотеза принимается, т. е. значимость данного параметра несущественна. sr =
47
ОГЛАВЛЕНИЕ Ппредисловие .......................................................................................... Введение ................................................................................................... 1. АНАЛИЗ ДАННЫХ ............................................................................ 1.1. Состав исходной информации ................................................ 1.2. Интерполяционный полином Лагранжа ................................ 1.3. Парная линейная регрессия. Метод наименьших квадратов 1.4. Множественная линейная регрессия ...................................... 1.5. Нелинейные модели ................................................................. 1.6. Системы одновременных эконометрических уравнений ..... 2. ВРЕМЕННЫЕ РЯДЫ ......................................................................... 2.1. Составляющие временного ряда ............................................. 2.2. Определение составляющих временного ряда ...................... 2.3. Временной ряд как случайный процесс ................................ 2.4. Модели ARIMA ......................................................................... 2.5. Учет сезонных составляющих ................................................. 3. ОЦЕНКА КАЧЕСТВА СПЕЦИФИКАЦИИ МОДЕЛИ .................... 3.1. Анализ погрешностей исходной информации ...................... 3.2. Доверительные интервалы ...................................................... 3.3. Расчет погрешностей ............................................................... 3.4. Коэффициент детерминации ................................................... 3.5. Средняя ошибка аппроксимации ............................................ 3.6. Принцип максимального правдоподобия. Построение регрессионных моделей при гетероскедастичности ошибок ....................................................................................... 3.7. Статистические гипотезы ........................................................ 3.8. F-статистика .............................................................................. 3.9. t-статистика ............................................................................... Библиографический список ...................................................................
48
3 5 10 10 11 13 15 19 20 23 23 24 25 28 30 32 32 34 37 40 41
42 44 45 46 47