Слайд 2
Как правило независимые переменные имеют непрерывные
области измерения (возраст, стаж, денежные доходы, уровень безработицы).
Однако, существуют переменные которые могут принимать два значения или в общем случае дискретное множество значений.
Слайд 3
Необходимость в таких переменных возникает в
тех случаях, когда требуется учесть влияние качественных признаков (пол,
национальность, уровень образования и т.д).
Слайд 4
Для того чтобы вести такие переменные в регрессионную
модель, им должны быть присвоены те или иные цифровые
метки, т.е. качественные переменные необходимо преобразовать в количественные.
Слайд 5
Такого вида сконструированные переменные в эконометрике принято называть
фиктивными переменными.
Например, рассмотрим модель формирования заработной платы (Y) от
количества отработанных часов (X1) и стажа работы (X2).
Слайд 6
Зависит ли заработная плата от пола работника?
Слайд 7
На практике используется два метода моделирования:
Регрессия строится для
каждой качественно отличной группы единиц совокупности, т.е. для каждой
группы в отдельности;
Слайд 8
2. Общая регрессионная модель строится для совокупности в
целом. В этом случае в регрессионную модель вводятся фиктивные
переменные, т.е. строится модель с переменной структурой.
Слайд 9
В английской литературе такие переменные называют
dummy – фиктивная переменная (косвенным образом придает количественное значение
качественным признакам).
Слайд 10
Ведем переменную d1, присвоив ей значения
по следующему правилу:
d1 = 1, если работник мужчина;
d1 =
0, если работник женщина;
Слайд 11
Тогда ожидаемое значение заработной платы при одинаковых значениях
количества отработанных часов и стажа будет:
Для мужчин
Слайд 12
Для женщин:
Заработная плата мужчин и женщин отличается на
величину γ.
Слайд 13
Проверив с помощью t-статистики значимость коэффициентов регрессии, можно
определить, имеет ли место дискриминация по половому признаку.
Слайд 14
Если коэффициент γ статистически значим, то очевидно, что
есть различия в оплате труда мужчин и женщин при
прочих равных условиях. Если этот коэффициент положителен, то дискриминация в пользу мужчин, если отрицателен – в пользу женщин.
Слайд 15
Стандартные гипотезы в данном случае имеют следующий смысл:
– дискриминация присутствует.
– на рынке труда нет дискриминации.
Слайд 16
Переменные такого типа во всем остальном не отличаются
от обычных непрерывных регрессоров для оценивания уравнения с фиктивными
переменными МНК коэффициент при фиктивной переменной интерпретируются также как и при остальных регрессорах.
Слайд 17
Способ задания значений переменной не влияет на результаты
оценивания, т.к. направление влияния данного признака отражает значение коэффициента.
Такая
модель называется «Модель с переменной структурой».
Слайд 18
Качественные различия можно формализовать с помощью любой переменной
принимающей два значения не обязательно 0 и 1.
Слайд 19
Однако, в эконометрической практики почти всегда используют фиктивные
переменные типа 0 и 1 т.к. в этом случае
интерпретация выглядит наиболее наглядно.
Слайд 20
Введем в первоначальную модель еще одну фиктивную переменную,
отражающую влияние образования на заработную плату:
Слайд 21
d2=1 – высшее образование;
d2=2 – среднее специальное образование;
d2=3
– бакалавр;
d2=4 – магистр;
d2 =0 - общее среднее образование.
Слайд 22
Если включаемый в рассмотрение качественный признак имеет не
два, а несколько значений, то можно было бы ввести
дискретную переменную, принимающее такое же значение, но в этом случае трудно дать содержательную интерпретацию соответствующему коэффициенту.
Слайд 23
На практике в таких случаях используют набор бинарных
фиктивных переменных.
Рассмотрим пример: необходимо оценить влияние времени года на
потребление некоторого товара.
Слайд 24
у – объем потребления некоторого продукта в месяц,
кг.
d1=1, если зима;
d1=0, в противном случае (любое другое
время года);
d2 =1, если весна;
d2 = 0, в противном случае;
d3= 1, если лето;
d3 = 0, в противном случае.
Слайд 25
Одна категория должна отсутствовать потому что она эталонная.
Мы
не вводим 4-у бинарную переменную для осени потому что
в этом случае выполнялось бы тождество d1+d2+d3+d4=1 что означает линейную зависимость регрессоров и невозможность нахождения оценок по МНК.
Слайд 26
Среднемесячный объем потребления в осенние месяцы есть величина
α
Для зимних месяцев объем потребления составляет α+ δ1, для
весенних α+ δ2, для летних α+ δ3
Т.о. оценки коэффициент δ показывают среднее отклонение в объеме потребления по сравнению с осенними месяцами
Но:α=δ1 потребление осенью равно зимой или Но: δ1= δ2
Слайд 27
Фиктивные переменные позволяют строить и оценивать так называемые
кусочно-линейные модели, которые можно применять для исследования структурных изменений.
Рассмотрим
пример.
Пусть у – зависимая перееменная и для простоты в модель включена только 1 независимая переменная х. х и у представлены в виде временных рядов.
xt – размер ОПФ в период времени t,
уt – объем продукции в t.
Слайд 28
Из некоторых априорных соображений исследователь считает, что в
момент времени tо произошла структурная перестановка и линия регрессии
будет отличаться от той которая была до момента tо, но общая регрессия будет непрерывна.
Слайд 29
Введем дискретную переменную rt = 0, если t
≤ to
и rt = 1, если t >
to
отсюда следует, что регрессионная линия (рис) имеет коэффициент наклона β1 для t ≤ to и наклон β1+β2 для t > to. При этом разрыва в точке to не происходит.