Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Тема 2. Парная линейная регрессионная модель

Содержание

Две переменные X и Y
Тема 2. Парная линейная регрессионная модельПЛРМ Две переменные X и Y Функциональная зависимость Независимость Статистическая зависимостьЕсли при изменении X меняется закон распределения случайной величины Y, то Статистическая зависимостьЗдесь будет красивый рисунок (когда-нибудь) Статистическая зависимостьСтатистическая зависимость называется корреляционной, если при изменении X меняется математическое ожидание Корреляция Корреляция Гетероскедастичность Гетероскедастичность Корреляция и гетероскедастичность Корреляция и гетероскедастичность Корреляционная зависимостьЕсли каждому значению величины X соответствует свое значение то говорят, что Случайная составляющаяОтклонение переменной Y от математического ожидания для соответствующего значения переменной X Регрессионное уравнениеУравнениеназывается уравнением регрессии переменной Y на переменную X Компоненты Y Экономический смысл невключение объясняющих переменных в уравнение. На самом деле на переменную Экономический смысл  (продолжение)Неправильная функциональная спецификация. Функциональное соотношение между Y и Х Способы определения регрессионной функции f(X) параметрический – предполагаем, что вид регрессионной функции Выбор вида f(X)экономическая теорияопыт, интуиция исследователяэмпирический анализ данных Эмпирический анализ данныхВ парном случае материал наблюдений представляет собой набор пар чисел: . На плоскости каждому такому наблюдению соответствует точка:Полученный график называют облако наблюдений, поле Линейная    Y=+X+. Квадратичная Показательная Степенная Гиперболическая X и Y независимы Парная линейная регрессионная модель Y=+X+. Выбор коэффициентов регрессионной прямойИз всех возможных прямых мы хотим выбрать ту, чтобы Выбор коэффициентов регрессионной прямойβ – коэффициент наклона (slope),α – свободный коэффициент (intercept) Истинная линия регрессии, определяемая коэффициентами α и β Точки наблюдений разбросаны вокруг этой линии. Их бесконечность. В выборку попадает только их часть В выборку попадает только их часть И что мы наблюдаем Всего мы наблюдаем N точек Линия, которую мы проводим Линия, которую мы проводимПроводим прямую через центр скопления точек облака наблюдений, т. Реальные и прогнозные значения Разницу между реальным и прогнозным значением назовем остатком Рассмотрение остатков на графике Истинная и оцененная линия регрессииМы надеемся, что построенная линия регрессии не очень Грусть печальМетод наименьших квадратов не всегда состоятельный Как найти «наилучшую» прямую аналитически?Выберем меру близости одной точки к прямой.Построим интегральную Мера близости одной точки к прямой – остаток. Интегральная мера близости Интегральная мера близостипочему бы не минимизировать просто сумму остатков? Для какой прямой сумма остатков равна 0? для такой и для такой Метод наименьших квадратовСреди всех возможных прямых выбираем ту, для которой сумма квадратов остатков минимальна Минимизация или Система нормальных уравнений МНК-коэффициенты ПЛРМ- коэффициент наклона- свободный коэффициент Другие формы записи коэффициента наклона ЗамечанияЛиния регрессии проходит через точку Мы предполагаем, что среди Xi есть разные, Теснота линейной корреляционной связиВ качестве меры близости данных наблюдений к линии регрессии Вспомним теоретический коэффициент корреляции Связь между коэффициентом корреляции и коэффициентом наклонаЗнак коэффициента наклона линии регрессии и коэффициента корреляции совпадают Положительная корреляцияС ростом переменной X переменная Y в среднем растет (имеет тенденцию к росту) Отрицательная корреляцияС ростом переменной X переменная Y в среднем убывает (имеет тенденцию к уменьшению) Свойства коэффициента корреляции Свойства коэффициента корреляции (продолжение)переменные не связаны линейной корреляционной связью. Линия регрессии проходит Уравнение одно, коэффициенты корреляции разные Вопросы для самопроверкиЧто такое функциональная зависимость между переменными.Что такое статистическая зависимость.Что такое
Слайды презентации

Слайд 2 Две переменные X и Y

Две переменные X и Y

Слайд 3 Функциональная зависимость

Функциональная зависимость

Слайд 4 Независимость

Независимость

Слайд 5 Статистическая зависимость
Если при изменении X меняется закон распределения

Статистическая зависимостьЕсли при изменении X меняется закон распределения случайной величины Y,

случайной величины Y, то говорят, что величины (X,Y) связаны

статистической зависимостью.

Слайд 6 Статистическая зависимость
Здесь будет красивый рисунок (когда-нибудь)

Статистическая зависимостьЗдесь будет красивый рисунок (когда-нибудь)

Слайд 7 Статистическая зависимость
Статистическая зависимость называется корреляционной, если при изменении

Статистическая зависимостьСтатистическая зависимость называется корреляционной, если при изменении X меняется математическое

X меняется математическое ожидание случайной величины Y.
Если при

изменении переменной X меняется дисперсия переменной Y, такую зависимость называют гетероскедастичностью.
Корреляция и гетерокедастичность могут наблюдаться одновременно


Слайд 8 Корреляция

Корреляция

Слайд 9 Корреляция

Корреляция

Слайд 10 Гетероскедастичность

Гетероскедастичность

Слайд 11 Гетероскедастичность

Гетероскедастичность

Слайд 12 Корреляция и гетероскедастичность

Корреляция и гетероскедастичность

Слайд 13 Корреляция и гетероскедастичность

Корреляция и гетероскедастичность

Слайд 14 Корреляционная зависимость
Если каждому значению величины X соответствует свое

Корреляционная зависимостьЕсли каждому значению величины X соответствует свое значение то говорят,

значение
то говорят, что существует
регрессионная функция


Линию, которую описывает регрессионная функция, называется линия регрессии


Слайд 15 Случайная составляющая
Отклонение переменной Y от математического ожидания для

Случайная составляющаяОтклонение переменной Y от математического ожидания для соответствующего значения переменной

соответствующего значения переменной X называется ошибкой и обозначается 


Слайд 16 Регрессионное уравнение
Уравнение
называется уравнением регрессии переменной Y на переменную

Регрессионное уравнениеУравнениеназывается уравнением регрессии переменной Y на переменную X

Слайд 17 Компоненты Y

Компоненты Y

Слайд 18 Экономический смысл 
невключение объясняющих переменных в уравнение. На

Экономический смысл невключение объясняющих переменных в уравнение. На самом деле на

самом деле на переменную Y влияет не только переменная

X, но и ряд других переменных, которые не учтены в нашей модели по следующим причинам:
мы знаем, что другая переменная влияет, но не модем ее учесть, потому как не знаем, как измерить (психологический фактор, например);
существуют факторы, которые мы знаем, как измерить, но влияние их на Y так слабо, что их не стоит учитывать;
существенные переменные, но из-за отсутствия опыта или знаний мы их таковыми не считаем.

Слайд 19 Экономический смысл  (продолжение)
Неправильная функциональная спецификация. Функциональное соотношение

Экономический смысл  (продолжение)Неправильная функциональная спецификация. Функциональное соотношение между Y и

между Y и Х может быть определено неправильно. Например,

мы предположили линейную зависимость, а она может быть более сложной.
Ошибки наблюдений (занижение реального уровня доходов). В этом случае наблюдаемые значения не будут соответствовать точному соотношению, и существующее расхождение будет вносить свой вклад в остаточный член.

Слайд 20 Способы определения регрессионной функции f(X)
параметрический – предполагаем,

Способы определения регрессионной функции f(X) параметрический – предполагаем, что вид регрессионной

что вид регрессионной функции известен, неизвестны параметры функции
непараметрический –

предполагаем, что вид регрессионной функции неизвестен и мы составляем алгоритм расчета значений функции в каждой точке

Слайд 21 Выбор вида f(X)
экономическая теория
опыт, интуиция исследователя
эмпирический анализ данных

Выбор вида f(X)экономическая теорияопыт, интуиция исследователяэмпирический анализ данных

Слайд 22 Эмпирический анализ данных
В парном случае материал наблюдений представляет

Эмпирический анализ данныхВ парном случае материал наблюдений представляет собой набор пар чисел: .

собой набор пар чисел:

.


Слайд 23 На плоскости каждому такому наблюдению соответствует точка:
Полученный график

На плоскости каждому такому наблюдению соответствует точка:Полученный график называют облако наблюдений,

называют облако наблюдений, поле корреляции или диаграмма рассеяния. По

виду облака наблюдений можно определить вид регрессионной функции.

Слайд 24 Линейная Y=+X+.

Линейная  Y=+X+.

Слайд 25 Квадратичная

Квадратичная

Слайд 26 Показательная

Показательная

Слайд 27 Степенная

Степенная

Слайд 28 Гиперболическая

Гиперболическая

Слайд 29 X и Y независимы

X и Y независимы

Слайд 30 Парная линейная регрессионная модель Y=+X+.

Парная линейная регрессионная модель Y=+X+.

Слайд 31 Выбор коэффициентов регрессионной прямой
Из всех возможных прямых мы

Выбор коэффициентов регрессионной прямойИз всех возможных прямых мы хотим выбрать ту,

хотим выбрать ту, чтобы она «наилучшим образом» подходила к

нашим данным, т. е. отражала бы линейную зависимость Y от X. Иными словами, чтобы каждое Yi лежало бы как можно ближе к прямой. Можно сказать, мы хотим, чтобы желаемая прямая была бы в центре скопления наших данных.

Слайд 32 Выбор коэффициентов регрессионной прямой
β – коэффициент наклона (slope),
α

Выбор коэффициентов регрессионной прямойβ – коэффициент наклона (slope),α – свободный коэффициент (intercept)

– свободный коэффициент (intercept)


Слайд 33 Истинная линия регрессии, определяемая коэффициентами α и β

Истинная линия регрессии, определяемая коэффициентами α и β

Слайд 34 Точки наблюдений разбросаны вокруг этой линии. Их бесконечность.

Точки наблюдений разбросаны вокруг этой линии. Их бесконечность.

Слайд 35 В выборку попадает только их часть

В выборку попадает только их часть

Слайд 36 В выборку попадает только их часть

В выборку попадает только их часть

Слайд 37 И что мы наблюдаем
Всего мы наблюдаем N

И что мы наблюдаем Всего мы наблюдаем N точек

точек


Слайд 38 Линия, которую мы проводим

Линия, которую мы проводим

Слайд 39 Линия, которую мы проводим
Проводим прямую через центр скопления

Линия, которую мы проводимПроводим прямую через центр скопления точек облака наблюдений,

точек облака наблюдений, т. е. таким образом, чтобы точки

облака наблюдений были одновременно к этой линии близки.

Слайд 40 Реальные и прогнозные значения

Реальные и прогнозные значения

Слайд 41 Разницу между реальным и прогнозным значением назовем остатком

Разницу между реальным и прогнозным значением назовем остатком

Слайд 42 Рассмотрение остатков на графике

Рассмотрение остатков на графике

Слайд 43 Истинная и оцененная линия регрессии
Мы надеемся, что построенная

Истинная и оцененная линия регрессииМы надеемся, что построенная линия регрессии не

линия регрессии не очень сильно отличается от истинной, в

частности, чем больше объем выборки, тем шансы на то, что линии похожи, возрастают (состоятельность).

Слайд 44 Грусть печаль
Метод наименьших квадратов не всегда состоятельный

Грусть печальМетод наименьших квадратов не всегда состоятельный

Слайд 45 Как найти «наилучшую» прямую аналитически?
Выберем меру близости одной

Как найти «наилучшую» прямую аналитически?Выберем меру близости одной точки к прямой.Построим

точки к прямой.
Построим интегральную меру близости всех точек к

прямой, учитывающую меру близости отдельных точек и выберем ту прямую, для которой эта мера близости минимальна.

Слайд 46 Мера близости одной точки к прямой – остаток.

Мера близости одной точки к прямой – остаток.

Слайд 47 Интегральная мера близости

Интегральная мера близости

Слайд 48 Интегральная мера близости
почему бы не минимизировать просто сумму

Интегральная мера близостипочему бы не минимизировать просто сумму остатков?

остатков?


Слайд 49 Для какой прямой сумма остатков равна 0?

Для какой прямой сумма остатков равна 0?

Слайд 50 для такой

для такой

Слайд 51 и для такой

и для такой

Слайд 52 Метод наименьших квадратов
Среди всех возможных прямых выбираем ту,

Метод наименьших квадратовСреди всех возможных прямых выбираем ту, для которой сумма квадратов остатков минимальна

для которой сумма квадратов остатков минимальна


Слайд 53 Минимизация
или

Минимизация или

Слайд 54 Система нормальных уравнений

Система нормальных уравнений

Слайд 55 МНК-коэффициенты ПЛРМ
- коэффициент наклона
- свободный коэффициент

МНК-коэффициенты ПЛРМ- коэффициент наклона- свободный коэффициент

Слайд 56 Другие формы записи коэффициента наклона

Другие формы записи коэффициента наклона

Слайд 57 Замечания
Линия регрессии проходит через точку

Мы предполагаем, что

ЗамечанияЛиния регрессии проходит через точку Мы предполагаем, что среди Xi есть

среди Xi есть разные, тогда dX  0. В

противном случае, оценок по методу наименьших квадратов не существует.

Слайд 58 Теснота линейной корреляционной связи
В качестве меры близости данных

Теснота линейной корреляционной связиВ качестве меры близости данных наблюдений к линии

наблюдений к линии регрессии служит выборочный коэффициент парной линейной

корреляции (парный линейный коэффициент корреляции):

Слайд 59 Вспомним теоретический коэффициент корреляции

Вспомним теоретический коэффициент корреляции

Слайд 60 Связь между коэффициентом корреляции и коэффициентом наклона
Знак коэффициента

Связь между коэффициентом корреляции и коэффициентом наклонаЗнак коэффициента наклона линии регрессии и коэффициента корреляции совпадают

наклона линии регрессии и коэффициента корреляции совпадают


Слайд 61 Положительная корреляция
С ростом переменной X переменная Y в

Положительная корреляцияС ростом переменной X переменная Y в среднем растет (имеет тенденцию к росту)

среднем растет (имеет тенденцию к росту)


Слайд 62 Отрицательная корреляция
С ростом переменной X переменная Y в

Отрицательная корреляцияС ростом переменной X переменная Y в среднем убывает (имеет тенденцию к уменьшению)

среднем убывает (имеет тенденцию к уменьшению)


Слайд 63 Свойства коэффициента корреляции

Свойства коэффициента корреляции      - необходимое и

- необходимое и достаточное

условием того, что все наблюдаемые значения (Xi,Yi) лежат на прямой регрессии

Слайд 64 Свойства коэффициента корреляции (продолжение)
переменные не связаны линейной корреляционной

Свойства коэффициента корреляции (продолжение)переменные не связаны линейной корреляционной связью. Линия регрессии

связью. Линия регрессии проходит горизонтально.

между переменными существует линейная корреляционная

связь, которая тем лучше (ближе к линейной функциональной), чем ближе коэффициент корреляции по модулю к 1

Слайд 65 Уравнение одно, коэффициенты корреляции разные

Уравнение одно, коэффициенты корреляции разные

  • Имя файла: tema-2-parnaya-lineynaya-regressionnaya-model.pptx
  • Количество просмотров: 179
  • Количество скачиваний: 0