Слайд 2
Понятие регрессии
Для выражения регрессии служат эмпирические и теоретические
ряды, их графики — линии регрессии, а также корреляционные
уравнения (уравнения регрессии) и коэффициент линейной регрессии.
Показатели регрессии выражают корреляционную связь двусторонне, учитывая изменение средней величины признака Y при изменении значений xi признака X, и, наоборот, показывают изменение средней величины признака Х по измененным значениям yi признака Y. Исключение составляют временные ряды, или ряды динамики, показывающие изменение признаков во времени. Регрессия таких рядов является односторонней.
Слайд 3
Ряды регрессии, особенно их графики, дают наглядное представление
о форме и тесноте корреляционной связи между признаками, в
чем и заключается их ценность. Форма связи между показателями, влияющими на уровень спортивного результата и общей физической подготовки занимающихся физической культурой и спортом, может быть разнообразной. И поэтому задача состоит в том, чтобы любую форму корреляционной связи выразить уравнением определенной функции (линейной, параболической и т.д.), что позволяет получать нужную информацию о корреляции между переменными величинами Y и X, предвидеть возможные изменения признака Y на основе известных изменений X, связанного с Y корреляционно.
Слайд 4
Уравнение линейной регрессии
Обычно признак Y рассматривается как функция
многих аргументов — x1, x2, x3, ...— и может
быть записана в виде:
y = a + bx1 + cx2 + dx3 + ...
а, b, с и d — параметры уравнения, определяющие соотношение между аргументами и функцией. В практике учитываются не все, а лишь некоторые аргументы, в простейшем случае, как при описании линейной регрессии, — всего один:
y = a + bx
Слайд 5
В этом уравнении параметр а — свободный член;
графически он представляет отрезок ординаты (у) в системе прямоугольных
координат. Параметр b называется коэффициентом регрессии. С точки зрения аналитической геометрии b— угловой коэффициент, определяющий наклон линии регрессии по отношению к осям, координат. В области регрессионного анализа этот параметр показывает, насколько в среднем величина одного признака (Y) изменяется при изменении на единицу меры другого корреляционно связанного с Y признака X. Наглядное представление об этом параметре и о положении линий регрессии Y по Х и X по Y в системе прямоугольных координат дает следующий рисунок -
Слайд 6
Схема линий регрессии Y по Х и Х
по Y в системе прямоугольных координат.
Слайд 7
Линии регрессии, как показано, пересекаются в точке 0,
соответствующей средним арифметическим значениям корреляционно связанных друг с другом
признаков Y и X. Линия АВ, проходящая через эту точку, изображает полную (функциональную) зависимость между переменными величинами Y и X, когда коэффициент корреляции r = 1. Чем сильнее связь между Y и X, тем ближе линии регрессии к АВ, и, наоборот, чем слабее связь между варьирующими признаками, тем более удаленными оказываются линии регрессии от АВ. При отсутствии связи между признаками, когда r = 0, линии регрессии оказываются под прямым углом (90°) по отношению друг к другу.
Уравнение регрессии тем лучше описывает зависимость, чем меньше рассеяние диаграммы, чем больше теснота взаимосвязи. Уравнение прямой линии пригодно для описания только линейных зависимостей. В случае нелинейных зависимостей математическая запись может отображаться уравнениями параболы, гиперболы и др.Необходимо также сделать одно важное замечание о значении показателей, характеризующих взаимосвязь признаков (коэффициентов корреляции, регрессии и т. п.). Все они дают лишь количественную меру связи, но ничего не говорят о причинах зависимости. Определить эти причины — дело самого исследователя.
Слайд 8
Коэффициенты уравнения парной линейной регрессии
Как уже было определено
выше, в случае линейной зависимости уравнение регрессии является уравнением
прямой линии. Таких уравнений два:
Y = a1 + by/xX — прямое
и X = a2 + bx/yY — обратное,
где: a и b – коэффициенты, или параметры, которые надлежит определить.
Значение коэффициентов регрессии вычисляется по формуле:
Коэффициенты регрессии b имеют размерность, равную отношению размерностей изучаемых показателей X и Y, и тот же знак, что и коэффициент корреляции.
Слайд 9
Коэффициенты а определяются по формуле:
Чтобы вычислить этот
коэффициенты, надо просто в уравнения регрессии подставить средние значения
коррелируемых переменных.
Для оценки качества уравнений регрессии вычисляются остаточные средние квадратические отклонения (или абсолютные погрешности уравнений) по формуле:
и
Эти оценки абсолютны и, следовательно, не могут быть сравнимы друг с другом. Поэтому вводят оценки относительной погрешности уравнений, которые выражаются в процентах и служат для точности предсказания (прогнозирования) результатов одного показателя по заранее известным значениям другого. Относительные погрешности уравнений регрессии определяются по формуле:
и
Слайд 10
Связь между коэффициентами регрессии и корреляции
Между коэффициентом
корреляции и параметром парной линейной регрессии существует зависимость, которая
применительно к выборочным оценкам может быть представлена следующим образом:
где: и Sy, Sx – средние квадратические ошибки.
Слайд 11
Приведенное выражение позволяет оценить параметр регрессии без решения
системы нормальных уравнений при условии, что коэффициент корреляции уже
определен. На основе формулы легко показать, что выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессии. Действительно, Сравнив формулы с основной формулой коэффициента корреляции, видим, что их числители равны
Это свидетельствует об определенной связи между этими характеристиками. Выборочный коэффициент корреляции выражается тогда равенством r2 = by/x * bx/y , откуда
.
Слайд 12
Эта формула ценна тем, что, во-первых, может быть
использована для нахождения неизвестной величины коэффициента корреляции по известным
значениям коэффициента регрессии by/x и bx/y, а во-вторых, позволяет контролировать правильность расчета коэффициента корреляции, если известны величины by/x и bx/y.
Знак выборочного коэффициента корреляции совпадает со знаком выборочных коэффициентов регрессии, что следует из формулы . Если зависимость между признаками функциональная, то by/x = 1 / bx/y и, следовательно, r = 1. И, наоборот, при полном отсутствии взаимосвязи между признаками by/x= 0, bx/y= 0, и r = 0.
Слайд 13
Определение параметров парной линейной регрессии
Определение параметров линейной регрессии
– одна из задач регрессионного анализа. Она решается способом
наименьших квадратов, основанным на требовании, чтобы сумма квадратов отклонений вариант от линии регрессии была наименьшей. Этому требованию удовлетворяет следующая система нормальных уравнений:
Слайд 14
Ряды регрессии — это ряды усредненных значений (yx
и xy) варьирующих признаков Y и X, соответствующих значениям
аргументов xi и yi. Поэтому эмпирические уравнения регрессии следует записывать так:
yx = ay/x + by/x*x
xy = ax/y + bx/y*y
Формулы для определения параметров а и b принимают следующие выражения:
Слайд 15
Уравнение линейной регрессии можно выразить в виде отклонений
вариант от их средних арифметических:
В таком случае система
нормальных уравнений для определения параметров а и b будет следующая:
Заменив параметры by/x и bx получим систему уравнений парной линейной регрессии:
Слайд 16
Формулы расчета свободных коэффициентов
Слайд 17
Упрощенные формулы для расчета коэффициентов регрессии получаются из
систем уравнений
Слайд 18
Графическое представление уравнения парной линейной регрессии
Эмпирические ряды регрессии
Y по Х и Х по Y изображаются в
виде линейного графика, при построении которого наиболее точным является использование способа наименьших квадратов, предложенного в 1806 г. К. Гауссом и независимо от него А. Лежандром. В основу этого способа положена теорема, согласно которой сумма квадратов отклонений вариант (xi) от средней арифметической - есть величина наименьшая, т. е.
Слайд 19
При графическом изображении эмпирического уравнения регрессии (например, показатели
роста и веса 10 исследуемых), представленного на рисунке используется
следующая последовательность:
1.Определив форму и направление взаимосвязи между эмпирическими данными на основе данных расчета нормированного коэффициента корреляции, производят расчет уравнений регресиии (прямого и обратного) по формуле.
2. Подставляя в конечный вид уравнений, выражающих зависимость между переменными величинами Y и X, эмпирические данные xi и yi находят координаты точек линий регрессии для усредненных значений yx и xy.
3. На графике, выполненном в прямоугольной системе координат, на оси x откладывают значения переменных xi, на оси у – значения yi и отмечают точками рассчитанные координаты линий регрессии для усредненных значений yx и xy .
4. Две линии регрессии на графике пересекаются в точке М с координатами средних значений показателей xi и yi.
Слайд 20
Графическое изображение эмпирического уравнения регрессии.
Слайд 21
График линий регрессии отражает ряды теоретически ожидаемых значений
функции по известным значениям аргумента. При этом, чем сильнее
взаимосвязь между величинами xi и yi, тем меньше угол между линиями регрессии. При r = линии уравнения регресии либо совпадают, либо расположены параллельно, так как корреляционная зависимость между признаками в этом случае переходит в функциональную. И, наоборот, чем слабее зависимость между признаками, тем больше угол между линиями на графике. При r = 0 линии регрессии расположены перпендикулярно.
Слайд 22
Коэффициент τ - Кендалла
P – число совпадений
Q –
число инверсий
N – число ранжируемых признаков