Слайд 2
Секции
Понятие и назначение
дисперсионного анализа
Sergey Mityagin
Постановка задачи
дисперсионного
анализа
Однофакторный
дисперсионный анализ
Априорные контрасты
и апостериорные критерии
Многофакторный
дисперсионный анализ
Слайд 3
Условия применения дисперсионного анализа
Sergey Mityagin
Количественный непрерывный тип
данных, дискретные данные менее желательны.
Независимые между собой выборки.
Нормальное распределение
признака в статистических совокупностях, из которых извлечены выборки.
Равенство (гомогенность) дисперсий изучаемого признака в статистических совокупностях из которых извлечены выборки.
Независимые наблюдения в каждой из выборок.
Слайд 4
Понятие и назначение
Sergey Mityagin
Дисперсионный анализ
анализ изменчивости
результативного признака под влиянием каких-либо контролируемых переменных факторов. (В
зарубежной литературе именуется ANOVA – «Analisis of Variance»)
ОИ
(Явление/
процесс)
Контролируемые переменные
Результативный признак
Y
X
Слайд 5
Формулировка гипотез в дисперсионном анализе
Sergey Mityagin
Нулевая гипотеза:
«Средние
величины результативного признака во всех условиях действия фактора (или
градациях фактора) одинаковы».
Альтернативная гипотеза:
«Средние величины результативного признака в разных условиях действия фактора различны».
Слайд 6
Sergey Mityagin
Формулировка гипотез в дисперсионном анализе
Дисперсионный анализ можно
подразделить на несколько категорий в зависимости:
1. от количества рассматриваемых
независимых факторов;
2. от количества результативных переменных, подверженных действию факторов;
3. от характера, природы получения и наличия взаимосвязи сравниваемых выборок значений.
Слайд 7
Sergey Mityagin
Формулировка гипотез в дисперсионном анализе
Дисперсионный анализ:
от количества
рассматриваемых независимых факторов;
Однофакторный;
2. Многофакторный.
ОИ
(Явление/
процесс)
Y
X
ОИ
(Явление/
процесс)
Y
X1
X2
X3
Слайд 8
Sergey Mityagin
Формулировка гипотез в дисперсионном анализе
Дисперсионный анализ:
от количества
рассматриваемых независимых факторов;
Однофакторный;
1.1. Анализ несвязанных (то есть – различных)
выборок
1.2. Анализ связанных выборок
ОИ
(Явление/
процесс)
Y
X
Слайд 9
Sergey Mityagin
Формулировка гипотез в дисперсионном анализе
Дисперсионный анализ:
от количества
результативных переменных, подверженных действию факторов;
Одномерный;
Многомерный.
ОИ
(Явление/
процесс)
Y
X
ОИ
(Явление/
процесс)
Y
X
Слайд 10
Понятие и назначение
Sergey Mityagin
Задача дисперсионного анализа
ОИ
(Явление/
процесс)
Y
X
Определить:
вариативность,
обусловленную действием каждой из исследуемых независимых переменных (факторов);
вариативность, обусловленную
взаимодействием исследуемых независимых переменных;
вариативность случайную, обусловленную всеми неучтенными обстоятельствами
Слайд 11
Понятие и назначение
Sergey Mityagin
Пример медиального критерия
Медиана по
всем выборкам = 25
Слайд 12
Понятие и назначение
Sergey Mityagin
Пример медиального критерия
Ожидаемые наблюдения
согласно H1
Критерий согласия
Слайд 13
Понятие и назначение
Sergey Mityagin
Пример медиального критерия
Значения критерия
согласия
Табличное значение критерия согласия
Слайд 14
Понятие и назначение
Sergey Mityagin
Задание:
Разбиться на 3 команды
и проверить зависимость выборок успеваемости по дисциплинам первого семестра:
Урбанистика
НИРС
Социология города
Экономика города
Разбиться на 2 команды (М/Ж) и проверить тоже самое для 98% доверительного интервала.
Слайд 15
Секции
Понятие и назначение
дисперсионного анализа
Sergey Mityagin
Постановка задачи
дисперсионного
анализа
Однофакторный
дисперсионный анализ
Априорные контрасты
и апостериорные критерии
Многофакторный
дисперсионный анализ
Слайд 16
Постановка задачи
Sergey Mityagin
Влияние кратковременной памяти на успеваемость
Слайд 17
Постановка задачи
Sergey Mityagin
Переменная «условия»
Слайд 18
Постановка задачи
Sergey Mityagin
H0: исследованные условия выращивания растений не
оказывают никакого влияния на вес последних.
H1: исследованные условия выращивания
растений оказывают влияние на вес последних.
Слайд 19
Постановка задачи
Sergey Mityagin
Слайд 20
Постановка задачи
Sergey Mityagin
Слайд 21
Секции
Понятие и назначение
дисперсионного анализа
Sergey Mityagin
Постановка задачи
дисперсионного
анализа
Однофакторный
дисперсионный анализ
Априорные контрасты
и апостериорные критерии
Многофакторный
дисперсионный анализ
Слайд 22
Однофакторный дисперсионный анализ
Sergey Mityagin
Дисперсионный анализ, который рассматривает только
одну независимую переменную называется однофакторным дисперсионным анализом (One-Way ANOVA).
Слайд 23
Однофакторный дисперсионный анализ
Sergey Mityagin
Процедура дисперсионного анализа состоит в
определении соотношения систематической (межгрупповой) дисперсии к случайной (внутригрупповой) дисперсии
в измеряемых данных.
Межгрупповая сумма квадратов
Внутригрупповая сумма квадратов
Общая сумма квадратов
Слайд 24
Однофакторный дисперсионный анализ
Sergey Mityagin
В случае если верна Ho,
то как внутригрупповая, так и межгрупповая дисперсии служат оценками
одной и той же дисперсии и должны быть приблизительно равны.
Межгрупповое число степеней свободы:
Внутригрупповое число степеней свободы:
m – число групп
n - число наблюдений в каждой из групп
Слайд 25
Однофакторный дисперсионный анализ
Sergey Mityagin
Данные подготовленные для анализа.
Слайд 26
Однофакторный дисперсионный анализ
Sergey Mityagin
Межгрупповая вариация:
Внутригрупповая вариация:
Слайд 27
Однофакторный дисперсионный анализ
Sergey Mityagin
Результаты анализа.
Слайд 28
Понятие и назначение
Sergey Mityagin
Задание:
Разбиться на команды по
базовому образованию и проверить зависимость выборок успеваемости по дисциплинам
первого семестра для 95% интервала :
Урбанистика
НИРС
Социология города
Экономика города
Слайд 29
Секции
Понятие и назначение
дисперсионного анализа
Sergey Mityagin
Постановка задачи
дисперсионного
анализа
Однофакторный
дисперсионный анализ
Априорные контрасты
и апостериорные критерии
Многофакторный
дисперсионный анализ
Слайд 30
Априорные контрасты и апостериорные критерии
Sergey Mityagin
Критерии для
сравнения средних значений
Априорные контрасты
Апостериорные критерии
коэффициенты сравниваемых уровней (или комбинаций
уровней) должны иметь разные знаки
коэффициенты уровней, не представляющих интереса, приравниваются нулю
Слайд 31
Повторные измерения
Sergey Mityagin
Однофакторный дисперсионный анализ для связанных выборок
(ANOVA с повторными измерениями):
Проверяемые гипотезы:
1. H0(A): Различия независимой величины
при разных градациях фактора являются не более выраженными, чем различия, обусловленные случайными причинами.
2. H1(A): Различия независимой величины при разных градациях фактора являются более выраженными, чем различия, обусловленные случайными причинами.
3. Hο(Б): Индивидуальные различия между элементами выборки являются не более выраженными, чем различия, обусловленные случайными причинами.
4. H1(Б): Индивидуальные различия между элементами выборки являются более выраженными, чем различия, обусловленные случайными причинами.
Слайд 32
Повторные измерения
Sergey Mityagin
Результаты анализа:
Слайд 33
Повторные измерения
Sergey Mityagin
Где:
- сумма квадратов ошибки
Статистическая проверка гипотезы
о наличии различий осуществляется на основании:
Слайд 34
Повторные измерения
Sergey Mityagin
Ограничения метода дисперсионного анализа для
связанных выборок:
1. Дисперсионный анализ для связанных выборок требует не
менее трех градаций фактора и не менее двух элементов выборки в каждой группе.
2. Должно соблюдаться правило равенства дисперсий в каждой группе. Это условие косвенно выполняется за счет одинакового количества наблюдений в каждой группе.
3. Результативный признак должен быть нормально распределен в исследуемой выборке. :
Слайд 35
Повторные измерения
Sergey Mityagin
Способы реализации однофакторного дисперсионного анализа
с повторными измерениями:
Одномерная модель основана на предположении, что каждому
уровню внутригруппового фактора соответствует повторное измерение одной и той же зависимой переменной (следовательно, эти изменения положительно коррелируют).
Многомерная модель свободна от допущения о коррелированности измерений зависимой переменной (т.е. о сферичности).
Слайд 36
Секции
Понятие и назначение
дисперсионного анализа
Sergey Mityagin
Постановка задачи
дисперсионного
анализа
Однофакторный
дисперсионный анализ
Априорные контрасты
и апостериорные критерии
Многофакторный
дисперсионный анализ
Слайд 37
Многофакторный дисперсионный анализ
Sergey Mityagin
Фактор 1
Фактор 2
Зависимая
переменная
Слайд 38
Многофакторный дисперсионный анализ
Sergey Mityagin
Схема двухфакторного дисперсионного анализа имеет
несколько нулевых гипотез:
Н0: Фактор 1 и д Фактор
2 не имеют эффекта взаимодействия на Зависимую переменную.
Н1: Фактор 1 и Фактор 2 имеют эффект взаимодействия на Зависимую переменную.
Н0: Зависимая переменная не зависит от Фактора 1.
Н1: Зависимая переменная зависит от Фактора 1.
Н0: Зависимая переменная не зависит от Фактора 2 .
Н1: Зависимая переменная зависит от Фактора 2 .
Слайд 39
Многофакторный дисперсионный анализ
Sergey Mityagin
Результаты анализа:
Слайд 40
Многофакторный дисперсионный анализ
Sergey Mityagin
Общая изменчивость в двухфакторном дисперсионном
анализе может быть разложена следующим образом:
Слайд 41
Многофакторный дисперсионный анализ
Sergey Mityagin
Условия применения:
1. Генеральные совокупности,
из которых извлечены выборки, должны быть нормально распределены.
2. Выборки
должны быть независимыми.
3. Дисперсии генеральных совокупностей, из которых извлекались выборки, должны быть равными.
4. Группы должны иметь одинаковый объем выборки.
Слайд 42
Многофакторный дисперсионный анализ
Sergey Mityagin
Пример применения:
Необходимо выяснить, оказывают
ли влияние тип потребляемого бензина и тип автомобиля на
расход топлива. Для этого будут использованы два типа бензина – обычный и высокооктановый, и для каждой группы будут использованы два типа автомобилей – с двумя ведущими колесами и с четырьмя. Для каждой группы будут использованы по два автомобиля, всего восемь.
Слайд 43
Многофакторный дисперсионный анализ
Sergey Mityagin
Пробег автомобиля в милях на
галлон:
Слайд 44
Многофакторный дисперсионный анализ
Sergey Mityagin
Алгоритм решения задачи:
1.
Сформулировать гипотезы.
2. Найти критическое значение для каждого значения
F-критерия при заданном α, например, α = 0,05.
3. Заполнить итоговую таблицу, чтобы получить фактические значения критерия.
4. Принять решение.
Слайд 45
Многофакторный дисперсионный анализ
Sergey Mityagin
Формулировка гипотез.
1. для взаимодействия
типа топлива и типа автомобиля:
Н0: Тип топлива и тип
автомобиля не оказывают эффекта взаимодействия на потребление бензина.
Н1: Тип топлива и тип автомобиля оказывают эффект взаимодействия на потребление бензина.
2. для типов топлива:
Н0: Для двух типов топлива нет разницы между средним потреблением бензина.
Н1: Для двух типов топлива существует разница между средним потреблением бензина.
3. для типов автомобилей:
Н0: Для автомобилей с двумя и четырьмя ведущими колесами нет разницы в среднем потреблении бензина.
Н1: Для автомобилей с двумя и четырьмя ведущими колесами существует разница в среднем потреблении бензина.
Слайд 46
Многофакторный дисперсионный анализ
Sergey Mityagin
Каждая независимая переменная имеет два
уровня:
Фактор А - тип топлива: обычное и высокооктановое,
а = 2.
Фактор В - тип автомобиля: также имеет два значения, b = 2.
Число объектов в каждой группе, n = 2.
Степени свободы для каждого фактора:
фактор А
фактор В
взаимодействие (A×B)
ошибка внутри группы:
Слайд 47
Многофакторный дисперсионный анализ
Sergey Mityagin
Критические значения:
Слайд 48
Многофакторный дисперсионный анализ
Sergey Mityagin
Результаты дисперсионного анализа:
Слайд 49
Анализ взаимодействия
Sergey Mityagin
Средний пробег автомобиля в милях на
галлон топлива:
Слайд 50
Анализ взаимодействия
Sergey Mityagin
Средний пробег автомобиля в милях на
галлон топлива:
Беспорядочное взаимодействие
Слайд 51
Анализ взаимодействия
Sergey Mityagin
Средний пробег автомобиля в милях на
галлон топлива:
Порядковое взаимодействие
Слайд 52
Анализ взаимодействия
Sergey Mityagin
Средний пробег автомобиля в милях на
галлон топлива:
Отсутствие значимого взаимодействия