Слайд 2
План лекции
1. Измерение. Шкалы. Группировки.
2. Статистическая и генеральная
совокупность.
3. Меры центральной тенденции.
4. Меры разброса значений.
5. Методы определения
достоверности различий.
6. Методы определения коэффициентов корреляции.
Слайд 3
1. Измерение. Шкалы. Группировки.
Измерение — процедура приписывания
чисел объектам изучения в соответствии с определенными правилами.
В качестве
объектов измерения:
- «единицы» поведения,
- физиологические реакции.
Слайд 4
1. Измерение. Шкалы. Группировки.
Показатели – количественные и
качественные характеристики действий, высказываний, физиологических реакций и.т.п.
Виды показателей:
-
количественные,
- качественные.
Слайд 5
1. Измерение. Шкалы. Группировки.
Для измерения различных признаков
используются шкалы.
Шкала — числовая система.
Виды шкал:
- номинальная,
-
ранговая (порядковая),
- интервальная (метрическая).
Слайд 6
1. Измерение. Шкалы. Группировки.
Номинальная шкала — измеряются
объективные признаки респондентов (пол, возраст, семейное положение и т.п.).
Пример:
возраст
— 23 года.
Возможные выводы:
- равно-неравно,
- больше-меньше,
- во сколько раз больше или меньше.
Слайд 7
1. Измерение. Шкалы. Группировки.
Ранговая (порядковая) шкала —
измеряются субъективные признаки респондентов (степень удовлетворенности чем-либо или кем-либо
и т.п.).
Пример:
Степень удовлетворенности профессией:
5 — полностью удовлетворен,
4 — удовлетворен,
3 — затрудняюсь ответить,
2 — скорее, не удовлетворен,
1 — полностью не удовлетворен.
Возможные выводы:
- равно-неравно,
- больше-меньше,
- во сколько раз больше или меньше?
Слайд 8
1. Измерение. Шкалы. Группировки.
Интервальная (метрическая) шкала —
измеряются объективные признаки респондентов (пол, возраст, семейное положение и
т.п.) с помощью интервалов.
Пример:
Возраст:
1. 0 — 5 лет,
2. 6 — 10 лет,
3. 11 — 15 лет.
Возможные выводы:
- равно-неравно,
- больше-меньше,
- во сколько раз больше или меньше?
Слайд 9
1. Измерение. Шкалы. Группировки.
Группировка — распределение единиц
изучаемого объекта на однородные группы по существенным для него
признакам.
Пример:
возраст — 23 года ....
Назначение группировки:
- установление численности каждой отдельно взятой части совокупности,
- изучение влияния причин и характеристики явления.
Слайд 10
1. Измерение. Шкалы. Группировки.
Виды группировок:
1.
комбинационная:
а) структурная,
б) типологическая,
2. аналитическая.
Слайд 11
1. Измерение. Шкалы. Группировки.
Комбинационная группировка — распределение
в группы по двум и более признакам.
а) структурная группировка
— с учетом объективных признаков,
б) типологическая группировка — с учетом субъективного признака.
Аналитическая группировка - распределение в группы по двум и более признакам для выявления их взаимосвязи (уровень мышления и успеваемость).
Слайд 12
2. Статистическая и генеральная совокупность
Слайд 13
2. Статистическая и генеральная совокупность
Статистическая совокупность — это
объединение какого-либо множества испытуемых по одному или нескольким признакам.
При
этом:
выделяемая совокупность должна быть однородна по основным качественным характеристикам;
сравнение может проводиться лишь по тому признаку, который является предметом исследования.
Слайд 14
2. Статистическая и генеральная совокупность
Статистическая совокупность = объем
выборки.
если объем выборки 30 и более человек, то используется
аппарат параметрической статистики,
если объем выборки от 10 до 30 человек, то используется аппарат непараметрической статистики.
Слайд 15
2. Статистическая и генеральная совокупность
Генеральная совокупность — объект
исследования, который территориально, производственно и во времени «локализован» и
на который распространяются выводы исследования.
Слайд 16
2. Статистическая и генеральная совокупность
Ряд распределения —
упорядоченный ряд чисел, получаемый в результате группировки.
Виды рядов распределения:
-
атрибутный — упорядоченный ряд распределения по качественным признакам,
- вариационный — упорядоченный ряд распределения по количественным признакам.
Вариационый ряд может быть дискретным и непрерывным (интервальным).
Слайд 17
2. Статистическая и генеральная совокупность
Вариационный (непрерывный) ряд распределения
Пример: объем произвольного внимания детей 7 лет (n= 8):
1; 1; 2; 2; 2; 3; 3; 4.
варианты - 1 2 3 4
частоты - 2 3 2 1
Слайд 18
2. Статистическая и генеральная совокупность
Атрибутный ряд распределения
Пример:
уровень развития творческого воображения детей 7 лет (n= 8):
В; В; В; С; С; С; С; Н.
III; III; III; II; II; II; II; I.
атрибуты - I II III
частоты - 1 4 3
Слайд 19
2. Статистическая и генеральная совокупность
Графическое изображение статистических
данных:
- полигон - для отображения непрерывных рядов,
- гистограмма
— для отображения дискретных рядов.
Слайд 21
3. Меры центральной тенденции
Меры центральной тенденции — величины,
вокруг которых группируются отдельные, расходящиеся между собой значения показателя.
С
их помощью множество разбросанных показателей заменяет одна величина.
Меры центральной тенденции:
М (X) — среднее арифметическое,
Мо — мода,
Мd — медиана.
Слайд 22
3. Меры центральной тенденции
М — среднее арифметическое
М= ∑
vi / n
Пример:
V1 (n=7): 1; 2; 3; 4; 4;
4; 5.
М= (1+2+3+4+4+4+5) / 7≈3,29.
Слайд 23
3. Меры центральной тенденции
Мo — мода — максимально
встречающийся результат.
Пример:
V1(n=9): 1; 2; 3; 3; 3; 4; 4;
4; 5.
Мo1 = 3; Мo2 = 4.
Слайд 24
3. Меры центральной тенденции
Мd — медиана — числовое
значение, занимающее в упорядоченном ряду данных срединное положение (делит
упорядоченный ряд на две равные части).
Расчет места медианы:
Место медианы = (n+1)/2
Пример:
V1 (n=8): 1; 2; 3; 3; 3; 4; 4; 5.
Место медианы = (8+1)/2 = 4,5.
Мd = 3.
Слайд 26
4. Меры разброса значений
При замене множества числовых значений
показателя одним числом — средним арифметическим или медианой —
мы, выигрывая в простоте и наглядности ситуации, теряем часть информации.
Так, два множества значений имеют одинаковые М и Мd:
V1: 5; 5; 5. М= 5,0. Md= 5.
V2: 1; 5; 9. М= 5,0. Md= 5.
Слайд 27
4. Меры разброса значений
Меры разброса значений:
W - размах
δ
— стандартное отклонение
m — ошибка среднего арифметического
Слайд 28
4. Меры разброса значений
W — размах — разность
максимального и минимального значений в ряду данных.
Пример:
V1 (n=8): 2;
3; 4; 6; 7; 8; 9; 10.
W1= vmax - vmin = 10 — 2 = 8.
V2 (n=9): 4; 4; 5; 5; 6; 6; 6; 6; 6.
W 2 = ?
Слайд 29
4. Меры разброса значений
δ — стандартное отклонение.
δ
= √ ∑ (vi — M)² / (n —
1)
Пример: V1 (n=10): 2; 2; 3; 3; 3; 3; 4; 4; 5; 6.
Слайд 31
4. Меры разброса значений
δ — стандартное отклонение.
δ
= √ ∑ (vi — M)² / (n —
1) =
√14,5 / (10 — 1) = √14,5 / 9 =
√1,611 ≈ 1,269.
Слайд 32
4. Меры разброса значений
m — ошибка среднего арифметического
m
= ∂ / √n =
≈ 1,269 / √ 10
≈ 1,269 / 3,161 ≈ 0,401.
Запись ряда распределения:
M ± m = 3,5 ± 0,40.
Слайд 33
5. Методы определения достоверности различий
Слайд 34
5. Методы определения достоверности различий
Для установления факта случайности
различий средних арифметических зависимых и независимых выборок или его
опровержения пользуются статистическими критериями
(если исследователь хочет распространить свои выводы на генеральную совокупность).
Слайд 35
5. Методы определения достоверности различий
Зависимые выборки — выборки,
в которых результаты измерения некоторого свойства испытуемых одной выборки
влияют на результаты измерения этого свойства испытуемых другой выборки.
Независимые выборки — выборки, в которых результаты измерения некоторого свойства испытуемых одной выборки не влияют на результаты измерения этого свойства испытуемых другой выборки.
Слайд 36
5. Методы определения достоверности различий
Методы определения достоверности различий
для зависимых выборок:
t критерий Стьюдента,
критерий знаков.
Методы определения достоверности различий
для независимых выборок:
U критерий Манна-Уитни,
t критерий Стьюдента.
Слайд 37
5. Методы определения достоверности различий
Определение t критерия Стьюдента,
t Стьюдента = (М1 – М2) / √ (m²1
+ m²2).
М1 – среднее арифметическое большего значения,
М2 – среднее арифметическое меньшего значения.
Ограничение применения методики – необходимо симметричное распределение показателей.
Слайд 38
5. Методы определения достоверности различий
Ограничение применения методики –
необходимо симметричное распределение показателей.
Слайд 39
5. Методы определения достоверности различий
Пример:
M1 ± m1 =
3,33 ± 0,401, при n = 12.
M2 ± m2
= 3,82 ± 0,412, при n = 14.
t Стьюдента = (М1 – М2) / √ (m²1 + m²2)≈
≈ ( 3,82 – 3,33) / √ (0,401² + 0,412²) ≈
≈ 0,49 / √ (0,160801 + 0,169744) ≈
≈ 0,49 / √ 0,330545 ≈ 0,49 / 0,5749 ≈ 0,852.
Слайд 40
5. Методы определения достоверности различий
Нахождение статистически достоверной вероятности
различий с помощью t критерия Стьюдента:
Гипотеза H0: если t
расчетная < t табличной, то между рядами показателей не существует достоверное различие на уровне 95 % (98 %, 99 % или 99,5 %) вероятности.
Гипотеза H1: если t расчетная ≥ t табличной, то между рядами показателей существует достоверное различие на уровне 95 % (98 %, 99 % или 99,5 %) вероятности.
Так как, t расчетная (0,852) < t табличной (2,06), то между анализируемыми рядами показателей не существует достоверное различие на уровне 95 % вероятности. Подтвердилась гипотеза H0.
Слайд 41
5. Методы определения достоверности различий
Метод определения достоверности различий
для зависимых выборок -
критерий знаков.
Пример: Необходимо выявить наличие
достоверных различий в объеме произвольного внимания ЧБД 7 лет до и после формирующего эксперимента.
Слайд 42
5. Методы определения достоверности различий
Критерий знаков
Пример: Необходимо
выявить наличие достоверных различий в объеме произвольного внимания ЧБД
7 лет до и после формирующего эксперимента.
Слайд 43
5. Методы определения достоверности различий
Критерий знаков – обработка:
1.
n´ = 12 – 2 = 10. (различающиеся пары
результатов)
2. Kmax = 9. (количество чаще встречающихся знаков)
3. Kтабл (n´ = 10) = 9.
Слайд 44
5. Методы определения достоверности различий
4. Нахождение статистически достоверной
вероятности различий с помощью критерия знаков:
Гипотеза H0: если Кmax
< Ктабл , то между рядами показателей не существует достоверное различие на уровне 95 % вероятности.
Гипотеза H1: если Кmax ≥ Ктабл , то между рядами показателей существует достоверное различие на уровне 95 % вероятности.
Так как, Кmax= 9 равен Ктабл = 9, то между анализируемыми рядами показателей существует достоверное различие на уровне 95 % вероятности. Подтвердилась гипотеза H1.
Слайд 45
Пограничные значения критерия знаков (95% уровень достоверности)(Рунион Р.
Справочник по непараметричяеской статистике. М., 1982)
Слайд 46
5. Методы определения достоверности различий
Метод определения достоверности различий
для независимых выборок - U критерий Манна-Уитни.
Пример: двум
группам ЧБД 7 лет предлагалось запомнить 10 новых слов в условиях игры и в условиях лабораторного эксперимента.
Слайд 47
5. Методы определения достоверности различий
U критерий Манна-Уитни.
Vигра (n=11):
3; 4; 4; 4; 5; 5; 5; 5;
5; 6; 6. (М= 4,7.)
Vэкспер (n=10): 2; 3; 3; 3; 3; 4; 4; 4; 4; 5. (М= 3,5.)
Ранг – порядковый номер:
ранг 6 = (1+2) / 2 = 1,5.
ранг 5 = ? ранг 4 =? ранг 3 = ? ранг 2 = ?
Слайд 48
5. Методы определения достоверности различий
Обработка:
1. Сумма рангов для
иргы и для эксперимента:
Rигра = 1,5*2 + 5,5 *
5 + 12*3 + 18*1 = 84,5.
Rэкспер = ?
2. Проверка: Rигра + Rэкспер = N / 2 * (N + 1)?
где N = nигра + nэкспер.
84,5 + 146,5 = 21 / 2 * 22. 231 = 231.
Слайд 49
5. Методы определения достоверности различий
U критерий Манна-Уитни.
Обработка:
3. Uигра
= nи*nэ + nи(nи + 1) / 2 –
Rигра.
Uигра = 11*10 + 11*12 / 2 – 84,5 = 91,5.
4. Uэкспер = nи*nэ + nэ(nэ + 1) / 2 – Rэкспер.
Uэкспер = 11*10 + 10*11 / 2 – 146,5 = 18,5.
5. Проверка: Uигра = nи*nэ – Uэкспер.
91,5 = 11*10 – 91,5 = 110 – 18,5 = 91,5.
Слайд 50
5. Методы определения достоверности различий
4. Нахождение статистически достоверной
вероятности различий с помощью U критерия Манна-Уитни:
Гипотеза H0: если
Umax расчетная < Umax табличная, а Umin расчетная > Umin табличная, то между рядами показателей не существует достоверное различие на уровне 95 % вероятности.
Гипотеза H1: если Umax расчетная ≥ Umax табличная, а Umin расчетная < Umin табличная, то между рядами показателей существует достоверное различие на уровне 95 % вероятности.
Так как, Umax расчетная (91,5) > Umax табличная (84), а Umin расчетная (18,5) < Umin табличная (26), то между анализируемыми рядами показателей существует достоверное различие на уровне 95 % вероятности. Подтвердилась гипотеза H1.
Слайд 51
5. Методы определения достоверности различий
H – критерий Краскела-Уоллеса
-
предназначен для оценки различий по какому-либо показателю между тремя
и более выборками.
H= [12/n(n+1)]* (ΣR²/nk) - 3(n+1),
R – суммы рангов по группам,
k – количество групп,
nk – объем групп,
n – объем объединенной выборки.
Слайд 52
5. Методы определения достоверности различий
H – критерий Краскела-Уоллеса
Пример:
Существует ли достоверные различия в степени стрессоустойчивости у представителей
четырех групп студентов – ППФ, физики, физической культуры, музыки.
Слайд 53
5. Методы определения достоверности различий
H – критерий Краскела-Уоллеса
Подсчет
суммы рангов для каждой группы
Слайд 54
5. Методы определения достоверности различий
H – критерий Краскела-Уоллеса
H=
[12/n(n+1)]* (ΣR²/nk) - 3(n+1),
R – суммы рангов по группам,
k
– количество групп,
nk – объем групп,
n – объем объединенной выборки.
H= [12/13(13+1)]* (15²/5 + 15²/2 +29,5²/3 +31,5²/3) -
-3(13+1)≈ 9,4.
Слайд 55
5. Методы определения достоверности различий
H – критерий Краскела-Уоллеса
H=
[12/13(13+1)]* (15²/5 + 15²/2 +29,5²/3 +31,5²/3) -
-3(13+1)≈
9,4.
Степень свободы H-критерия: df = k – 1 = 4 - 1 = 3.
Для определения табличного (критического) распределения статистики χ² используем таблицу.
Слайд 56
5. Методы определения достоверности различий
H – критерий Краскела-Уоллеса
Гипотеза
H0: если Hрасчетная < Hтабличная, то между рядами показателей
не существует достоверное различие на уровне 95 % вероятности.
Гипотеза H1: если Hрасчетная ≥ Hтабличная,то между рядами показателей существует достоверное различие на уровне 95 % вероятности.
Так как, Hрасчетная (9,4) > Hтабличная (7,815), то между анализируемыми рядами показателей существует достоверное различие на уровне 95 % вероятности. Подтвердилась гипотеза H1.
Слайд 57
6. Методы определения коэффициентов корреляции
Слайд 58
6. Методы определения коэффициентов корреляции
Корреляция — оценка статистической
связи между двумя рядами данных.
- изменяются ли показатели
одного ряда при изменении показателей другого ряда.
Коэффициент корреляции — в пределах:
от +1 (прямая функциональная связь)
до -1 (обратная функциональная связь).
Если коэффициент корреляции близок к 0, то между рядами данных статистической связи нет.
Слайд 59
6. Методы определения коэффициентов корреляции
Виды коэффициентов корреляция:
rxy —
коэффициент корреляции Пирсона,
ρ — коэффициент ранговой корреляции
Спирмена.
Слайд 60
6. Методы определения коэффициентов корреляции
rxy — коэффициент корреляции
Пирсона
Ограничения:
- количественные показатели,
- симметричное (нормальное) распределение данных.
rxy=(n*∑xi*yi — ∑xi
* ∑yi) / √ [n*∑xi² —
— (∑xi)²] * [n*∑yi² — (∑yi)²].
Слайд 61
6. Методы определения коэффициентов корреляции
rxy — коэффициент корреляции
Пирсона
Пример: найти корреляционную связь между объемом зрительного внимания (x)
и количеством ошибок (y).
rxy=(n*∑xi*yi — ∑xi * ∑yi) / √ [n*∑xi² —
— (∑xi)²] * [n*∑yi² — (∑yi)²].
Слайд 62
6. Методы определения коэффициентов корреляции
rxy=(n*∑xi*yi — ∑xi *
∑yi) / √ [n*∑xi² —
— (∑xi)²] *
[n*∑yi² — (∑yi)²].
Слайд 63
rxy=(n*∑xi*yi — ∑xi * ∑yi)/
√[n*∑xi²—(∑xi)²]*[n*∑yi² — (∑yi)²]
rxy =
=(10*381
– 74*58) / √ [10*590 — 74²] *
*[10*410 — 58²] ≈ -482 / 558,40 ≈
-0,86.
Слайд 64
6. Методы определения коэффициентов корреляции
Для оценки значимости
rxy необходимо сравнить полученный коэффициент с табличным коэффициентом:
Гипотеза H0:
если rxy ≤ rтабличная, то между рядами показателей не существует достоверная связь на уровне 95 % вероятности.
Гипотеза H1: если rxy > r табличная, то между рядами показателей существует достоверная связь на уровне 95 % (99%) вероятности.
Так как, rxy (-0,86) > rтабличная (0,77), то между анализируемыми рядами показателей существует достоверная обратная связь на уровне 99 % вероятности. Подтвердилась гипотеза H1.
Слайд 65
6. Методы определения коэффициентов корреляции
ρ — коэффициент ранговой
корреляции Спирмена
Ограничения применения:
наличие качественных показателей.
ρ = 1 –
6 * ∑ di² / n (n² - 1).
Слайд 66
6. Методы определения коэффициентов корреляции
ρ = 1 –
6 * ∑ di² / n (n² - 1).
Слайд 67
6. Методы определения коэффициентов корреляции
ρ = 1 –
6 * ∑ di² / n (n² - 1).
ρ
= 1 – 6 * 62 / 10 (100 – 1) ≈ 1 – 0,376 ≈ 0,624.
Слайд 68
6. Методы определения коэффициентов корреляции
Для оценки значимости
ρ необходимо сравнить полученный коэффициент с табличным коэффициентом:
Гипотеза H0:
если ρ ≤ ρтабличная, то между рядами показателей не существует достоверная связь на уровне 95 % вероятности.
Гипотеза H1: если ρ > ρтабличная, то между рядами показателей существует достоверная связь на уровне 95 % (99%) вероятности.
Так как, ρ (0,624) > ρтабличная (0,564), то между анализируемыми рядами показателей существует достоверная прямая связь на уровне 95 % вероятности. Подтвердилась гипотеза H1.
Слайд 70
Кластерный анализ
(таксономический) анализ используется
для упорядочивания объектов и
объединения их в однородные разряды.
Кластер — это группа объектов,
характеризующаяся повышенной
плотностью и дисперсией.