Слайд 3
Группировка данных
Группировка — процесс систематизации и упорядочивания данных
с целью извлечения содержащейся в них информации
Способы группировки:
А)
безинтервальный вариационный ряд;
Б) интервальный вариационный ряд.
Данные могут быть представлены в аналитической и графической форме
Слайд 4
Вариационный ряд: термины
Вариационный ряд — ранжированный в порядке
возрастания/убывания ряд значений признака с соответствующими им весами (количествами
людей, обладающих этим уровнем признака).
1) Дискретный вариационный ряд — частоты привязаны к конкретным значениям признака.
Пример: у 5 детей по тесту школьной готовности 10 баллов; 3 ребенка получили 7 баллов; 4 ребенка — 8 баллов; и один ребенок — 5 баллов.
Слайд 5
Таблица распределения частот
Тест Керна-Иерасека, набор в 1 «Д»
класс (N=25 чел)
Слайд 6
Определения
Частота - число, показывающее, сколько раз данное значение
признака встречается в данной выборке.
Относительная частота — отношение частоты
к объему выборки
Накопленная частота — сумма частот от первого имеющегося значения до текущего
Накопленная относительная частота — аналогично см. выше
Слайд 8
Интервальный вариационный ряд
В интервальном вариационном ряду частоты, характеризующие
повторяемость вариантов в выборке, распределяются по интервалам группировки;
Применяется, если:
а)
есть большой размах вариации;
б) объем выборки большой;
в) измеряли непрерывную величину (время, скорость и т.п.)
Слайд 9
Интервальный вариационный ряд
Количество интервалов - по формуле Стерджеса,
в которой k - число интервалов, N-объем выборки
k=1+3,32*lgN
Количество интервалов
- по таблице:
Слайд 10
Интервальный вариационный ряд
Ширина интервала определяется по формуле:
h=(Хмах- Хmin)/k
Есть
два правила:
Правило 1. Точность границ интервала должна быть равна
точности данных (число знаков после запятой одинаково)
Правило 2. Минимальное значение должно попадать в середину 1-го интервала
Слайд 12
Гистограмма распределения частот
Слайд 13
Гистограмма
Гистограмма — график, отображающий особенности интервального ряда распределения
(термин ввел К.Пирсон в 1895г.)
Основанием столбика диаграммы является интервал
группировки
При построении гистограммы, описывающей плотность распределения, высота i-го столбика (L) зависит от частоты (m) данного интервала:
Li = mi / (h*N)
Слайд 15
Для чего нужны гистограммы?
Понять истинную природу различий двух
выборок
Пример:
50 мужчин и 50 женщин;
1 тест пространственного мышления (0-100);
Мужчины:
ср.арифм=72,62
Женщины: ср.арифм=67,92
Слайд 19
Для чего нужны гистограммы?
Понять, есть ли скрытые переменные
Пример:
Влияет
ли оральная контрацепция на уровень Артериального Давления (АД)?
100 женщин,
использующих “The Pill”
100 женин, использующих другие виды контрацепции
Слайд 20
Сравним гистограммы:
Используют оральную контрацепцию
АД=124,41
Используют другие виды
АД=119,85