Слайд 2
План лекции
Методы группировки экспериментальных данных.
Точечная оценка параметра.
Интервальная оценка
параметра.
Слайд 3
Методы группировки экспериментальных данных
Допустим, из генеральной совокупности извлечена
выборка объемом n, измерена некоторая величина Х, в результате
чего получен ряд значений х1, х2, . . . хn.
Этот ряд называется простым статистическим рядом.
Слайд 4
Пример: измерена масса тела 10 девочек 6 лет.
Полученные данные образуют простой статистический ряд:
24 22 23 28
24 23 25 27 25 25
Отдельные значения статистического ряда называются вариантами.
Если варианта хi появилась f раз, то число f называют частотой, а ее отношение к объему выборки f /n – относительной частотой.
Последовательность вариант, записанная в возрастающем (убывающем) порядке, называется ранжированным рядом.
Слайд 5
Пример: Ранжированный ряд:
22 23 23 24 24
25 25 25 27 28
Таблица, в первой строке которой
записаны все значения величины (варианты), во второй – соответствующие им частоты, называется безынтервальным вариационным рядом.
Пример: Безынтервальный вариационный ряд
Слайд 6
Графическим изображением безынтервального вариационного ряда является полигон (рис.
1).
Рис. 1. Полигон вариационного ряда
Для его построения на
оси ОХ откладывают значения вариант, на оси ОУ – соответствующие им частоты.
Точки с координатами (хi; fi) соединяют отрезками, полученная ломаная линия называется полигоном частот.
Слайд 7
Основными параметрами генеральной совокупности являются математическое ожидание (генеральная
средняя) М(Х) и среднее квадратическое отклонение .
Это
постоянные величины, которые можно оценить по выборочным данным. Оценка генерального параметра, выражаемая одним числом, называется точечной.
Слайд 8
Точечной оценкой генеральной средней m является выборочное среднее
.
Выборочным средним называется среднее арифметическое всех значений величины,
встречающихся в выборке.
Слайд 9
Пример: Вычислить среднее значение массы тела девочек 6
лет.
Слайд 10
Если выборочное среднее вычисляется по вариационному ряду, то
находят сумму произведений вариант на соответствующие частоты, и делят
на количество элементов в выборке.
Пример: Вычислить среднее значение массы тела девочек 6 лет(ранжированный ряд –
22 23 23 24 24 25 25 25 26 27).
Слайд 11
Выборочное среднее является основной характеристикой положения, показывает центр
распределения совокупности, позволяет охарактеризовать исследуемую совокупность одним числом, проследить
тенденцию развития, сравнить различные совокупности.
Непараметрическими характеристиками положения являются мода и медиана.
Модой называется варианта, имеющая наибольшую частоту
Медианой называется варианта, расположенная в центре ранжированного ряда.
Если ряд состоит из четного числа вариант, то медианой считают среднее арифметическое двух вариант, расположенных в центре ранжированного ряда.
Слайд 12
Пример: найти моду и медиану выборочной совокупности по
массе тела девочек 6 лет
Мо = 25; Ме =
24,5
Слайд 14
Пример. Определить основные статистические показатели результатов измерения роста
студентов, если данные выборки таковы (n=16):
185, 171, 190,
170, 190, 178, 188, 174, 193, 178, 176, 180, 175, 176, 180, 192.
Слайд 16
Для того чтобы статистические оценки давали «хорошие» приближения
оцениваемых параметров, они должны быть:
несмещенными;
эффективными;
состоятельными.
Слайд 17
Определение. Оценка называется несмещенной, если математическое ожидание ее
выборочного распределения совпадает со значением генерального параметра.
Определение.
Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками, т.е. обнаруживает наименьшую случайную вариацию.
Слайд 18
Определение. Точечная оценка называется состоятельной, если при увеличении
объема выборочной совокупности она стремиться к величине генерального параметра.
Для
выборки из нормальной генеральной совокупности эта оценка является эффективной, состоятельной и несмещенной.
Слайд 19
Интервальная оценка параметра
При выборке малого объема точечная оценка
может значительно отличаться от оцениваемого параметра, т.е. приводить к
грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами – концами интервала – доверительного интервала.
Интервальные оценки позволяют установить точность и надежность оценок.
Слайд 20
Знание величины ошибки репрезентативности недостаточно, чтобы быть уверенным
в результатах выборочного исследования, т.к. конкретная ошибка одного выборочного
наблюдения может быть больше (меньше) средней ошибки выборки.
Поэтому на практике определяют так же пределы возможных ошибок выборки или предельную ошибку выборки (∆).
Т.к. предельная ошибка может быть как в сторону увеличения, так и в сторону уменьшения, то говорят о доверительном интервале или доверительных границах, в пределах которых будет находиться показатель генеральной совокупности на основании данных выборочного исследования.
Слайд 21
Для оценки генерального параметра с помощью доверительного интервала
необходимы три величины:
значение выборочного показателя;
критерий надежности t, или показатель
безошибочных прогнозов, значение которого определяется заранее, при планировании исследования, исходя из представления о большей или меньшей ответственности возможных результатов работы;
ошибка репрезентативности m или показатель точности выборочного параметра (определяется на основе выборочных данных по формулам математической статистики).
Слайд 22
Если признак генеральной совокупности распределён нормально, то интервальную
оценку производят, используя интервал Стьюдента:
t- критерий достоверности или критерий
Стьюдента, который показывает, с какой вероятностью данные выборки совпадут с данными генеральной совокупности (определяется по таблице Стьюдента);
- доверительная вероятность.
Слайд 24
Для большинства медицинских исследований допускают р = 0,95
или 95%. В этом случае вероятность выхода результата выборочного
исследования за границы доверительного интервала, т.е. вероятность ошибки составляет 0,05 или 5%.
Поэтому говорят, что результат исследования получен с уровнем значимости 0,05 (р=0,05).
При необходимости более строгой оценки р=0,99 (99%), вероятность ошибки составит 0,01 (1%) и следовательно уровень значимости будет р=0,01
Слайд 25
Виды интервалов
нижняя граница последующего интервала повторяет верхнюю границу
последующего интервала.
С индивидуальными границами в интервал входят верхняя и
нижняя границы.
открытый интервал, интервал с одной границей
При расчетах по интервальному вариационному ряду за xi принимается середина интервала.
Слайд 27
Интервалы могут быть как равные, так и нет.
При изучении вариационного ряда существенную помощь оказывает графическое изображение.
Слайд 29
68.3 % всех вариант отклоняются от своей средней
не более чем на σ
95.4% вариант находятся в пределах
X ± 2σ
99.7% вариант находятся в пределах X ± 3σ
Отклонение параметра от его средней арифметической в пределах σ расценивается как норма.
Субнормальным считается отклонение в пределах
± 2σ.
Патологическим - сверх этого предела, т.е. > ± 2σ