Слайд 2
Задачи математической статистики
Слайд 3
Оценка неизвестной функции распределения.
Оценка неизвестных параметров распределения.
Статистическая проверка
гипотез.
Слайд 4
Выборочный метод.
Генеральная совокупность. Выборка
Слайд 5
Опр. Исследуемая совокупность объектов
наз. генеральной совокупностью (
- очень велико, в некоторых случаях количество значений, образующих генеральную совокупность, можно считать и бесконечным).
Слайд 6
Опр. Совокупность объектов , отобранных случайным образом
из генеральной совокупности наз. выборочной совокупностью (выборкой), где
Число наз. объемом выборки.
Слайд 7
Метод основанный на том, что по выборочной совокупности
выделенной из данной генеральной совокупности делается заключение о всей
генеральной совокупности наз. выборочным методом
Слайд 9
Собственно-случайная
Выборка образованная случайным выбором элементов без расчленения на
части или группы.
Слайд 10
Механическая
Выборка, в которую элементы из генеральной совокупности отбираются
через определенный интервал. Например, если объем выборки должен составлять
10% (10%-я выборка), то отбирается каждый 10-й элемент.
Слайд 11
Типическая
Выборка, в которую случайным образом отбираются элементы из
типических групп, на которые по некоторому признаку разбивается генеральная
совокупность.
Слайд 12
Серийная
Выборка, в которую случайным образом отбираются не элементы,
а целые группы совокупности(серии), а сами серии подвергаются сплошному
наблюдению.
Слайд 14
Повторный отбор
Каждый элемент, случайно отобранный и обследованный, возвращается
в общую совокупность и может быть повторно отобран.
Слайд 15
Бесповторный
Отобранный элемент не возвращается в общую совокупность
Слайд 16
Статистический ряд. Статистическое распределение.
Эмпирическая функция распределения
Слайд 17
Варианты:
Вариационный ряд:
или
Слайд 18
Из генеральной совокупности извлечена выборка объема
наблюдалась
раз;
наблюдалась раза;
наблюдалась раза;
…………………………………
наблюдалась раз.
Причем .
называются частотами.
Числа
, где
наз. относительными частотами.
Слайд 20
Статистическое распределение выборки
Слайд 25
Эмпирическая функция распределения
Слайд 26
Эмпирическая функция распределения это функция равная отношению числа
вариант, меньших , к объему выборки:
.
Слайд 27
Свойства эмпирической функции распределения
- неубывающая;
3) если наименьшая варианта,
то при
4) если наибольшая варианта,
то при
Слайд 29
Пример.
По данному распределению выборки построить эмпирическую функцию.
Слайд 35
Число интервалов определяется по формуле Стерджеса
Слайд 37
Ступенчатая фигура, состоящая из
прямоугольников, основаниями которых
служат частичные интервалы длиною , а
высоты равны отношению
(плотность частот).
Слайд 39
Площадь гистограммы частот
тогда
Слайд 40
Гистограмма относительных частот
Слайд 41
Ступенчатая фигура, состоящая из
прямоугольников, основаниями которых
служат частичные интервалы длиною , а
высоты равны отношению
(плотность относительных частот).
Слайд 43
Площадь гистограммы относительных частот
Слайд 45
Статистические оценки параметров распределения
Слайд 46
Точечные оценки
Оценка, которая определяется одним число, наз. точечной.
Слайд 47
Интервальные оценки
Оценка, которая определяется двумя числами, являющимися концами
интервала, содержащего неизвестный параметр, называется интервальной.
Слайд 49
Несмещенность
Статистическая оценка
наз. несмещенной, если её математическое ожидание равно оцениваемому параметру
при любом объеме выборки:
Слайд 50
Эффективность
Статистическая оценка наз.
эффективной, если она имеет наименьшую возможную дисперсию.
Слайд 51
Состоятельность
Статистическая оценка
наз.
состоятельной, которая при
стремится по вероятности к
оцениваемому параметру :
Слайд 52
Теорема. Если дисперсия несмещенной оценки при
стремится к нулю, то такая оценка
состоятельна.
Док-во: Оценка параметра несмещенная, т.е. , поэтому при из неравенства Чебышева
следует
при
Значит при , для каждого
фиксированного :
а
Но тогда при
Слайд 63
Выборочная средняя является несмещенной и состоятельной:
Слайд 64
1.Рассмотрим выборочную среднюю, как случайную величину
Слайд 69
2.Используем неравенство Чебышева:
тогда
т.е.
Значит выборочная средняя является статистической оценкой
генеральной средней.
Слайд 71
Выборочная дисперсия является смещенной оценкой:
Слайд 74
Несмещенная оценка генеральной дисперсии - исправленная выборочная дисперсия:
Слайд 78
Асимметрия
Асимметрия распределения характеризуется тем, что вариант, меньших и
больших моды неодинаковое число.
асимметрия положительная;
При
асимметрия отрицательная.
, то распределение почти симметрично;
если
, то распределение сильно асимметрично.
Слайд 81
Эксцесс
Эксцесс характеризует крутовершинность кривой распределения.
то распределение считается
близким к нормальному;
если
, то распределение
значительно отклоняется от нормального.
Слайд 83
Метод произведений
-условные варианты,
-условный нуль.
Слайд 87
Статистическая проверка статистических гипотез
Слайд 88
Нулевая гипотеза -
выдвинутая гипотеза.
Конкурирующая гипотеза -
- гипотеза, которая противоречит нулевой гипотезе.
Слайд 89
Простая гипотеза – гипотеза, содержащая одно предположение:
Слайд 90
Сложная гипотеза – гипотеза, которая состоит из конечного
или бесконечного числа простых гипотез:
Слайд 91
Ошибка первого рода состоит в том, что будет
отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что
будет принята неправильная гипотеза.
Уровень значимости – вероятность совершить ошибку первого рода.
Слайд 92
Статистический критерий - случайная
величина, которая служит для проверки нулевой гипотезы.
Наблюдаемым значением
-
значение критерия, вычисленное по выборке.
Слайд 93
Критическая область – совокупность значений критерия, при которых
нулевую гипотезу отвергают.
Область принятия гипотезы - совокупность значений критерия,
при которых нулевую гипотезу принимают.
Критические точки - точки, отделяющие критическую область от области принятия гипотезы.
Слайд 94
Правосторонняя критическая область – критическая область определяющаяся неравенством:
ищут, исходя из требования
чтобы
Слайд 95
Левосторонняя критическая область – критическая область, определяющаяся неравенством:
ищут, исходя из
требования чтобы
Слайд 96
Двусторонняя критическая область – критическая область, определяющаяся неравенством:
ищут, исходя из требования чтобы
Слайд 97
Если распределение критерия симметрично относительно 0 и имеются
основания выбрать симметричные относительно нуля точки:
то
Тогда
заменится
или
Слайд 98
Доверительная вероятность (надежность)- вероятность с которой осуществляется неравенство
,
т.е.
Доверительный интервал – интервал, который покрывает неизвестный параметр с заданной надежностью .
Слайд 99
Доверительный интервал для оценки математического ожидания нормального распределения
при известном .
Число определяется из
равенства
Слайд 100
Доверительный интервал для оценки математического ожидания нормального распределения
при неизвестном
Число определяется по
таблице
Слайд 101
Критерий согласия – критерий проверки гипотезы о предполагаемом
законе неизвестного распределения.
Критерии согласия: ( хи
квадрат) Пирсона, Колмогорова, Смирнова и др.
Слайд 102
Проверка гипотезы о нормальном распределении генеральной совокупности
Слайд 104
В качестве критерия проверки
примем случайную величину
где
-эмпирические частоты;
-теоретические частоты.
Слайд 105
Строим правостороннюю критическую область, исходя из требования, что
в предположении справедливости
,
где - уровень значимости;
- число степеней свободы.
Слайд 106
Число степеней свободы находят по формуле
где - число групп(частичных интервалов) выборки;
- число параметров предполагаемого распределения, которые оценены по данным выборки.
Если предполагаемое распределение нормальное, то оценивают два параметра и тогда
, то
при гипотезу принимают;
при гипотезу отвергают.
Слайд 109
Если функция распределения
случайной величины
непрерывна, то
практически ее эмпирическая функция
распределения
при сходится к .
Слайд 110
Если непрерывна, то
функция
распределения величины
при имеет пределом функцию
которая не зависит от вида функции
Слайд 111
По таблице найдем значение функции
и затем значение функции
Если , то расхождение между эмпирическими и теоретическими функциями распределения несущественно, если , то расхождение существенно.
Слайд 112
Сравнение двух дисперсий нормальных генеральных совокупностей
Слайд 113
В качестве критерия проверки нулевой гипотезы о равенстве
генеральных дисперсий примем случайную величину , причем отношение большей
исправленной дисперсии к меньшей:
Слайд 114
Величина при условии
справедливости имеет распределение Фишера-Снедекора
со степенями свободы и где - объем выборки, по которой вычислена большая исправленная дисперсия.
Слайд 117
О форме корреляционной связи между
и
в
виде некоторой функциональной зависимости, которая хотя бы приближенно изображала расплывчатую корреляционную зависимость.
Об оценке тесноты корреляционной связи между и , т.е. о степени близости корреляционной зависимости к функциональной.
Слайд 118
Регрессии
Регрессией от
называется функциональная зависимость между значениями
и соответствующими условными средними значениями .
Регрессии можно представить геометрически в виде ломанных линий, соединяющих или точки ( ; ), или точки ( ; ).
Слайд 119
Эти линии называются эмпирическими (полученными из опыта) ломаными
линиями регрессии.
Плавную кривую можно получить и иначе, –
если ломаную линию регрессии “сгладить” посредством какой-либо известной линии (прямой, параболы, гиперболы и т.п.).
Уравнение сглаживающей линии даст хотя и приближенно, но аналитическое – в виде формулы – выражение регрессии. Подобные формулы называют эмпирическими
Слайд 120
Задача отыскания эмпирической формулы распадается на две
Слайд 121
1. Выбор типа линии, выравнивающей ломанную регрессии, т.е.
типа линии, около которой группируются экспериментальные точки
( ; ) или ( ; ).
2. Определение параметров, входящих в уравнение линии выбранного типа, таким образом, чтобы из множества линий этого типа взять ту, которая наиболее близко проходит около точек ломаной регрессии.
Слайд 122
Выбор типа линии, выравнивающей ломаную линию регрессии
Для
выбора типа линии, выравнивающей ломаную линию регрессии, необходимо хорошо
знать простейшие виды линий и их уравнения.
Слайд 123
Определения параметров в уравнении выравнивающей линии выбранного типа
Слайд 124
Метод средних применяют в тех случаях, когда выбранный
тип уравнения выравнивающей линии содержит лишь один параметр.
Метод
проб используют, когда выбранная формула содержит несколько параметров .
Слайд 125
Метод выровненных (или выбранных) точек состоит в выборе
по чертежу нескольких точек (не обязательно совпадающих с точками
линии регрессии), через которые проводят выравнивающую линию и определяют ее уравнение по координатам этих выбранных точек.
Метод наименьших квадратов служит для оценки неизвестных величин по результатам измерений, содержащим случайные погрешности.
Слайд 127
Необходимо минимизировать сумму
где , –
значения опытных данных;
– значение функции, взятое из эмпирической зависимости в точке ;
– число опытов.
Слайд 128
В случае линейной эмпирической формулы сумма принимает вид
,
а в случае квадратической зависимости – следующий вид:
.
Слайд 131
Оценка тесноты корреляционной зависимости
Слайд 132
Для оценки тесноты корреляционной зависимости служит корреляционное отношение:
где – выборочная дисперсия
случайной величины , вычисленная по всей таблице;
– дисперсия условных средних относительно общей средней, так называемая внешняя дисперсия.
– остаточная дисперсия;
– число коэффициентов в уравнении регрессии;
– ордината линии регрессии в точке ;
– дисперсия воспроизводимости средних, равная исправленной внутренней дисперсии, деленной на число экспериментов , по которым вычислялись условные средние :
Слайд 137
Величина имеет распределение Фишера
с
числами степеней свободы ( – число задаваемых экспериментатором значений величины ,
– число проводимых опытов, – число коэффициентов в уравнении регрессии).
Из таблицы критических точек распределения Фишера находим .
, уравнение регрессии адекватно.
Если >
расхождение между теоретической и эмпирической линиями регрессии значимо, уравнение не адекватно, следует взять многочлен более высокого порядка.
Слайд 140
Из всех корреляционных зависимостей надо особо выделить линейную
корреляцию, т.е. такую, когда точки регрессии располагаются вблизи некоторой
прямой линии.
Слайд 141
Виды регрессии
1) регрессия на
в виде функциональной зависимости
;
2) регрессия на в виде функциональной зависимости
.
Слайд 143
Выборочное уравнение прямой линии регрессии на
Слайд 144
Выборочное уравнение прямой линии регрессии на
Слайд 145
Если данные наблюдений над признаками
и заданы в
виде корреляционной таблицы с равноотстоящими вариантами, то целесообразно перейти к условным вариантам :
,