Слайд 2
9.2.1. Критерий А.Н. Колмогорова
Критерий А.Н. Колмогорова применяется для
проверки простой гипотезы Н0 о том, что независимые одинаково
распределенные случайные величины Х1, Х2, …, Хп имеют заданную непрерывную функцию распределения F(x).
Слайд 3
Требуется принять или отклонить эту гипотезу по реализации
случайной выборки независимых измерений. Для решения этой задачи введем
статистику Т(Xn) критерия проверки гипотезы Н. Реализация t статистики Т соответствующая выборке хn определяется по формуле
Слайд 4
Доказано, что (H – истинна)⇒(T=D). Здесь
D –
случайная величина, распределенная по известному закону Колмогорова. Для этой
величины можно найти tα из условия:
P(D≥tα)= α, (*)
где α - вероятность практически невозможного события, и следовательно, событие (D≥tα) - практически невозможное.
С точностью до принципа практической уверенности имеем:
Слайд 5
(Н – истинна)⇒(t
соотношений следует, что неравенство (t
неравенство (t≥tα) достаточно для отклонения гипотезы Н (с точностью до принципа практической уверенности).
Руководствуясь этими соображениями, принимают следующее правило решения поставленной задачи:
(t(t≥tα)⇒(Н – отклонить).
Слайд 6
Это правило называют критерием согласия Колмогорова проверки гипотезы
о непрерывной функции распределения случайной величины.
Алгоритм:
1) Провести
независимые n-кратные измерения СВ Х с непрерывной функцией распределения и получить выборку хn;
2) Исключить из выборки грубые ошибки;
Слайд 7
3) Построить реализацию F*(x) статистической ФР;
4) Выдвинуть
гипотезу F(x) о ФР СВ Х;
5) Вычислить параметр
t.
6) Задать вероятность α практически невозможного события и из таблицы распределения Колмогорова найти параметр tα как решение уравнения (*).
7) Принять или отклонить гипотезу
Н=(Х∈F(x)) по решающему правилу.
Доказано, что критерий А.Н. Колмогорова состоятельный и в общем случае смещенный.
Слайд 8
Он более чувствителен к различию гипотез, поэтому при
прочих равных условиях может применяться для меньших объемов выборки.
Поскольку результат проверки признака критерия t зависит от наибольших различий F(x) и F*(x), то нет необходимости построения F(x) и F*(x) на всем диапазоне изменения х; достаточно ограничиться областями наибольших различий F(x) и F*(x).
Слайд 9
Недостатком критерия является то, что точность его выводов
нарушается, если в формулировании гипотезы о F(x) используются характеристики
эмпирических распределений, т.к. в этом случае статистика Т зависит от F(x); неудобство доставляет также значительная трудоемкость построения статистики Колмогорова А.Н.
Слайд 10
9.2.2. Критерий Пирсона
Критерий Пирсона (критерий χ2) используется для
проверки гипотезы о различных законах распределения с применением статистики:
Слайд 11
Здесь Nj – число Xi в разряде статистического
ряда, q – число разрядов.
Решающее правило состоит в следующем:
если pj удовлетворяет неравенству
то гипотеза Н отвергается, в противном случае Н принимается.
Слайд 12
Алгоритм:
по выборке хn , освобожденной от ошибок,
строим статистический ряд, предварительно задав число разрядов q и
установив границы разрядов;
задав гипотезу о функции распределения или плотности распределения, определяем гипотетические вероятности разрядов
;
Слайд 13
3) вычисляем реализацию t=T(xn) статистики Т(Xn);
4) задавая
уровень значимости α, при помощи табл. χ2 – распределения
находим tα;
5) применяем решающее правило, если (t≥tα), то Н отклоняем, в противном случае Н принимаем.
Достоинства:
относительная простота;
возможность применения для векторной Х;
состоятельность;
Слайд 14
возможность применения оценок параметров при формулировании гипотезы Н
без потерь точности выводов;
несмещенность при pj=const;
пониженная требовательность к
точности xi.
Недостатки:
потери информации за счет предвари-тельного группирования данных по разрядам;
неопределенность в выборе q и границ разрядов;
Слайд 15
неучет знака разности Nj – npj .
Слайд 16
9.2.2.1. Проверка гипотезы о нормальном распределении
Пусть получена выборка
достаточно большого объема п с большим количеством различных значений
вариант. Для удобства ее обработки, разделим интервал от наименьшего до наибольшего из значений вариант на q равных частей.
Слайд 17
Будем считать, что значения вариант,
попавших в каждый интервал,
приближенно
равны числу, задающему середину
интервала. Подсчитав число вариант,
попавших в каждый
интервал, составим так
называемую сгруппированную выборку:
варианты………..х1 х2 … хs
частоты………….n1 n2 … ns ,
где хi – значения середин интервалов, а ni – число вариант, попавших в i-й интервал (эмпирические частоты).
Слайд 18
По полученным данным можно вычислить выборочное среднее и
выборочное среднее квадратическое отклонение σВ. Проверим предположение, что генеральная
совокупность распределена по нормальному закону с параметрами M(X) = , D(X) = . Тогда можно найти количество чисел из выборки объема п, которое должно оказаться в каждом интервале при этом предположении (то есть теоретические частоты).
Слайд 19
Для этого по таблице значений функции Лапласа найдем
вероятность попадания в i-й интервал:
,
где аi и bi - границы i-го интервала. Умножив полученные вероятности на объем выборки n, найдем теоретические частоты: ni =n·pi.
Слайд 20
Наша цель – сравнить эмпирические и
теоретические частоты, которые,
конечно,
отличаются друг от друга, и выяснить, являются ли
эти различия
несущественными, не
опровергающими гипотезу о нормальном
распределении исследуемой случайной величины,
или они настолько велики, что противоречат этой
гипотезе.
Для этого используется критерий в виде
случайной величины
Слайд 21
Вне зависимости от реального закона распределения генеральной совокупности
закон распределения случайной величины при стремится к закону распределения
с числом степеней свободы k = q – 1 – r, где r – число параметров предполагаемого распределения, оцененных по данным выборки. Нормальное распределение характеризуется двумя параметрами, поэтому k = q – 3.
Слайд 22
Для выбранного критерия строится правосторонняя критическая область, определяемая
условием
где α – уровень значимости. Следовательно, критическая область задается
неравенством
а область принятия гипотезы – .
Слайд 23
Итак, для проверки нулевой гипотезы Н0: генеральная совокупность
распределена нормально – нужно вычислить по выборке наблюдаемое значение
критерия:
(*)
а по таблице критических точек распределения χ2 найти критическую точку , используя известные значения α и k = q – 3. Если
– нулевую гипотезу принимают,
при ее отвергают.