Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Математическая статистика (лекция 5)

Содержание

Основные определенияГенеральная совокупность – всё то множество объектов, относительно которого исследователь хотел бы делать выводы в рамках определённого исследованияПримеры ГС: все совершеннолетние жители Казани; все люди с заболеванием Альцгеймера Выборка – некая часть ГС, её модель,
Математические методы в биологииБлок 3. Математическая статистикаЛекция 5Козлова Ольга Сергеевна89276755130, olga-sphinx@yandex.ru Основные определенияГенеральная совокупность – всё то множество объектов, относительно которого исследователь хотел Визуализация выборокПолигон – график, сопоставляющий варианты значений признака с их частотами (абсолютными Описательные статистики Меры центральной тенденции Выборочная средняя и выборочная дисперсия  И всё же, откуда в формуле выборочной дисперсии (n-1)?   Стандартная ошибка среднего (SE) Все наблюдения – из одной ГС, значит, и Построение доверительного интервала для среднего  2,5% значений сл.вел. находятся здесь!Ещё 2,5% значений сл.вел.  Построение доверительного интервала для среднего. Пример Гипотезы и их проверкаПонятие статистической гипотезыСтатистическая гипотеза - некое предположение о виде Типовой пример статистической задачи на проверку гипотез  Распределение сл.вел. «средний срок выздоровления после приёма нового лекарства» при условии принятия P-value (уровень значимости)Это вероятность наблюдения заданных отклонений (различий) при условии, что верна Чем чреваты маленькие выборки (n Нормальное распределение vs распределение Стьюдента   p-value=0,0455 H0 отвергаемВер-ть наблюдать случайное отклонение на ±2σ Это Сравнение средних – парный t-тест   Выборки принадлежат одной ГСВыборки принадлежат разным ГСp-value=0 Пример на сравнение средних  t-распределение c 38 степенями свободы(38=20+20-2)При условии, что верна нулевая гипотеза, вероятность наблюдать Резюме (или что мы умеем делать из статистики) 
Слайды презентации

Слайд 2 Основные определения
Генеральная совокупность – всё то множество объектов,

Основные определенияГенеральная совокупность – всё то множество объектов, относительно которого исследователь

относительно которого исследователь хотел бы делать выводы в рамках

определённого исследования
Примеры ГС: все совершеннолетние жители Казани; все люди с заболеванием Альцгеймера
Выборка – некая часть ГС, её модель, на основе изучения которой исследователь делает выводы о всей ГС.
Репрезентативность выборки – её способность отражать существенные для исследования характеристики ГС



ГС

Выборка












Объекты

Объекты (наблюдения)

У объектов изучаются признаки (колич. либо кач.)
Объём выборки (или ГС) – количество объектов (элементов), содержащихся в выборке (или ГС)

Задача статистики – делать выводы о распределении признака в ГС на основе изучения этого распределения в выборке!!!


Слайд 3 Визуализация выборок
Полигон – график, сопоставляющий варианты значений признака

Визуализация выборокПолигон – график, сопоставляющий варианты значений признака с их частотами

с их частотами (абсолютными или относительными) (для дискретных признаков)
Пример.

Изучаем количество детей в семьях Казани. Объём выборки – 10 семей.






Гистограмма – ступенчатая фигура из прямоугольников с основанием, равным ширине интервала по оси x (значения признака) и высотой, равной частоте значений признака из этого интервала (абсолютной или относительной) (для непрерывных признаков)

x – кол-во детей в семье;
y – кол-во семей с таким кол-вом детей
Значения по y абсолютные.

Пример. Гистограмма абсолютных частот нормально распределённого признака с параметрами μ=0 и σ=1 (объём выборки 100)


Слайд 4 Описательные статистики
 
Меры центральной тенденции

Описательные статистики Меры центральной тенденции      Меры изменчивости1

Меры изменчивости












1

2 3 4 5 6 7


Мода – самое часто встречаемое значение признака в выборке


Медиана – то значение признака, которое делит упорядоченную выборку пополам:
если число эл-тов нечётно:


если число эл-тов чётно:


(3+3)/2=3 (ср.арифм-е)












1 1 2 2 3 3 3 4 5 5 7 8















1 2 3 4 5 6 7



 


Мода – единственная описат.статистика для качест.признака;
Мод м.б. несколько и 0


Слайд 5 Выборочная средняя и выборочная дисперсия
 

Выборочная средняя и выборочная дисперсия 

Слайд 6 И всё же, откуда в формуле выборочной дисперсии

И всё же, откуда в формуле выборочной дисперсии (n-1)?  

(n-1)?
 
 


Слайд 7 Стандартная ошибка среднего (SE)
 
Все наблюдения – из одной

Стандартная ошибка среднего (SE) Все наблюдения – из одной ГС, значит, и

ГС, значит, и

изменчивость одинакова

 


Формула стандартной ошибки среднего



Генеральная совокупность

Выборки объёма 30

Распределение выб.средних

 

Истинная
дисперсия

Работает для n≥30!


Слайд 8 Построение доверительного интервала для среднего
 
 
2,5% значений сл.вел. находятся

Построение доверительного интервала для среднего  2,5% значений сл.вел. находятся здесь!Ещё 2,5% значений

здесь!
Ещё 2,5% значений сл.вел. находятся где-то здесь!
Здесь находятся 95%

значений сл.вел!

-1,96*σ в общем виде

Дов. инт-л – симметричный относительно мат.ожидания интервал, насчёт которого мы можем на сколько-то уверенно сказать, что там находится случайная величина.

Z-значение


Слайд 9  
Построение доверительного интервала для среднего. Пример

 Построение доверительного интервала для среднего. Пример

Слайд 10 Гипотезы и их проверка
Понятие статистической гипотезы
Статистическая гипотеза -

Гипотезы и их проверкаПонятие статистической гипотезыСтатистическая гипотеза - некое предположение о

некое предположение о виде неизвестного распределения или о его

параметрах.
Примеры статистических гипотез:
Распределение роста студентов нормально
Средняя продолжительность жизни в России – 67 лет
Нулевая гипотеза (H0)– основное предположение, выдвинутое в статистическом исследовании (обычно пессимистична).
Альтернативная гипотеза (H1) – гипотеза, противоречащая нулевой.
Гипотезы проверяются статистическими тестами.
Результат статистического теста – отклонение (☺) или не отклонение нулевой гипотезы (☹)
Отклонение нулевой гипотезы означает принятие альтернативной (☺)
НО: Не отклонение нулевой гипотезы – это ещё не отклонение альтернативной!

Слайд 11 Типовой пример статистической задачи на проверку гипотез
 

Типовой пример статистической задачи на проверку гипотез 

Слайд 12 Распределение сл.вел. «средний срок выздоровления после приёма нового

Распределение сл.вел. «средний срок выздоровления после приёма нового лекарства» при условии

лекарства» при условии принятия H0
 
 
А вот где наше выборочное

среднее!!


Если мы принимаем H0, то наше выборочное среднее отклоняется от 20 аж на 3 стандартных отклонения! Вероятность наблюдать такие и более серьёзные отклонения составляет 0,00135*2=0,0027 (p-value, или уровень значимости) .



Слайд 13 P-value (уровень значимости)
Это вероятность наблюдения заданных отклонений (различий)

P-value (уровень значимости)Это вероятность наблюдения заданных отклонений (различий) при условии, что

при условии, что верна H0 (вероятность случайности заданного выборочного

значения)
Чем меньше, тем большее право имеем на отклонение H0
«Золотой стандарт» порогового уровня p-value – 0,05 (<0,05 – отклоняем H0 и принимаем H1, если ≥0,05 – оснований для отклонения H0 недостаточно!)
Обычно двусторонний (вычисляем вероятность отклонения как в одну, так и в другую сторону)

Статистические ошибки
Ошибка первого рода – отклонили H0, хотя она была верна (выборочные данные были получены случайно)
Последствия – получили ложно статистически значимый вывод.
Возможный способ борьбы – уменьшить пороговое p-value (до 0,001, например). P-value – вероятность совершить ошибку первого рода.
Ошибка второго рода – не отклонили H0, хотя она не была верна (верна H1).
Последствия – не получили статистического вывода.
Возможный способ борьбы – увеличить объём выборки.


Слайд 14 Чем чреваты маленькие выборки (n

Чем чреваты маленькие выборки (n

попадания с.в. в крайние интервалы
(±2σ)
Бледно-фиолетовая линия – обыкновенное нормальное

распределение


Пар-р k (число степеней свободы)
k=n-1 (n-объём выборки)

 

N(0,1)

χ2(k)


Слайд 15 Нормальное распределение vs распределение Стьюдента
 
 


 
p-value=0,0455 H0

Нормальное распределение vs распределение Стьюдента   p-value=0,0455 H0 отвергаемВер-ть наблюдать случайное отклонение на

отвергаем
Вер-ть наблюдать случайное отклонение на ±2σ
 
Это не абс. знач-я,

а сигмы!

p-value=0,0569 > 0,05=> H0 не отвергаем


Слайд 16 Сравнение средних – парный t-тест
 
 
 
Выборки принадлежат одной ГС
Выборки

Сравнение средних – парный t-тест   Выборки принадлежат одной ГСВыборки принадлежат разным ГСp-value=0

принадлежат разным ГС



p-value
=0


Слайд 17 Пример на сравнение средних
 

Пример на сравнение средних 

Слайд 18 t-распределение c 38 степенями свободы
(38=20+20-2)
При условии, что верна

t-распределение c 38 степенями свободы(38=20+20-2)При условии, что верна нулевая гипотеза, вероятность

нулевая гипотеза, вероятность наблюдать отклонение разности выборочных средних от

0 в более чем 2,53 стандартных отклонения равна 0,0157 (<0,05) => отклоняем нулевую гипотезу (разница между температурами денатурации статистически значима).

 


  • Имя файла: matematicheskaya-statistika-lektsiya-5.pptx
  • Количество просмотров: 157
  • Количество скачиваний: 0