Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.

Обратная связь

Презентация на тему Разведочный анализ данных. Цель и задачи. Обнаружение аномальных наблюдений. Критерий проверки

Содержание

2. Цель, задачиЦель– представить наблюдаемые данные в компактной
3. Вопросы анализа данныхКакой обработке подвергнуть наблюдения? Какую модель выбрать? Какие заключения можно сделать?
4. Пример РАДРазведочный анализ (Exploratory data analysis) –
5. Предварительная обработка данных. Оценка среднегоОценка
6. Причины отличия реального распределения от нормальногоБольшинство измерений
7. Робастные оценкиРобастные оценки - robust – крепкий,
8. Мера разбросасреднеквадратическое отклонение σ дисперсия σ2размах RОценки
9. Разбиение данных на три группы
10. Качество результатовПростая перепроверка. Проверка полученной модели на
11. Неоднородные выборки
12. Разделение неоднородной совокупности на однородные Пусть
13. Обнаружение аномальных наблюдений Причины:грубые ошибки при
14. Обнаружение аномальных наблюдений. Критерий проверки
15. Обнаружение аномальных наблюдений. Критерий проверки При построении
16. Общие выводы об удалении аномальных наблюденийДля данных
17. Простые числовые и графические сводки данныхПроцедура «стебель
18. Скачать презентацию
19. Похожие презентации

Цель, задачиЦель– представить наблюдаемые данные в компактной и простой форме, позволяющей выявить имеющиеся закономерности и связиРазведочный анализ данных (РАД) включает: преобразование данных и способы наглядного их представления выявление аномальных значений грубая оценка типа распределениясглаживание

Главная
Математика
Разведочный анализ данных. Цель и задачи. Обнаружение аномальных наблюдений. Критерий проверки

Цель, задачиЦель– представить наблюдаемые данные в компактной и простой форме, позволяющей выявить

Вопросы анализа данныхКакой обработке подвергнуть наблюдения? Какую модель выбрать? Какие заключения можно сделать?

Пример РАДРазведочный анализ (Exploratory data analysis) – средство получения более полной информации

Предварительная обработка данных. Оценка среднегоОценка - истинного среднего m независимой

Причины отличия реального распределения от нормальногоБольшинство измерений проводится в конкретных единицахРезкая асимметрия

Робастные оценкиРобастные оценки - robust – крепкий, здоровый, Пример робастной оценки среднего,

Мера разбросасреднеквадратическое отклонение σ дисперсия σ2размах RОценки этих величин обозначают, соответственно, S,

Качество результатовПростая перепроверка. Проверка полученной модели на данных, отличных от тех, по

Разделение неоднородной совокупности на однородные Пусть выборка изучаемой совокупности x1, …,

Обнаружение аномальных наблюдений Причины:грубые ошибки при регистрации измерений, случайные импульсные помехи,

Обнаружение аномальных наблюдений. Критерий проверки Пусть наблюдения x1, …, xn

Обнаружение аномальных наблюдений. Критерий проверки При построении критерия возможны варианты, зависящие от

Общие выводы об удалении аномальных наблюденийДля данных с неправдоподобными наблюдениями использовать робастные

Простые числовые и графические сводки данныхПроцедура «стебель с листьями» (Stem-and-Leaf)250 688 695

Списки использованной литературы и источников:А.А.Большаков, Р.Н.Каримов «Методы обработки многомерных данных и временных

Слайды презентации

Слайд 2 Цель, задачи
Цель– представить наблюдаемые данные в компактной и

Цель, задачиЦель– представить наблюдаемые данные в компактной и простой форме, позволяющей

простой форме, позволяющей выявить имеющиеся закономерности и связи

Разведочный анализ

данных (РАД) включает:
преобразование данных и способы наглядного их представления
выявление аномальных значений
грубая оценка типа распределения
сглаживание

Слайд 3 Вопросы анализа данных

Какой обработке подвергнуть наблюдения?
Какую

модель выбрать?
Какие заключения можно сделать?

Слайд 4 Пример РАД
Разведочный анализ (Exploratory data analysis) – средство

Пример РАДРазведочный анализ (Exploratory data analysis) – средство получения более полной

получения более полной информации об изучаемом явлении

Наблюдения n пар

(x1,Y1), …, (xn,Yn) опишем уравнением

(1)

Минимальный предварительный анализ - график рассеяния точек (xj,Yj).

Слайд 5 Предварительная обработка данных. Оценка среднего
Оценка -

истинного среднего m независимой случайной величины x по выборке

объема n
Доверительный интервал:
t-распределение Стьюдента:
95%-е доверительные интервалы
Для нормального распределения t = 1,96,

Для t-распределения при числе степеней свободы v (v = n – 1), равных 1; 3 и 12, величина t, соответственно, равна 12,7; 4,3 и 2,18.

Слайд 6 Причины отличия реального распределения от нормального
Большинство измерений проводится

Причины отличия реального распределения от нормальногоБольшинство измерений проводится в конкретных единицахРезкая

в конкретных единицах
Резкая асимметрия некоторых распределений (например,χ2, F) при

малых выборках, обрывистые края у равномерного распределения
Поведение на «хвостах» распределения, которое существенно отличается от значений основного количества наблюдений

Слайд 7 Робастные оценки
Робастные оценки - robust – крепкий, здоровый,

Робастные оценкиРобастные оценки - robust – крепкий, здоровый, Пример робастной оценки

Пример робастной оценки среднего, терпимой к отклонению хвостов распределения

от нормального - медиана распределения

Слайд 8 Мера разброса
среднеквадратическое отклонение σ
дисперсия σ2
размах R

Оценки этих

Мера разбросасреднеквадратическое отклонение σ дисперсия σ2размах RОценки этих величин обозначают, соответственно,

величин обозначают, соответственно, S, S2, R

Оценка разброса по S

– в линейных преобразованиях типа Y = β + αX

Слайд 9 Разбиение данных на три группы

Слайд 10 Качество результатов
Простая перепроверка. Проверка полученной модели на данных,

Качество результатовПростая перепроверка. Проверка полученной модели на данных, отличных от тех,

отличных от тех, по которым определены параметры модели
Двойная перепроверка.

Проверка на данных отличных, как от тех, по которым строилась модель, так и от тех, которые использованы для вычисления параметров модели

Слайд 11 Неоднородные выборки

Слайд 12 Разделение неоднородной совокупности на однородные
Пусть выборка

изучаемой совокупности x1, …, xn, содержит элементы двух независимых

случайных величин с плотностями распределений f(x,θ1) и f(x,θ2).
Обозначим через А – множество элементов выборки, принадлежащих к первой случайной величине, В – множество элементов выборки из второй совокупности.
Требуется найти оценки неизвестных параметров θ1, θ2 и множества А и В.
Для оценки этих четырех неизвестных используем метод максимума правдоподобия

Слайд 13 Обнаружение аномальных наблюдений
Причины:

грубые ошибки при регистрации

измерений,
случайные импульсные помехи,
сбои оборудования,
измерения в ошибочных

единицах
и др.

Слайд 14 Обнаружение аномальных наблюдений. Критерий проверки
Пусть

наблюдения x1, …, xn являются реализациями независимых случайных величин,

подчиняющихся одинаковому нормальному N(μ,σ2) распределению
Основная гипотеза H0: Mxi = μ, Dxi = σ2, i = 1, …, n.
Альтернативная гипотеза H1 : одна или несколько величин имеют среднее μ + d

Слайд 15 Обнаружение аномальных наблюдений. Критерий проверки
При построении критерия

Обнаружение аномальных наблюдений. Критерий проверки При построении критерия возможны варианты, зависящие

возможны варианты, зависящие от степени информации о μ и

σ.
Рассмотрим случай, когда значения μ и σ неизвестны. Критериальная статистика:

Распределение величины Dn получены К. Пирсоном и Н.В. Смирновым. Критические значения Dn, вычислены Н.В. Смирновым и Ф. Граббсом
H0 - Dn < Dα - наблюдение не является аномальным
H1 - Dn > Dα - наблюдение является аномальным

Слайд 16 Общие выводы об удалении аномальных наблюдений
Для данных с

Общие выводы об удалении аномальных наблюденийДля данных с неправдоподобными наблюдениями использовать

неправдоподобными наблюдениями использовать робастные процедуры оценивания
Существенно выделяющиеся данные обнаруживать,

преобразовывать и удалять, при этом интерпретировать, привлекая знания, не относящиеся к статистической природе
Процедуры удаления существенно выделяющихся и подозрительно больших наблюдений с последующим оцениванием близких к робастным оценкам

Слайд 17 Простые числовые и графические сводки данных
Процедура «стебель с

Простые числовые и графические сводки данныхПроцедура «стебель с листьями» (Stem-and-Leaf)250 688

листьями» (Stem-and-Leaf)
250 688 695 795 795 895 895 895

1099 1166 1333 1499 1693 1699 1775 1895
Три вида записи «стебля с листьями» цен на 17 автомобилей «Шевроле»: а – единица = 100 $; б – единица = 10 $; в – единица = 100 $

- Предыдущая Проектирование принципиальных схем проведения мероприятий и различных работ в рамках проекта: Наставничество на Сахалине

Следующая - Паравентрикулярное ядро. Дорсальный гипоталамус

Ещё раз про проценты 167

Презентация к фрагменту урока в 1 классе. Тема Числа и цифры 1 и 2 презентация к уроку по математике (1 класс) по теме 151

Метапредметный подход в обучении информатике, как основное требование ФГОС НОО презентация к уроку по математике 193

МатематикаУстный счёт 2 класс 233

Факториал числа 145

Наглядная геометрия для начальной школы 149

Комплексные числа 162

Симметрия в жизни 141

konkurs kapitanov 139

Решето Эратосфена 128

Развитие творческих способностей на уроке математики презентация урока для интерактивной доски по математике (1 класс) 150

Конспект урока по математике Повторение деления столбиком. Вычисления с помощью калькулятора план-конспект урока по математике (3 класс) 175

Презентация по математике на тему Отношения , 6 класс 149

Таблица умножения и деления на 7 127

Сумма углов треугольника 5 класс 135

tablichnoe slozhenie i vychitanie - copy 87

Урок математики, Числовое равенство и уравнение. план-конспект урока по математике (2 класс) по теме 174

Нестандартные приёмы сравнения обыкновенных дробей 163

презентация к уроку математики в 3 классе по теме Нахождение доли числа и числа по доле презентация к уроку по математике (3 класс) по теме 182

ИНТЕГРИРОВАННОЕ НОД МЫ И ВРЕМЯ ПОДГОТОВИТЕЛЬНАЯ ГРУППА презентация к уроку по математике (подготовительная группа) по теме 151

ustnyy schet 4 klass 135

ustnyy schyot urok 44 139

Методы решения дифференциальных уравнений в частных производных 173

Признаки параллелограмма 144

Что такое findslide.org?

Обратная связь

Презентация на тему Разведочный анализ данных. Цель и задачи. Обнаружение аномальных наблюдений. Критерий проверки

Содержание

Слайд 2 Цель, задачиЦель– представить наблюдаемые данные в компактной и

простой форме, позволяющей выявить имеющиеся закономерности и связиРазведочный анализ

Слайд 3 Вопросы анализа данныхКакой обработке подвергнуть наблюдения? Какую

модель выбрать? Какие заключения можно сделать?

Слайд 4 Пример РАДРазведочный анализ (Exploratory data analysis) – средство

получения более полной информации об изучаемом явленииНаблюдения n пар

Слайд 5 Предварительная обработка данных. Оценка среднегоОценка -

истинного среднего m независимой случайной величины x по выборке

Слайд 6 Причины отличия реального распределения от нормальногоБольшинство измерений проводится

в конкретных единицахРезкая асимметрия некоторых распределений (например,χ2, F) при

Слайд 7 Робастные оценкиРобастные оценки - robust – крепкий, здоровый,

Пример робастной оценки среднего, терпимой к отклонению хвостов распределения

Слайд 8 Мера разбросасреднеквадратическое отклонение σ дисперсия σ2размах RОценки этих

величин обозначают, соответственно, S, S2, RОценка разброса по S