Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.

Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть

Презентация на тему Визуализация многомерных пространств

Содержание

2. Где мы встречаем многомерные пространства? Одна из самых распространенных областей - анализ данных:
3. Цель визуализации Цель – получить отображение
4. "To deal with hyper-planes in a 14
5. МетодыРассмотрим методы, сопоставляющие точке в n-мерном пространстве точку в пространстве меньшей размерности:
6. Метод главных компонент (PCA)Основной линейный метод понижения
7. Максимизировать вариацию по векторуМинимизировать сумму расстояний от точки до ее проекции на данный вектор
8. Записать x1 … xn как вектор-строкиРазместить вектор-строки
9. Шаг 2: Оцентрировать данныеНайти среднее по каждой колонкеВычесть вектор средних из каждой строки матрицы объектов-признаков Х
10. Шаг 3: Вычислить матрицу ковариацииНайти матрицу ковариации
11. Шаг 4: Найти собственные вектора и собственные
12. Шаг 5: Проекция и реконструкцияВ матрицу Vreduced
13. Ирисы Фишера
14. Проекция ирисов на главные компоненты
15. MNIST (сокр. от Mixed National Institute of Standards and Technology)
17. Почему такой плохой результат?Линейная комбинация объектов датасета
18. Нелинейные методыРассмотрим более простую модель и поставим
19. Гипотеза: малоразмерное представление сохраняет попарные расстояния между
20. Функционал качества: Ищем представления, апроксимирующие dij:Алгоритм: SMACOF (Scaling by MAjorizing a COmplicated Function) - стресс-функцияRepeatuntil
21. Stochastic Neighbour Embedding (SNE)Гипотеза: В точности воспроизвести
22. Функционал качества: Минимизируем разницу между распределениями расстояний с
23. t-distributed SNEЧем выше размерность пространства, тем меньше
24. Значит нужно меньше штрафовать за увеличение пропорций в маломерном пространстве.Изменим распределение:
25. Сохраняет кластерную структуру самих классов
26. Сравнение методов
27. Выводы Существует множество методов визуализации многомерных данных
28. Скачать презентацию
29. Похожие презентации

Где мы встречаем многомерные пространства? Одна из самых распространенных областей - анализ данных:

Главная
Математика
Визуализация многомерных пространств

Визуализация многомерных пространствАвтор: Сугоняев Андрей, гр. 331

Где мы встречаем многомерные пространства? Одна из самых распространенных областей - анализ данных:

Цель визуализации Цель – получить отображение данных в 2 или 3

МетодыРассмотрим методы, сопоставляющие точке в n-мерном пространстве точку в пространстве меньшей размерности:

Метод главных компонент (PCA)Основной линейный метод понижения размерности – PCA – производит

Максимизировать вариацию по векторуМинимизировать сумму расстояний от точки до ее проекции на данный вектор

Записать x1 … xn как вектор-строкиРазместить вектор-строки в одной матрице X размером

Шаг 2: Оцентрировать данныеНайти среднее по каждой колонкеВычесть вектор средних из каждой строки матрицы объектов-признаков Х

Шаг 3: Вычислить матрицу ковариацииНайти матрицу ковариации С размера n × n

Шаг 4: Найти собственные вектора и собственные числа матрицы СВычислить матрицу V

Шаг 5: Проекция и реконструкцияВ матрицу Vreduced записать k вектор-колонок, соответствующих k

MNIST (сокр. от Mixed National Institute of Standards and Technology)

Почему такой плохой результат?Линейная комбинация объектов датасета не является рукописной цифрой.Значит объекты

Нелинейные методыРассмотрим более простую модель и поставим задачу нелинейного понижения размерности:Задача —

Гипотеза: малоразмерное представление сохраняет попарные расстояния между объектами. - расстояние

Функционал качества: Ищем представления, апроксимирующие dij:Алгоритм: SMACOF (Scaling by MAjorizing a COmplicated Function) - стресс-функцияRepeatuntil

Stochastic Neighbour Embedding (SNE)Гипотеза: В точности воспроизвести расстояния – слишком сложно. Достаточно

Функционал качества: Минимизируем разницу между распределениями расстояний с помощью дивергенции Кульбака-Лейблера:Алгоритм: (Стохастический) градиентный

t-distributed SNEЧем выше размерность пространства, тем меньше расстояния между парами точек отличаются

Значит нужно меньше штрафовать за увеличение пропорций в маломерном пространстве.Изменим распределение:

Сохраняет кластерную структуру самих классов

Выводы Существует множество методов визуализации многомерных данных Выбор метода сильно зависит от

Слайды презентации

Слайд 2 Где мы встречаем многомерные пространства?
Одна из самых

распространенных областей - анализ данных:

Слайд 3 Цель визуализации
Цель – получить отображение данных

Цель визуализации Цель – получить отображение данных в 2 или

в 2 или 3 мерном пространстве для дальнейшего изучения

структурных особенностей и закономерностей этих данных.

Слайд 4 "To deal with hyper-planes in a 14 dimensional

space, visualize a 3D space and say 'fourteen' very

loudly. Everyone does it." — Geoffrey Hinton

Задача — найти такое отображение объектов выборки в пространство малой размерности, которое оптимизировало бы некоторый функционал качества.

Задача визуализации

Слайд 5 Методы
Рассмотрим методы, сопоставляющие точке в n-мерном пространстве точку

в пространстве меньшей размерности:

Слайд 6 Метод главных компонент (PCA)
Основной линейный метод понижения размерности

Метод главных компонент (PCA)Основной линейный метод понижения размерности – PCA –

– PCA – производит линейное сопоставление данных из n-мерного

пространства пространству меньшей размерности так, чтобы максимизировать вариацию данных в их малоразмерном представлении.

Слайд 7 Максимизировать вариацию по вектору

Минимизировать сумму расстояний от точки

до ее проекции на данный вектор

Слайд 8
Записать x1 … xn как вектор-строки
Разместить вектор-строки в

Записать x1 … xn как вектор-строкиРазместить вектор-строки в одной матрице X

одной матрице X размером m × n (матрица объектов-признаков)

Шаг

1: Организовать данные

Слайд 9 Шаг 2: Оцентрировать данные
Найти среднее по каждой колонке
Вычесть

вектор средних из каждой строки матрицы объектов-признаков Х

Слайд 10 Шаг 3: Вычислить матрицу ковариации
Найти матрицу ковариации С

Шаг 3: Вычислить матрицу ковариацииНайти матрицу ковариации С размера n ×

размера n × n как:
C = 1⁄(n − 1)

XT X

Использование N − 1 вместо N обусловлено поправкой Бесселя

Слайд 11 Шаг 4: Найти собственные вектора и собственные числа

Шаг 4: Найти собственные вектора и собственные числа матрицы СВычислить матрицу

матрицы С
Вычислить матрицу V эйгенвекторов которая диагонализирует ковариационную матрицу

C:
C = V D V-1
D = diag{ λ1, … , λn } , где λi , i = 1,...,n - собственные числа
Матрица V размера n × n содержит n вектор-колонок, представляющие из себя собственные векторы
Собственные числа и векторы упорядочены и идут парами
Можно использовать сингулярное разложение
C = U S WT

Слайд 12 Шаг 5: Проекция и реконструкция
В матрицу Vreduced записать

Шаг 5: Проекция и реконструкцияВ матрицу Vreduced записать k вектор-колонок, соответствующих

k вектор-колонок, соответствующих k наибольшим собственным числам.
Умножить Vreduced на

X чтобы получить проекции на главные компоненты:
Z = Vreduced . X

Умножить VreducedT на проекции Z чтобы реконструировать данные:
X = VreducedT . Z

Слайд 13 Ирисы Фишера

Слайд 14 Проекция ирисов на главные компоненты

Слайд 15 MNIST (сокр. от Mixed National Institute of Standards

and Technology)

Слайд 16

Слайд 17 Почему такой плохой результат?
Линейная комбинация объектов датасета не

Почему такой плохой результат?Линейная комбинация объектов датасета не является рукописной цифрой.Значит

является рукописной цифрой.
Значит объекты расположены в подпространстве, не являющемся

линейным.

Слайд 18 Нелинейные методы
Рассмотрим более простую модель и поставим задачу

нелинейного понижения размерности:

Задача — найти отображение объектов выборки в

пространство малой размерности, которое оптимизировало бы функционал качества.
При этом мы не ограничены линейными отображениями.

Слайд 19 Гипотеза: малоразмерное представление сохраняет попарные расстояния между объектами.

- расстояние между xi и xj

- евклидово расстояние между малоразмерными представлениями

Многомерное шкалирование

Слайд 20
Функционал качества:
Ищем представления, апроксимирующие dij:

Алгоритм: SMACOF (Scaling by

MAjorizing a COmplicated Function)

- стресс-функция
Repeat

until

Слайд 21 Stochastic Neighbour Embedding (SNE)
Гипотеза: В точности воспроизвести расстояния

Stochastic Neighbour Embedding (SNE)Гипотеза: В точности воспроизвести расстояния – слишком сложно.

– слишком сложно. Достаточно сохранения пропорций.

Опишем объекты нормированными расстояниями

до остальных объектов:

Слайд 22
Функционал качества:
Минимизируем разницу между распределениями расстояний с помощью

дивергенции Кульбака-Лейблера:

Алгоритм: (Стохастический) градиентный спуск
Repeat

until convergence

Слайд 23 t-distributed SNE
Чем выше размерность пространства, тем меньше расстояния

t-distributed SNEЧем выше размерность пространства, тем меньше расстояния между парами точек

между парами точек отличаются друг от друга (проклятие размерности).
Это

затрудняет точное сохранение пропорций в двух- или трехмерном пространстве.

Слайд 24 Значит нужно меньше штрафовать за увеличение пропорций в

маломерном пространстве.
Изменим распределение:

Слайд 25 Сохраняет кластерную структуру самих классов

Слайд 26 Сравнение методов

Слайд 27 Выводы
Существует множество методов визуализации многомерных данных
Выбор

Выводы Существует множество методов визуализации многомерных данных Выбор метода сильно зависит

метода сильно зависит от конкретной задачи
Ключевым фактором при

выборе метода является балансирование между большей потерей информации и лучшей визуализацией структуры данных

- Предыдущая Франция в 1815-1847 гг

Следующая - Налоговая система России. Законодательство о налогах и сборах

Введение в геометрию 107

Презентация по математике на тему Умножения нуля и единицы 131

Единица площади – квадратный метр план-конспект урока по математике (3 класс) 73

Презентация к уроку по математике по теме Многогранники (призма, параллелепипед, пирамида) их свойства 256

Функции и графики 118

Единицы длинны 114

Презентация по математике на тему Состав числа 8 (Т.Истомина, 1 класс) 145

Четырехугольники вокруг нас 134

Отношения в решении задач 118

Презентация к уроку по теме Сложение смешанных чисел 124

Математический тренажёр Считай тренажёр по математике (2 класс) 132

Параллелограмм. Свойства параллелограмма 117

Конспект НОД по формированию элементарных математических представлений в средней группе Поможем найти Машеньку план-конспект занятия по математике (средняя группа) 130

Игра по математике для 6 класса Счастливый случай 140

Сложение и вычитание в пределах 100 133

Готовимся к ОГЭ №3 (Текстовые задачи 2 часть) 9 класс 126

Викторина по математике 125

Урок математики во 2 классе по теме Умножение как действие, заменяющее сложение одинаковых слагаемых. Знак умножения(Технологическая карта, презентация к уроку) презентация к уроку по математике (2 класс) 152

Решение задач на разностное сравнение 2 класс 191

Презентация Научим Незнайку математике презентация к уроку по математике (подготовительная группа) 167

Отыскание части от целого и целого по его части 128

Презентация к НПК по теме Площадь и периметр прямоугольника 146

ПРЕЗЕНТАЦИЯ - развитие оптико-пространственных представлений у леворуких детей на уроках математики 117

Қарапайым математикалық түсініктер. Уақытты бағдарлау 159

Что такое findslide.org?

Обратная связь

Презентация на тему Визуализация многомерных пространств

Содержание

Слайд 2 Где мы встречаем многомерные пространства? Одна из самых

распространенных областей - анализ данных:

Слайд 3 Цель визуализации Цель – получить отображение данных

в 2 или 3 мерном пространстве для дальнейшего изучения

Слайд 4 "To deal with hyper-planes in a 14 dimensional

space, visualize a 3D space and say 'fourteen' very

Слайд 5 МетодыРассмотрим методы, сопоставляющие точке в n-мерном пространстве точку

в пространстве меньшей размерности:

Слайд 6 Метод главных компонент (PCA)Основной линейный метод понижения размерности

– PCA – производит линейное сопоставление данных из n-мерного

Слайд 7 Максимизировать вариацию по векторуМинимизировать сумму расстояний от точки

до ее проекции на данный вектор

Слайд 8 Записать x1 … xn как вектор-строкиРазместить вектор-строки в

одной матрице X размером m × n (матрица объектов-признаков)Шаг

Слайд 9 Шаг 2: Оцентрировать данныеНайти среднее по каждой колонкеВычесть

вектор средних из каждой строки матрицы объектов-признаков Х

Слайд 10 Шаг 3: Вычислить матрицу ковариацииНайти матрицу ковариации С

размера n × n как:C = 1⁄(n − 1)

Слайд 11 Шаг 4: Найти собственные вектора и собственные числа

матрицы СВычислить матрицу V эйгенвекторов которая диагонализирует ковариационную матрицу

Слайд 12 Шаг 5: Проекция и реконструкцияВ матрицу Vreduced записать

k вектор-колонок, соответствующих k наибольшим собственным числам.Умножить Vreduced на