Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Кластерная индексация файлов для оптимизации поиска информации в распределенной файловой системе

Содержание

Актуальность:Высокие темпы роста объема текстовой информацииНакопление неклассифицированных данных в распределенной структуреОтсутствие возможности оптимального смыслового определения архитектуры классовНеобходимость в высококачественном и быстром поиске по большому массиву документов02 / 24
КЛАСТЕРНАЯ ИНДЕКСАЦИЯ ФАЙЛОВ ДЛЯ ОПТИМИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В РАСПРЕДЕЛЕННОЙ ФАЙЛОВОЙ СИСТЕМЕКушвид Евгений Актуальность:Высокие темпы роста объема текстовой информацииНакопление неклассифицированных данных в распределенной структуреОтсутствие возможности Цель:Целью работы является разработка метода эффективного поиска текстовой информации в распределенной файловой Общая архитектура04 / 24 Выборка:Иерархическая структурированная библиотека открытая для скачивания объемом 21гб05 / 24 Сбор и очистка данных:ДанныеПолученные очищенные слова данные отравляютсяНа формирование входного вектора 06 / 24 Формирование входного вектора для кластеризатора07 / 24 Существующие подходы к кластеризации:08 / 24 Существующие подходы к индексации09 / 24 Обоснование выбранного решение:Устойчивость к шумамСкоростьТочностьАдаптивностьОтсутствие необходимости в эвристикахSOINN10 / 24 Формирование структуры кластеров11 / 24 ИндексацияКаждому кластеру присваивается уникальный индекс в порядке вложенностиПределом кластеризации является сведение к Пример иерархической индексированной кластерной структуры файловПо окончанию иерархической кластеризации каждый файл отделяется Пример вида метаинформации в документе14 / 24 Пример сохраненной  метаинформации в текстовом файле15 / 24 Поиск16 / 24 Имплементация:17 / 24 Визуальный интерфейс18/ 24 Поисковый запрос19 / 24 Расширение поискового запроса20 / 24 Экран настроек21 / 24 Анализ эффективности:400мб1,5гб7 мс18 мс21гб19 мс23 мс22 / 24 Сравнительная характеристика алгоритмов поиска23 / 24 Выводы
Слайды презентации

Слайд 2 Актуальность:
Высокие темпы роста объема текстовой информации

Накопление неклассифицированных данных

Актуальность:Высокие темпы роста объема текстовой информацииНакопление неклассифицированных данных в распределенной структуреОтсутствие

в распределенной структуре

Отсутствие возможности оптимального смыслового определения архитектуры классов

Необходимость

в высококачественном и быстром поиске по большому массиву документов

02 / 24


Слайд 3 Цель:
Целью работы является разработка метода эффективного поиска текстовой

Цель:Целью работы является разработка метода эффективного поиска текстовой информации в распределенной

информации в распределенной файловой системе с высокой производительностью и

качеством при малых ресурсных затратах приложения

03 / 24


Слайд 4 Общая архитектура
04 / 24

Общая архитектура04 / 24

Слайд 5 Выборка:
Иерархическая структурированная библиотека открытая для скачивания объемом 21гб
05

Выборка:Иерархическая структурированная библиотека открытая для скачивания объемом 21гб05 / 24

/ 24


Слайд 6 Сбор и очистка данных:
Данные
Полученные очищенные слова данные отравляются
На

Сбор и очистка данных:ДанныеПолученные очищенные слова данные отравляютсяНа формирование входного вектора 06 / 24

формирование входного вектора
06 / 24


Слайд 7 Формирование входного вектора для кластеризатора
07 / 24

Формирование входного вектора для кластеризатора07 / 24

Слайд 8 Существующие подходы к кластеризации:
08 / 24

Существующие подходы к кластеризации:08 / 24

Слайд 9 Существующие подходы к индексации
09 / 24

Существующие подходы к индексации09 / 24

Слайд 10 Обоснование выбранного решение:
Устойчивость к шумам
Скорость
Точность
Адаптивность
Отсутствие необходимости в эвристиках

SOINN
10

Обоснование выбранного решение:Устойчивость к шумамСкоростьТочностьАдаптивностьОтсутствие необходимости в эвристикахSOINN10 / 24

/ 24


Слайд 11 Формирование структуры кластеров
11 / 24

Формирование структуры кластеров11 / 24

Слайд 12 Индексация
Каждому кластеру присваивается уникальный индекс в порядке вложенности

Пределом

ИндексацияКаждому кластеру присваивается уникальный индекс в порядке вложенностиПределом кластеризации является сведение

кластеризации является сведение к один кластер это один файл

и таким образом можно определить вложенность кластеров как уникальный HASH

12 / 24


Слайд 13 Пример иерархической индексированной кластерной структуры файлов

По окончанию иерархической

Пример иерархической индексированной кластерной структуры файловПо окончанию иерархической кластеризации каждый файл

кластеризации каждый файл отделяется в отдельный персональный кластер (исключение: файлы

дубликаты/копии)

Индекс файла со звездочкой: 0001000300020002

13 / 24


Слайд 14 Пример вида метаинформации в документе

14 / 24

Пример вида метаинформации в документе14 / 24

Слайд 15 Пример сохраненной метаинформации в текстовом файле
15 / 24

Пример сохраненной метаинформации в текстовом файле15 / 24

Слайд 16 Поиск
16 / 24

Поиск16 / 24

Слайд 17 Имплементация:

17 / 24

Имплементация:17 / 24

Слайд 18 Визуальный интерфейс

18/ 24

Визуальный интерфейс18/ 24

Слайд 19 Поисковый запрос

19 / 24

Поисковый запрос19 / 24

Слайд 20 Расширение поискового запроса

20 / 24

Расширение поискового запроса20 / 24

Слайд 21 Экран настроек
21 / 24

Экран настроек21 / 24

Слайд 22 Анализ эффективности:
400мб
1,5гб
7 мс
18 мс
21гб
19 мс
23 мс
22 / 24

Анализ эффективности:400мб1,5гб7 мс18 мс21гб19 мс23 мс22 / 24

Слайд 23 Сравнительная характеристика алгоритмов поиска
23 / 24

Сравнительная характеристика алгоритмов поиска23 / 24

  • Имя файла: klasternaya-indeksatsiya-faylov-dlya-optimizatsii-poiska-informatsii-v-raspredelennoy-faylovoy-sisteme.pptx
  • Количество просмотров: 117
  • Количество скачиваний: 0