Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Базы данных. Управление данными

Содержание

Основные требования, предъявляемые к банкам данных
Базы данных Управление данными Основные требования, предъявляемые к банкам данных Основные требования, предъявляемые к банкам данных Основные требования, предъявляемые к банкам данных Основные требования, предъявляемые к банкам данных Основные требования, предъявляемые к банкам данных Информационная базаДанные, отражающие состояние определенной предметной области и используемые информационной системой Уровни представления данныхКонцептуальный уровеньПользовательРазработчик ИСЛогический (внешний) уровеньПрикладной программистФизический (внутренний) уровеньСУБДОбобщенный взгляд на Лингвистические средствав состав СУБД включаются специальные языки для описания представлений внутреннего и Этапы работы с базой данныхОписание БДОписание частей БД, необходимых для конкретных приложений Языковые средства работы с базой данныхЯзык описания данных (ЯОД)определение схемы базы данныххарактеристики Языки, базирующиеся на C-исчислении, предложенном Коддомбазируется на классическом прикладном исчислении предикатовв качестве Характеристики языковФункциональныеотражают возможности описания данных, средств представления запроса, обновления, поддержки целостности и Свойства языков запросовСелективная мощностьхарактеризует возможность выбора данных по разным критериямязык с большей Свойства языков запросовУровень процедурностиопределяется присущими реляционной модели свойствами, в частности, полным отделением Язык для работы с базами данных  SQL (Structured Query Language)SQLсредства для Программные средства Комплекс программных средствядро, обеспечивающее управление данными во внешней и оперативной памяти, а Централизованное управление данными обеспечивает:сокращение избыточности в хранимых данныхсовместное использование хранимых данныхстандартизацию Технические средстваТехнические средства БнДЭВМСредства хранения данныхСредства ввода данныхСредства отображения данныхКоммуникационные средстваУстройства ввода-вывода Организационно-административные подсистемы и нормативно-методическое обеспечениеОрганизационно-методические средства банка данныхразличные инструкции, методические и регламентирующие Пользователи баз данныхКонечный пользовательимеет дело только с внешним интерфейсом, поддерживаемым СУБДАдминистратор базы Пользователи баз данныхПрикладные программистыимеют, как правило, в своем распоряжении один или несколько Типология баз данныхКлассификация по форме представляемой информацииФактографическиеДокументальныеМультимедийныеКартографическиеВидео-, аудио-, графические Типология баз данныхКлассификация по типу хранимой (не мультимедийной) информацииФактографическиеДокументальныеПолнотекстовыеБиблиографически-реферативныеЛексикографическиеКлассификаторыКодификаторыСловариТезаурусыРубрикаторы Типология баз данныхКлассификация по типу используемой модели данныхИерархическиеСетевыеРеляционныеПостреляционныеОбъектно-ориентированные Типология баз данныхКлассификация по топологии храненияЛокальные БДРаспределенные БДКлассификация по типологии доступа и Типология баз данныхКлассификация по сфере возможного примененияУниверсальныеСпециализированныеКлассификация по степени доступностиОбщедоступныеС ограниченным доступом Типология баз данных с точки зрения информационных процессовБД могут относится с различным Система моделей представления информации Инфологические моделиМодели представления хорошо структурированной информацииМодели представления плохо Примерная схема организации ввода-вывода Линейные файлы данных Методы доступа к записям Первые системы управления базами данных Два уровня независимости данных Схема обработки запроса на выборку данных из БДприкладная программа (клиентское приложение) формирует Типы, форматы, структуры данныхтип данных - совокупность соглашений о программно-аппаратурной форме представления Варианты размещения данных и их описанияПрограммаОписание данныхДанныеВ прикладной программеПрограммаОписание данныхДанныеВ файле данныхПрограммаДанныеОтдельным Основные отличительные особенности обработки данных, характерные для файловых систем и систем управления Основные задачи обработки данных, решаемые на основе концепций баз данных, сводятся к Эффективность Простота Скорость выборки Стоимость (сложность) аппаратных средств Скорость выборкиСложность процедур доступа Соотношение понятий концептуальной и внутренней схемнабор объектов, представляющих интерес для актуальных или Варианты решений трехуровневого представления Трехуровневая архитектура обеспечивает выполнение основных требований, предъявляемых к системам баз данныхадекватность отображения Трехуровневая архитектура имеет следующие достоинства с точки зрения пользователей различных категорийсистемный аналитик, Идентификация объектов и записей Основные понятияв задачах обработки информации атрибуты именуют (обозначают) Атрибутивный способ идентификации (используется для хорошо структурированной информации) ИнформацияОбъект предметной областиСвойствоДанныеЗаписьЭлементы данныхЗначениеАтрибутивный способ идентификации (используется для хорошо структурированной информации) Поиск записейВ зависимости от уровня программного обеспечения прикладной программист может использовать следующие Первичный (главный) ключидентифицирует запись единственным образомВторичный (альтернативный) ключидентифицирует некоторую группу записей, имеющих Способы хранения ключа и атрибутаИнвертируемый список Типология простых (атомарных) запросов:А(Е) = ? Каково значение атрибута А для объекта Составные условия поиска могут использовать несколько простых условий, обычно связанных логическими (булевыми) Этапы преобразования представлений предметной области Модели данных и баз данныхМодель данных - обеспечивает на формальном абстрактном уровне Структуры данныхСтруктура информациисхематичная форма представления сложных композиционных объектов и связей реальной предметной Линейные структурыМассивысовокупность однотипных элементов число элементов массива известно до его размещения, что Нелинейные структурыСпискисовокупность однотипных элементовпорядок выборки элементов может отличаться от порядка следования в 123456789101112131415162117181920ДеревоКореньЛистья ДеревьяСбалансированное дерево в каждом узле имеет одинаковое число ветвей, причем процесс включения 1Сетевые структуры23456789101112345 ПоставщикИзделиеПример простой сетевой структуры РасценкаЗаказ на закупкуПартия товара РуководительСлужащийруководитИзделиеУзелДетальПример сетевой структуры с петлей Основные понятия реляционной модели Первичный ключPKFIOYEARJOBKAFДоменыОтношениеКортежиКардинальностьАтрибутыСтепень Реляционная модель предъявляет к таблицам следующие требования:1) данные в ячейках таблицы должны Объединение Пересечение Разность Произведение ВыборкаKaf = 605 Проекция Соединение ДелениеДелимоеПосредникДелительДеление Физические модели баз данныхОрганизация данных на машинных носителях Физические модели баз данныхТипы записей Способы организации файлов данных Физическое представление с разделением данных и связей Требования, предъявляемые к базам данных Описания должны быть понятны пользователю, не проектировавшему Модели и этапы проектирования баз данныхПроектирование базы данных — это упорядоченный формализованный Модели и этапы проектирования баз данныхПроектирование начинается c анализа предметной области и Модели и этапы проектирования баз данныхОбъединяя отдельные представлений о содержимом базы данных, Модели и этапы проектирования баз данныхИнфологическая человеко-ориентированная модель практически полностью независима от Модели и этапы проектирования баз данныхВсе модели, кроме инфологической, являются машинно-ориентированными С Стадии и объекты процесса проектирования Пример ER-диаграммы Сущность, с помощью которой моделируется класс однотипных объектов, определяется как «предмет, который СвойстваCвойство - характер связи свойства с сущностью.Свойство может быть множественным или единичнымСвойство Связь определяется как «ассоциация, объединяющая несколько сущностей»Сущности, объединяемые связью, называются участниками. Степень СотрудникРабочийПрограммистТабельный номерФИОЯзык программированияПрикладной программистСистемный программистОтношение «род – вид» используется для представления обобщенных Сущности. Каждый тип сущности в ER-диаграммах представляется в виде прямоугольника, содержащего имя Нотация ER-диаграммСвойства. Свойства служат для уточнения, идентификации, характеристики или выражения состояния сущности Нотация ER-диаграммСвязь – это графически изображаемая ассоциация, устанавливаемая между сущностями. Каждый тип В первой нормальной форме ER-диаграммы устраняются повторяющиеся атрибуты или группы атрибутов, т. Пример ER-диаграммы в третьей нормальной форме ТранзакцииИсходное состояниеИсходное состояниеИзмененная БДНарушение целостностиCOMMITROLLBACKИсходное состояниеТранзакция – неделимая с точки зрения воздействия Модель автоматического выполнения транзакций INSERTCOMMITUPDATECOMMITINSERTCOMMITUPDATEROLLBACKНепротиворечивая БДНепротиворечивая БДНепротиворечивая БД Модель управляемого выполнения транзакций BEGIN TRANSACTIONИсходное состояние БДUPDATESAVE TRANSACTION AINSERTROLLBACK TO ADELETECOMMIT Протокол журнализации (и управления буферизацией) действует по правилу Write Ahead Log (WAL) Пользователь не должен осуществлять рестарт транзакций или повторный ввод данных. Восстановление должно Программы ведения системного журнала регистрируют операции над БД: описание соответствующей транзакции, код Кладовщик 1Кладовщик 2Запрос количества пива на складе для ID_Сорт = 5Ответ: 30Запрос Кладовщик 1Кладовщик 2Запрос количества пива на складе для ID_Сорт = 5Ответ: 30Заполнение Кладовщик 1Кладовщик 2Запрос количества пива на складе для ID_Сорт = 5Ответ: 30Заполнение Проблема «строк-призраков»Декан ФИТВыгрузить данные аттестации!!! Компьютер деканата Выгружаем список…Студент ПупкинУра! Я только Сериализация транзакцийМетод сериализации транзакций — это механизм их выполнения по такому плану, Захват и освобождение объекта Выделяются два основных режима захватов:совместный режим — S В контексте реляционных баз данных возможны следующие варианты:файл - физический (с точки Транзакция — это законченный блок обращений к базе данных и некоторых действий Распределенные базы данных Основные особенности распределенных баз данныхРепликацияУдаленные транзакцииРаспределенные запросы OLTP  (Online Transaction Processing) транзакционная системаобработка транзакций в реальном времениСпособ организации Типовой запрос к OLTP-системе:«Каков был уровень импорта товара в январе 2012 года?»Невозможны Использование OLTPOLTP-системы оперативной обработки транзакций, характеризуются большим количеством изменений, одновременным обращением множества Системы OLTP характеризуются:поддержкой большого числа пользователей; малым временем отклика на запрос; относительно Требования к OLTPСильно нормализованные модели данных;При возникновении ошибки транзакция должна целиком откатиться Хранилища данныхSQLКаково среднее значение промежутка времени между выставлением счета и оплатой его Хранилища данных Хранилища данныхОсновные операции над кубами данных:СечениеВращениеСверткаДетализация OLAP  (Online Analytical Processing) аналитическая обработка в реальном временитехнология обработки данных, Критерии OLAP (FASMI)Fast (Быстрый). Приложение OLAP должно обеспечивать минимальное время доступа к Методы аналитической обработки данных в хранилищеТрадиционные статистические методы регрессионного, факторного, дисперсионного анализа, Средства анализа данных в СППР на основе хранилищ данных используются для решения
Слайды презентации

Слайд 2


Слайд 3 Основные требования, предъявляемые к банкам данных

Основные требования, предъявляемые к банкам данных

Слайд 4 Основные требования, предъявляемые к банкам данных

Основные требования, предъявляемые к банкам данных

Слайд 5 Основные требования, предъявляемые к банкам данных

Основные требования, предъявляемые к банкам данных

Слайд 6 Основные требования, предъявляемые к банкам данных

Основные требования, предъявляемые к банкам данных

Слайд 7 Основные требования, предъявляемые к банкам данных

Основные требования, предъявляемые к банкам данных

Слайд 9 Информационная база
Данные, отражающие состояние определенной предметной области и

Информационная базаДанные, отражающие состояние определенной предметной области и используемые информационной системой

используемые информационной системой


Слайд 10 Уровни представления данных
Концептуальный уровень

Пользователь
Разработчик ИС

Логический (внешний) уровень

Прикладной программист

Физический

Уровни представления данныхКонцептуальный уровеньПользовательРазработчик ИСЛогический (внешний) уровеньПрикладной программистФизический (внутренний) уровеньСУБДОбобщенный взгляд

(внутренний) уровень

СУБД
Обобщенный взгляд на данные с позиций предметной области
Не

затрагивает физической организации (размещения) данных во внешней памяти

Глобальное представление БД, определяет необходимые условия для организации хранения данных на внешних запоминающих устройствах



Слайд 11 Лингвистические средства
в состав СУБД включаются
специальные языки для

Лингвистические средствав состав СУБД включаются специальные языки для описания представлений внутреннего

описания представлений внутреннего и внешнего уровней

язык манипулирования данными (ЯМД)

дополнительные

сервисные средства (например, средства генерации отчетов)



Слайд 12 Этапы работы с базой данных
Описание БД
Описание частей БД,

Этапы работы с базой данныхОписание БДОписание частей БД, необходимых для конкретных

необходимых для конкретных приложений (задач, групп задач)
Программирование задач или

описание запросов в соответствии с правилами конкретного языка и использованием языковых конструкций для обращения к БД
Загрузка БД

Слайд 13 Языковые средства работы с базой данных
Язык описания данных

Языковые средства работы с базой данныхЯзык описания данных (ЯОД)определение схемы базы

(ЯОД)
определение схемы базы данных
характеристики хранимых и виртуальных данных
параметры организации

хранения данных в памяти
средства поддержки целостности базы данных, ограничения доступа, секретности

Язык манипулирования данными (ЯОД)

средства запросов к базе данных и поддержания базы данных (добавление, удаление, обновление данных, создание и уничтожение БД, изменение определений БД, обеспечение запросов к справочнику БД)


Слайд 14 Языки, базирующиеся на C-исчислении, предложенном Коддом
базируется на классическом

Языки, базирующиеся на C-исчислении, предложенном Коддомбазируется на классическом прикладном исчислении предикатовв

прикладном исчислении предикатов
в качестве области изменения значений предметной переменной

используется множество выборок (кортежей) отношения

Языки, базирующиеся на P-исчислении, предложенном Пиротти

представляет собой разновидность прикладного многотипного исчисления предикатов
каждому типу переменных или констант соответствует определенный домен базы данных

Языковые средства работы с базой данных


Слайд 15 Характеристики языков
Функциональные
отражают возможности описания данных, средств представления запроса,

Характеристики языковФункциональныеотражают возможности описания данных, средств представления запроса, обновления, поддержки целостности

обновления, поддержки целостности и секретности, включения в языки программирования,

управления форматом ответов, средств запроса к словарю данных БД и т. д.

Качественные

определяются такими свойствами, как полнота, селективная мощность, простота изучения и использования, степень процедурности и модульности, унифицированность, производительность и эффективность


Слайд 16 Свойства языков запросов
Селективная мощность
характеризует возможность выбора данных по

Свойства языков запросовСелективная мощностьхарактеризует возможность выбора данных по разным критериямязык с

разным критериям
язык с большей селективной мощностью позволяет сформулировать большинство

запросов так, что ответ на них содержит меньше ненужных данных

Простота изучения

субъективная оценка, охарактеризована степенью его близости к естественному языку, требуемым для его освоения временем и необходимым уровнем подготовки пользователя


Слайд 17 Свойства языков запросов
Уровень процедурности
определяется присущими реляционной модели свойствами,

Свойства языков запросовУровень процедурностиопределяется присущими реляционной модели свойствами, в частности, полным

в частности, полным отделением логической структуры данных от структур

хранения и стратегий доступа

Модульность построения языка

характеризует возможность существования нескольких уровней языка и зависит от специфических свойств математической теории, лежащей в его основе
языки, не обладающие модульностью, требуют от пользователя знания почти всего объема средств языка, что усложняет процесс их изучения


Слайд 18 Язык для работы с базами данных SQL (Structured

Язык для работы с базами данных SQL (Structured Query Language)SQLсредства для

Query Language)
SQL
средства для спецификации и обработки запросов на выборку

данных

функции по созданию, обновлению, управлению доступом

язык описания данных + язык манипулирования данными

внутренний язык баз данных, отражает особенности конкретной СУБД



Слайд 19 Программные средства

Программные средства

Слайд 20 Комплекс программных средств
ядро, обеспечивающее управление данными во внешней

Комплекс программных средствядро, обеспечивающее управление данными во внешней и оперативной памяти,

и оперативной памяти, а также протоколирование изменений

процессор языка

базы данных, обеспечивающий обработку (трансляцию или компиляцию) и оптимизацию запросов на выборку и изменение данных


подсистема (библиотека) поддержки программных вызовов, которая обслуживает прикладные программы управления данными, взаимодействующие с СУБД через средства пользовательского интерфейса


сервисные программы (системные и внешние утилиты), обеспечивающие настройку СУБД, восстановление после сбоев и ряд дополнительных возможностей обслуживания



Слайд 21 Централизованное управление данными обеспечивает:
сокращение избыточности в хранимых данных

совместное

Централизованное управление данными обеспечивает:сокращение избыточности в хранимых данныхсовместное использование хранимых данныхстандартизацию

использование хранимых данных

стандартизацию представления данных, упрощающую

эксплуатацию БД


разграничение доступа к данным


целостность данных, обеспечиваемую процедурами, предотвращающими включение в БД неверных данных, и ее восстановление после отказов системы




Слайд 22 Технические средства
Технические средства БнД
ЭВМ

Средства хранения данных

Средства ввода данных

Средства

Технические средстваТехнические средства БнДЭВМСредства хранения данныхСредства ввода данныхСредства отображения данныхКоммуникационные средстваУстройства

отображения данных

Коммуникационные средства

Устройства ввода-вывода и накопители внешней памяти —

традиционно «узкое место» любой базы данных
Важные параметры: объем и быстродействие накопителей, отказоустойчивость



Слайд 23 Организационно-административные подсистемы и нормативно-методическое обеспечение
Организационно-методические средства банка данных
различные

Организационно-административные подсистемы и нормативно-методическое обеспечениеОрганизационно-методические средства банка данныхразличные инструкции, методические и

инструкции, методические и регламентирующие материалы, предназначенные для пользователей разных

категорий, взаимодействующих с банком данных

инструкции конечным пользователям по работе с базой данных, документы, определяющие права доступа и регламент работы; сюда же отнесем и методики проектирования баз


Слайд 24 Пользователи баз данных
Конечный пользователь
имеет дело только с внешним

Пользователи баз данныхКонечный пользовательимеет дело только с внешним интерфейсом, поддерживаемым СУБДАдминистратор

интерфейсом, поддерживаемым СУБД

Администратор базы данных (АБД)
несет ответственность за проектирование

и общее управление базой данных

определяет информационное содержание БД

идентифицирует объекты БД и моделирует базу, используя язык описания данных

решает все вопросы, связанные с размещением БД в памяти, выбором стратегии и ограничений доступа к данным

организует процессы загрузки, ведения и восстановления БД и многие другие действия, которые не могут быть полностью формализованы и автоматизированы


Слайд 25 Пользователи баз данных
Прикладные программисты
имеют, как правило, в своем

Пользователи баз данныхПрикладные программистыимеют, как правило, в своем распоряжении один или

распоряжении один или несколько языков программирования, с помощью которых

генерируются прикладные программы

Администратор приложений
определяет для приложений подмодели данных

(разные приложения обеспечиваются собственным «взглядом», но не на всю БД, а только на требуемую для конкретного приложения («видимую») ее часть)



Слайд 26 Типология баз данных
Классификация по форме представляемой информации
Фактографические

Документальные

Мультимедийные
Картографические

Видео-, аудио-,

Типология баз данныхКлассификация по форме представляемой информацииФактографическиеДокументальныеМультимедийныеКартографическиеВидео-, аудио-, графические

графические



Слайд 27 Типология баз данных
Классификация по типу хранимой (не мультимедийной)

Типология баз данныхКлассификация по типу хранимой (не мультимедийной) информацииФактографическиеДокументальныеПолнотекстовыеБиблиографически-реферативныеЛексикографическиеКлассификаторыКодификаторыСловариТезаурусыРубрикаторы

информации
Фактографические

Документальные
Полнотекстовые

Библиографически-реферативные


Лексикографические
Классификаторы

Кодификаторы

Словари

Тезаурусы

Рубрикаторы



Слайд 28 Типология баз данных
Классификация по типу используемой модели данных
Иерархические

Сетевые

Реляционные

Постреляционные
Объектно-ориентированные

Типология баз данныхКлассификация по типу используемой модели данныхИерархическиеСетевыеРеляционныеПостреляционныеОбъектно-ориентированные

Слайд 29 Типология баз данных
Классификация по топологии хранения
Локальные БД

Распределенные БД

Классификация

Типология баз данныхКлассификация по топологии храненияЛокальные БДРаспределенные БДКлассификация по типологии доступа

по типологии доступа и характеру использования
Специализированные

Интегрированные

Классификация по функциональному назначению
Операционные

Справочно-информационные


Слайд 30 Типология баз данных
Классификация по сфере возможного применения
Универсальные

Специализированные

Классификация по

Типология баз данныхКлассификация по сфере возможного примененияУниверсальныеСпециализированныеКлассификация по степени доступностиОбщедоступныеС ограниченным доступом

степени доступности
Общедоступные

С ограниченным доступом


Слайд 31 Типология баз данных с точки зрения информационных процессов
БД

Типология баз данных с точки зрения информационных процессовБД могут относится с

могут относится с различным уровням информационных процессов
Уровень информационных технологий

(ИТ)
БД определяется как взаимосвязанная совокупность файлов ОС, содержащих данные о предметной области решаемой задачи

основное внимание уделяется физической структуре БД


Уровень системы (ИС)
БД рассматривается как компонента, представляющая собой информационную модель предметной области

наиболее важной является проблема логической структуры БД


Уровень информационных ресурсов (ИР)
БД трактуется как элемент мировых ИР

основной характеристикой здесь является содержание БД



Слайд 32 Система моделей представления информации
Инфологические модели
Модели представления хорошо

Система моделей представления информации Инфологические моделиМодели представления хорошо структурированной информацииМодели представления

структурированной информации
Модели представления плохо структурированной информации
IDEF-модели
Диаграммы потоков данных
ER-модели
Дескрипторные модели

Семантические

сети. Тезаурусы


Фреймы

Даталогические модели

Модели представления фактографической информации

Модели представления документальной информации

Объектно-ориентированные


Теоретико-графовые

Теоретико-множественные

Инвертирования организация

Прямая организация

Иерархические

Сетевые

Реляционные

Бинарных отношений

Схемно-определяемая структура

Контекстно-определяемая структура

Физические модели

Модели, основанные на файловых структурах

Модели, имеющие страничную организацию

IDEF – одно из семейств стандартов ICAM (Integrated Computer-Aided Manufacturing)
IDEF – ICAM DEFinition

DFD – Data Flow Diagram

ER – Entity-Relationship – Сущность-Связь


Слайд 33 Примерная схема организации ввода-вывода

Примерная схема организации ввода-вывода

Слайд 34 Линейные файлы данных

Линейные файлы данных

Слайд 35 Методы доступа к записям

Методы доступа к записям

Слайд 36 Первые системы управления базами данных

Первые системы управления базами данных

Слайд 37 Два уровня независимости данных

Два уровня независимости данных

Слайд 38 Схема обработки запроса на выборку данных из БД
прикладная

Схема обработки запроса на выборку данных из БДприкладная программа (клиентское приложение)

программа (клиентское приложение) формирует и выдает системе управления базами

данных запрос на чтение необходимых данных, содержащихся в базе

СУБД отыскивает описание затребованных данных в структуре описания данных прикладного уровня (внешняя модель)

СУБД по глобальному описанию БД (концептуальная схема) определяет необходимые данные на логическом уровне

СУБД по описанию физической структуры БД (физическая модель) определяет физическую запись (или совокупность записей), которую необходимо считать для выборки данных, затребованных прикладной программой

СУБД через подсистему управления потоками данных выдает операционной системе запрос на чтение хранимой записи

подсистема управления вводом-выводом операционной системы осуществляет физическое чтение записи в системный буфер ОС

СУБД выделяет необходимую логическую запись, осуществляет форматные преобразования, обусловленные различиями описаний на глобальном и прикладном уровнях, и передает для функциональной обработки приложением данные в рабочий буфер, выделяемый прикладной программой или самой СУБД


Слайд 39 Типы, форматы, структуры данных
тип данных - совокупность соглашений

Типы, форматы, структуры данныхтип данных - совокупность соглашений о программно-аппаратурной форме

о программно-аппаратурной форме представления и обработки, а также ввода,

контроля и вывода элементарных данных
Пример: Bigint (целочисленный)


структуры данных — способы композиции простых данных в агрегаты и операции над ними
Пример: File (файл)


форматы файлов — представление информации им уровне взаимодействия операционной системы с прикладными программами
Пример: двоичный, символьный, текстовый файлы



Слайд 40 Варианты размещения данных и их описания
Программа


Описание данных
Данные
В прикладной

Варианты размещения данных и их описанияПрограммаОписание данныхДанныеВ прикладной программеПрограммаОписание данныхДанныеВ файле

программе

Программа

Описание данных
Д
а
н
н
ы
е


В файле данных
Программа


Данные
Отдельным набором данных (словарь данных)
Описание данных


Слайд 41 Основные отличительные особенности обработки данных, характерные для файловых

Основные отличительные особенности обработки данных, характерные для файловых систем и систем

систем и систем управления базами данных
Файл


представляет собой совокупность записей

одного типа, доступ к которым определяется типом организации файла и осуществляется только средствами операционной системы



описывают и используют в прикладной программе, работающей с данными



ОС устанавливает связь между именем и адресом данных

База данных



совокупность данных разного типа, причем часто по одним данным получают другие



существует независимо от конкретной прикладной программы, создается с целью интеграции данных, объединяющей данные многих приложений (но определенного назначения)



СУБД устанавливает связь между содержанием и адресом


Слайд 42 Основные задачи обработки данных, решаемые на основе концепций

Основные задачи обработки данных, решаемые на основе концепций баз данных, сводятся

баз данных, сводятся к следующим вопросам
Каким образом сложные нелинейные

структуры данных представить в виде линейных — наиболее соответствующих принципу последовательного представления (хранения) в машинной памяти?


Каким образом организовать данные, чтобы была возможность эффективного внесения, удаления и редактирования данных?


Как организовать данные, чтобы использование пространства памяти (плотность данных) было достаточно рациональным, а скорость доступа к записям данных высокой?


Каким образом организовать данные, чтобы поиск был эффективным и позволял отыскивать записи по нескольким ключам?



Слайд 43 Эффективность
Простота
Скорость выборки
Стоимость (сложность) аппаратных средств

Эффективность Простота Скорость выборки Стоимость (сложность) аппаратных средств Скорость выборкиСложность процедур


Скорость выборки
Сложность процедур доступа
Плотность данных
Время доступа и

сложность процедур

Независимость данных

Производительность

Гибкость средств поиска

Избыточность данных

Гибкость поиска

Скорость поиска

Сложность процедур доступа

Простота обслуживания









Создание базы данных — это попытка найти компромисс сразу по нескольким направлениям и сочетаниям нескольких взаимообратных факторов (с точки зрения прагматики)


Слайд 44 Соотношение понятий концептуальной и внутренней схем
набор объектов, представляющих

Соотношение понятий концептуальной и внутренней схемнабор объектов, представляющих интерес для актуальных

интерес для актуальных или предполагаемых пользователей
совокупность функциональных характеристик объектов

и особенностей представления информации (например, в числовой или текстовой форме)

Абстрагированное описание предметной области с фиксированной (логической) точки зрения

Отображение концептуальной схемы на физический уровень называют внутренней схемой

Отражение взгляда (точки зрения) отдельного пользователя на концептуальную схему (как вариант восприятия предметной области) называют внешней схемой


Слайд 45 Варианты решений трехуровневого представления

Варианты решений трехуровневого представления

Слайд 46 Трехуровневая архитектура обеспечивает выполнение основных требований, предъявляемых к

Трехуровневая архитектура обеспечивает выполнение основных требований, предъявляемых к системам баз данныхадекватность

системам баз данных
адекватность отображения предметной области

возможность взаимодействия с БД

разных пользователей при решении разных прикладных задач


обеспечение независимости программ и данных


надежность функционирования БД и защита от несанкционированного доступа



Слайд 47 Трехуровневая архитектура имеет следующие достоинства с точки зрения

Трехуровневая архитектура имеет следующие достоинства с точки зрения пользователей различных категорийсистемный

пользователей различных категорий
системный аналитик, создающий модель предметной области, не обязательно

должен быть специалистом в области программирования и вычислительной техники и не вмешивается во внутреннее представление данных


администратор баз данных, обеспечивающий отражение концептуальной схемы во внутреннюю, не должен беспокоиться о корректности представления предметной области


конечные пользователи, используя внешнюю схему, могут не вдаваться полностью в предметную область, обращаясь только к необходимым составляющим



Слайд 48 Идентификация объектов и записей Основные понятия
в задачах обработки информации

Идентификация объектов и записей Основные понятияв задачах обработки информации атрибуты именуют

атрибуты именуют (обозначают) и приписывают им значения
информацию о свойствах

каждого из объектов рассматриваемой совокупности надо сохранять (записывать) как данные, чтобы при решении задач их можно было найти и выполнить необходимые преобразования
любое состояние объекта характеризуется совокупностью актуализированных атрибутов (имеющих некоторое из значений в этот момент времени), которые фиксируются на некотором материальном носителе в виде записи — совокупности (группы) формализованных элементов данных (значений атрибутов, представленных в том или ином формате)

Слайд 49 Атрибутивный способ идентификации (используется для хорошо структурированной информации)

Атрибутивный способ идентификации (используется для хорошо структурированной информации)

Слайд 50 Информация
Объект
предметной области
Свойство
Данные
Запись
Элементы данных





Значение
Атрибутивный способ идентификации (используется для хорошо

ИнформацияОбъект предметной областиСвойствоДанныеЗаписьЭлементы данныхЗначениеАтрибутивный способ идентификации (используется для хорошо структурированной информации)

структурированной информации)


Слайд 51 Поиск записей
В зависимости от уровня программного обеспечения прикладной

Поиск записейВ зависимости от уровня программного обеспечения прикладной программист может использовать

программист может использовать следующие способы
Задать машинный адрес данных и

в соответствии с физическим форматом записи прочитать значение
Это случай, когда программист должен быть «навигатором»

Сообщить системе имя записи или элемента данных, которые он хочет получить, и возможно, организацию набора данных.
В этом случае система сама произведет выборку, но для этого она должна будет использовать вспомогательную информацию о структуре данных и организации набора

В качестве ключа, обеспечивающего доступ к записи, можно использовать идентификатор — отдельный элемент данных


Слайд 52 Первичный (главный) ключ
идентифицирует запись единственным образом

Вторичный (альтернативный) ключ
идентифицирует

Первичный (главный) ключидентифицирует запись единственным образомВторичный (альтернативный) ключидентифицирует некоторую группу записей,

некоторую группу записей, имеющих определенное общее свойство

Сцепленный ключ
несколько

элементов данных, которые в совокупности, обеспечат уникальность идентификации каждой записи набора данных

Поиск записей


Слайд 53 Способы хранения ключа и атрибута
Инвертируемый список

Способы хранения ключа и атрибутаИнвертируемый список

Слайд 54



Типология простых (атомарных) запросов:
А(Е) = ?

Каково значение

Типология простых (атомарных) запросов:А(Е) = ? Каково значение атрибута А для

атрибута А для объекта Е?
А(?) = V

Какие объекты

имеют значение атрибута, равное V?

?(Е) = V


Какие атрибуты объекта Е имеют значение, равное V?

?(Е) = ?


Какие значения атрибутов имеет объект E?

А(?) = ?


Какие значения имеет атрибут А в наборе?

?(?) = V


Какие атрибуты объектов набора имеют значение, равное V?

в запросах типов 2, 3, 6 вместо оператора равенства может быть использован другой оператор сравнения (больше, меньше, не­равно или другие)

Запросы типа 1 выполняются поиском по «прямому» массиву: доступ к записи производится по первичному ключу

Запросы типа 2 выполняются поиском по инвертированному списку: доступ к записи(ям) производится по указателю, выбираемому из списка по значению вторичного ключа. Ответом в этих случаях будет значение атрибута или идентификатора

Запросы типа 3 имеют ответом имя атрибута

Запросы типа 2, 5, 6 относятся к нескольким атрибутам, и в этом случае могут быть построены несколько индексов, облегчаю­щих поиск по этим ключам


Слайд 55 Составные условия поиска могут использовать несколько простых условий,

Составные условия поиска могут использовать несколько простых условий, обычно связанных логическими

обычно связанных логическими (булевыми) операторами
Системы с вторичными индексами. В

этих системах последовательность расположения записей соответствует последовательности значений первичного ключа.
Как правило, используется один первичный индекс и несколько вторичных.


Системы частично инвертированных файлов. В этих системах записи могут располагаться в произвольной последовательности. Первичный индекс отсутствует. Вторичные индексы применяются для прямой адресации записей, что существенно облегчает включение в файл новых записей, так как допускается их размещение в любом свободном участке файла


Системы полностью инвертированных файлов. В этих системах предусмотрено наличие файлов, содержащих значения отдельных элементов данных, входящих в состав записей, — допускается раздельное хранение элементов данных записи.
Значения элементов данных, составляющих конкретную запись или кортеж, в общем случае могут размещаться в памяти произвольно.



Слайд 56 Этапы преобразования представлений предметной области

Этапы преобразования представлений предметной области

Слайд 57 Модели данных и баз данных
Модель данных - обеспечивает

Модели данных и баз данныхМодель данных - обеспечивает на формальном абстрактном

на формальном абстрактном уровне конкретные способы представления объектов и

связей
средство спецификации типов данных и их организации, разрешенных в конкретной БД

основа разработки общей методологии построения баз данных

основа минимизации влияния эволюции баз данных на уже существующие прикладные программы и работу конечных пользователей

основа разработки семейства языков запросов и языков манипулирования данными

основа архитектуры СУБД

основа изучения динамических свойств различных организаций данных

Модель базы данных
определяет ясную границу между логическим и физическим аспектами управления базой данных (независимость данных)

обеспечивает конечным пользователям и программистам, создающим БД, возможность и средства общего понимания смысла данных (коммуникабельность)

определяет языковые понятия высокого уровня, обеспечивающие возможность выполнения однотипных операций над большими совокупностями записей (в общем случае разнотипных данных) как единую операцию (обработка множеств)


Слайд 58 Структуры данных
Структура информации
схематичная форма представления сложных композиционных объектов и

Структуры данныхСтруктура информациисхематичная форма представления сложных композиционных объектов и связей реальной

связей реальной предметной области, выделяемых как актуально необходимые для

решения прикладных задач
это неотъемлемое свойство информации (сведений, сигналов, воспринимаемых субъектом) о некоторой совокупности объектов предметной области в контексте практической задачи (решаемой субъектом)
Структура данных
атрибутивная форма представления свойств и связей предметной области, ориентированная на выражение описания данных средствами формальных языков
это определение информационных масси­вов (состава и взаимосвязей данных на логическом уровне, соответствующих характеру информации и видам соответствующих преобразований)
Структура записей
целесообразная (учитывающая особенности физической среды) реализация способов хранения данных и организации доступа к ним как на уровне отдельных записей, так и их элементов
это определение структуры физической памяти: выделение, освобождение и защита областей физического носителя, способы адресации и пересылки

Слайд 59 Линейные структуры
Массивы
совокупность однотипных элементов
число элементов массива известно

Линейные структурыМассивысовокупность однотипных элементов число элементов массива известно до его размещения,

до его размещения, что позволяет строить гибкие многомерные системы

адресации
Последовательности
представляет собой совокупность однотипных элементов
число элементов до размещения неизвестно
Таблицы
последовательности, обычно представляемые строками – совокупностями разнотипных элементов.
множество записей, каждая из которых представляет набор поименованных полей

Слайд 60 Нелинейные структуры
Списки
совокупность однотипных элементов
порядок выборки элементов может отличаться

Нелинейные структурыСпискисовокупность однотипных элементовпорядок выборки элементов может отличаться от порядка следования

от порядка следования в памяти, определенного при размещении
число элементов

до размещения неизвестно

Деревья

представляет собой иерархию элементов, называемых узлами
на самом верхнем уровне иерархии имеется только один узел — корень
каждый узел, кроме корня, связан с одним узлом на более высоком уровне, называемым исходным узлом для данного узла
Каждый элемент может быть связан с одним или несколькими элементами на более низком уровне, которые называются порожденными.
элементы, расположенные в конце ветви, т. е. не имеющие порожденных, называются листьями

Сети

любой элемент может быть связан с любым другим элементом


Слайд 61 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
21
17
18
19
20
Дерево
Корень
Листья

123456789101112131415162117181920ДеревоКореньЛистья

Слайд 62 Деревья
Сбалансированное дерево в каждом узле имеет одинаковое число

ДеревьяСбалансированное дерево в каждом узле имеет одинаковое число ветвей, причем процесс

ветвей, причем процесс включения новых ветвей в узлы дерева

идет сверху вниз, а на каждом уровне дерева — слева направо

Двоичные деревья — это особая категория сбалансированных древовидных структур, в которой допускается не более двух ветвей для одного узла

Пример несбалансированного двоичного дерева


Слайд 63 1
Сетевые структуры
2
3
4
5
6
7
8
9
10
11
1
2
3
4
5





1Сетевые структуры23456789101112345

Слайд 64 Поставщик
Изделие
Пример простой сетевой структуры
Расценка
Заказ
на закупку
Партия
товара

ПоставщикИзделиеПример простой сетевой структуры РасценкаЗаказ на закупкуПартия товара

Слайд 65 Руководитель
Служащий
руководит





Изделие
Узел
Деталь
Пример сетевой структуры с петлей

РуководительСлужащийруководитИзделиеУзелДетальПример сетевой структуры с петлей

Слайд 66 Основные понятия реляционной модели
Первичный ключ
PK
FIO
YEAR
JOB
KAF

Домены
Отношение
Кортежи
Кардинальность
Атрибуты
Степень

Основные понятия реляционной модели Первичный ключPKFIOYEARJOBKAFДоменыОтношениеКортежиКардинальностьАтрибутыСтепень

Слайд 67
Реляционная модель предъявляет к таблицам следующие требования:

1) данные

Реляционная модель предъявляет к таблицам следующие требования:1) данные в ячейках таблицы

в ячейках таблицы должны быть структурно неделимыми ;
2) данные

в одном столбце должны быть одного типа;
3) каждый столбец должен быть уникальным (недопустимо дублирование столбцов);
4) столбцы размещаются в произвольном порядке;
5) строки размещаются и таблице также в произвольном порядке;
6) столбцы имеют уникальные наименования.

Слайд 68



Объединение

Объединение

Слайд 69



Пересечение

Пересечение

Слайд 70

Разность


Разность

Слайд 71

Произведение

Произведение

Слайд 72 Выборка







Kaf = 605

ВыборкаKaf = 605

Слайд 73 Проекция




Проекция

Слайд 74 Соединение

Соединение

Слайд 75 Деление
Делимое
Посредник
Делитель
Деление



ДелениеДелимоеПосредникДелительДеление

Слайд 76 Физические модели баз данных
Организация данных на машинных носителях

Физические модели баз данныхОрганизация данных на машинных носителях

Слайд 77 Физические модели баз данных
Типы записей

Физические модели баз данныхТипы записей

Слайд 78 Способы организации файлов данных

Способы организации файлов данных

Слайд 79
Физическое представление с разделением данных и связей


Физическое представление с разделением данных и связей

Слайд 80 Требования, предъявляемые к базам данных
Описания должны быть

Требования, предъявляемые к базам данных Описания должны быть понятны пользователю, не

понятны пользователю, не проектировавшему базу

2. Однажды принятые способы представления

данных должны допускать присоединение новых элементов данных без изменения существующих схем данных и прикладных программ

3. СУБД должны позволять эффективно обрабатывать произвольные запросы к базе данных

Слайд 81 Модели и этапы проектирования баз данных
Проектирование базы данных

Модели и этапы проектирования баз данныхПроектирование базы данных — это упорядоченный

— это упорядоченный формализованный процесс создания системы взаимосвязанных описаний,

т. е. таких моделей предметной области, которые связывают (фиксируют) хранимые в базе данные с объектами предметной области, описываемыми этими данными

Такие описания реализуются, например, в виде схем


Слайд 82 Модели и этапы проектирования баз данных
Проектирование начинается c

Модели и этапы проектирования баз данныхПроектирование начинается c анализа предметной области

анализа предметной области и выявления функциональных и других требований

к проектируемой системе

Проектирование обычно выполняется человеком (группой людей) — системным аналитиком (а на практике чаще администратором базы данных), которым может быть как специально выделенным сотрудником, так и будущим пользователем базы данных, достаточно хорошо знакомым с машинной обработкой данных

Слайд 83 Модели и этапы проектирования баз данных
Объединяя отдельные представлений

Модели и этапы проектирования баз данныхОбъединяя отдельные представлений о содержимом базы

о содержимом базы данных, полученные в результате опроса пользователей,

и свои представления о данных, которые могут потребоваться для решения практических задач, системный аналитик сначала создает обобщенное неформальное описание создаваемой базы данных.

2. Это описание, выполненное с использованием естественного языка, математических выражений, таблиц, графов и других средств, понятных всем людям, работающим над проектированием базы данных, называют инфологической моделью

Слайд 84 Модели и этапы проектирования баз данных
Инфологическая человеко-ориентированная модель

Модели и этапы проектирования баз данныхИнфологическая человеко-ориентированная модель практически полностью независима

практически полностью независима от физических параметров среды хранения данных,

которой может быть как память человека, так и ЭВМ

Инфологическая модель не изменяется до тех пор, пока какие-то изменения в реальном мире (той его части, которая отнесена к предметной области) не потребуют изменения в модели соответствующего фрагмента описания, чтобы эта модель продолжала адекватно отражать предметную область.

Слайд 85 Модели и этапы проектирования баз данных
Все модели, кроме

Модели и этапы проектирования баз данныхВсе модели, кроме инфологической, являются машинно-ориентированными

инфологической, являются машинно-ориентированными

С их помощью СУБД дает возможность

программам и пользователям осуществлять доступ к хранимым данным лишь по их именам, не заботясь о физическом расположении этих данных

Так как доступ к данным осуществляется с помощью конкретной СУБД, то модели должны быть представлены на языке описания данных этой СУБД. Такое описание, создаваемое по инфологической модели данных, называют даталогической моделью данных.

Для размещения и поиска данных на внешних запоминающих устройствах СУБД использует физическую модель данных.

Слайд 86 Стадии и объекты процесса проектирования

Стадии и объекты процесса проектирования

Слайд 87 Пример ER-диаграммы

Пример ER-диаграммы

Слайд 88 Сущность, с помощью которой моделируется класс однотипных объектов,

Сущность, с помощью которой моделируется класс однотипных объектов, определяется как «предмет,

определяется как «предмет, который может быть четко идентифицирован».

Сущность должна

определяться таким набором атрибутов, который позволял бы различать отдельные экземпляры сущности.

Сущность имеет имя, уникальное в пределах модели. При этом имя сущности — это имя типа, а не некоторого конкретного экземпляра.

Сущности подразделяются на сильные и слабые.

Сущности


Слайд 89 Свойства
Cвойство - характер связи свойства с сущностью.

Свойство может

СвойстваCвойство - характер связи свойства с сущностью.Свойство может быть множественным или

быть множественным или единичным

Свойство может быть простым или составным

В

некоторых случаях полезно различать базовые и производные свойства

Если наличие некоторого свойства для всех экземпляров сущности не является обязательным, то такое свойство называется условным

Значения свойств могут быть постоянными – статическими или динамическими

Свойство может быть неопределенным

Свойство может рассматриваться как ключевое

Слайд 90 Связь определяется как «ассоциация, объединяющая несколько сущностей»

Сущности, объединяемые

Связь определяется как «ассоциация, объединяющая несколько сущностей»Сущности, объединяемые связью, называются участниками.

связью, называются участниками. Степень связи определяется количеством участников связи

Если

каждый экземпляр сущности участвует, по крайней мере, в одном экземпляре связи, то такое участие этой сущности называется полным (или обязательным); в противном случае — неполным (или необязательным)

Количественный характер участия экземпляров сущностей (один или многие) задается типом связи (или мощностью связи). Возможны следующие типы: «один к одному» (1:1), «один ко многим» (1:M), «многие ко многим» (М:М).

Отношение «часть — целое» используются для представления составных объектов.

Связи


Слайд 91 Сотрудник

Рабочий

Программист

Табельный номер

ФИО
Язык программирования
Прикладной программист

Системный программист

Отношение «род – вид»

СотрудникРабочийПрограммистТабельный номерФИОЯзык программированияПрикладной программистСистемный программистОтношение «род – вид» используется для представления

используется для представления обобщенных объектов.
Сущность может быть расщеплена на

два или более взаимоисключающих подтипов, каждый из которых включает общие атрибуты и/или связи.
Сущность, на основе которой определяются подтипы, называется супертипом.

Супертипы


Слайд 92 Сущности. Каждый тип сущности в ER-диаграммах представляется в

Сущности. Каждый тип сущности в ER-диаграммах представляется в виде прямоугольника, содержащего

виде прямоугольника, содержащего имя сущности.

В качестве имени обычно

используются существительные (или обороты существительного) в единственном числе.

Для отражения сущностей слабых типов используются прямоугольники, стороны которых рисуются двойными линиями.

Нотация ER-диаграмм


Слайд 93 Нотация ER-диаграмм
Свойства. Свойства служат для уточнения, идентификации, характеристики

Нотация ER-диаграммСвойства. Свойства служат для уточнения, идентификации, характеристики или выражения состояния

или выражения состояния сущности или связи. Свойства отображаются в

виде эллипсов, содержащих имя свойства. Эллипс соединяется с соответствующей сущностью или связью линией.

Имена ключевых свойств подчеркиваются

Контур эллипса рисуется двойной линией, если свойство многозначное

Контур эллипса рисуется штриховой линией, если свойство производное

Эллипс соединяется пунктирной линией, если свойство условное

Если свойство составное, то составляющие его свойства отображаются другими эллипсами, соединенными с эллипсом составного

Слайд 94 Нотация ER-диаграмм
Связь – это графически изображаемая ассоциация, устанавливаемая

Нотация ER-диаграммСвязь – это графически изображаемая ассоциация, устанавливаемая между сущностями. Каждый

между сущностями. Каждый тип связи на ER-диаграмме отображается в

виде ромба с именем связи внутри. И качестве имени обычно используются отглагольные существительные.

Стороны ромба рисуют двойными линиями, если это связь сущности слабого типа с сущностью, от которой она зависит.

Участники связи соединены со связью линиями. Двойная линия обозначает полное участие сущности в связи с данной стороны.

Связь может быть модифицирована указанием роли.

Тип связи указывается индексами «1» или «М» над соответствующей линией

Слайд 95 В первой нормальной форме ER-диаграммы устраняются повторяющиеся атрибуты

В первой нормальной форме ER-диаграммы устраняются повторяющиеся атрибуты или группы атрибутов,

или группы атрибутов, т. е. производится выявление неявных сущностей,

«замаскированных» под атрибуты.

Во второй нормальной форме устраняются атрибуты, зависящие только от части уникального идентификатора. Эта часть уникального идентификатора определяет отдельную сущность.

В третьей нормальной форме устраняются атрибуты, зависящие от атрибутов, не входящих в уникальный идентификатор. Эти атрибуты являются основой отдельной сущности.

Нормальные формы ER-диаграмм


Слайд 96 Пример ER-диаграммы в третьей нормальной форме

Пример ER-диаграммы в третьей нормальной форме

Слайд 97 Транзакции




Исходное состояние
Исходное состояние
Измененная БД
Нарушение целостности
COMMIT
ROLLBACK
Исходное состояние
Транзакция – неделимая

ТранзакцииИсходное состояниеИсходное состояниеИзмененная БДНарушение целостностиCOMMITROLLBACKИсходное состояниеТранзакция – неделимая с точки зрения

с точки зрения воздействия на БД последовательность операторов манипулирования

данными, такая, что:
1) либо результаты всех операторов, входящих в транзакцию, отображаются в БД;
2) либо воздействие всех этих операторов полностью отсутствует.

Слайд 98
Модель автоматического выполнения транзакций
INSERT
COMMIT

UPDATE
COMMIT


INSERT
COMMIT

UPDATE
ROLLBACK
Непротиворечивая БД
Непротиворечивая БД
Непротиворечивая БД

Модель автоматического выполнения транзакций INSERTCOMMITUPDATECOMMITINSERTCOMMITUPDATEROLLBACKНепротиворечивая БДНепротиворечивая БДНепротиворечивая БД

Слайд 99
Модель управляемого выполнения транзакций
BEGIN TRANSACTION
Исходное состояние БД
UPDATE
SAVE

Модель управляемого выполнения транзакций BEGIN TRANSACTIONИсходное состояние БДUPDATESAVE TRANSACTION AINSERTROLLBACK TO

TRANSACTION A
INSERT
ROLLBACK TO A
DELETE
COMMIT TRANSACTION


Точка сохранения А
Cостояние БД после

транзакции



Слайд 100 Протокол журнализации (и управления буферизацией) действует по правилу

Протокол журнализации (и управления буферизацией) действует по правилу Write Ahead Log

Write Ahead Log (WAL) — «пиши сначала в журнал»,

и состоит в том, что если требуется сохранить во внешней памяти измененный объект базы данных, то перед этим нужно гарантировать сохранение во внешней памяти журнала записи о его изменении.

Журнал транзакций


Слайд 101 Пользователь не должен осуществлять рестарт транзакций или повторный

Пользователь не должен осуществлять рестарт транзакций или повторный ввод данных. Восстановление

ввод данных. Восстановление должно проходить на базе транзакции с

помощью отмены или изменения отдельных транзакций.

2. Быстрое восстановление данных обеспечивается генерацией данных, используемых для восстановления.

3. При выполнении процедур автоматизированного восстановления пользователь не должен анализировать состав данных и выбирать сами процедуры.

Общие требования к системе восстановления данных в составе СУБД


Слайд 102 Программы ведения системного журнала регистрируют операции над БД:

Программы ведения системного журнала регистрируют операции над БД: описание соответствующей транзакции,

описание соответствующей транзакции, код пользователя, текст входного сообщения, тип

изменения БД, адреса изменяемых данных вместе с их значениями до и после изменения.
Программы архивации используются для регулярного получения копий БД для последующего ее восстановления.
Программы восстановления применяются для возврата БД или некоторых ее частей и состояние, предшествующее возникновению отказа. При этом используют архивную копию БД и системный журнал.
Программы отката ликвидируют последствия выполнения оп­ределенной транзакции в БД.
Программы записи контрольных точек и повторного исполнения позволяют ускорить восстановление.

Сервисные программные средства для восстановления


Слайд 103 Кладовщик 1
Кладовщик 2
Запрос количества пива на складе для

Кладовщик 1Кладовщик 2Запрос количества пива на складе для ID_Сорт = 5Ответ:

ID_Сорт = 5
Ответ: 30
Запрос количества пива на складе для

ID_Сорт = 5
Ответ: 30

Заполнение столбца ID_Сорт таблицы «Пиво» с Количеством 25

Заполнение столбца ID_Сорт таблицы «Пиво» с Количеством 18

Изменение значения столбца Количество и занесение нового значения (5) в строку таблицы

Изменение значения столбца Количество и занесение нового значения (12) в строку таблицы

ID_Сорт … Количество
… … …
5 … 30
… … …

ID_Сорт … Количество
… … …
5 … 5
… … …

ID_Сорт … Количество
… … …
5 … 12
… … …

«Проблема пропавшего изменения»


Слайд 104 Кладовщик 1
Кладовщик 2
Запрос количества пива на складе для

Кладовщик 1Кладовщик 2Запрос количества пива на складе для ID_Сорт = 5Ответ:

ID_Сорт = 5
Ответ: 30
Заполнение столбца ID_Сорт таблицы «Пиво» с

количеством 30

Увеличение значения столбца Количество на 30 и занесение нового значения (60) в строку таблицы

Запрос количества пива на складе с ID_Сорт=5
Ответ: 60

ID_Сорт … Количество
… … …
5 … 30
… … …

ID_Сорт … Количество
… … …
5 … 60
… … …

ID_Сорт … Количество
… … …
5 … 30
… … …

Проблема чтения «грязных данных» (dirty data)

ROLLBACK
(возврат к исходному состоянию)

Заполнение столбца ID_Сорт таблицы «Пиво» с количеством 60

!! ОШИБКА !!


Слайд 105 Кладовщик 1
Кладовщик 2
Запрос количества пива на складе для

Кладовщик 1Кладовщик 2Запрос количества пива на складе для ID_Сорт = 5Ответ:

ID_Сорт = 5
Ответ: 30
Заполнение столбца ID_Сорт таблицы «Пиво» с

количеством 30

Увеличение значения столбца Количество на 30 и занесение нового значения (60) в строку таблицы

Запрос количества пива на складе с ID_Сорт=5
Ответ: 30

ID_Сорт … Количество
… … …
5 … 30
… … …

ID_Сорт … Количество
… … …
5 … 60
… … …

☹ Не то продали! Бестолковые менеджеры!

Проблема чтения несогласованных данных

Запрос количества пива на складе с ID_Сорт=6
Ответ: 50


Продаем 6ой сорт, раз его больше!

Запрос количества пива на складе с ID_Сорт=5
Ответ: 60



Слайд 106 Проблема «строк-призраков»


Декан ФИТ
Выгрузить данные аттестации!!!

Компьютер деканата

Выгружаем

Проблема «строк-призраков»Декан ФИТВыгрузить данные аттестации!!! Компьютер деканата Выгружаем список…Студент ПупкинУра! Я

список…
Студент Пупкин
Ура! Я только что переписал аттестацию!

Преображенский Ю.П.
Беги

в деканат, расскажи им об этом!


Студент Пупкин

Бягу!!!

Студент бежит…, список выгружается….


Декан ФИТ

Всё! Пупкин не сдал! Отчислить его!


Студент Пупкин

Аааа! Я ж сдал!

Список выгружается еще раз…. Пупкин сдал… но его уже отчислили…


Слайд 107 Сериализация транзакций
Метод сериализации транзакций — это механизм их

Сериализация транзакцийМетод сериализации транзакций — это механизм их выполнения по такому

выполнения по такому плану, когда результат совместного выполнения транзак­ций

эквивалентен результату некоторого последовательного выпол­нения этих же транзакций.

Между транзакциями могут существовать следующие виды конфликтов:

Транзакция 2 пытается изменять объект, измененный незакончившейся Транзакцией 1 (W-W — конфликт);

Транзакция 2 пытается изменять объект, прочитанный незакончившейся Транзакцией 1 (R-W — конфликт);

Транзакция 2 пытается читать объект, измененный незакончившейся Транзакцией 1 (W-R — конфликт).


Слайд 108 Захват и освобождение объекта
Выделяются два основных режима

Захват и освобождение объекта Выделяются два основных режима захватов:совместный режим —

захватов:

совместный режим — S (Shared), означающий разделяемый захват объекта

и необходимый для выполнения операции чтения объекта;

монопольный режим — X (exclusive), означающий монопольный захват объекта и необходимый для выполнения операций записи, удаления и модификации.

Слайд 109 В контексте реляционных баз данных возможны следующие варианты:

файл

В контексте реляционных баз данных возможны следующие варианты:файл - физический (с

- физический (с точки зрения базы данных) объект, область

хранения нескольких отношений и, возможно, индексов
таблица - логический объект, соответствующий множеству записей данного отношения;
страница данных - физический объект, хранящий записи од­ного или нескольких отношений, индексную или служебную информацию;
запись - элементарный физический объект базы данных.

Потенциально возможные объекты для захвата


Слайд 110 Транзакция — это законченный блок обращений к базе

Транзакция — это законченный блок обращений к базе данных и некоторых

данных и некоторых действий над ней, для которого гарантируется

выполнение четырех условий, так называемых свойств ACID (Atomicity, Consistency, Isolation, Durability):

атомарность — операции транзакции образуют неразделимый атомарный блок с определенным началом и концом. Этот блок либо выполняется от начала до конца, либо не выполняется вообще. Если в процессе выполнения транзакции произошел сбой, происходит откат к исходному состоянию
согласованность — по завершении транзакции все задействованные объекты находятся в согласованном состоянии
изолированность — одновременный доступ транзакций различных приложений к разделяемым объектам координируется таким образом, чтобы эти транзакции не влияли друг на друга
долговременность — все изменения данных, осуществленные в процессе выполнения транзакции, не могут быть потеряны

Правила ACID


Слайд 111 Распределенные базы данных

Распределенные базы данных

Слайд 112 Основные особенности распределенных баз данных



Репликация


Удаленные транзакции


Распределенные запросы

Основные особенности распределенных баз данныхРепликацияУдаленные транзакцииРаспределенные запросы

Слайд 113 OLTP (Online Transaction Processing) транзакционная система
обработка транзакций в реальном

OLTP (Online Transaction Processing) транзакционная системаобработка транзакций в реальном времениСпособ организации

времени

Способ организации БД, при котором система работает с небольшими

по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.

Слайд 114 Типовой запрос к OLTP-системе:

«Каков был уровень импорта товара

Типовой запрос к OLTP-системе:«Каков был уровень импорта товара в январе 2012

в январе 2012 года?»


Невозможны аналитические запросы вида:

«Будет ли получена

от этого прибыль?»
«Какие клиенты наиболее выгодны с позиции таможенных платежей и почему?»

Слайд 115 Использование OLTP
OLTP-системы оперативной обработки транзакций, характеризуются большим количеством

Использование OLTPOLTP-системы оперативной обработки транзакций, характеризуются большим количеством изменений, одновременным обращением

изменений, одновременным обращением множества пользователей к одним и тем

же данным для выполнения разнообразных операций - чтения,  записи, удаления или  модификации данных. Для нормальной работы множества пользователей применяются блокировки и транзакции. Эффективная обработка транзакций и поддержка блокировок входят в число важнейших требований к системам оперативной обработки транзакций.
OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени.

Слайд 116 Системы OLTP характеризуются:
поддержкой большого числа пользователей;
малым временем

Системы OLTP характеризуются:поддержкой большого числа пользователей; малым временем отклика на запрос;

отклика на запрос;
относительно короткими запросами;
короткими транзакциями;
участие

в запросах небольшого числа таблиц.


Критическим для OLTP-приложений является скорость и надежность выполнения коротких операций обновления данных.


Слайд 117 Требования к OLTP
Сильно нормализованные модели данных;
При возникновении ошибки

Требования к OLTPСильно нормализованные модели данных;При возникновении ошибки транзакция должна целиком

транзакция должна целиком откатиться и вернуть систему к состоянию,

которое было до начала транзакции;
Обработка данных в реальном времени.


Слайд 119
Хранилища данных
SQL
Каково среднее значение промежутка времени между выставлением

Хранилища данныхSQLКаково среднее значение промежутка времени между выставлением счета и оплатой

счета и оплатой его участником ВЭД в текущем и

прошедшем году для разных групп участников ВЭД ?».

Данные практически не обновляются, а лишь накапливаются.

Необходима хронологическая упорядоченность данных

При запросах импорта нет нужды учитывать «каждый контейнер», достаточно иметь агрегированную информацию за прошлый сезон/прошлый год/несколько лет


Слайд 120 Хранилища данных

Хранилища данных

Слайд 123 Хранилища данных
Основные операции над кубами данных:

Сечение
Вращение
Свертка
Детализация

Хранилища данныхОсновные операции над кубами данных:СечениеВращениеСверткаДетализация

Слайд 124 OLAP (Online Analytical Processing) аналитическая обработка в реальном времени
технология

OLAP (Online Analytical Processing) аналитическая обработка в реальном временитехнология обработки данных,

обработки данных, заключающаяся в подготовке суммарной (агрегированной) информации на

основе больших массивов данных, структурированных по многомерному принципу

это совокупность концепций, принципов и требований, лежащих в основе программных продуктов, облегчающих аналитикам доступ к данным

Слайд 127 Критерии OLAP (FASMI)
Fast (Быстрый). Приложение OLAP должно обеспечивать минимальное

Критерии OLAP (FASMI)Fast (Быстрый). Приложение OLAP должно обеспечивать минимальное время доступа

время доступа к аналитическим данным - в среднем порядка

5 секунд;
Analysis (Анализ). Приложение OLAP должно давать пользователю возможность осуществлять числовой и статистический анализ;
Shared (Разделяемый доступ). Приложение OLAP должно предоставлять возможность работы с информацией многим пользователям одновременно;
Multidimensional (Многомерность);
Information (Информация). Приложение OLAP должно давать пользователю возможность получать нужную информацию, в каком бы электронном хранилище данных она не находилась.

Слайд 129 Методы аналитической обработки данных в хранилище
Традиционные статистические методы

Методы аналитической обработки данных в хранилищеТрадиционные статистические методы регрессионного, факторного, дисперсионного

регрессионного, факторного, дисперсионного анализа, анализа временных рядов, а также

методы, основанные на искусственном интеллекте (нейронные сети, нечеткую логику, генетические алгоритмы, методы извлечения знаний)

Слайд 130 Средства анализа данных в СППР на основе хранилищ

Средства анализа данных в СППР на основе хранилищ данных используются для

данных используются для решения следующих задач:

выделение в данных групп

сходных по некоторым признакам записей (кластерный анализ);

2) нахождение и аппроксимация зависимостей, связывающих анализируемые параметры или события, а также поиск параметров, наиболее значимых в терминах конкретной задачи;

3) поиск данных, существенно отклоняющихся от выявленных закономерностей (анализ аномалий);

4) прогнозирование развития объектов различной природы на основе хранящейся ретроспективной информации об их состоянии в прошлом.

  • Имя файла: bazy-dannyh-upravlenie-dannymi.pptx
  • Количество просмотров: 136
  • Количество скачиваний: 0