Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Обзор параллельных вычислительных систем

Содержание

СодержаниеПути достижения параллелизма вычислений Определение суперкомпьютераПримеры суперкомпьютеров
Обзор параллельных вычислительных системЕсли создать систему, которой сможет пользоваться даже дурак, то СодержаниеПути достижения параллелизма вычислений Определение суперкомпьютераПримеры суперкомпьютеров Параллельные вычисленияПараллельные вычисления – процессы решения задач, в которых в один и Пути достижения параллелизмаНезависимое функционирование отдельных устройств компьютера (устройства ввода-вывода, обрабатывающие процессоры и Пути достижения параллелизмаМногозадачный (псевдопараллельный) режимдля выполнения нескольких процессов используется единственный процессорПараллельный режимв СуперкомпьютерСуперкомпьютер – вычислительная система, обладающая предельными характеристиками по производительности среди компьютерных систем, Производительность суперкомпьютеровFLOPS (Floating point Operations Per Second, флопс) – мера производительности, показывающая, сколько Пиковая и Linpack производительностьПиковая производительность – суммарная производительность процессоров (ядер), из которых Популярность LinpackФлопс является абсолютной величиной. Многие задачи инженерной и научной практики в Границы применимости FLOPSФлопс не всегда адекватная мера производительности, поскольку неоднозначным является уже Границы применимости FLOPSСуперкомпьютер MDGrape-3 (Исследовательский институт RIKEN, Япония), пиковая производительность 1 Пфлопс. Данный компьютер КластерыКластерная вычислительная система (кластер) – набор рабочих станций или персональных компьютеров общего Персональные суперкомпьютерыПерсональный мини-кластер T-Edge Mini t-platforms.ru/ru/temini.php4 двухпроцессорных узла на базе 4-ядерных процессоров Суперкомпьютер СКИФ-Аврора ЮУрГУПиковая производительность  117 Teraflops2011 г.Вычислительный кластерСКИФ Урал Пиковая производительность16 InfinityЧисло вычислительных узлов/процессоров: 26/52 Тип процессора:  Intel Xeon EM64T 3.2 ГГцОперативная СКИФ УралЧисло вычислительных узлов/процессоров/ядер: 166/332/1328Оперативная память: 1.33 ТбТип процессора: Intel Xeon E5472 Вычислительный узел СКИФ УралТип процессора: Intel Xeon E5472 (4 ядра по 3.0ГГц)Оперативная Хост-машина СКИФ УралТип процессора:  Intel Xeon E5472 (4 ядра по 3.0 Параллельная система хранения данных СКИФ УралПроизводительное хранилище данных Panasas ActiveStorage 5100 (20 Характеристики суперкомпьютера «СКИФ-Аврора ЮУрГУ»4 место в рейтинге СНГ ТОР50185 место в рейтинге Суперкомпьютер «СКИФ-Аврора ЮУрГУ»Высший технологический уровеньВысокая производительностьВысокая надежностьНизкая стоимость владенияЭффективное использование площадейПроизводительность (TFlops)Энергопотребление (Киловатт/TFlops)Плотность упаковки  (TFlops/Юнит) Вычислительный модуль СуперЭВМ «СКИФ Аврора»с водяным охлаждением Охлаждение горячей водой.  Полная нагрузка In — 50°C, Out — 55°C, CPU — 86–92°C http://supercomputer.susu.ru Рейтинг-листы суперкомпьютеровМировой: TOP500 (top500.org)    Российский: TOP50 (supercomputers.ru) Суперкомпьютер ЗаключениеОсновные пути достижения параллелизмаНезависимое функционирование отдельных устройств компьютераИзбыточность элементов вычислительной системыКонвейерная реализация
Слайды презентации

Слайд 2 Содержание
Пути достижения параллелизма вычислений
Определение суперкомпьютера
Примеры суперкомпьютеров

СодержаниеПути достижения параллелизма вычислений Определение суперкомпьютераПримеры суперкомпьютеров

Слайд 3 Параллельные вычисления
Параллельные вычисления – процессы решения задач, в

Параллельные вычисленияПараллельные вычисления – процессы решения задач, в которых в один

которых в один и тот же момент времени могут

выполняться одновременно несколько вычислительных операций.


Слайд 4 Пути достижения параллелизма
Независимое функционирование отдельных устройств компьютера (устройства

Пути достижения параллелизмаНезависимое функционирование отдельных устройств компьютера (устройства ввода-вывода, обрабатывающие процессоры

ввода-вывода, обрабатывающие процессоры и устройства памяти).
Избыточность элементов вычислительной системы
использование

специализированных устройств
отдельные процессоры для целочисленной и вещественной арифметики, устройства многоуровневой памяти;
дублирование устройств
использование нескольких однотипных обрабатывающих процессоров или нескольких устройств оперативной памяти
Конвейерная реализация обрабатывающих устройств.

Слайд 5 Пути достижения параллелизма
Многозадачный (псевдопараллельный) режим
для выполнения нескольких процессов

Пути достижения параллелизмаМногозадачный (псевдопараллельный) режимдля выполнения нескольких процессов используется единственный процессорПараллельный

используется единственный процессор
Параллельный режим
в один и тот же момент

времени может выполняться несколько команд обработки данных (обеспечивается при наличии нескольких процессоров или при помощи конвейерных и векторных обрабатывающих устройств)
Режим распределенных вычислений
для параллельной обработки данных используется несколько удаленных друг от друга обрабатывающих устройств, а передача данных по линиям связи приводит к существенным временным задержкам.

Слайд 6 Суперкомпьютер
Суперкомпьютер – вычислительная система, обладающая предельными характеристиками по

СуперкомпьютерСуперкомпьютер – вычислительная система, обладающая предельными характеристиками по производительности среди компьютерных

производительности среди компьютерных систем, имеющихся в данное время.
Другие определения


Суперкомпьютер – любой компьютер, весящий более одной тонны.
Суперкомпьютер – любой компьютер, который создал Сеймур Крей (создатель ряда американских суперкомпьютеров).

Cray-2, самый быстрый компьютер 1985-89 гг.


Слайд 7 Производительность суперкомпьютеров
FLOPS (Floating point Operations Per Second, флопс) –

Производительность суперкомпьютеровFLOPS (Floating point Operations Per Second, флопс) – мера производительности, показывающая,

мера производительности, показывающая, сколько операций с плавающей запятой в секунду выполняет данная вычислительная

система.

Слайд 8 Пиковая и Linpack производительность
Пиковая производительность – суммарная производительность

Пиковая и Linpack производительностьПиковая производительность – суммарная производительность процессоров (ядер), из

процессоров (ядер), из которых состоит суперкомпьютер
Linpack-производительность определяется путём запуска

на суперкомпьютер теста LINPACK (решение систем линейных алгебраический уравнений), в ходе которого решается задача с известным количеством операций и подсчитывает время, за которое она была решена. 

Слайд 9 Популярность Linpack
Флопс является абсолютной величиной.
Многие задачи инженерной

Популярность LinpackФлопс является абсолютной величиной. Многие задачи инженерной и научной практики

и научной практики в конечном итоге сводятся к решению СЛАУ,

а тест LINPACK как раз и базируется на измерении скорости решения таких систем.
Подавляющее большинство компьютеров (включая суперкомпьютеры) построены по классической архитектуре с использованием стандартных процессоров, что позволяет использовать общепринятые тесты с большой достоверностью.

Слайд 10 Границы применимости FLOPS
Флопс не всегда адекватная мера производительности,

Границы применимости FLOPSФлопс не всегда адекватная мера производительности, поскольку неоднозначным является

поскольку неоднозначным является уже само его определение.
Под "операцией

с плавающей запятой" может скрываться масса разных понятий.
Существенную роль в данных вычислениях играет разрядность операндов, которая также нигде не оговаривается.
Величина флопс подвержена влиянию очень многих факторов, напрямую не связанных с производительностью вычислительного модуля:
пропускная способность каналов связи с окружением процессора
производительность основной памяти 
синхронность работы кэш-памяти разных уровней.
Результаты, полученные на одном и том же компьютере при помощи разных программ, могут существенным образом отличаться. Более того, с каждым новым испытанием разные результаты можно получить при использовании одного алгоритма.

Слайд 11 Границы применимости FLOPS
Суперкомпьютер MDGrape-3 (Исследовательский институт RIKEN, Япония), пиковая производительность

Границы применимости FLOPSСуперкомпьютер MDGrape-3 (Исследовательский институт RIKEN, Япония), пиковая производительность 1 Пфлопс. Данный

1 Пфлопс.
Данный компьютер не является компьютером общего назначения

и приспособлен для решения задач моделирования сворачивания белков, и стандартный тест LINPACK на нем выполнить невозможно в силу особенностей его архитектуры.
Игровая приставка Xbox 360 (Microsoft), пиковая производительность  1 Тфлопс, приставка PlayStation 3 (SONY) – 2 Тфлопс (суперкомпьютеры начального уровня!).
Операции с 3d графикой, которые они в основном выполняют, очень хорошо поддаются распараллеливанию, что с успехом используется в графических процессорах.
Однако эти процессоры не в состоянии выполнять большинство задач общего назначения, и их производительность не поддаётся оценке теста LINPACK и сравнению с другими системами.

Слайд 12 Кластеры
Кластерная вычислительная система (кластер) – набор рабочих станций

КластерыКластерная вычислительная система (кластер) – набор рабочих станций или персональных компьютеров

или персональных компьютеров общего назначения, объединенных в систему с

помощью одной из стандартных сетевых технологий (Fast или Gigabit Ethernet, Myrinet и др.) на базе шинной архитектуры или коммутатора.
Кластер предполагает более высокую надежность и эффективность, чем ЛВС, и существенно более низкую стоимость в сравнении с другими видами параллельных вычислительных систем (за счет использования типовых аппаратных и программных решений).


Слайд 13 Персональные суперкомпьютеры
Персональный мини-кластер T-Edge Mini t-platforms.ru/ru/temini.php
4 двухпроцессорных узла на

Персональные суперкомпьютерыПерсональный мини-кластер T-Edge Mini t-platforms.ru/ru/temini.php4 двухпроцессорных узла на базе 4-ядерных

базе 4-ядерных процессоров Intel Xeon (всего 32 ядра)
Оперативная память

– до 128 Гбайт
Сеть передачи данных – Gigabit Ethernet или InfiniBand
Операционная система – одна из: SUSE Linux Enterprise Server, RedHat Enterprise Linux, MS Windows Compute Cluster Server 2003
Пиковая производительность – 384 GFlops
Размеры – 57×33×76 см

Слайд 14 Суперкомпьютер СКИФ-Аврора ЮУрГУ
Пиковая производительность 117 Teraflops
2011 г.
Вычислительный кластер
СКИФ Урал
Пиковая

Суперкомпьютер СКИФ-Аврора ЮУрГУПиковая производительность 117 Teraflops2011 г.Вычислительный кластерСКИФ Урал Пиковая производительность16

производительность
16 Teraflops
2008 г.
Вычислительный кластер
Infinity
Пиковая производительность
333 Gflops
2004 г.
Intel Xeon64 DP 3,2 ГГц
Intel

Xeon E5472 3 ГГц

Intel Xeon x5680 3,33 ГГц

Суперкомпьютер СКИФ-Аврора ЮУрГУ
Пиковая производительность 24 Teraflops
2010 г.

Intel Xeon x5570 2,93 ГГц

Вычислительный кластер
Physics
Пиковая производительность
1 Gflops
2000 г.

Intel Pentium 3 0,8 ГГц

Динамика развития суперкомпьютерных мощностей в ЮУрГУ


Слайд 15 Infinity
Число вычислительных узлов/процессоров: 26/52
Тип процессора: Intel Xeon

InfinityЧисло вычислительных узлов/процессоров: 26/52 Тип процессора: Intel Xeon EM64T 3.2 ГГцОперативная

EM64T 3.2 ГГц
Оперативная память: 58 Гб
Дисковая память: 2400 Гб
Тип

системной сети: InfiniBand (PCI-Express 4х)
Тип управляющей (вспомогательной) сети: Gigabit Ethernet
Пиковая производительность: 333 GFlops
Производительность на тесте Linpack: 270 GFlops
Операционная система:
Linux Gentoo 2006.1
Windows Compute Cluster Server 2003
Система бесперебойного электропитания: 15 kVA


Слайд 16 СКИФ Урал
Число вычислительных узлов/процессоров/ядер: 166/332/1328
Оперативная память: 1.33 Тб
Тип

СКИФ УралЧисло вычислительных узлов/процессоров/ядер: 166/332/1328Оперативная память: 1.33 ТбТип процессора: Intel Xeon

процессора: Intel Xeon E5472 (4 ядра по 3.0 ГГц)
Дисковая память:

49.29 Тб
Параллельная система хранения данных: T-Platforms ReadyStorage – 20ТB
Тип системной сети: InfiniBand (20 Гбit/s, макс. задержка 2 µs)
Тип управляющей сети: Gigabit Ethernet
Сервисная сеть: СКИФServNet
Пиковая производительность: 16 Тфлопс
Производительность на тесте Linpack: 12.2 Тфлопс
Операционная система:
SUSE Linux Enterprise Server 10
Windows HPC Server 2008
Система бесперебойного электропитания: APC Symmetra 160 kVA

Слайд 17 Вычислительный узел СКИФ Урал
Тип процессора: Intel Xeon E5472 (4

Вычислительный узел СКИФ УралТип процессора: Intel Xeon E5472 (4 ядра по

ядра по 3.0ГГц)
Оперативная память: 8 Гб
Дисковая память: 320 Гб
Операционная

система:
SUSE Linux Enterprise Server 10
Windows Computer Cluster Server


Слайд 18 Хост-машина СКИФ Урал
Тип процессора: Intel Xeon E5472 (4

Хост-машина СКИФ УралТип процессора: Intel Xeon E5472 (4 ядра по 3.0

ядра по 3.0 ГГц)
Оперативная память: 16 Гб
Дисковая память: 1.25

Тб RAID
Операционная система:
SUSE Linux Enterprise Server 10
Windows Computer Cluster Server


Слайд 19 Параллельная система хранения данных СКИФ Урал
Производительное хранилище данных

Параллельная система хранения данных СКИФ УралПроизводительное хранилище данных Panasas ActiveStorage 5100

Panasas ActiveStorage 5100 (20 Тб) с архитектурой NAS, разработанное

специально для кластеров
Пропускная способность более 60 Гбит/сек
Параллельный доступ к данным всех узлов кластера

Слайд 20 Характеристики суперкомпьютера «СКИФ-Аврора ЮУрГУ»
4 место в рейтинге СНГ ТОР50
185

Характеристики суперкомпьютера «СКИФ-Аврора ЮУрГУ»4 место в рейтинге СНГ ТОР50185 место в

место в рейтинге TOP500
117 Терафлопс
8832 вычислительных ядер
Оперативная память: 9

Тбайт
Дисковая память: Intel SSD 108 Тбайт

Коммуникационные сети:
Cистемная сеть: 3D torus, 60 Гбит/сек.
InfiniBand QDR, 40 Гбит/сек.
Gigabit Ethernet
Сети мониторинга – 3 шт.


Слайд 21 Суперкомпьютер «СКИФ-Аврора ЮУрГУ»
Высший технологический уровень
Высокая производительность
Высокая надежность
Низкая стоимость

Суперкомпьютер «СКИФ-Аврора ЮУрГУ»Высший технологический уровеньВысокая производительностьВысокая надежностьНизкая стоимость владенияЭффективное использование площадейПроизводительность (TFlops)Энергопотребление (Киловатт/TFlops)Плотность упаковки (TFlops/Юнит)

владения
Эффективное использование площадей
Производительность (TFlops)
Энергопотребление (Киловатт/TFlops)
Плотность упаковки (TFlops/Юнит)


Слайд 22 Вычислительный модуль СуперЭВМ «СКИФ Аврора»
с водяным охлаждением

Вычислительный модуль СуперЭВМ «СКИФ Аврора»с водяным охлаждением

Слайд 23 Охлаждение горячей водой. Полная нагрузка In — 50°C,

Охлаждение горячей водой. Полная нагрузка In — 50°C, Out — 55°C, CPU — 86–92°C

Out — 55°C, CPU — 86–92°C


Слайд 25 http://supercomputer.susu.ru

http://supercomputer.susu.ru

Слайд 26 Рейтинг-листы суперкомпьютеров
Мировой: TOP500 (top500.org)
Российский: TOP50 (supercomputers.ru)

Рейтинг-листы суперкомпьютеровМировой: TOP500 (top500.org)  Российский: TOP50 (supercomputers.ru)

Слайд 28 Суперкомпьютер "СКИФ-Аврора ЮУрГУ" занял 87 место в 37-ой

Суперкомпьютер

редакции рейтинга TOP500 (июнь 2011).

Суперкомпьютер "СКИФ-Аврора ЮУрГУ" занял 185

место в 39-ой редакции рейтинга TOP500 (июнь 2012).

  • Имя файла: obzor-parallelnyh-vychislitelnyh-sistem.pptx
  • Количество просмотров: 129
  • Количество скачиваний: 0