Слайд 2
Содержание
Пути достижения параллелизма вычислений
Определение суперкомпьютера
Примеры суперкомпьютеров
Слайд 3
Параллельные вычисления
Параллельные вычисления – процессы решения задач, в
которых в один и тот же момент времени могут
выполняться одновременно несколько вычислительных операций.
Слайд 4
Пути достижения параллелизма
Независимое функционирование отдельных устройств компьютера (устройства
ввода-вывода, обрабатывающие процессоры и устройства памяти).
Избыточность элементов вычислительной системы
использование
специализированных устройств
отдельные процессоры для целочисленной и вещественной арифметики, устройства многоуровневой памяти;
дублирование устройств
использование нескольких однотипных обрабатывающих процессоров или нескольких устройств оперативной памяти
Конвейерная реализация обрабатывающих устройств.
Слайд 5
Пути достижения параллелизма
Многозадачный (псевдопараллельный) режим
для выполнения нескольких процессов
используется единственный процессор
Параллельный режим
в один и тот же момент
времени может выполняться несколько команд обработки данных (обеспечивается при наличии нескольких процессоров или при помощи конвейерных и векторных обрабатывающих устройств)
Режим распределенных вычислений
для параллельной обработки данных используется несколько удаленных друг от друга обрабатывающих устройств, а передача данных по линиям связи приводит к существенным временным задержкам.
Слайд 6
Суперкомпьютер
Суперкомпьютер – вычислительная система, обладающая предельными характеристиками по
производительности среди компьютерных систем, имеющихся в данное время.
Другие определения
Суперкомпьютер – любой компьютер, весящий более одной тонны.
Суперкомпьютер – любой компьютер, который создал Сеймур Крей (создатель ряда американских суперкомпьютеров).
Cray-2, самый быстрый компьютер 1985-89 гг.
Слайд 7
Производительность суперкомпьютеров
FLOPS (Floating point Operations Per Second, флопс) –
мера производительности, показывающая, сколько операций с плавающей запятой в секунду выполняет данная вычислительная
система.
Слайд 8
Пиковая и Linpack производительность
Пиковая производительность – суммарная производительность
процессоров (ядер), из которых состоит суперкомпьютер
Linpack-производительность определяется путём запуска
на суперкомпьютер теста LINPACK (решение систем линейных алгебраический уравнений), в ходе которого решается задача с известным количеством операций и подсчитывает время, за которое она была решена.
Слайд 9
Популярность Linpack
Флопс является абсолютной величиной.
Многие задачи инженерной
и научной практики в конечном итоге сводятся к решению СЛАУ,
а тест LINPACK как раз и базируется на измерении скорости решения таких систем.
Подавляющее большинство компьютеров (включая суперкомпьютеры) построены по классической архитектуре с использованием стандартных процессоров, что позволяет использовать общепринятые тесты с большой достоверностью.
Слайд 10
Границы применимости FLOPS
Флопс не всегда адекватная мера производительности,
поскольку неоднозначным является уже само его определение.
Под "операцией
с плавающей запятой" может скрываться масса разных понятий.
Существенную роль в данных вычислениях играет разрядность операндов, которая также нигде не оговаривается.
Величина флопс подвержена влиянию очень многих факторов, напрямую не связанных с производительностью вычислительного модуля:
пропускная способность каналов связи с окружением процессора
производительность основной памяти
синхронность работы кэш-памяти разных уровней.
Результаты, полученные на одном и том же компьютере при помощи разных программ, могут существенным образом отличаться. Более того, с каждым новым испытанием разные результаты можно получить при использовании одного алгоритма.
Слайд 11
Границы применимости FLOPS
Суперкомпьютер MDGrape-3 (Исследовательский институт RIKEN, Япония), пиковая производительность
1 Пфлопс.
Данный компьютер не является компьютером общего назначения
и приспособлен для решения задач моделирования сворачивания белков, и стандартный тест LINPACK на нем выполнить невозможно в силу особенностей его архитектуры.
Игровая приставка Xbox 360 (Microsoft), пиковая производительность 1 Тфлопс, приставка PlayStation 3 (SONY) – 2 Тфлопс (суперкомпьютеры начального уровня!).
Операции с 3d графикой, которые они в основном выполняют, очень хорошо поддаются распараллеливанию, что с успехом используется в графических процессорах.
Однако эти процессоры не в состоянии выполнять большинство задач общего назначения, и их производительность не поддаётся оценке теста LINPACK и сравнению с другими системами.
Слайд 12
Кластеры
Кластерная вычислительная система (кластер) – набор рабочих станций
или персональных компьютеров общего назначения, объединенных в систему с
помощью одной из стандартных сетевых технологий (Fast или Gigabit Ethernet, Myrinet и др.) на базе шинной архитектуры или коммутатора.
Кластер предполагает более высокую надежность и эффективность, чем ЛВС, и существенно более низкую стоимость в сравнении с другими видами параллельных вычислительных систем (за счет использования типовых аппаратных и программных решений).
Слайд 13
Персональные суперкомпьютеры
Персональный мини-кластер T-Edge Mini
t-platforms.ru/ru/temini.php
4 двухпроцессорных узла на
базе 4-ядерных процессоров Intel Xeon (всего 32 ядра)
Оперативная память
– до 128 Гбайт
Сеть передачи данных – Gigabit Ethernet или InfiniBand
Операционная система – одна из: SUSE Linux Enterprise
Server, RedHat Enterprise Linux, MS Windows Compute Cluster Server 2003
Пиковая производительность – 384 GFlops
Размеры – 57×33×76 см
Слайд 14
Суперкомпьютер
СКИФ-Аврора ЮУрГУ
Пиковая производительность
117 Teraflops
2011 г.
Вычислительный
кластер
СКИФ Урал
Пиковая
производительность
16 Teraflops
2008 г.
Вычислительный
кластер
Infinity
Пиковая
производительность
333 Gflops
2004 г.
Intel Xeon64
DP 3,2 ГГц
Intel
Xeon E5472
3 ГГц
Intel Xeon x5680
3,33 ГГц
Суперкомпьютер
СКИФ-Аврора ЮУрГУ
Пиковая производительность
24 Teraflops
2010 г.
Intel Xeon x5570
2,93 ГГц
Вычислительный
кластер
Physics
Пиковая
производительность
1 Gflops
2000 г.
Intel Pentium 3
0,8 ГГц
Динамика развития суперкомпьютерных мощностей в ЮУрГУ
Слайд 15
Infinity
Число вычислительных узлов/процессоров: 26/52
Тип процессора:
Intel Xeon
EM64T 3.2 ГГц
Оперативная память: 58 Гб
Дисковая память: 2400 Гб
Тип
системной сети:
InfiniBand (PCI-Express 4х)
Тип управляющей (вспомогательной) сети: Gigabit Ethernet
Пиковая производительность: 333 GFlops
Производительность на тесте Linpack:
270 GFlops
Операционная система:
Linux Gentoo 2006.1
Windows Compute Cluster Server 2003
Система бесперебойного электропитания: 15 kVA
Слайд 16
СКИФ Урал
Число вычислительных узлов/процессоров/ядер: 166/332/1328
Оперативная память: 1.33 Тб
Тип
процессора:
Intel Xeon E5472 (4 ядра по 3.0 ГГц)
Дисковая память:
49.29 Тб
Параллельная система хранения данных:
T-Platforms ReadyStorage – 20ТB
Тип системной сети:
InfiniBand (20 Гбit/s, макс. задержка 2 µs)
Тип управляющей сети: Gigabit Ethernet
Сервисная сеть: СКИФServNet
Пиковая производительность: 16 Тфлопс
Производительность на тесте Linpack: 12.2 Тфлопс
Операционная система:
SUSE Linux Enterprise Server 10
Windows HPC Server 2008
Система бесперебойного электропитания:
APC Symmetra 160 kVA
Слайд 17
Вычислительный узел СКИФ Урал
Тип процессора:
Intel Xeon E5472 (4
ядра по 3.0ГГц)
Оперативная память: 8 Гб
Дисковая память: 320 Гб
Операционная
система:
SUSE Linux Enterprise Server 10
Windows Computer Cluster Server
Слайд 18
Хост-машина СКИФ Урал
Тип процессора:
Intel Xeon E5472 (4
ядра по 3.0 ГГц)
Оперативная память: 16 Гб
Дисковая память: 1.25
Тб RAID
Операционная система:
SUSE Linux Enterprise Server 10
Windows Computer Cluster Server
Слайд 19
Параллельная система хранения данных СКИФ Урал
Производительное хранилище данных
Panasas ActiveStorage 5100 (20 Тб) с архитектурой NAS, разработанное
специально для кластеров
Пропускная способность более 60 Гбит/сек
Параллельный доступ к данным всех узлов кластера
Слайд 20
Характеристики суперкомпьютера
«СКИФ-Аврора ЮУрГУ»
4 место в рейтинге СНГ ТОР50
185
место в рейтинге TOP500
117 Терафлопс
8832 вычислительных ядер
Оперативная память: 9
Тбайт
Дисковая память: Intel SSD 108 Тбайт
Коммуникационные сети:
Cистемная сеть: 3D torus, 60 Гбит/сек.
InfiniBand QDR, 40 Гбит/сек.
Gigabit Ethernet
Сети мониторинга – 3 шт.
Слайд 21
Суперкомпьютер «СКИФ-Аврора ЮУрГУ»
Высший технологический уровень
Высокая производительность
Высокая надежность
Низкая стоимость
владения
Эффективное использование площадей
Производительность (TFlops)
Энергопотребление (Киловатт/TFlops)
Плотность упаковки
(TFlops/Юнит)
Слайд 22
Вычислительный модуль СуперЭВМ «СКИФ Аврора»
с водяным охлаждением
Слайд 23
Охлаждение горячей водой.
Полная нагрузка In — 50°C,
Out — 55°C, CPU — 86–92°C
Слайд 26
Рейтинг-листы суперкомпьютеров
Мировой: TOP500 (top500.org)
Российский: TOP50 (supercomputers.ru)
Слайд 28
Суперкомпьютер "СКИФ-Аврора ЮУрГУ" занял 87 место в 37-ой
редакции рейтинга TOP500 (июнь 2011).
Суперкомпьютер "СКИФ-Аврора ЮУрГУ" занял 185
место в 39-ой редакции рейтинга TOP500 (июнь 2012).