Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Fortan OpenMP DVM - язык параллельного программирования для кластеров

Содержание

OpenMP FortranВысокоуровневая модель параллелизма с общей памятьюДирективы, функции системы поддержки, системные переменныеСпецкомментарииНедостатки: Локализация данных и вычисленийЯвная синхронизация общих данных
Fortan OpenMP/DVM -  язык параллельного программирования для кластеров  В.А. Бахтин, OpenMP FortranВысокоуровневая модель параллелизма с общей памятьюДирективы, функции системы поддержки, системные переменныеСпецкомментарииНедостатки: Fortran-DVMВысокоуровневая модель параллелизма без явной ориентации на общую или распределенную памятьДирективы - Fortran OpenMP/DVMЦели:Расширение сферы применения модели DVM (OpenMP-программы)Расширение сферы использования OpenMP (системы с распределенной памятью) Директивы распределения данных и вычисленийDISTRIBUTE - распределение массива			   на многомерную Отображение последовательной программыМассив виртуальныхпроцессоровМассивыМассивыЦиклыМассив задачФизическиепроцессорыPARALLELPARALLELALIGNDISTRIBUTEDISTRIBUTEMAP Общие данныеREDUCTION  - редукционные данныеCONSISTENT - консистентные данные SHADOW Схема компиляцииFortran-DVMFortranOpenMP/DVMТрансляторDVMТрансляторOpenMPHPFFortran + вызовы LibDVMOpenMPFortran Распределение данных	Рассмотрим некоторую дискретную область моделирования (массив). Если в каждой точке модели Распределение данных		  real B(6), WB(6) Распределение массива с неоднородными вычислениямиописывается директивой:CDVM$ Тесты NAS 		BT	3D Навье-Стокс, метод переменных 			направленийCG	Оценка наибольшего собственного значения 		 симметричной Неоднородный кластер	Неоднородный кластер был промоделирован на машине МВС-1000М с увеличением процессорных времен Неоднородность коммуникационной среды Способы адаптации к медленным коммуникационным каналам:сокращение количества обменов =>
Слайды презентации

Слайд 2 OpenMP Fortran
Высокоуровневая модель параллелизма с общей памятью
Директивы, функции

OpenMP FortranВысокоуровневая модель параллелизма с общей памятьюДирективы, функции системы поддержки, системные

системы поддержки, системные переменные
Спецкомментарии
Недостатки:
Локализация данных и вычислений
Явная синхронизация

общих данных


Слайд 3 Fortran-DVM
Высокоуровневая модель параллелизма без явной ориентации на общую

Fortran-DVMВысокоуровневая модель параллелизма без явной ориентации на общую или распределенную памятьДирективы

или распределенную память
Директивы - спецкомментарии
Согласованное распределение данных и вычислений

(локализация)
Не требует явной синхронизации при работе с общими данными


Слайд 4 Fortran OpenMP/DVM
Цели:
Расширение сферы применения модели DVM (OpenMP-программы)
Расширение сферы

Fortran OpenMP/DVMЦели:Расширение сферы применения модели DVM (OpenMP-программы)Расширение сферы использования OpenMP (системы с распределенной памятью)

использования OpenMP (системы с распределенной памятью)


Слайд 5 Директивы распределения данных и вычислений
DISTRIBUTE - распределение массива

Директивы распределения данных и вычисленийDISTRIBUTE - распределение массива			  на многомерную

на многомерную решетку
виртуальных процессоров
ALIGN

- распределение массива
в соответствии с распределением
другого массива
PARALLEL - распределение витков цикла
в соответствии с распределением
массива
MAP - распределение задач на секции
решетки виртуальных процессоров

Слайд 6
Отображение последовательной программы
Массив
виртуальных
процессоров
Массивы
Массивы
Циклы
Массив задач
Физические
процессоры
PARALLEL
PARALLEL
ALIGN
DISTRIBUTE
DISTRIBUTE
MAP

Отображение последовательной программыМассив виртуальныхпроцессоровМассивыМассивыЦиклыМассив задачФизическиепроцессорыPARALLELPARALLELALIGNDISTRIBUTEDISTRIBUTEMAP

Слайд 7 Общие данные

REDUCTION - редукционные данные

CONSISTENT - консистентные

Общие данныеREDUCTION - редукционные данныеCONSISTENT - консистентные данные SHADOW	  -

данные

SHADOW - «соседние» данные

ACROSS

- «соседние» данные
с информационными связями

REMOTE - удаленные данные

Слайд 8 Схема компиляции
Fortran-DVM
Fortran
OpenMP/DVM
Транслятор
DVM
Транслятор
OpenMP
HPF
Fortran +
вызовы
LibDVM
OpenMP
Fortran

Схема компиляцииFortran-DVMFortranOpenMP/DVMТрансляторDVMТрансляторOpenMPHPFFortran + вызовы LibDVMOpenMPFortran

Слайд 9 Распределение данных
Рассмотрим некоторую дискретную область моделирования (массив). Если

Распределение данных	Рассмотрим некоторую дискретную область моделирования (массив). Если в каждой точке

в каждой точке модели выполняется одинаковое количество вычислений, то

мы будем называть эти вычисления однородными, иначе неоднородными.
real A(12), B(6)
Распределение массивов с однородными вычислениями описывается директивой DISTRIBUTE:
CDVM$ DISTRIBUTE A(BLOCK)
CDVM$ DISTRIBUTE B(BLOCK)
node1 node2 node3 node4
A 1,2,3 4,5,6 7,8,9 10,11,12
B 1,2 3,4 5 6


Слайд 10 Распределение данных

real B(6), WB(6)

Распределение массива

Распределение данных		 real B(6), WB(6) Распределение массива с неоднородными вычислениямиописывается директивой:CDVM$

с неоднородными вычислениями
описывается директивой:
CDVM$ DISTRIBUTE B(WGT_BLOCK(WB,6))
data WB

/1., 0.5, 0.5, 0,5, 0.5, 1./

node1 node2 node3 node4
B 1 2,3 4,5 6
Данные и вычисления распределяются таким образом,
чтобы суммы весов вычислений на каждом процессоре
были пропорциональны весам (производительности)
процессоров.

Слайд 11 Тесты NAS

BT 3D Навье-Стокс, метод переменных направлений
CG Оценка наибольшего

Тесты NAS 		BT	3D Навье-Стокс, метод переменных 			направленийCG	Оценка наибольшего собственного значения

собственного значения симметричной разреженной матрицы
EP Генерация пар случайных

чисел Гаусса
FT Быстрое преобразование Фурье, 3D спектральный метод
IS Параллельная сортировка
LU 3D Навье-Стокс, метод верхней релаксации
MG 3D уравнение Пуассона, метод Multigrid
SP 3D Навье-Стокс, Beam-Warning approximate factorization


Слайд 12 Неоднородный кластер
Неоднородный кластер был промоделирован на машине МВС-1000М

Неоднородный кластер	Неоднородный кластер был промоделирован на машине МВС-1000М с увеличением процессорных

с увеличением процессорных времен между последовательными обращениями к MPI

функциям.
В следующих диаграммах будет показано изменение времени выполнения MPI и DVM версий тестов NAS (класс С) на следующих конфигурациях:

CL1 – 128 процессоров со скоростью выполнения P,
CL2 – 128 процессоров со скоростью выполнения 3P,
CL3 – 128 процессоров со скоростью выполнения P и 128 процессоров со скоростью выполнения 3P (неоднородный кластер).

  • Имя файла: fortan-openmp-dvm-yazyk-parallelnogo-programmirovaniya-dlya-klasterov.pptx
  • Количество просмотров: 164
  • Количество скачиваний: 0