2015-12-06 Сергей Хрущев - Человеческим языком о...

11
Человеческим языком о суперкомпьютерах. Сергей Хрущев Институт математики СО РАН Суперкомпьютерный центр г. Омск, 2015

Transcript of 2015-12-06 Сергей Хрущев - Человеческим языком о...

Page 1: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Человеческим языком о суперкомпьютерах.

Сергей ХрущевИнститут математики СО РАНСуперкомпьютерный центр

г. Омск, 2015

Page 2: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Два основных типа суперкомпьютеров и список Top500

• Традиционные системы: “CPU only”.• Гибридные системы: CPU + вычислители.• Top500 – список мощнейших суперкомпьютеров мира.• 1/3 суммарной производительности всех суперкомпьютеров

из Top500 обеспечивается гибридными системами, при этом их чуть более 100 (т.е. около 20%).

• 1 место уже в шестой раз подряд: Tianhe-2 (Китай).• Tianhe-2 (Млечный путь-2) – гибридная система.• Число гибридных систем

(в списке) постоянно растёт.

Page 3: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Архитектура суперкомпьютера

Метод соединения узлов играет

первостепенную роль

Page 4: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Массивно-параллельная система

Block Diagram:

NVIDIA Tesla K20 (GK110)

Page 5: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Использование кластера Tesla: повышение эффективности вычислений

• Решение задач глобальной маршрутизации данных в реальном времени.

• Основная проблема:не существует параллельных

алгоритмов поиска кратчайших путей.• Имеется огромная потребность в

быстром нахождении путей.

Вариант ускорения алгоритма:

• Имеется возможность предварительного вычисления маршрутов.

• Однако, массив маршрутов содержит 5 352 247 348 рёбер:

• Время счёта на центральном процессоре: 17910 мс.

Page 6: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Системное ПО суперкомпьютера• Для программирования

используются C/С++ и CUDA.• Работа с каждым из

вычислителей организуется в отдельном потоке.

• Для управления потоками используется OpenMP.

• Взаимосвязь между узлами – через OpenMPI.

• Каждая вычислительная программа выполняется под управлением менеджера очередей Torque.

• Доступ к кластеру – по протоколу SSH (только с фиксированного IP).

Данное ПО обеспечивает работу кластера

Page 7: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Перспективы и проблемы

• Увеличение производительности центральных процессоров замедляется

• Прогресс специализированных вычислителей пока виден• Фундаментальные ограничения текущей архитектуры:

- трудности с дальнейшим уменьшением техпроцесса- рост тепловыделения с ростом частоты

«…если мы будем продолжать использовать современные методы дизайна процессоров, то к 2010 году процессоры будут вырабатывать больше тепла на квадратный миллиметр, чем это делает ядерный реактор…».

Патрик Гелсингер,директор по технологиям

корпорации Intel (2001 год)

Page 8: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Вычислительная мощность, FLOPS

• “Спейс Шаттл” • iPhone 6• GeForce GT 630 (2013 год)• PlayStation 4 (GPU)• Tianhe-2 (лидер Top500)• Человеческий мозг

….…………………………325 000….……………….1 435 000 000….…………..692 700 000 000….………..1 843 000 000 000…..54 902 400 000 000 000…999 000 000 000 000 000

(усреднённые/примерные данные)

Page 9: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Мозг и компьютер – два разных мираЖивое существо Число нейронов Число синапсов

Медуза 800

Улитка 11 000 ~109

Пчела 960 000

Лягушка 16 000 000

Кошка 760 000 000 ~1013

Макака резус 6 376 000 000

Человек 86 000 000 000 1014 -1015

Африканский слон 267 000 000 000

Нейроморфный процессорIBM SyNAPSE:

•моделирует 1 000 000 нейронов•и 256 * 106 синапсов•содержит более 5 * 109

транзисторов

Page 10: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Суперкомпьютер Tesla• 11776 потоковых процессоров• объём системного ОЗУ: 48 ГБ.• объём ОЗУ на вычислителях: 38 ГБ. • быстродействие в режиме FP64: 6,74 Tflop/s. • быстродействие в режиме FP32: 18,2 Tflop/s.

Институт математики СО РАН, суперкомпьютерный центр.•использование суперкомпьютера в режиме тестирования собственноручно созданного ПО – бесплатно•коммерческое использование – по договорённости

E-mail: [email protected] т. 23-72-19

Page 11: 2015-12-06 Сергей Хрущев - Человеческим языком о суперкомпьютерах

Спасибо за внимание.

Массивно-параллельная система снеговиков,максимальная рабочая температура: -10С ☺

(Sapporo Snow Festival)