2015-12-06 Сергей Хрущев - Человеческим языком о...
Transcript of 2015-12-06 Сергей Хрущев - Человеческим языком о...
Человеческим языком о суперкомпьютерах.
Сергей ХрущевИнститут математики СО РАНСуперкомпьютерный центр
г. Омск, 2015
Два основных типа суперкомпьютеров и список Top500
• Традиционные системы: “CPU only”.• Гибридные системы: CPU + вычислители.• Top500 – список мощнейших суперкомпьютеров мира.• 1/3 суммарной производительности всех суперкомпьютеров
из Top500 обеспечивается гибридными системами, при этом их чуть более 100 (т.е. около 20%).
• 1 место уже в шестой раз подряд: Tianhe-2 (Китай).• Tianhe-2 (Млечный путь-2) – гибридная система.• Число гибридных систем
(в списке) постоянно растёт.
Архитектура суперкомпьютера
Метод соединения узлов играет
первостепенную роль
Массивно-параллельная система
Block Diagram:
NVIDIA Tesla K20 (GK110)
Использование кластера Tesla: повышение эффективности вычислений
• Решение задач глобальной маршрутизации данных в реальном времени.
• Основная проблема:не существует параллельных
алгоритмов поиска кратчайших путей.• Имеется огромная потребность в
быстром нахождении путей.
Вариант ускорения алгоритма:
• Имеется возможность предварительного вычисления маршрутов.
• Однако, массив маршрутов содержит 5 352 247 348 рёбер:
• Время счёта на центральном процессоре: 17910 мс.
Системное ПО суперкомпьютера• Для программирования
используются C/С++ и CUDA.• Работа с каждым из
вычислителей организуется в отдельном потоке.
• Для управления потоками используется OpenMP.
• Взаимосвязь между узлами – через OpenMPI.
• Каждая вычислительная программа выполняется под управлением менеджера очередей Torque.
• Доступ к кластеру – по протоколу SSH (только с фиксированного IP).
Данное ПО обеспечивает работу кластера
Перспективы и проблемы
• Увеличение производительности центральных процессоров замедляется
• Прогресс специализированных вычислителей пока виден• Фундаментальные ограничения текущей архитектуры:
- трудности с дальнейшим уменьшением техпроцесса- рост тепловыделения с ростом частоты
«…если мы будем продолжать использовать современные методы дизайна процессоров, то к 2010 году процессоры будут вырабатывать больше тепла на квадратный миллиметр, чем это делает ядерный реактор…».
Патрик Гелсингер,директор по технологиям
корпорации Intel (2001 год)
Вычислительная мощность, FLOPS
• “Спейс Шаттл” • iPhone 6• GeForce GT 630 (2013 год)• PlayStation 4 (GPU)• Tianhe-2 (лидер Top500)• Человеческий мозг
….…………………………325 000….……………….1 435 000 000….…………..692 700 000 000….………..1 843 000 000 000…..54 902 400 000 000 000…999 000 000 000 000 000
(усреднённые/примерные данные)
Мозг и компьютер – два разных мираЖивое существо Число нейронов Число синапсов
Медуза 800
Улитка 11 000 ~109
Пчела 960 000
Лягушка 16 000 000
Кошка 760 000 000 ~1013
Макака резус 6 376 000 000
Человек 86 000 000 000 1014 -1015
Африканский слон 267 000 000 000
Нейроморфный процессорIBM SyNAPSE:
•моделирует 1 000 000 нейронов•и 256 * 106 синапсов•содержит более 5 * 109
транзисторов
Суперкомпьютер Tesla• 11776 потоковых процессоров• объём системного ОЗУ: 48 ГБ.• объём ОЗУ на вычислителях: 38 ГБ. • быстродействие в режиме FP64: 6,74 Tflop/s. • быстродействие в режиме FP32: 18,2 Tflop/s.
Институт математики СО РАН, суперкомпьютерный центр.•использование суперкомпьютера в режиме тестирования собственноручно созданного ПО – бесплатно•коммерческое использование – по договорённости
E-mail: [email protected] т. 23-72-19
Спасибо за внимание.
Массивно-параллельная система снеговиков,максимальная рабочая температура: -10С ☺
(Sapporo Snow Festival)