Вычисления с использованием графических чипов набирают популярность, и решение с их помощью сложнейших научных задач – лишнее тому подтверждение. Исследователи из Национального университета Тайваня (National Taiwan University, NTU) изучают эволюцию Вселенной на ранних стадиях её развития, соответствующие расчёты проводятся на кластере с картами NVIDIA Tesla. По словам профессора физики из Центра квантовых наук и разработок (Center for Quantum Science and Engineering, CQSE) Тинга-Вэя Чью (Ting-Wai Chiu), частью работы является моделирование взаимодействия субатомных частиц, что позволяет заглянуть в тайны раннего космоса.
NTU пользуется суперкомпьютером, оснащённым 128 графическими процессорами. Решение включает 16 систем в форм-факторе 1U NVIDIA Tesla S1070 и 64 процессора Tesla C1060. Согласно оценке исследователей, производительность мейнфрейма находится на уровне суперкомпьютера IBM BlueGene/L при на два порядка меньшей стоимости и энергопотреблении, не превышающем 10% от машины IBM. Помимо тайн формирования Вселенной, на кластере проводятся вычисления в области квантовой физики, включая сильное ядерное взаимодействие и связь электронов в веществе. Как утверждает Чью, учёные были удивлены более высокой эффективностью системы на базе GPU по сравнению с традиционными суперкомпьютерами как в плане стоимости, так и в плане энергозатрат. 15 Тфлопс обошлись разработчикам кластера в $200 тыс.
Напомним, что в NVIDIA Tesla используется архитектура CUDA, которая позволяет программировать параллельные вычисления с помощью стандартных языков и API. В CQSE разработаны алгоритмы для решения на Tesla задач, связанных с хромодинамикой, квантовыми спиновыми системами и астрофизикой. Один узел 1U NVIDIA Tesla S1070 включает четыре 1-Тфлопс процессора с тактовой частотой 1,5 ГГц и 240 вычислительными ядрами в каждом, 16 Гб памяти GDDR3 800 МГц с интерфейсом 4 х 512 бит (пропускная способность до 408 Гб/с). Карта Tesla C1060 оснащается одним GPU 1,3 ГГц, 4 Гб памяти GDDR3 800 МГц с 512-битной шиной и пропускной способностью 102 Гб/с. Производительность – 1 Тфлопс.