GeForce GTX 1080 — новый флагманский продукт от компании NVIDIA. Разработчики заявляют, что GTX 1080 является самой быстрой игровой видеокартой. Мы провели обзор GeForce GTX1080 и выяснили все особенности и свойства видеокарты, которые позволяют ей действительно лидировать на рынке компьютерных графических технологий.
Обзор GeForce GTX 1080 — составляющие видеокарты
Мощные видеокарты представляют собой отдельные устройства расширения, устанавливаемые на материнскую плату PC.
Основные составляющие видеоплаты:
• графический процессор (ГПЦ или GPU);
• видеоконтроллер;
• видеопамять;
• цифрово — аналоговый преобразователь;
• видео-ПЗУ;
• система охлаждения.
Видеоплата представляет собой небольшой компьютер, обладающий даже собственной BIOS, ПЗУ, оперативной памятью.
Изменяя настройки БИОС, можно увеличивать параметры производительности видеосистемы, используя штатные программы производителя устройства или стороннее ПО.
Архитектура Pascal GeForce GTX 1080
Чип GPU GP104 – основа устройства. При создании его применена технология 16 нм, что позволило значительно вырасти тактовым частотам ГПЦ. По сравнению с GeForce GTX980 – почти в 2 раза.
Особенности
• ядро CUDA: 2560. CUDA (Compute Unified Device Architecture) – платформа с использованием С-подобного языка программирования для лучшего управления аппаратными возможностями чипа;
• базовая тактовая частота: 1607 МГц;
• тактовая частота процессора 1080 с ускорением: 1733 МГц, возможен «разгон» до 2 ГГц.
Архитектура Pascal, по которой построен чип, обладает скоростным двунаправленным интерфейсом NVIDIA NVLink, что дает возможность масштабировать приложения на несколько GPU, обеспечивая прирост скорости работы по сравнению с аналогами в несколько раз.
Рациональный подход к организации структуры памяти, при помощи объединения ЦП и данных в один комплекс, — метод CoWoS с HBM2 – увеличивает полосу пропускания в 3 раза, если сравнивать с архитектурой NVIDIA Maxwell у более ранних моделей GeForce.
Применение новых инструкций половинной точности дает более 21 Терафлопс пиковой производительности возможно реализовать в задачах глубокого обучения.
Использование новых целочисленных операций с пиком в 47 TOPS (тераопераций в секунду) обеспечивает отзывчивость системы в реальном времени во время работы с инференсом.
Технология GPU Boost 3.0. Особенности разгона GPU
Смысл применяемой технологии состоит в повышении тактовой частоты ГЦП, если уровень потребления энергии и нагрева не достиг высшего уровня. Здесь применяется уже третье поколение разработки — GPU Boost 3.0.
Новшеством стала основательная настройка турбо-частот, которая зависит от напряжения.
Если в ранних версиях программы разница между турбо и основной частотой была постоянным значением, то теперь появилась возможность определения для любого отдельного значения напряжения, что позволит более полно использовать GPU.
Для осуществления этого управления понадобятся сторонние утилиты, компания Nvidia хотя и не занимается разработкой такого ПО, но помогает программистам.
Например, программа EVGA Precision XOC имеет в своем арсенале сканер по разгону, который проводит специальный тест по анализу производительности и стабильности. В результате генерируется оптимальный график турбо-частоты, применительно к конкретному чипу. При этом возможны и ручные настройки.
Утилита Precision XOC поддерживает 3 режима работы: базовый, линейный и ручной. Базовый режим устанавливает фиксированное значение турбо-частоты, как в более старых версиях.
Линейный – позволяет выставить линейное изменение частоты от «Min» до «Max» значений напряжения GPU. При ручном режиме параметры задаются для любой точки напряжения на графике.
Имеется сканер для разгона, работающий автоматически. После запуска теста будут найдены оптимальные значения для оверклокинга.
Видеопамять GeForce GTX 1080 GDDR5X — особенности сжатия данных
Если компания AMD занимается разработками в области многослойной HBM-памяти, Nvidia решили продолжить работу над проверенной GDDR5X, хотя тип этот начал применяться еще в 2009 году.
Память этого стандарта – одна из самых сложных и прогрессивных, скорость передачи данных – до 10 Gbps.
Для обеспечения такой скорости на не новом типе GDDR5X, пришлось несколько лет разрабатывать новую архитектуру систем ввода-вывода (совместно с создателями чипов памяти). При этом удалось добиться более низкого потребления напряжения микросхемами — 1,35 В.
Были применены новые алгоритмы сжатия памяти, — по схемам 4:1, 8:1, что снизило количество записываемых в память блоков, и увеличило темп перекачки данных из видеопамяти в кэш-память 2 уровня.
Сравнение с видеокартами gtx более ранних моделей (GTX980) показывает прирост эффективности сжатия до 40% по ПСП (пропускная способность памяти), плюс около 20% по ЭПП (эффективной полосы пропускания). Как итог: получаем не менее 60% оптимизации.
Асинхронные вычисления Async Compute
Компьютерные игры занимают ресурсы ПК не только по графическим вычислениям, но и по обработке остальных данных, например, аудио информации. Видеоплата может заниматься расчетами этих данных параллельно, они не связаны друг с другом.
Поддержка статического разделения ресурсов существовало и в Maxwell, но теперь драйвера Pascal получили возможность производить динамический баланс нагрузки, если ПО устройства решит, что часть ресурсов GPU используется нерационально, то оно может перераспределить их для другого, более важного, процесса. Это касается работы с асинхронными шейдерами.
Для технологии Pascal усовершенствована возможность прерывания, то есть возможна остановка решения менее срочной задачи в пользу более срочной, с коротким временем выполнения.
Теперь прерывание работает на уровне пикселей, GPU приостанавливает операцию, сохраняет ее состояние и переходит на другой процесс. Это занимает не более 100 микросекунд.
GeForce GTX 1080 — поддержка Simultaneous Multi-Projection
Этот новый движок представлен физическим блоком, помещен в состав PolyMorph. Способен создавать до 16 отображений на плоскости геометрических объектов из одной точки или перемещать точку обзора для генерации стерео изображений, повторяя геометрическую картинку при помощи аппаратных механизмов 32 раза, это происходит без потери производительности.
Это хорошо почувствуют владельцы систем из трех мониторов, проекции изображения на 3 монитора будут накладываться с необходимыми смещениями.
Ошибочная перспектива:
Коррекция SMP:
Однако при этом программное обеспечение должно поддерживать SMP и опции по настройке широких углов обзора.
В обычных компьютерных играх движок тоже пригодится, например, при использовании виртуальной реальности.
Обычно в компьютерной игре создаются визуализации на каждый глаз по отдельности, но SMP поддерживает создание проекций из двух центров одновременно, значит каждая сцена может быть обработана за один проход.
NVidia заявляет о почти двукратном приросте производительности для продуктов VR c использованием этих технологий.
Создание игровых скриншотов с Ansel
Позволяет создавать качественные снимки из компьютерных игр. Интересно, что платформа Ansel названа в честь американского фотографа.
Помимо захвата изображения можно редактировать его, используя фирменную библиотеку Nvidia. Для этого разработчик игры должен включить поддержку Ансель в программный код.
Пользователь может изменять углы и точки обзора при редактировании скриншота, устанавливать камеру практически в любой точке виртуального мира и делать 3D-снимки и панорамы, используя большие разрешения, — до 4,5 гигапикселей.
SLI технология GeForce GTX 1080
Эта разработка позволяет использовать как минимум две видеокарты для обработки графики на одном ПК. Первые SLI устройства появились в 1998 году. Для использования технологии требуется поддержка не только производителя видеокарты, но и материнской платы.
Официально Nvidia обеспечивает объединение только двух устройств, что связано с проблемами масштабирования производительности в новейших играх и особенностями DirectX 12. При необходимости монтажа трех и более карт на одном ПК, придется запросить у компании ключ разблокировки.
Сравнение GeForce GTX 1080 с другими устройствами
Сравним модель 1080 с видеокартой более раннего выпуска GeForce GTX 980, с чипом GM204.
Наименование ЦП | GP104 | GM204 |
Техпроцесс | 16 нм | 28 нм |
Площадь чипа | 314 мм2 | 398 мм2 |
Количество транз-в | 7,2 млрд | 5,2 млрд |
GPC | 4 | 4 |
SM | 20 | 16 |
CUDA-ядер | 2560 | 2048 |
Число Блоков текстур | 160 | 128 |
ROP | 64 | 64 |
Тактовая частота | 1607 (1733) МГц | 1126 (1216) МГц |
Шина памяти | 256 бит | 256 бит |
Кэш L2 | 2048 Кбайт | 2048 Кбайт |
Энергопотр-ние | 180 Вт | 165 Вт |
Пик вычисл. мощности на Boost-частоте | 8873 ГФЛОПС | 4981 ГФЛОПС |
С увеличением количества транзисторов внутри чипа и уменьшением их размера, несколько сократилась площадь кристалла.
Основные особенности и сравнение с прочими моделями:
1. GeForce GTX1080 – первая видеоплата, где GPU скомпонован из трехмерных полупроводников.
2. GTX1080 превосходит GTX980 по вычислительным способностям почти в два раза, но потребляет при этом лишь на 16 Вт больше.
3. Более совершенный программный комплекс Polymorph Engine-4.0, управляющий процессами в устройстве.
4. 8 Гб памяти с частотой 2500 МГц плюс 256-я шина; пропускная способность памяти равна 320 Гбайт/с. Это на сто больше, чем у GTX980, но меньше чем у GTX980 Ti.
5. Новый принцип вертикальной синхронизации FastSync для снижения задержек передачи изображения на экран.
6. Контролер дисплея теперь имеет поддержку BT.2020, а также HDR для улучшения качества выводимого на экран изображения.
Параметры охлаждения и шума
При включении скорость вращения вентилятора примерно 2159 об/мин, это 50% от максимума. Температура держится в районе 80 градусов. Максимум для чипа – 92 градуса.
Измерения шума на дистанции 1 м – около 42 дБ. Это средние значения для серийных плат Nvidia.
Бекплейт уверенно сдерживает увеличение температуры, поэтому соседние устройства не должны сильно нагреваться. Значительно (но не критично) греются микросхемы видеопамяти.
Результаты теста по максимальному энергопотреблению видеосистемы подтверждают заявления производителя.
Сравнение игровой производительности GeForce GTX 1080
Сравнение проводилось на тестовом ПК с различными видеокартами.
Battlefield 4: наблюдаем гигантский FPS во всех разрешениях. Почти 60 кадров в секунду в качестве Ultra HD.
Только в игре Dragon Age Inquisition карта GeForce GTX1080 не смогла стать лидером.
В GTA V видеокарта GTX 1080 превосходит своего ближайшего соперника на 24% и на 23%.
Однако по вычислениям игровая карта GTX1080 ничем не выделяется среди младших собратьев, а конкуренту AMD Radeon проигрывает. Например, по вычислениям двойной точности. Тестирование производилось в программе Sisoftware Sandra.
Даже тесты по профпригодности к майнингу пройдены на оценку «хорошо».
Бюджетная игровая версия GeForce GTX1050
Видеоплаты начального игрового уровня GTX 1050/1050 Ti интересны не только ценой, но и своими особенностями.
Небольшая печатная плата с одним кулером и простым радиатором, которого хватает для нормального охлаждения, — энергопотребление составляет – до 75 Вт. «Разгон» устройств не даст большого прироста производительности – от силы — 7-12%, для обоих чипсетов.
Видеокарты предназначены для не слишком требовательных компьютерных и онлайн игр, более серьезные игры вынудят играть на невысоких настройках, малый объем видеопамяти – 2 и 4 Гб у 1050 и 1050 Ti – даст о себе знать, но все остальные новшества старшей модели присутствуют.
Следует отметить, что даже в 2018 году видеокарта Nvidia GTX1080 — одна из самых мощных игровых карт, работающих на одном чипе. Единственный минус модели – ее цена.