Сравнение карт nvidia 1070 разных производителей. Знакомимся с графическим адаптером

После удачного старта GeForce GTX 1080 компания Nvidia преподнесла второй сюрприз для любителей игр, анонсировав преемника GeForce GTX 970 в виде видеокарты GeForce GTX 1070. Естественно, существенно уменьшив стоимость новинки – до $379 для моделей партнеров и $449 за версию референсного дизайна.

Основное нововведение в GeForce GTX 1070 то же, что и в GeForce GTX 1080 – это техпроцесс изготовления 16 нм. Благодаря ему в графический процессор средних размеров (314 мм 2) поместилось 7.2 млрд транзисторов, что позволяет говорить о том, что GP104 по сложности замещает GM204, но по возможностям превосходит его.

Новые возможности

В рамках 16 нм техпроцесса Nvidia удалось значительно повысить рабочие частоты видеоядра, и теперь в режиме GPU Boost достигается невероятное значение – 1.7-1.8 ГГц. Порадует энтузиастов и разгон.

Сделаем небольшую ремарку, объясняющую причины невысокого роста производительности при разгоне. Дело в том, что даже штатный режим GPU Boost постоянно удерживает высокую частоту GPU, поэтому разгон в относительной величине измеряется скромными +150-200 МГц. При этом рассчитывать на легкие 2.0 ГГц в случае GeForce GTX 1070 не приходится. Разработчики компании приложили максимум усилий, чтобы младшая модель ни при каких условиях не догнала бы старшую.

Отсюда и изначально низкий уровень TDP, и скромный запас по максимальному энергопотреблению. Остается надеяться на появление модифицированной версии BIOS, открывающей доступ к повышенному лимиту. Пока же путем правки и записи расширенного TDP сместить лимит не удалось никому. По моим наблюдениям графический процессор должен отлично масштабироваться с поднятием напряжения, достигая частот 2.3-2.4 ГГц на воздухе, но тогда энергопотребление видеокарты будет уже не таким впечатляющим и легко перешагнет 200 Вт.

По сравнению с GeForce GTX 1080 новая модель лишилась памяти GDDR5X, оставшись на старой GDDR5. Кроме того, из-за множества физических оптимизаций Nvidia легко отрезала излишек цены и отправила новинку в сегмент среднего класса.

Конечно, все ранее описанные для GeForce GTX 1080 нововведения в полной мере подходят и для GeForce GTX 1070. Мы лишь повторим, что компания действительно верит в будущее 3D реальности, поэтому многие нововведения направлены на поддержку выходящих вскоре решений. Основные улучшения внутри видеоядра направлены на оптимизацию работы с 3D очками и рассказывать об этом можно бесконечно. Остановимся на главном.

Во-первых, это однопроходное стереоизображение для VR. Благодаря технологии уменьшается работа GPU «по геометрии», чем существенно повышается производительность без падения качества. Во-вторых, драйвер и видеокарта учитывают геометрические особенности линз в 3D очках и используют специальные алгоритмы расчета.

Упомянем и новый режим Sli с двойными мостиками. Изначально многие обозреватели неправильно трактовали заявление Nvidia о новом соединении. GeForce GTX 1080 все еще можно объединять в 3- или 4-Way конфигурации, но акцент постепенно смещается в сторону 2-Way. Обусловлено это достаточной производительностью GP104.

Даже одна видеокарта превосходит GeForce GTX Titan X, а пары хватит для 100 кадров в секунду и 4К разрешения в любой игре. Старые мостики Sli можно использовать по-прежнему, но с новыми доступны большие разрешения.

И раз уж речь зашла о графическом процессоре, рассмотрим его подробнее. По сути перед нами решение среднего класса, а пока не представлены более дорогие и производительные модели, Nvidia GeForce GTX 1080 и GeForce GTX 1070 будут считаться самыми быстрыми видеокартами.

В полном GP104 каждый SM работает в паре с движком Polimorph. Но для соответствия современным запросам в него поставили новый блок Multi-Projection. У GeForce GTX 1070 отключили один блок, оставив 15 потоковых мультипроцессоров вместо 20.

Пара из SM и движка Polimorph образуют блок TPC.

В GP104 содержится четыре GPC, каждый из которых состоит из пяти TPC и суммарно восьми сегментов контроллера памяти на весь чип. Каждый TPC состоит из SM и Polimorph. Каждый SM содержит 128 ядер Cuda и кэш-память размером 256 Кбайт, 96 Кбайт общей памяти и 48 Кбайт L1 кэша, а также восемь текстурных блоков.

Любой SM может работать с очередью, состоящей до 32 команд. На внешнем крае остались восемь 32-битных контроллеров видеопамяти.

Поддержка DX12 выразилась в новом режиме работы планировщика заданий, который прямо связан с тем, что видеоядро Pascal обладает динамическим распределением. И чтобы оно не простаивало в моменты, когда обработка графических данных закончена, планировщик подкидывает ядрам вычислительную задачу. Таким образом сокращается время бездействия графического процессора, причем существенно.

Технические характеристики

Наименование Radeon
R9 Fury X
GeForce
GTX 1070
GeForce
GTX 980
GeForce
GTX 1080
GeForce
GTX 980 Ti
Кодовое имя Fiji GP104 GM204 GP104 GM200
Версия GCN 1.2 Pascal Maxwell 2.x Pascal Maxwell 2.x
Техпроцесс, нм 28 16 28 16 28
Размер ядра/ядер, мм 2 596 314 398 314 601
Количество транзисторов, млн 8900 7200 5200 7200 8000
Частота ядра, МГц 1506 1126 1607 1000
Частота ядра (Turbo), МГц 1050 1683 1216 1734 1075
Число шейдеров (PS), шт. 4096 1920 2048 2560 2816
Число текстурных блоков (TMU), шт. 256 120 128 160 176
Число блоков растеризации (ROP), шт. 64 64 64 64 96
Максимальная скорость закраски, Гпикс/с 67.2 96.4 72 102.8 96.2
Максимальная скорость выборки текстур, Гтекс/с 269 180.7 144.1 257.1 176
Тип памяти HBM GDDR5 GDDR5 GDDR5X GDDR5
Эффективная частота памяти, МГц 500 2000 1750 2500 1750
Объем памяти, Гбайт 4 8 4 8 6
Шина памяти, бит 4096 256 256 256 384
Пропускная способность памяти, Гбайт/с 512 256.3 224.3 320.3 336.5
Питание, разъемы Pin 8 + 8 8 6 + 6 8 6 + 8
Потребляемая мощность (2D / 3D), Ватт -/275 -/150 -/165 -/180 -/250
CrossFire/Sli V V V V V
Цена при анонсе, $ 649 415 500 650 650
Заменяемая модель Radeon
R9 295X
GeForce
GTX 970(80)
GeForce
GTX 780 Ti
GeForce
GTX 980(Ti)
GeForce
GTX
Titan Black

Да, при определенной нагрузке (например, в главном меню «Ведьмака») у всех видеокарт подсвистывают дроссели. Ничего критичного. Лично я этому факту не удивляюсь, так как практически все модели страдают подобным недугом.

Все пять кастомов оказались тихими. Но меньше всех под нагрузкой шумит MSI GeForce GTX 1070 GAMING X 8G.

В заключение

Успешность любого компьютерного устройства определяют продажи. Признаем, что GeForce GTX 1070 даже в нашей стране разбирают, как горячие пирожки. Этому способствует и большое количество нереференсов в продаже. Как показало тестирование, все пять видеокарт лучше Founders Edition. Они тише, холоднее, но при этом быстрее эталонной GeForce GTX 1070.

Производителям «зеленой» продукции не позавидуешь. Сейчас конкуренция обострена как никогда. Этому поспособствовала сама NVIDIA, выжав из чипов Pascal на сегодняшний момент практически весь свой максимум. Вот мы и видим, что абсолютное большинство кастомов обладает схожим разгонным потенциалом. Что делать в такой ситуации? Производители решили привлекать внимание потенциальных покупателей дли-и-и-ннющими названиями, в которых всенепременно должно присутствовать однокоренное слово GAME, и прочей мишурой наподобие подсветки. Никуда не делись огромные кулеры, хотя мы видим, что GeForce GTX 1070 - это холодная видеокарта. Подобному развитию событий, несомненно, радуются производители корпусов. Пользователям приходится брать кейсы попросторнее.

Простая констатация фактов: самая холодная по чипу - Zotac; самая тихая - MSI; самая быстрая в номинале - Palit; самая быстрая в разгоне - MSI.

ASUS выжала практически весь максимум из процессора GP104. Карта в дефолте работает на частотах, превышающих психологические 2000 МГц. При этом она холодная и очень тихая. Продукт сбалансированный, больше мне добавить нечего. Единственный момент: я не вижу смысла брать более дорогую разогнанную версию ROG STRIX-GTX1070-O8G-GAMING. Возьмите ROG STRIX-GTX1070-8G-GAMING, которая дешевле. А те же 2000+ МГц по чипу вы получите самостоятельно.

GIGABYTE с моделью G1 Gaming выступила в роли матерого середнячка. Такой и должна быть среднестатистическая GeForce GTX 1070. Тихая и холодная. Эталонную Founders Edition превосходит по всем параметрам.

MSI GeForce GTX 1070 GAMING X 8G, как я уже сказал, оказалась самой тихой. При этом карта лучше всех держит частоты в разгоне. Поэтому в абсолютном зачете она оказалась быстрее остальных участников тестирования.

Прошло то время, когда про Palit говорили, что она «воняет и горит». Версия Premium Edition опередила всех в дефолте. Она холодная и практически бесшумная. При этом стоит дешевле той же ASUS ROG Strix, например.

Наконец, Zotac демонстрирует, что нет особого смысла гнаться за дорогими адаптерами. Кулер кастома эффективно охлаждается и несильно шумит. А отставание по частотам всегда реально нейтрализовать вручную. Так зачем платить больше?

Доброго времени суток. В этой статье мы посмотрим на видеокарту GTX 1070 Ti, видеокарту, окутанной просто невероятным количеством слухов. Сами новости о том, что эта видеокарта выйдет казались противоречивыми и неправдоподобными, но нет она всё-таки вышла. Также были слухи, что её не будет в референсном исполнении, что сразу выйдут карты в дизайне от партнеров, но нет всё-таки версия Founders Edition вышла. Её, кстати, можно будет купить на сайте Nvidia к концу ноября, если я ничего не путаю. Также говорили, что эта видеокарта будет заблокирована для разгона, но, к счастью, этот слух не оправдался, то есть в плане разгона здесь всё как и у любого другого GTX и делает ли всё вышесказанное эту карту более интересные для покупки — ну давайте разбираться.

Видеокарта GTX 1070 Ti очень близка к обычной версии GTX 1070: в плане технологий у них одинаковая память, в обоих случаях используется GDDR5 памяти (не 5x, которая стоит в более дорогой GTX 1080), так же и здесь есть 8 Гб и работает она на частоте 2000 МГц — что в 1070, что в 1070 Ti. В GTX 1070 Ti чуть больше ядер и текстурных блоков, таким образом мы посмотрим, что ей это дает или говоря иначе — сравним референсную GTX 1070 Ti и ASUS Strix GTX 1070. ASUS Strix из коробки работает на частоте 2000 МГц по ядру, а референсное исполнение GTX 1070 Ti, кажется, на частоте 1800 МГц. В Afterburner я сделал так, чтобы референсная модель тоже работала на частоте 2 ГГц, теперь 2000 МГц по памяти и 2000 МГц по ядру. В качестве процессора на тестовом стенде был выбран Intel i7 8700K на частоте 4.8 ГГц, 16 Гб оперативной памяти в двухканальном режиме при частоте 3.2 ГГц. Перейдем к самим тестам.

Тестирование

Overwatch

Эпические настройки графики, сначала тесты проводились на Full HD разрешении, а потом на Quad HD и 4K, но настройки я больше не трогаю и ничего кроме разрешений я не меняю. Тест проходит на самодельном бенчмарке в синглплеере. Как показывает практика нагрузка на железо здесь выше, чем в реальном мультиплеере. И тем не менее по среднему фреймрейту GTX 1070 выдаёт 150 кадров в секунду, а GTX 1070 Ti отрисовывает 161 кадр. В Quad HD разрешении получаем 101 и 108 кадров соответственно, когда в 4K выходит 53 против 56 кадров. Стоит отметить, что я говорю сейчас только про средний фреймрейт.


Battlefield 1

Также ультра настройки для всех трех разрешениё: 1920 на 1080, 2560 на 1440 и 4K. По среднему и максимальному фреймрейцту все нормально — GTX 1070 Ti слегка впереди вот.


Watch Dogs 2

Ультра настройки и теперь это не последняя игра в тесте. По среднему фреймрейту получаем 61 и 65 кадров соответственно у GTX 1070 и GTX 1070 Ti в Full HD, 42 и 47 кадров в Quad HD, а вот в 4K видеокарты буквально сравнялись с разницей в один fps по максимальному показателю. Это может быть вызвано тем, что скорее всего всё просто упирается в пропускную способность памяти самих видеокарты. Кстати говоря, в 4K разрешении с максимальными настройками игре нужно 6 гигабайт видеопамяти, а у видеокарт её 8, так что тут не идет активное скидывание данных в оперативку или на жесткий диск.


Assassin’s Creed Origins

Ну и теперь новички в тестовом наборе — один из них это Assassin’s Creed Origins. Максимальные настройки, без ограничения по фреймрейту, без вертикальной синхронизации и получаем разницу в 45 кадров по всем параметрам, во всех разрешениях. Совершенно ничего не округлял просто взял данные из полученной статистики и как говорится «Совпадение? Не думаю».


Middle-earth: Shadow of War

В качестве второго новичка будет Middle-earth: Shadow of War без динамического разрешения, без вертикальной синхронизации и с максимальными настройками. В Full HD получаем средний фреймрейт 82 и 89 кадров в секунду, в Quad HD видеокарта 1070 выдала 56 кадров в секунду, а GTX 1070 Ti получилось 61. Ну и наконец в 4K получаем 31 кадр против 34.


Так что в итоге?

Ну что ж, GTX 1070 Ti быстрее, чем GTX 1070 — тут без сюрпризов, при этом быстрее не сильно, но учитывая разницу в цене — тоже все понятно. Кстати говоря о ценах, рекомендованная розничная цена у GTX 1070 Ti составляет 33990 рублей, в общем за эти деньги можно будет купить Founders Edition на сайте nvidia. Возможно в магазинах ещё будут варианты похожие на референс, когда при этом рекомендованная розничная цена на простую GTX 1070 составляет 31500 рублей, то есть разница между ними ~2500 рублей. При всем при этом я посмотрел, что сейчас творится с ценами в DNS и GTX 1070 обычную можно найти от 30500, то есть ниже рекомендованной розничной цены и до 35-36к рублей. И тут получается довольно интересная штука, что с выходом GTX 1070 Ti обычная видеокарта GTX 1070 должна подешеветь, иначе будет сильное пересечение по цене и за те же деньги покупатели естественно отдадут предпочтение более мощному варианту. Ну или же новая версия видеокарты будет будет продаваться дороже рекомендованной цены и станет просто более интересным вариантом, чем GTX 1080. Поэтому тут остается только подождать и посмотреть как ситуация сложится на самом деле, чем вот так просто сидеть и гадать. Я, пожалуй, на этом закончу и спасибо за внимание, надеюсь, что вам было интересно и полезно.

NVIDIA продолжает пополнять свою новую линейку и вот уже три графических ускорителя GTX 1080/1070/1060 заняли своё место в различных ценовых сегментах. На примере всех перечисленных моделей можно сделать вывод о том, что компания всерьез вознамерилась завоевать еще большую часть рынка. Несмотря на то, что подавляющее большинство интересуется бюджетными решениями, многие также будут наблюдать и за более дорогими ускорителями в надежде на снижение цен в результате конкурентной борьбы с AMD, если таковая вообще будет. В пору говорить о монополии одного производителя в настольном сегменте видеокарт. Но не будем о грустном и обратим свой взор на референсную модель GeForce GTX 1070 от компании NVIDIA.

Спецификация

  • Производитель: NVIDIA;
  • Модель: GeForce GTX 1070;
  • Графический процессор: GP104;
  • Техпроцесс: 16 нм;
  • Частота GPU: 1506/турбо режим 1683 МГц;
  • Кол-во шейдерных процессоров: 1920;
  • Видеопамять: 8 Гб;
  • Тип видеопамяти: GDDR5;
  • Разрядность шины видеопамяти: 256 бит;
  • Частота видеопамяти: 2000 МГц (8 ГГц QDR);
  • Поддержка SLI: есть;
  • Поддержка HDCP: есть (1080p);
  • Порты: 3х DisplayPort, DVI-D, HDMI 2.0;
  • Макс. кол-во подключаемых мониторов: 4 (до 3-х для 3D Vision Surround);
  • Разъем дополнительного питания: 8-pin;
  • Уровень потребления: 150 Вт;
  • Длина: 267 мм;
  • Цена: 35000 руб.

Что новенького?

По утверждениям компании NVIDIA новая архитектура является революционной, но так ли это на самом деле? Наиболее ярким нововведением в случае с PASCAL является переход на новый техпроцесс 16 нм. Это позволило добиться значительного прироста рабочей частоты GPU, что привело к заметному росту производительности. Еще одной важной особенностью стало применение FinFET (Field Effect Transistor with Fin) - транзисторов, благодаря чему произошло снижение энергопотребления и повышение эффективности. Несмотря на это, архитектура PASCAL представляет собой скорее эволюцию Maxwell, чем что-то принципиальное новое.

Интересные нововведения коснулись и SLI. Теперь компания станет уделять больше внимания тандему из двух ускорителей, т.е. постарается максимально оптимизировать масштабирование производительности именно для подобного сценария. Однако это не означает, что использование трех или даже четырех видеокарт теперь станет невозможным, отнюдь нет, просто акцент будет смещён в сторону наиболее востребованного варианта. Ни для кого не секрет, что позволить себе систему из трех или четырех видеокарт могут лишь единицы.

Для любителей многомониторных конфигураций и шлемов виртуальной реальности NVIDIA заготовила технологию единовременного мультипроецирования (Simultaneous Multi-Projection ). По сути это оптимизация призвана осуществлять одновременный просчёт геометрических данных для нескольких заранее заготовленных проекций. Для чего это нужно? Во-первых, для устранения различных искажений при использовании изогнутых мониторов или конфигураций с несколькими дисплеями. Во-вторых, это позволяет повысить производительность для подобных сценариев использования вашей системы. Немногие из нас имели возможность опробовать в своё время NVIDIA 3D Vision, но те кому довелось, отмечали заметную нехватку производительности, так как на видеокарту ложилась двойная нагрузка при прорисовке изображений для каждого глаза. С внедрением SMP эта проблема устраняется.

Также, нельзя не упомянуть еще о двух интересных новшествах, которые озаглавлены как Ansel и Fast Sync .

Ansel - бесценный инструмент для создания сопутствующего игрового контента, что пригодится стримерам и авторам различных игровых блогов. В процессе игры вы можете нажать на паузу и отрегулировать камеру под любым требуемым углом для создания скриншота. Помимо этого вам будет доступен ряд эффектов для улучшения изображение, а также возможность сделать снимок с потрясающей четкостью. Помимо этого существует возможность создания 3D изображения, панорамных скриншотов и 360° снимков. Правда следует оговориться, что доступно это будет только в тех играх, где будет введена соответствующая поддержка данной опции.

Fast Sync - это своеобразное дополнение к такой функции, как VSYNC. В общих чертах, активация этого нововведения позволит вам избавиться от задержек, что происходит при включении VSYNC. Помимо этого устраняются артефакты в виде разрыва картинки, что может быть заметно при отключении вертикальной синхронизации. Данный сценарий справедлив только в том случае, если значение FPS превышает порог частоты обновления экрана.

Позиционирование

Для начала определимся с типичным портретом потребителя. NVIDIA GeForce GTX 1070 обладает весьма приличной производительностью, но ориентирована в первую очередь на тех, кто хочет с комфортом поиграть на мониторах с разрешением WQXGA (2560x1440). Для Full HD (1920х1080) производительность такой видеокарты избыточна, а для 4к UHD (3840х2160) её явно недостаточно. Учитывая среднюю цену в 35 тысяч такая модель найдёт гораздо больше поклонников, нежели заметно более дорогая GTX 1080. Также, при такой стоимости GTX 1070 становится отличным выбором для объединения видеокарт в SLI. AMD на данный момент ответить нечем, поэтому какой-либо заметной альтернативы здесь пока не предвидится.

Упаковка и комплектация

Видеокарта приехала на тест без упаковки. Однако, коробка и комплектация ничем не отличаются от рассмотренных ранее в материале по . В свою очередь хочу отметить, что в версиях от сторонних брендов комплектация может быть дополнена всевозможными переходниками и аксессуарами или бонус кодами для актуальных игровых проектов.

Внешний вид изделия

Дизайн ускорителя полностью повторяет очертания GTX 1080 за тем лишь исключением, что надпись теперь указывает на рассматриваемую модель. В остальном же, её длина, количество занимаемых слотов и все прочее - осталось неизменным. К плюсам Founders Edition можно отнести сравнительно компактные габариты, что позволяет устанавливать такие видеокарты в корпуса самого различного форм-фактора. И это не пустой звук, взгляните к примеру на нереференсные модели с длиной до 300 мм и трёхслотовой системой охлаждения.

К несомненным плюсам можно отнести наличие на обратной стороне пластины, что положительным образом влияет на внешний вид компьютерной сборки, а также придаёт дополнительную жесткость конструкции для борьбы с провисанием видеокарты.

Как и в случае с GTX 1080 для подключения дополнительного питания устройство снабжено одним разъёмом на 8-пин, который располагается на торце ближе к концу платы. Для исправной работы вам потребуется блок питания мощностью от 500 Вт или выше. Любопытно наблюдать, как с ростом производительности видеокарты становятся все более экономичными в потреблении и на этом фоне отпадает какая-либо потребность в сверхмощных блоках питания. Кроме того, нельзя не отметить некоторые улучшения в дизайне, в данном ракурсе GTX 1070 Founders Edition смотрится более агрессивно и выразительно. Вдобавок к этому, видеокарта снабжена зеленой подсветкой, которую можно отрегулировать через приложение GeForce Experience.

На передней части наблюдается отсутствие каких-либо дополнительных разъемов, здесь просматриваются лишь ребра радиатора.

Интерфейсная панель ничем не примечательна и повторяет типовой набор портов, который нам уже неоднократно встречался на видеокартах прошлого поколения: 3х DisplayPort, DVI-D, HDMI 2.0.

Система охлаждения

Система охлаждения GeForce GTX 1070 Founders Edition лишена каких-либо значительных изменений и соответствует ранее описанной в материале по GTX 1080. Единственное отличие коснулось радиатора, который контактирует с графическим процессором. Если в случае с GTX 1080 применялась конструкция в основании которой находилась испарительная камера, то в данном случае решили прибегнуть к использованию трёх медных тепловых трубок. Для отвода тепла от чипов памяти и силовых транзисторов используется специальная пластина, на которой в конце расположен вентилятор турбинного типа. Крыльчатка вентилятора снабжена некоторыми оптимизациями, благодаря чему удалось уменьшить уровень шума без снижения воздушного потока.

На обратной стороне, для придания жесткости и защиты элементов печатной платы, используются две пластины. Подобный элемент увидишь далеко не на всех альтернативных моделях, особенно, если речь заходит о бюджетных решениях. Таким образом, наличие бэклпейта оказывает положительное влияние на итоговый вешний вид компьютерной сборки.

Чаще всего видеокарты с референсной системой охлаждения используются там, где необходимо выводить горячий воздух за пределы корпуса. Обычно это означает эксплуатацию ускорителя в компактных сборках или в системах с несколькими видеокартами в SLI.

Печатная плата

Перед нами печатная плата черного цвета с классическим расположением элементов. В центральной части расположен графический процессор вокруг которого распаяны микросхемы памяти. Немного правее расположена подсистема питания.

Обратите внимание на отсутствие защитной рамки вокруг GPU. Это означает, что необходимо предельно осторожно снимать или устанавливать систему охлаждения, чтобы случайно не повредить чип.

Общий объем памяти набран восемью чипами с маркировкой K4G80325FB производства Samsung. Подсистема питания насчитывает 5 фаз, четыре из которых отведены для GPU и одна на память. Для управления питанием используется ШИМ-контроллер uP9511P производства uPI Semiconductor. В качестве транзисторов используются NTMFD4C85N производства ON Semiconductor.

Конфигурация тестового стенда

  • Процессор: Intel Core i7-6700K (4000 МГц);
  • Материнская плата: GIGABYTE GA-Z170X-Gaming 7;
  • Кулер: ;
  • Термоинтерфейс: Cryorig CP15;
  • Память: 4 x 4 Гбайт DDR4 3400, ;
  • Видеокарта: NVIDIA GeForce GTX 1070;
  • Накопитель SSD: ;
  • Регулятор вращения вентиляторов: Schyte Kaze Q-12;
  • Блок питания: ;
  • Корпус: NZXT Switch 810;
  • Монитор: SAMSUNG U32E850R;
  • Операционная система: Windows 10 64-bit.
  • Драйвера: GeForce 368.69.

В качестве центрального процессора использовался Intel Core i7-6700K, при этом частота процессора была номинальной. Роль платформы выполняла материнская плата GIGABYTE GA-Z170X-Gaming 7. Значение FCLK было задано вручную и соответствовало 1000 МГц. Память функционировала на частоте 3400 МГц при активном профиле XMP с таймингами 16-18-18-36.

Рассматриваемый экземпляр является эталонным: частота ядра и памяти соответствует стандартным значениям, а для охлаждения используется референсная СО. Термоинтерфейс для GPU соответствует стандартному.

Синтетические тесты

Для оценки производительности в синтетике использовались тесты Valley Benchmark, Heaven Benchmark и 3DMark13.



Игровые тесты

Перейдем к игровым приложениям и остановимся на методике тестирования. Измерение FPS проводилось с помощью утилиты FRAPS. Все игры были протестированы в трех наиболее актуальных разрешениях: 1920х1080, 2560х1440 и 3840х2160. Вручную отключены следующие параметры:

  • VSync (вертикальная синхронизация)

Все остальные настройки, включая сглаживание, были установлены на максимально возможные. Для наглядности каждая игра снабжена скриншотами с меню настроек графики, изменялось лишь разрешение, все остальные параметры оставались неизменными.
















Исходя из полученных результатов можно сделать вывод о том, что GTX 1070 прекрасно справляется с большинством игр на разрешении 2560х1440. Если же обратиться к 4К, то подойдёт такая видеокарта только непривередливым игрокам, которые способны пойти на компромисс и отключать помимо сглаживания такие параметры как тени, объемное освещение или дальность прорисовки объектов. Недостаток FPS в таком разрешении особенно заметен на примере таких игр, как: Assassin"s Creed Syndicate, Crysis 3 и Metro Last Light.

Для повышения информативности материала приведу несколько видео снятых на разрешении 3840х2160 на максимальной графике, но с отключенным сглаживанием. Таким образом можно будет оценить влияние этого параметра на итоговое значение FPS. Для просмотра крайне рекомендую использовать браузер Google Chrome.

Температура и разгон

Тестирование происходило в открытом корпусе при комнатной температуре в 25 градусов. В режиме бездействия частота GPU и памяти снижается до 139/405 МГц, что напрямую сказывается на энергоэффективности и улучшает температурные показатели. В режиме покоя температура опустилась до 37°С, а под нагрузкой не превысила 81°С. Что же до уровня шума, то при малых нагрузках видеокарта работает достаточно тихо и навряд ли кого-то может не устроить по этому параметру. Под нагрузкой шум также не выходит из комфортной зоны. В общем и целом, благодаря снижению потребляемой мощности и, как следствие, снижению нагрева - референсная система охлаждения достаточно уверенно справляется с отводом тепла.

Разгон осуществлялся при помощи последней версии утилиты EVGA PrecisionX 16.

Помимо стандартного меню с изменением параметров частоты и напряжения в данной утилите доступно еще три режима:

  • Basic - выбираем точку на графике с определенным значением напряжения и указываем требуемый уровень частоты, при этом происходит линейное построение этой зависимости.
  • Linear - осуществляем построение по двум точка, что даёт возможность задать начальное и конечное значение, что влияет на крутизну линии.
  • Manual - выставляем вручную каждую точку частоты для соответствующего значения питающего напряжения.


Для того, чтобы проверить стабильность установленных параметров рекомендуется использовать встроенный ОС сканер, благодаря которому происходит проверка стабильности работы видеокарты в зависимости от частоты и уровня питающего напряжения. По итогам можно сохранить профиль, где будут отмечены все точки на графике.

Результат разгона:

  • Частоту графического процессора удалось повысить на 215 МГц, что в итоговом варианте составило 1721 МГц. Однако, с учетом GPU Boost искомое значение выросло до 2100 МГц, что гарантирует весьма существенную прибавку в производительности.
  • Частота памяти была увеличена на 655 МГц и достигла значения 2328 МГц (9,3 ГГц QDR), получилась отличная прибавка.

Предлагаю ознакомиться с возросшими показателями Fire Strike Extreme и Fire Strike Ultra:

Заключение

NVIDIA GeForce GTX 1070 Founders Edition получилась во всех отношениях удачной. Прежде всего отмечу высокую производительность, которая позволяет поиграть во многие игры в разрешении 4К, если вы готовы снизить некоторые графические настройки. Помимо этого, нельзя не упомянуть сравнительно невысокое потребление видеокарты, что поможет избежать излишних затрат на блок питания. Ко всему прочему можно отнести и вполне приемлемый уровень шума издаваемый СО под нагрузкой. Но больше всего порадовал отличный разгонный потенциал, который гарантирует дополнительную вычислительную мощность и заметную прибавку FPS в играх.

Стоит ли покупать Founders Edition или подождать выхода в свет альтернативных версий? По мнению автора, спешить с покупкой не следует. Начнём с того, что варианты от партнёров NVIDIA будут снабжены полупассивной системой охлаждения и будут работать значительно тише. Еще одним плюсом в копилку альтернативных вариантов является более низкое значение максимальной температуры под нагрузкой и как следствие, более высокие значения частоты в режиме BOOST. Не будем забывать и про заводской разгон, что окажет заметное влияние на производительность. Вспомним также о всевозможных дизайнерских изысках, как-то RGB подсветка, цветовое оформление и прочее. Последним аргументом для покупателей может стать цена. Доподлинно известно, что некоторые модели будут стоить дешевле, чем Founders Edition, что при всех перечисленных ранее плюсах делает покупку референса практически бессмысленным занятием.

Плюсы:

  • Дизайн, внешний вид;
  • Высокая производительность;
  • Отличный разгонный потенциал;
  • Сравнительно невысокое потребление;
  • Тихая в простое и ненавязчива под нагрузкой;
  • Хорошая эффективность системы охлаждения.

Минусы:

  • Не выявлены.

По мнению редакции, учитывая все плюсы и минусы, NVIDIA GeForce GTX 1070 Founders Edition получает награду "Золото".

Nvidia GeForce GTX 1070 8 ГБ 256-битной GDDR5 PCI-E
Параметр Значение Номинальное значение (референс)
GPU GeForce GTX 1070 (GP104) (P/N 900-1G411-2520-000 L)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1507-1797 1507-1797
Частота работы памяти (физическая (эффективная)), МГц 2000 (8000) 2000 (8000)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU 15
Число операций (ALU) в блоке 128
Суммарное количество блоков ALU 1920
Число блоков текстурирования (BLF/TLF/ANIS) 120
Число блоков растеризации (ROP) 64
Размеры, мм 270×100×35 270×100×35
Количество слотов в системном блоке, занимаемые видеокартой 2 2
Цвет текстолита черный черный
Энергопотребление Пиковое в 3D, Вт 151 151
В режиме 2D, Вт 42 42
В режиме «сна», Вт 21 21
Уровень шума В режиме 2D, дБА 20,5 20,5
В режиме 2D (просмотр видео), дБА 20,5 20,5
В режиме максимального 3D, дБА 25,5 25,5
Выходные гнезда 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работы SLI
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Дополнительное питание: количество 8-контактных разъемов 1 1
Дополнительное питание: количество 6-контактных разъемов Нет Нет
Максимальное разрешение 2D Display Port 4096×2160
HDMI 4096×2160
Dual-Link DVI 2560×1600
Single-Link DVI 1920×1200
Максимальное разрешение 3D Display Port 4096×2160
HDMI 4096×2160
Dual-Link DVI 2560×1600
Single-Link DVI 1920×1200

Комплектация локальной памятью

Карта имеет 8 ГБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой сторонe PCB.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу NVIDIA. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: NVIDIA и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании NVIDIA — Realistic Water Terrain , также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1070 GTX 1070 )
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080 )
  • GeForce GTX 970 со стандартными параметрами (сокращенно GTX 970 )
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X )
  • Radeon R9 390X со стандартными параметрами (сокращенно R9 390X )

Для проведения анализа производительности новой модели видеокарты GeForce GTX 1070 в синтетических тестах, мы выбрали эти решения по следующим причинам. GeForce GTX 970 является прямым предшественником новинки, основанном на аналогичном по сложности урезанном графическом процессоре из предыдущего поколения Maxwell. Видеокарта GeForce GTX 1080 взята как решение уже нынешнего поколения с максимальной производительностью, основанное на полноценном чипе GP104 — это сравнение покажет, насколько GTX 1070 медленнее GTX 1080.

От конкурирующей компании AMD для нашего сравнения мы снова выбрали две видеокарты разных поколений и семейств. Младшая из видеоплат Radeon R9 390X хоть и основана на довольно старом графическом процессоре Hawaii, но она до сих пор составляет неплохую конкуренцию во многих синтетических тестах. А заодно является самым близким по цене соперником для новинки. Также мы взяли Radeon R9 Fury X — в качестве самого производительного решения от AMD.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

От DirectX 9 тестов мы давно отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют еще со времени выпуска первых видеочипов на базе архитектуры GCN. И именно платы Radeon до сих пор являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ. Вывод подтверждается и сегодняшним сравнением — выпущенная сегодня видеокарта NVIDIA проиграла решениям конкурента, включая своего прямого соперника Radeon R9 390X, основанного на устаревшем графическом процессоре Hawaii.

В первом Direct3D 10 тесте новая видеоплата модели GeForce GTX 1070 до 20% уступила топовой модели нового поколения в виде GTX 1080, что соответствует теории. Удивительно, но вот свою предшественницу на чипе GM204 она обогнала совсем немного. Похоже, что видеокарты NVIDIA в этом тесте во что-то упираются. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста традиционно получились более интересными. Новая видеокарта модели GeForce GTX 1070 опережает аналогичную по позиционированию модель из прошлого поколения GTX 970 чуть ли не вдвое, что уже ближе к той разнице, что мы от неё ожидали, да и к теоретическим показателям. Сегодняшняя новинка уступила старшей модификации GTX 1080 чуть больше 20%, что также полностью соответствует теоретическим данным. Отставание от конкурентов в виде Radeon R9 Fury X и R9 390X серьёзно сократилось, хотя даже младшую модель Radeon новинка обойти так и не смогла.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом очень похожа на предыдущую (также без включения суперсэмплинга), и в этом тесте новая модель видеокарты GeForce GTX 1070 оказалась лишь немного быстрее GTX 970, и уступила почти 20% старшей GeForce GTX 1080, что близко к теории. Если же сравнивать новинку с видеокартами AMD, то и в этом случае новинка заметно уступает обеим платам Radeon. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Такие условия полностью изменили соотношение сил в сравнении. Хотя графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работали эффективнее конкурирующих плат GeForce, но именно новые модели GeForce GTX 1080 и GTX 1070, основанные на первом чипе архитектуры Pascal смогли наконец-то поспорить с ними. Старшая плата показала результат на уровне Radeon R9 Fury X во всех условиях, а рассматриваемая сегодня GTX 1070 оказалась почти точно на уровне R9 390X. По сравнению с другими GeForce, новинка показала скорость ощутимо быстрее GeForce GTX 970 из предыдущего семейства и уступила старшей GTX 1080 примерно 18-23%, что близко к теории.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае нашего теста Mineral, все видеокарты сравнения показали слишком близкие результаты, разница между которыми незначительна — похоже, что тест не отражает реальной разницы в производительности.

Увы, но в этом тесте именно GeForce GTX 1070 оказалась худшей в нашем сравнении, проиграв вообще всем — и платам от компании AMD и своей предшественнице на базе чипа архитектуры Maxwell, и GTX 1080, что хотя бы логично. Так что можно не принимать эти результаты всерьёз, они явно аномальны. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вот во втором математическом тесте из нашего RigthMark мы видим что-то хотя бы отдалённо похожее на реальное положение дел, и результаты видеокарт относительно друг друга близки к истинным. Так, новая модель GeForce GTX 1070 в этот раз уже опережает GTX 970, хотя и совсем незначительно. Разница должна быть большей. Старшей модели GTX 1080 новинка уступила порядка 19%, что примерно соответствует теоретическим пиковым параметрам.

Если сравнивать новую видеокарты на GPU архитектуры Pascal с Radeon, то обе видеокарты на чипах компании AMD показали лучшие результаты, хотя разница между GeForce GTX 1070 и Radeon R9 390X невелика, так как графический процессор Hawaii хоть и старый, но до сих пор весьма силён в математических тестах.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт от NVIDIA и AMD в этот раз явно в пользу решений первой. Скорее всего, это обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon. И в данном случае хорошо заметно, что топовые видеочипы NVIDIA выигрывают с заметным преимуществом, имея большее количество блоков по обработке геометрии.

Новая модель GeForce GTX 1070 уступила старшей модификации лишь 11-15%, а плата прошлого поколения в лице GTX 970 так и вовсе осталась далеко позади (хотя даже её производительность лучше, чем у Radeon). Видеокарты на чипах AMD показывают очень низкие результаты в этом тесте, Radeon R9 390X стала худшим решением сравнения, да и Fury X проиграла всем видеокартам NVIDIA, не говоря уже о GTX 1070. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно для плат AMD и для решений NVIDIA. И это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1070 и в этом подтесте показала отличный результат, обогнав видеокарты, кроме одной — GTX 1080 на основе такого же чипа, но не урезанного, где-то на 10-13% быстрее. А вот отставание Radeon в сложных условиях доходит до двукратного.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт NVIDIA:

На этой диаграмме мы видим примерно то же самое, что и в тесте Galaxy, хотя есть и некоторые отличия. Вторая модель видеоплаты на базе чипа GP104 оказалась заметно быстрее прошлого решения GeForce GTX 970 в сложных условиях, и уступила старшей плате нынешнего поколения 13-17%, что близко к теории. Возможно, в более сложном режиме тестирования что-то изменится:

В таких условиях результаты видеокарт компании NVIDIA серьезно изменились, но результаты довольно странные — GTX 970 стала лучшей в самых простых условиях, хотя в остальных режимах выигрывает уже нынешняя топовая карта GTX 1080. Ну а новая GTX 1070 проигрывает ей снова всё те же 14-17% в этом подтесте. Так что на фоне GeForce GTX 1080 в тестах геометрических шейдеров младшая модель показала себя неплохо.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат NVIDIA, которые в простых режимах не сильно быстрее себя же в более тяжёлом. Новая видеокарта GeForce GTX 1070 в этом тесте показывает скорость явно очень низкую — этот тест не очень хорошо исполняется вообще на всех платах GeForce, которые оказались примерно на одном уровне, но именно новинка стала худшей по непонятным причинам.

Ну а лидером в этом тесте традиционно является уже очень старая плата компании AMD на базе видеочипа Hawaii — в этот раз она оказалась сильнее всех плат от NVIDIA и Radeon R9 Fury X. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме несколько изменилась, и решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Впрочем, в самом легком они всё равно продолжают лидировать. Новая модель GeForce GTX 1070 в сложных условиях показала скорость, близкую к GTX 970, но всё же уступает ей. Старшей видеокарте на GP104 новинка проиграла ожидаемые 17-21%. Если сравнивать её результаты с Radeon, то она выиграла у обеих плат AMD в самом сложном режиме, проиграв в более лёгких.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» во многом похожи на то, что мы видели на предыдущих диаграммах — решения NVIDIA всё так же упираются во что-то в лёгких режимах. Скоростные показатели всех GeForce в этом тесте уступают производительности решений конкурента, вот и новая модель GeForce GTX 1070 показывает скорость ниже их уровня. Если сравнивать три рассмотренные в сравнении GeForce, то в тяжелых режимах GTX 1070 обгоняет GTX 970, хотя в лёгком уступает. Отставание от старшей GTX 1080 чуть меньше ожидаемого. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты NVIDIA пострадали несколько больше. Но в выводах ничего не меняется, по сути, разве что можно отметить куда более серьёзное отставание GTX 970 от новой модели GeForce GTX 1070. Рассматриваемая сегодня плата лишь на 6-14% медленнее старшего решения на том же чипе нового семейства. Впрочем, если сравнивать их с Radeon, оба решения уступают конкурирующим, особенно самой старой модели R9 390X.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1070 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и NVIDIA в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 970 и GTX 1070 оказалась более чем полуторакратной в пользу новой модели видеокарты на основе архитектуры Pascal, что близко к теоретической разнице. От GTX 1080 новинка отстала на четверть, что также было ожидаемо.

Что касается сравнения скорости текстурирования новой видеоплаты от NVIDIA с имеющимися на рынке решениями конкурента, то новинка показала почти точно такой же результат, что и Radeon R9 390X, хотя обе они уступили текущей видеокарте верхнего ценового диапазона R9 Fury X, имеющей очень большое количество блоков текстурирования.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce опередила свою предшественницу снова более чем в полтора раза, уступив старшей модели GTX 1080 те же 25%. Всё это вполне объяснимо теорией.

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1070 с результатами решений компании AMD в этом же тесте, то рассматриваемая сегодня плата показала более чем вдвое большую скорость заполнения сцены по сравнению с Radeon R9 390X, и уступила 14% текущему топовому решению в виде Radeon R9 Fury X. У лучших видеокарт AMD и NVIDIA сейчас достаточно большое количество блоков ROP, есть также весьма эффективные оптимизации для сжатия данных.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата GeForce GTX 1070 показала хороший результат, оказавшись более чем в полтора раза быстрее аналогичной по позиционированию модели предыдущего поколения GTX 970. Старшая модель текущего поколения, конечно же, оказалась быстрее — снова где-то на четверть, как и должно быть по теории. GeForce GTX 1070 в этом тесте показала результат получше, чем Radeon R9 390X, но примерно столько же уступила Radeon R9 Fury X.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов NVIDIA должны проявляться, но увы — в очередной раз отмечаем странные результаты плат GeForce. В этом тесте новая видеокарта NVIDIA показала низкую скорость, уступив в нем не только топовому решению на таком же чипе, но и своей прямой предшественнице GTX 970.

Понятно, что в таких условиях сравнение с платами Radeon в этом тесте для новинки будет печальным. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма и весьма эффективно, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении. Непонятно, чем ограничена скорость решений NVIDIA, показавших очень близкие результаты.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация серьёзно изменилась. В этот раз новая GeForce GTX 1070 уже показывает очень высокий результат, обогнав обе платы соперника и решение на чипе архитектуры Maxwell. Новая плата GeForce GTX 1070 в этот раз уступила только лидеру сравнения в виде GTX 1080, её отставание от старшей модели составило всего лишь около 15%. Сравнение новинки от NVIDIA с конкурирующими видеокартами компании AMD в этот раз позитивное — вторая плата семейства Pascal показала результат лучше обеих видеокарт Radeon.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

Вот теперь мы видим математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новые модели видеокарт от компании NVIDIA, основанные на первом игровом чипе Pascal, тоже показали высокую скорость. Если топовая GTX 1080 почти достала Radeon R9 Fury X, то младшая GTX 1070 обогнала Radeon R9 390X, в свою очередь. И это — очень хороший результат, подтверждающий успешность архитектуры Pascal с точки зрения вычислений.

Если же сравнивать скорость плат GeForce друг с другом, то предыдущая модель компании из семейства GeForce GTX 900 в этом тесте почти в полтора раза уступила сегодняшней новинке, а отставание GeForce GTX 1070 от GTX 1080 составило привычные чуть более, чем 25%. Так что тесты пакета 3DMark Vantage подтверждают, что GTX 1070 будет отставать от GTX 1080 в играх где-то на 20-25% в среднем.

Direct3D 11: Вычислительные шейдеры и производительность тесселяции

Как обычно, для тестов нового решения компании NVIDIA в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы хотели воспользоваться примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, NVIDIA и AMD. Но увы, все наши привычные тесты, использующие вычислительные шейдеры и тесселяцию, на тестовой системе с DirectX 12 под управлением операционной системы Windows 10 работают некорректно. Они толком не работают ни в оконном режиме, ни в полноэкранном. И разрешение менять не дают, аварийно завершая работу.

Если на системе с GeForce GTX 1080 в прошлый раз запустить пару из них всё же удалось, то в этот раз заставить их работать не получилось вовсе. Времени на исправление ошибок и введение новой методики для тестирования не было, и сегодня нам придётся обойтись вовсе без тестов вычислительных шейдеров и тесселяции. Для будущих же материалов планируется разработать новую методику с актуальными тестами DirectX 11/12 и OpenCL — к слову, в комментариях к статье на нашем форуме мы принимаем пожелания наших читателей по их набору.

Судя по результатам синтетических тестов новой видеокарты NVIDIA GeForce GTX 1070, основанной на урезанной версии нового графического процессора GP104, а также результатам других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем такой вывод, что рассматриваемая сегодня видеокарта станет отличным приобретением — одним из наиболее производительных решений на рынке, уступающим старшей модели GTX 1080 всего лишь около 20-25%.

Новая видеокарта от компании NVIDIA показала неплохие результаты в наших синтетических тестах, во многих из них опередив конкурирующие решения. Впрочем, в других тестах были и проигрыши, по сравнению с имеющимися на рынке платами Radeon в частности, но на результаты в реальных играх они практически не повлияют, ведь далеко не каждый синтетический тест можно перенести на игры. Решения компании AMD традиционно отличаются весьма эффективным исполнением простых и интенсивных вычислительных задач, а графические процессоры NVIDIA отыгрываются в геометрических тестах с применением тесселяции и тестах с более сложными вычислениями.

И в реальных игровых приложениях новая модель GeForce GTX 1070 должна показать в играх скорость до 25% хуже, чем у GTX 1080, судя по опыту, и это — чуть выше уровня GeForce GTX 980 Ti по нашим предварительным оценкам. Ну и Radeon R9 Fury X в среднем должен остаться позади, не говоря уже о Radeon R9 390X. В следующей части нашего материала мы рассмотрим производительность новинки по сравнению с конкурентами в играх, протестировав GeForce GTX 1070 в наборе актуальных игровых приложений.

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair


Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: