Введение
Ситуация на рынке процессоров для настольных систем развивается стремительно. Компания AMD со своими процессорами Ryzen сумела внести свежую струю, поэтому теперь в том, что происходит на рынке, можно видеть явное проявление настоящей конкуренции. И особенно интригует во всём этом то, что соперничество происходит не только в нижнем и среднем секторе.
Восьмиядерные процессоры Ryzen смогли поколебать позиции Intel и в верхнем ценовом сегменте, поскольку они смогли предложить большее количество ядер, лучшую многопоточную производительность и более низкую стоимость на фоне процессоров Core i7 для платформы LGA 1151. Безусловно, Intel всё ещё может противопоставить новоявленному конкуренту лучшую оптимизацию, более высокое однопоточное быстродействие и лучший разгон, но первые результаты продаж Ryzen говорят сами за себя: сделать конкурентоспособный продукт у компании AMD определённо получилось.
Однако неожиданно оказалось, что AMD не собирается останавливаться на достигнутом: компания готовит вторжение на территорию, которая всегда считалась интеловской вотчиной – в сегмент HEDT (высокопроизводительных настольных систем). В самое ближайшее время у AMD выйдет платформа Threadripper, в рамках которой компания намерена начать предлагать энтузиастам дорогие многоядерные процессоры, которые бы могли стать альтернативой интеловским Core i7 Extreme Edition. Поединок между высокопроизводительными процессорами AMD и Intel обещает стать воистину эпическим, там более, что и Intel не сидит сложа руки и в срочном порядке начала обновлять свои предложения для высокообеспеченных энтузиастов, вводя в обиход новую платформу LGA 2066. Именно о ней и пойдёт речь в этом материале.
Модельный ряд Skylake-X
Итак, в июне этого года компания Intel представила новый набор системной логики X299, новый процессорный сокет LGA 2066 и линейку соответствующих процессоров Skylake-X, в сумме составляющих платформу Basin Falls.
Изначально в этот модельный ряд должны были войти три процессора – с шестью, восемью и десятью вычислительными ядрами, отличающиеся также числом предлагаемых линий PCI Express и рабочими частотами. Позднее Intel решила дополнительно усилить семейство и 12-ядерным процессором, однако его реальный дебют ожидается лишь в августе. Однако в конце концов и этого микропроцессорному гиганту показалось мало, и в дополнение к перечисленным моделям он запланировал на осень выпуск дополнительных LGA 2066 CPU с 14, 16 и 18 ядрами. При этом для более понятной дифференциации модельный ряд новых процессоров был разделён на две части: CPU с числом ядер до восьми были отнесены к серии c привычным названием Core i7, более же многоядерные модели получили до сего времени неиспользовавшееся наименование Core i9.
Все перечисленные нами выше процессоры Skylake-X, входящие в платформу Basin Falls, традиционно представляют собой близких родственников серверных Xeon поколения Skylake-SP с отключенными «корпоративными» возможностями вроде поддержки многопроцессорных конфигураций, ECC-памяти и Omni-Path Fabric и с добавленными десктопными функциями, например, разгоном. Именно поэтому выпуск многоядерных версий Skylake-X с числом ядер более десятка не составит для Intel большого труда. Тем не менее совершенно очевидно, что их появлением в модельном ряду мы обязаны AMD Threadripper. Именно эта инициатива конкурента подтолкнула Intel на подготовку процессоров с числом ядер более 12, ведь в рамках HEDT-платформы AMD ожидаются процессоры с 12 и 16 вычислительными ядрами, а микропроцессорный гигант не мог себе позволить уступить конкуренту в числе ядер CPU для высокопроизводительных систем.
Стоит добавить, что для платформы LGA 2066 компания Intel заготовила и ещё два варианта, относящихся к начальному (в рамках HEDT) уровню. Эти варианты – четырёхъядерные процессоры Kaby Lake-X, по сути выступающие аналогами обычных Kaby Lake, но выполненные в ином форм-факторе. О них мы подробно поговорим в последующих обзорах.
В конечном итоге ассортимент процессоров для LGA 2066-систем оказался весьма необычным. Ранее для предыдущих версий HEDT-платформ Intel никогда не предлагала столь широкого разнообразия чипов, которые кардинальным образом отличаются между собой по характеристикам. Однако интересно в Skylake-X даже не это, а ценовая политика, которая тоже несёт в себе немало нового.
Дело в том, что AMD собирается продавать свой старший 16-ядерный процессор Ryzen Threadripper по цене порядка $1000. И это соответствует стоимости 10-ядерного Core i9-7900X, рекомендованная стоимость которого установлена в $989. И здесь нужно заметить, что цена нового десятиядерника по сравнению с предшествующим интеловским процессором с таким же числом ядер, Core i7-6950XE, заметно упала. Прошлый десятиядерный чип Intel, который до недавних пор выполнял роль единственного и неповторимого десктопного флагмана, стоил $1569. Новый же Core i9-7900X очевидно лучше его по всем признакам: несмотря на некоторое сокращение кеш-памяти третьего уровня, представитель поколения Skylake-X получил 300-мегагерцовое усиление в тактовой частоте, и значительно более высокие частоты, достигаемые в режиме Turbo Boost 2.0: они могут доходить до 4,3 ГГц, в то время как процессор поколения Broadwell-E мог разгоняться лишь до 3,5 ГГц. Кроме того, в Skylake-X появилась улучшенная технология Turbo Boost Max Technology 3.0, способная поднимать рабочую частоту Core i9-7900X ещё выше – до 4,5 ГГц, предлагая 500-мегагерцовое преимущество над предшественником по максимальной частоте, достижимой при однопоточной и двухпоточной нагрузке.
Подобная картина наблюдается и при сравнении процессоров поколений Skylake-X и Broadwell-E с меньшим числом ядер. Восьмиядерник Core i7-7820X превосходит по частоте Core i7-6900K на 400-600 МГц, но при этом он оценён в $589 против $1089. Шестиядерный же Core i7-7800X в сравнении с шестиядерником прошлого поколения почти не прибавил в тактовой частоте, но зато стал дешевле почти на 40 процентов, вплотную приблизившись цене к процессорам для экосистемы LGA 1151.
Получается, ещё не успев появиться, Ryzen Threadripper уже смог устроить заметную встряску в модельном ряду интеловских HEDT-процессоров. Обычная маркетинговая стратегия Intel такова, что новые модели CPU предлагают несколько лучшие возможности при сохранении постоянной стоимости. Либо стоимость снижается для процессоров, характеристики которых остаются на одном месте длительное время. В случае же Skylake-X произошло и то, и другое одновременно: новые CPU превосходят старые практически по всем параметрам, а кроме того, они заметно дешевле.
Говоря о преимуществах нового модельного ряда, следует отметить и ещё одну важную деталь. Процессоры Skylake-X производятся с использованием усовершенствованного техпроцесса 14+ нм. Этот не тот технологический процесс, который применялся при выпуске Broadwell-E, в нём микропроцессорный гигант сделал некоторые улучшения в дизайне транзисторов на микроуровне, и это обуславливает возросший частотный потенциал. А это значит, что при прочих равных Skylake-X должны лучше разгоняться, точно также как Kaby Lake имеют преимущества в разгоне на фоне старых представителей семейства Skylake.
Процессоры для платформы LGA 2066 различаются не только числом вычислительных ядер и рабочими частотами. Немалое значение для дифференциации моделей играют и отличия в числе поддерживаемых линий PCI Express. Иными словами, как и раньше, далеко не все процессоры Skylake-X могут обеспечить полноценную работу мульти-GPU конфигураций, собранных с применением технологий SLI и CrossfireX. Хотя максимально возможное в платформе LGA 2066 число линий PCI Express было увеличено на 4 линии и достигло 44, его может предложить лишь 1000-долларовый процессор Core i9-7900X. Даже восьмиядерный Core i7-7820X теперь обладает лишь 28 линиями, хотя восьмиядерник прошлого поколения мог предложить 40 линий PCI Express. Иными словами, полный набор средств для расширения системы, как и раньше, можно получить, лишь потратив на процессор сумму не менее $1000. Более дешёвые варианты CPU смогут обеспечить работу двухкомпонентных мульти-GPU конфигураций только по схеме x16 + x8.
Такой дополнительный уровень дифференциации кажется пережитком из прошлого: зачем Intel искусственным образом ограничивает производительность систем с массивами SLI или CrossfireX, совершенно непонятно. Тем более, что альтернативная платформа AMD никаких подобных искусственных ограничений иметь не будет. Процессоры Ryzen Threadripper, вне зависимости от числа активированных в них ядер, смогут предложить по 64 полноценных линии PCI Express.
Видимо, компания Intel считает, что с HEDT-процессорами AMD должны конкурировать лишь наиболее многоядерные процессоры Skylake-X, которые выступают под маркой Core i9. Те же CPU, которые относятся к классу Core i7 – это более простые варианты, которые представляют собой некий компромисс между стоимостью и предлагаемыми возможностями. У них меньше ядер, ниже частоты, а также хуже возможности расширения. У старшего же Skylake-X по сравнению с Broadwell-E появились четыре дополнительные линии PCI Express. Их компания Intel добавила в связи с распространением накопителей с интерфейсом NVMe. Появились они главным образом с прицелом на поддержку технологии Intel Optane, но могут использоваться для любых других целей.
Микроархитектурные изменения: расширения AVX-512
Надо сказать, что между представителями серий Core i7 и Core i9 поколения Skylake-X неожиданно нашлись и глубокие архитектурные отличия. Основная часть исполнительного конвейера этих процессоров практически не отличается от того, как этот конвейер функционирует в привычных процессорах Skylake или Kaby Lake, с которыми мы имеем дело уже два года. Это значит, что в сравнении с Broadwell-E процессоры Skylake-X могут предложить обработку чуть большего числа целочисленных инструкций одновременно, а кроме того в них увеличены основные буферы, что позволяет улучшить работу алгоритмов предсказания переходов.
Микроархитектура Skylake Конечно, это некоторое упрощение, на самом деле число исполнительных портов в Skylake по сравнению с Broadwell не увеличилось, а все улучшения сделаны во входной части исполнительного конвейера, и они улучшают коэффициент полезного действия имеющихся устройств. Но для того, чтобы понимать, где пролегают архитектурные отличия обычных Skylake и Skylake-X, а также их серверных собратьев Skylake-SP, этого вполне достаточно.
Главное изменение в Skylake-X, о котором следует сказать в первую очередь, это появление поддержки нового набора векторных инструкций AVX-512. Новые команды позволяют работать с числами вдвое большей размерности и выполнять над ними типичные векторные операции. Для реализации поддержки нового поколения AVX-инструкций в процессоре не только появились расширенные регистры, но и удвоилось их количество.
Добавление таких возможностей наделяет процессоры Skylake-X способностью обрабатывать за такт значительно большее количество данных. Поэтому Skylake-X может выполнить две 64-байтовых загрузки, и одно 64-байтовое сохранение данных за такт, в то время как в обычных Skylake за такт можно осуществить лишь одну 64-байтовую загрузку и одно 32-байтовое сохранение.
Вместе с дополнительными регистрами и увеличением их размерности в Skylake-X появилось выделенное AVX-512 исполнительное устройство, способное выполнять FMA-операции (умножения-сложения). Оно совместимо исключительно с AVX-512-инструкциями и относится к пятому исполнительному порту в традиционной структуре Skylake. Данное устройство добавилось к паре имевшихся 256-битных FMA-устройств, которые уже были в обычных процессорах Skylake, и которые тоже могут, объединяясь совместно, обрабатывать AVX-512-инструкции. В результате, Skylake-X оказывается способен выполнять AVX-512-инструкции с тем же темпом, что и обычные AVX-команды. А это в свою очередь означает удвоение пиковой производительности по сравнению с обычными массовыми Skylake за счёт увеличения размерности данных.
В теории это звучит весьма впечатляюще, однако на практике существует серьёзная проблема. Работа с 512-битными векторами требует очень больших энергозатрат, и приводит к сильному росту тепловыделения CPU. Поэтому исполнение инструкций из набора AVX-512 может приводить не только к отключению процессорного турбо-режима, но и даже к падению рабочих частот процессора ниже номинальных значений. Иными словами, прирост производительности при переходе на использование 512-битных регистров может оказаться ниже ожидаемого уровня, и разработчики программного обеспечения должны учитывать эту особенность, трезво оценивая величину получаемого выигрыша. Так, внедрение в код небольшой доли AVX-512-инструкций может оказаться плохой с точки зрения производительности стратегией, которая, вероятно, способна даже давать негативный эффект.
Есть и ещё одна особенность. Выполнять по две AVX-512-команды одновременно может далеко не каждый процессор, относящийся к семейству Skylake-X. Дополнительное FMA AVX-512 устройство предусмотрено лишь в тех процессорах, которые относятся к семейству Core i9. Модели же Core i7-7800X и Core i7-7820X имеют набор 512-битных регистров, но работать с ними могут только при помощи одного из двух 512-битных устройств, раелизованных в Skylake-X. И это, наряду с разным числом поддерживаемых линий PCI Express, – ещё один странный метод сегментации из-за которого скорости работы с AVX-512-кодом у разных процессоров семейства Skylake-X могут принципиально различаться.
Учитывая такую неестественную реализацию, появление поддержки AVX-512 вряд ли будет встречено разработчиками программного обеспечения с энтузиазмом. Да, какие-то узкоспециализированные задачи вроде машинного обучения, научных расчётов или финансовых вычислений, возможно, перейдут на работу с AVX-512, но массовое программное обеспечение вряд ли в ближайшее время будет оптимизироваться и перекомпилироваться под работу с 512-битными регистрами. И эта ситуация вряд ли поменяется до тех пор, пока поддержка AVX-512 не появится в процессорах для массового сегмента.
Новая система кеширования
Ещё одно важное изменение на уровне архитектуры, которое произошло с Skylake-X, касается подсистемы кеширования. В то время как предшественники современных HEDT-процессоров Broadwell-E, как и массовые процессоры Skylake, обладали сравнительно небольшим L2-кешем размером 256 Кбайт на каждое ядро, в Skylake-X этот кеш увеличился в четыре раза – до 1 Мбайт. Попутно увеличилась и ширина шины между L1 и L2-кешем. Учитывая появившуюся поддержку AVX-512-инструкций, обмен данных между кеш-памятью разного уровня может теперь идти со скоростью до 128 байт за такт. Попутно возросла и ассоциативность кеш-памяти второго уровня. Теперь она 16-кратная, в то время как в обычных Skylake была 4-кратной. Это значит, что обновлённый кеш чуть медленнее, но может предположить увеличенную эффективность. Сама Intel говорит о том, что проведённые изменения позволят хранить больше данных ближе к ядру, что должно повысить производительность при работе с большими объёмами информации.
Изменениям был подвергнут и объединённый кеш третьего уровня. Теперь его роль в структуре процессора стала заметно ниже, и его объём снижен до 1,375 Мбайт на ядро, в то время как раньше, в процессорах поколения Broadwell-E, его размер определялся из расчёта 2,5 Мбайт на ядро. Кроме того, поменялся и алгоритм кеширования. L3-кеш перестал быть по отношению к L2 инклюзивным, вместо этого теперь его можно считать виктимным. В результате эффективность использования пространства разделяемого кеша стала выше, однако выросла и его латентность. Однако Intel считает, что это вполне компенсируется ростом объёма кеша второго уровня.
Новая схема межъядерных соединений
И последнее нововведение, появившееся в архитектуре процессоров Skylake-X, о котором стоит рассказать отдельно, это – отказ от использовавшейся в течение многих лет кольцевой шины. Вместо неё для объединения процессорных ядер и внеядерных элементов теперь будет использоваться новая ячеистая сетевая структура, подобная той, что используется в ускорителях вычислений Knights Landing.
Переход к новой топологии обещает принести сразу несколько преимуществ. В первую очередь, Intel говорит о том, что в случае многоядерных процессоров ячеистые соединения позволяют обеспечить более низкие латентности и более высокие пропускные способности даже несмотря на использование более низких частот и меньшего сигнального напряжения. Это особенно важно, поскольку в многоядерных CPU фактор соединений начинает вносить достаточно весомый вклад в общее потребление и тепловыделение процессора.
Второе преимущество ячеистой топологии заключается в том, что она позволяет включать в структуру процессора различные блоки ввода-вывода, межсокетные соединения и контроллеры памяти по модульному принципу, что обеспечивает возможность простой масштабируемости. Intel утверждает что применённый подход устраняет узкие места в межъядерных соединениях, которые часто возникают с кольцевой шиной в том случае, когда несколько вычислительных ядер пытаются обратиться к одному и тому же ресурсу, например, к контроллеру памяти. С ячеистыми межсоединениями никаких подобных коллизий в работе процессора возникать не должно.
Переход к новой топологии должен положительно проявить себя в тех приложениях, где требуется интенсивный обмен данными между ядрами. Кеш-память третьего уровня, хоть и является разделяемой, на самом деле распределена по ядрам, но новая топология позволяет обеспечивать её равномерность и примерно одинаковые латентности вне зависимости от того, к какой части кеша обращается то или иное ядро. Аналогичным образом более равномерный доступ ядра процессора получают и к прочим общим ресурсам: к контроллерам памяти, к блокам ввода-вывода и проч.
Ранее L3-кеш мог быть разрезан на две части, относящиеся к двум разным кольцевым шинам внутри одного процессора, что требовало использования в структуре процессора дополнительных буферизирующих коммутаторов, объединяющих шины. Эти коммутаторы добавляли латентности, нивелируя преимущества кольцевых шин и фактически делали процессор похожим на объединение на кристалле двух NUMA-кластеров. Ячеистая же сетевая топология снимает с разработчиков программного обеспечения всю головную боль, связанную с необходимостью учитывать неоднородность задержек при работе с данными.
Все процессоры Skylake-X с числом ядер от шести до десяти основываются на одном и том же 14-нм 10-ядерном полупроводником кристалле LCC, в котором для формирования тех или иных моделей CPU может быть отключено до четырёх ядер. Это ядро имеет площадь порядка 325 кв. мм, число транзисторов Intel не раскрывает. Для таких процессоров преимущества сетевой топологии вряд ли будут как-то заметно проявляться, однако в чипах с большим числом ядер, которые основываются на кристалле HCC с 28 ядрами, ячеистая структура межсоединений должна сыграть заметную положительную роль.
Тестовые процессоры и платформа
Для проведения тестирования мы взяли три процессора семейства Skylake-X: Core i9-7900X, Core i7-7820X и Core i7-7800X.
Core i9-7900X, Core i7-7820X и Core i7-7800X Реальные рабочие частоты и напряжения этих процессоров при полной нагрузке приведены на скриншотах ниже. Следует заметить, что эта частота существенно различается в том случае, когда нагрузка имеет ординарный характер, либо, когда в ней используются AVX или AVX-512-инструкции. Поэтому для каждого процессора приведено по три скриншота диагностической утилиты CPU-Z.
Обычная нагрузка AVX 2.0 AVX-512 Новый процессорный разъём LGA 2066, в который устанавливаются новинки, по габаритам и конфигурации похож на прошлый разъём LGA 2011-3, но обрёл несколько десятков дополнительных контактов. Необходимость во внедрении нового сокета в данном случае обуславливалась переходом на DMI 3.0 и появлением в процессоре нескольких дополнительных линий PCI Express, поэтому совместимости между новыми HEDT-процессорами и предшествующими платформами с разъёмом LGA2011-3 нет и быть не может. Нужно заметить, что новый разъём LGA 2066, в отличие от предшественников, не имеет серверного аналога. Теперь поставить процессоры класса Xeon в десктопную плату уже не получится.
Для установки LGA 2066-процессоров требуются новые материнские платы, основанные на наборе логики Intel X299. Если говорить о нём в двух словах, то следует сказать, что X299 приносит в HEDT-платформу лишь те возможности, которые уже давно стали стандартными для LGA1151-систем. Однако и такое изменение не стоит недооценивать. Чипсеты для LGA 2011- и LGA 2011-3-систем были гораздо менее функциональны. И если X299 сравнивать с X99, а не с Z270, то прогресс очевиден почти во всём. Единственное ухудшение касается того, что в X99 было на два SATA-порта больше, причём SATA-порты были распределены по двум контроллерам.
Главных перемен две. Во-первых, X299 получил стандартную HSIO-топологию (High-Speed IO). Это значит, что новый набор логики подобен PCIe-коммутатору: в нём есть 30 высокоскоростных портов, которые производители материнских плат могут гибко сконфигурировать под свои нужды и получить в конечном итоге необходимое число линий PCI Express 3.0, а также USB 3.0- и SATA 3.0-портов. Во-вторых, изменилась шина, по которой чипсет общается с процессором. Если в X99 для этих целей применялась шина DMI 2.0, то X299 перешёл на вдвое более скоростную шину DMI 3.0, во многом аналогичную PCI Express 3.0 x4.
Высокоскоростные порты чипсета позволяют получить из него в разных комбинациях до 24 линий PCI Express 3.0, до восьми портов SATA 3.0 и до десяти портов USB 3.0. Это почти эквивалентно возможностям Z270, и можно было бы подумать, что хаб X299 представляет собой вариацию набора логики от платформы LGA1151, но у X299 всё-таки есть уникальная черта – он поддерживает на пару SATA-портов больше. В остальном характеристики схожи. Причём это касается и того, что оба чипсета производятся по одному и тому же 22-нм техпроцессу, имеют одинаковое тепловыделение на уровне 6 Вт, и даже мало отличаются друг от друга внешне.
Как мы тестировали
Для тестирования мы взяли все три доступные на данный момент модификации Skylake-X: десятиядерник Core i9-7900X, влсьмиядерник Core i7-7820X и шестиядерник Core i7-7800X. Для полноты сравнения их производительность была сопоставлена с быстродействием процессоров Core i7 поколений Broadwell-E и Skylake-S, а также со скоростью работы конкурирующих восьмиядерников компании AMD.
В конечном итоге, полный список задействованных в тестовых системах комплектующих получил следующий вид:
Процессоры:
AMD Ryzen 7 1800X (Summit Ridge, 8 ядер + SMT, 3,6-4,0 ГГц, 16 Мбайт L3);
AMD Ryzen 7 1700X (Summit Ridge, 8 ядер + SMT, 3,4-3,8 ГГц, 16 Мбайт L3);
AMD Ryzen 7 1700 (Summit Ridge, 8 ядер + SMT, 3,0-3,7 ГГц, 16 Мбайт L3);
Intel Core i9-7900X (Skylake-X, 10 ядер + HT, 3,3-4,5 ГГц, 13,75 Мбайт L3);
Intel Core i7-7820X (Skylake-X, 8 ядер + HT, 3,6-4,5 ГГц, 11 Мбайт L3);
Intel Core i7-7800X (Skylake-X, 6 ядер + HT, 3,5-4,0 ГГц, 8,25 Мбайт L3);
Intel Core i7-7700K (Kaby Lake, 4 ядра + HT, 4,2-4,5 ГГц, 8 Мбайт L3);
Intel Core i7-6950X Extreme Edition (Broadwell-E, 10 ядер + HT, 3,0-4,0 ГГц, 25 Мбайт L3);
Intel Core i7-6900K (Broadwell-E, 8 ядер + HT, 3,2-4,0 ГГц, 20 Мбайт L3);
Intel Core i7-6850K (Broadwell-E, 6 ядер + HT, 3,6-4,0 ГГц, 15 Мбайт L3);
Intel Core i7-6800K (Broadwell-E, 6 ядер + HT, 3,4-3,8 ГГц, 15 Мбайт L3).
Процессорный кулер: СВО CoolerMaster MasterLiquid Pro 280.
Материнские платы:
ASUS Crosshair IV Hero (Socket AM4, AMD X370);
ASUS Maximus IX Hero (LGA 1151, Intel Z270);
ASUS Prime X299-Deluxe (LGA 2066, Intel X299);
ASUS X99-Deluxe (LGA 2011-v3, Intel X99).
Память:
4 × 8 Гбайт DDR4-3000 SDRAM, 15-17-17-35 (Corsair Vengeance LPX CMK16GX4M2A3000C15).
Видеокарта: NVIDIA Titan X (GP102, 12 Гбайт/384-бит GDDR5X, 1417-1531/10000 МГц).
Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise Build 14393 с использованием следующего комплекта драйверов:
AMD Chipset Driver 17.10;
Intel Chipset Driver 10.1.1.40;
Intel Management Engine Interface Driver 11.7.0.1014;
Intel Turbo Boost Max 3.0 Technology Driver 1.0.0.1031;
NVIDIA GeForce 384.76 Driver.
Производительность
Skylake-X, Broadwell-E и Ryzen на равных частотах Перед тем, как столкнуть в едином тесте все процессоры, которые мы выбрали для сравнения, мы решили уделить отдельное внимание анализу того, насколько процессорный дизайн Skylake-X лучше предыдущего сам по себе. Благодаря использованию более современного технологического процесса 14+ нм, процессоры для платформы LGA 2066 имеют более высокие тактовые частоты. Кроме того, в них поддерживается более продвинутая версия технологии Turbo Boost Max Technology 3.0, которая может активироваться не только про однопоточной, но и при двухпоточной нагрузке. В результате во многих случаях преимущество новинок будет обеспечиваться именно этим, а не архитектурными преимуществами.
Для того же, чтобы выяснить прогресс именно с точки зрения глубинных факторов, мы сравнили восьмиядерные Skylake-X и Broadwell-E, поставив их на одинаковую частоту – 3,5 ГГц. А чтобы такое сравнение получилось ещё более интересным, к результатам этих процессоров мы добавили показатели производительности работающего на такой же частоте восьмиядерного процессора Ryzen 7.
Результаты получились весьма неожиданными. Комплексный тест PCMark 10 показал примерное равенство Skylake-X и Broadwell-E при работе на одинаковой частоте. 3DMark же, делающий упор на игровую многопоточную производительность, отдал первенство более старому процессору. Это наводит на то, что на самом деле новая структура кеш-памяти и новая топология межсоединений не слишком подходит для десктопных процессоров. Понятно, что Intel вводила её с прицелом на серверный сегмент. Однако в результате Skylake-X, откровенно говоря, во многом получились хуже предшественников.
Особенно сильно отставание нового процессорного дизайна раскрывается в играх. Здесь разница в пользу архитектуры Broadwell-E может достигать двузначных значений процентов. И это делает представителей семейства Skylake совершенно неподходящим выбором для использования в игровых системах.
Если вы думаете, что столь обескураживающие результаты вызваны какими-то ошибками в конфигурации тестовых систем, то вынуждены заверить, что это совсем не так. Наблюдаемый эффект со снижением игровой производительности в системах с процессорами Skylake-X прокомментировал и сам производитель. Согласно Intel, подобный эффект даёт именно новая шина «ячеистого» типа, которая используется для соединения блоков внутри Skylake-X. Процессоры Broadwell-E, в свою очередь, используют старую кольцевую шину, и в данном типе вычислительных нагрузок она проявляет себя лучше.
В то же время в ресурсоёмких приложениях ситуация в целом складывается в пользу новинки. В среднем, при нагрузке такого типа Skylake-X имеет примерно 3-процентное преимущество над процессорами прошлого поколения. При этом в ряде случаев, в частности при перекодировании видео кодерами x264 и x265 прирост производительности может достигать 13-процентного уровня. Однако есть и обратные примеры. В WinRAR или Photoshop лучший результат показывает Broadwell-E. Напрашивается вывод о том, что Skylake-X уступает своему предшественнику в тех приложениях, которые способны чутко реагировать на латентность подсистемы памяти, но выигрывает там, где от процессора требуется высокая чистая вычислительная мощность.
Весьма любопытно выглядит соотношение результатов Skylake-X и Ryzen на одинаковой частоте. Хотя в комплексных тестах PCMark 10 и 3DMark процессор AMD оказывается сильнее, в играх интеловская архитектура демонстрирует более чем убедительное превосходство. В приложениях же относительные результаты восьмиядерника AMD выглядят получше, однако в среднем платформа Intel обеспечивает более высокое быстродействие, проигрывая Ryzen лишь в отдельных единичных случаях. Впрочем, не стоит забывать, что между современными восьмиядерными процессорами AMD и Intel существует значительный ценовой разрыв. В частности, Core i7-7820X дороже Ryzen 7 1800X более чем на 15 процентов.
Комплексная производительность Для оценки производительности процессоров в общеупотребительных задачах мы воспользовались тестовым пакетом Futuremark PCMark 10, который моделирует работу пользователя в реальных распространённых современных офисных программах и приложениях для создания и обработки цифрового контента. Свежая версия этого бенчмарка оперируют тремя сценариями: Essentials (запуск типовых офисных приложений и открытие файлов, просмотр веб-сайтов, трансляция видео-конференций), Productivity (работа с текстовым редактором и электронными таблицами) и Digital Content Creation (редактирование фотоматериалов, редактирование видео, рендеринг и визуализация).
Для оценки комплексного быстродействия в игровом 3D был использован тест Futuremark 3DMark Professional Edition 2.2.3509, в котором мы воспользовались сценой Time Spy 1.0.
Тесты в приложениях Задачей, которая наиболее чувствительно реагирует на наращивание процессорного параллелизма, традиционно выступает финальный рендеринг в пакетах трёхмерного проектирования и моделирования. Скорость рендеринга мы тестировали в двух популярных рендерерах: в Corona 1.3, где измеряли время, затрачиваемое на рендеринг стандартной сцены BTR, широко используемой для измерения производительности; и в Blender 2.78с где проверялась продолжительность построения финальной модели из Blender Cycles Benchmark rev4.
Следующая тестовая задача – обработка изображений. Здесь используется Adobe Lightroom 6.10 и Adobe Photoshop CC 2017. В первом случае тестируется производительность при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 16-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T1. Во втором - производительность при обработке индивидуальных графических изображений. Для этого измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
Для тестирования скорости обработки видел мы пользовались тремя задачами. Adobe Premiere Pro CC 2017 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов. x264 r2851 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл, имеющий битрейт около 30 Мбит/с. И x265 2.4+17 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.
Для измерения быстродействия процессоров при компрессии информации мы выбрали архиватор WinRAR 5.50. Измерялось время, затрачиваемое на сжатие с максимальной степенью компрессии директории с различными файлами общим объёмом 1,7 Гбайт.
Игровая производительность До недавних пор производительность платформ, оснащенных современными процессорами, в подавляющем большинстве актуальных игр определялась возможностями графической подсистемы. Однако произошедший за несколько последних лет бурный рост производительности игровых видеокарт привёл к тому, что теперь нередко производительность стала ограничиваться не столько видеокартой, сколько центральным процессором. И если раньше, чтобы понять геймерский потенциал того или иного CPU, нам приходилось использовать уменьшенные разрешения, то с современными видеокартами это делать совсем не обязательно.
Для комплектации нашей процессорной тестовой системы компания NVIDIA предоставила нам свой новейший ускоритель GeForce GTX Titan (Pascal), который благодаря беспрецедентно высокой мощности хорошо подходит и для 4K-разрешений, и для виртуальной реальности, а уж для FullHD – и подавно. В результате мы смогли отказаться от игровых тестов в разрешении 1280 × 800, которые нередко не встречали понимания у наших читателей. Теперь зависимость частоты кадров от мощности CPU отлично можно проследить в абсолютно реальных, а не искусственно созданных условиях: в FullHD-разрешении 1920 × 1080 и с максимальными настройками качества изображения. Этот подход мы и взяли на вооружение.
Энергопотребление
Расчётное тепловыделение процессоров Skylake-X установлено в 140 Вт. Тепловой пакет у LGA 2011-3-процессоров Broadwell-E было ровно таким же. Однако новое поколения HEDT-чипов имеет более высокие рабочие частоты, которые были достигнуты без перехода на новые технологические нормы. И более того, для выпуска Skylake-X компания Intel задействовала 14-нм-техпроцесс второго поколения, который, вообще говоря, напротив, делает полупроводниковые кристаллы более прожорливыми в плане потребления электроэнергии.
Как это соотносится с обещаниями Intel вписаться в те же самые, что и раньше, 140-ваттные рамки, совершенно непонятно. Поэтому проверить реальные энергетические аппетиты процессоров поколения Skylake-X было очень любопытно.
Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графиках ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.
В состоянии простоя экономичность платформы Basin Fall по сравнению с прошлой HEDT-платформой несколько улучшилась. Однако произошло это скорее всего за счёт набора системной логики X299, производство которого теперь переведено c 32-нм на 22-нм технологию.
При рендеринге оказывается, что новые процессоры потребляют как минимум на четверть больше представителей поколения Broadwell-E. Получается, что за прирост частоты в Skylake-X действительно приходится расплачиваться возросшим энергопотреблением и тепловыделением.
А вот как выглядит ситуация с потреблением при максимально возможной нагрузке - в утилите Prime 29.10, которая активно использует энергоёмкие AVX- и FMA3-инструкции.
Здесь ситуация принципиально не отличается. По потреблению Skylake-X заметно обходят процессоры для платформы LGA 2011-3. Таким образом, необходимость использования для новых процессоров производительных систем охлаждения даже в том случае, когда речь идёт об их эксплуатации в номинальном режиме, не вызывает никаких сомнений. Обратите внимание, даже шестиядерный Core i7-7800X требует энергии больше, чем восьмиядерник или десятиядерник прошлого поколения.
Разгон
Перед анонсом семейства Skylake-X компания Intel успела наобещать заметный рост разгонного потенциала, поэтому интерес к оверклокерским экспериментам существует немалый. Причём, в данном случае речь идёт не совсем о чистом маркетинге: несмотря на то, что прошлое поколение HEDT-процессоров, Broadwell-E, тоже производилось с применением 14-нм норм, Skylake-X должны оказаться в этом плане заметно интереснее, поскольку в новом поколении CPU используется улучшенный техпроцесс 14-нм+ (или 14FF+), который достался Skylake-X по наследству от Kaby Lake.
Полупроводниковые кристаллы, выращенные по такой усовершенствованной технологии, используют на 12 % более высокий уровень управляющих токов и имеют увеличенный шаг затворов транзисторов (предположительно с 70 до 84 нм), что в конечном итоге снижает токи утечки и позволяет добиваться стабильной работы на более высокой частоте. Например, выпущенные по такому техпроцессу четырёхъядерные процессоры Core i7-7700K без применения специальных методов охлаждения разгоняются до 4,8–5,0 ГГц и даже сильнее.
Что же касается Skylake-X, то улучшение частотного потенциала этих процессоров прослеживается даже в паспортных характеристиках. Заявленная в спецификациях частота новинок на 10-20 процентов выше, чем у CPU прошлого поколения, так что в теории примерно в таких же масштабах хочется ожидать и улучшения разгона. Впрочем, на пути покорения высоких частот встаёт уже обрисованная выше проблема – слишком высокое тепловыделение.
В конечном итоге для экспериментов по разгону мы решили перейти на более производительную систему охлаждения – СВО CoolerMaster MasterLiquid Pro 280.
Её эффективность заведомо выше, чем у любого воздушного кулера. Тем не менее, применение даже такого мощного охлаждения не может быть панацеей. Дело в том, что в процессорах Skylake-X компания Intel решила отказаться от использования бесфлюсового припоя в роли термоинтерфейса между процессорным кристаллом и теплораспределителем. Теперь роль мостика в передаче тепла внутри процессорной сборки взяла на себя полимерная термопаста, точно такая же, как давно применяется в массовых потребительских CPU. И узким местом на пути передачи тепла выступает именно она, а не система охлаждения. Иными словами, даже с мощным теплоотводом Skylake-X может запросто перегреваться.
Есть и ещё одно препятствие – инструкции AVX-512. Если при проверке стабильности разгона пользоваться утилитами, использующими эти команды, то тут же окажется, что Skylake-X разгоняются очень плохо. Поэтому большинство тестировщиков при проверке стабильности продолжают пользоваться утилитами, опирающимися на AVX-инструкции, и показывать высокие частоты разгона, стабильность при которых на самом деле лишь частичная. С переходом на новые средства проверки все такие результаты окажутся неверными.
Проблема эта не фатальная: процессоры Skylake-X позволяют выставлять отдельные множители на режимы работы с инструкциями AVX и AVX-512. Беда лишь в том, что для всех трёх режимов: обычного, AVX и AVX-512 должно использоваться одинаково запрограммированное напряжение. Поэтому в конечном итоге разгон процессоров нового поколения становится очень сложной задачей. Для получения наилучшего результата подбирать напряжения нужно в адаптивном режиме (Offset) с тем, чтобы оно зависело от изменяющейся рабочей частоты, а коэффициенты умножения, при которых достигается стабильность, следует искать трижды: для каждого из возможных типов инструкций. Трудоёмкость такого процесса очень велика, но только так можно добиться полной стабильности системы при более-менее результативном разгоне во всех состояниях.
Мы же решили применить более простой подход: попробовать разогнать процессоры по старинке, при фиксированном напряжении с проверкой стабильности в утилите LinX 0.7.0, которая активно использует AVX2-инструкции. А затем для найденного режима подобрать необходимое снижение множителя, которое позволит процессору проходить тестирование и в LinX 0.7.2 – более новой версии утилиты, которая опирается на инструкции AVX-512. Такой подход имеет смысл, пока набор инструкций AVX-512 распространён очень узко, и их поддержка мало где требуется. Поэтому сниженная частота при активации 512-битных регистров пока не будет наносить заметного ущерба общей производительности процессора.
Результаты получились следующими:
Core i9-7900X. Разгон до 4,2 ГГц с повышением напряжения до 1,05 В. При активации AVX-512-инструкций частота снижается до 2,5 ГГц.
Core i7-7820X. Разгон до 4,3 ГГц с повышением напряжения до 1,1 В. При активации AVX-512-инструкций частота снижается до 2,3 ГГц.
Core i7-7800X. Разгон до 4,3 ГГц с повышением напряжения до 1,125 В. При активации AVX-512-инструкций частота снижается до 2,1 ГГц.
Получается, что разгон процессоров Skylake-X никакого особенного их оверклокерского потенциала не раскрывает. Из-за того, что они горячее, чем Broadwell-E и к тому же лишены качественного внутреннего термоинтерфейса, максимальные достижимые частоты оказываются даже ниже, чем были доступны для процессоров предшествующего поколения. Дополнительные проблемы с оверклокингом создают инструкции AVX-512: тепловыделение при их активации значительно превышает привычные величины, что требует дополнительных настроек для обеспечения стабильной работы CPU при любой нагрузке.
Выводы
Процессоры компании Intel долгое время занимали безальтернативное положение в сегменте высокопроизводительных решений для десктопов. Поэтому вне зависимости от того, были ли они действительно хорошими или не были, пользователям, стремящимся получить максимальное быстродействие, в конечном итоге приходилось прибегать именно к ним. Хотя, впрочем, слишком серьёзных претензий к ним всё же не возникало. Да, прогресс в удельной производительности был не быстрым, но он был. К тому же Intel время от времени добавляла в свои флагманские чипы по паре вычислительных ядер, и это несколько сглаживало претензии к скорости развития микроархитектуры.
Однако в процессорах Skylake-X микропроцессорный гигант вознамерился совершить некий качественный шаг вперёд и перейти на новую схему кеш-памяти и межъядерных соединений. Связано это, конечно, вовсе не с тем, что происходит в мире производительных десктопов, а исключительно с делами в серверном сегменте, где наращивание числа ядер требует от Intel отказаться от кольцевой шины. Но принятая у компании унификация требует проведения симметричных действий и в секторе HEDT. И в здесь, как показывают тесты, эти нововведения имеют скорее негативный характер: в целом ряде случаев удельная производительность стала хуже.
Intel попыталась сгладить возникшие негативные эффекты увеличением тактовых частот и добавлением существенного числа вычислительных ядер, однако, откровенно говоря, эффект это дало не слишком серьёзный. Фактически новые процессоры Skylake-X смотрятся убедительно рядом с предшественниками лишь в ресурсоёмких приложениях для создания и обработки контента. В тех же случаях, когда от процессора требуется интенсивная работа с данными в памяти, а также практически в любых играх Skylake-X проигрывают своим предшественникам. Причём проигрывают более чем заметно. А это значит, что Skylake-X из процессоров для энтузиастов окончательно превращаются в процессоры для профессионалов. Это, конечно, не плохо, но стоит понимать, что обычным пользователям больше не следует задумываться о платформе HEDT. Skylake-X – это явно не про них.
А чтобы у обеспеченных геймеров и оверклокеров не возникало помыслов о приобретении представителей семейства Skylake-X, Intel сделала контрольный выстрел: испортила разгон. В то время как без внедрения новых производственных процессоров тепловыделение чипов продолжает расти, Intel ухудшила теплоотвод, заменив качественный внутренний термоинтерфейс из бесфлюсового индиевого припоя на сомнительную полимерную термопасту. По тому же пути пошли и производители материнских плат, которые не стали наделять платформу LGA 2066 мощными системами питания, что сделало её окончательно неоверклокерской.
Единственная отрада на таком фоне – это цены. Видя, что новые процессоры получили мягко говоря спорные характеристики, а в стане врага (компании AMD) готовятся серьёзные соперники, Intel решительно срезала цены, и теперь HEDT-платформа стала не столь дорогой. Восьмиядерный процессор, например, теперь может даже вписаться в 1000-долларовый бюджет вместе с платой и памятью.
Но вряд ли это может стать весомым аргументом для энтузиастов. Для разгона и обычных (в первую очередь геймерских) применений сегодня гораздо интереснее выглядят шестиядерные процессоры Intel Coffee Lake, которые должны будут появиться в течение ближайших месяцев. Для рабочих станций весьма привлекательно выглядят старшие Ryzen 7 и Ryzen Threadripper, которые как минимум дешевле. Да, задачи, где Skylake-X работает лучше всех прочих альтернатив, существуют, но уж очень их мало. Поэтому в конечном итоге из этих процессоров получился узконаправленный продукт. Конечно, платформа HEDT всегда была нишевой, но с выходом Skylake-X эта ниша стала явно уже.
Впрочем, у Intel остаётся некий шанс на реабилитацию. Компания пока не выпустила LGA 2066-процессоры с 12, 14, 16 и 18 ядрами. Быть может, именно такие процессоры смогут раскрыть все сильные стороны нового дизайна? Посмотрим.