Введение
Оба ведущих производителя x86-микропроцессоров совсем недавно отметились выводом в свет новых поколений продуктов
AMD Richland и
Intel Haswell. Мы уже имели возможность познакомиться с представителями новых семейств, и, к сожалению, это знакомство оставило после себя не самые позитивные впечатления. Совершенно очевидно, рост вычислительной производительности, обеспечиваемой традиционными x86-ядрами, перестал быть основным приоритетом разработчиков. Новые процессорные дизайны предлагают весьма скромное увеличение скорости работы традиционных приложений, величина которого составляет лишь единицы процентов. Первоочередной целью новых разработок стало снижение тепловыделения и возможность выпуска процессоров с минимальными тепловыми пакетами, открывающие перед классическими микроархитектурами путь в мобильные устройства новых форм-факторов, однако это – далеко не единственный вектор развития, взятый на вооружение инженерами AMD и Intel.
Немалое внимание обе компании уделяют и производительности интегрированных графических ядер, которые к настоящему времени отвоевали на полупроводниковых кристаллах современных процессоров не менее трети транзисторного бюджета.
Если ещё несколько лет тому назад разговор о производительности встроенных графических ядер не имел практически никакого смысла, то к сегодняшнему дню ситуация в корне изменилась. Интегрированные в сегодняшние CPU графические ядра стали способны полноценно заменять бюджетные видеокарты, в результате чего им удалось отжать у дискретных видеоускорителей достаточно весомую рыночную долю. Однако главная цель добавления в базовый микропроцессорный дизайн производительной интегрированной графики состоит отнюдь не в соперничестве с дискретными видеокартами. Основной спрос на кристаллы, объединяющие вычислительные и графические ядра, идёт с рынка мобильных систем и выступает отражением желания пользователей иметь в своём распоряжении достаточно компактные, но при этом вполне производительные вычислительные системы. Единый чип, одновременно объединяющий в себе и CPU, и GPU, и имеющий при этом невысокое тепловыделение, это – именно тот базис, который жизненно необходим для создания современных мобильных решений.
То же, что подобные процессоры с интегрированной графикой наводнили и рынок решений для настольных компьютеров – это побочный эффект, возникший из-за унификации дизайнов мобильных и десктопных продуктов. Впрочем, пользователи настольных систем от этого тоже внакладе не остаются. Отличный пример полезности сожительства вычислительных и графического ядра на едином полупроводниковом кристалле – постепенно приобретающая всё более широкую поддержку концепция гетерогенных вычислений. Перенос части традиционно процессорной работы на исполнение параллельными потоковыми конвейерами графического ядра – плодотворная идея, способная вывести на новый уровень производительность целого ряда алгоритмов, связанных с обработкой мультимедийной информации.
Вместе с этим набирают популярность и компактные настольные системы, которые, благодаря отсутствию необходимости во внешней видеокарте, могут умещаться в корпусах минимального размера или даже находиться внутри монитора. И в довершение, не следует забывать, что использование процессора со встроенной графикой – это отличный повод сэкономить. Если в сферу применений компьютера не входят современные 3D-игры, то процессор с интегрированным графическим ядром позволяет не тратиться на видеокарту, а направить инвестиции на улучшение прочих компонентов системы. Иными словами, встраиваемые в процессоры графические ядра – отнюдь не бесполезная для многих пользователей настольных систем возможность. Именно поэтому рассмотрению последних версий графических ядер AMD и Intel мы и решили посвятить отдельное исследование.
Десктопные процессоры последних поколений AMD Richland и Intel Haswell предлагают более высокий, чем ранее, уровень графического быстродействия. Компания AMD улучшила своё встраиваемое графическое ядро Devastator за счёт увеличения рабочей частоты. Intel же в новой микроархитектуре Haswell существенно нарастила количество исполнительных устройств, предложив для десктопных процессоров, тем не менее, урезанную версию получившегося ускорителя. Столь существенные изменения, очевидно, нуждаются в подробном практическом рассмотрении. В данном материале мы сравнили скорость работы встроенной графики различных недорогих процессоров для настольных систем.
Новые варианты интегрированной графики для настольных систем
AMD Richland Графическое ядро, которое компания AMD встроила в свои процессоры поколения Richland, подробного описания, честно говоря, не заслуживает. Несмотря на то, что интегрируемая в эти CPU графика и отнесена к серии Radeon HD 8000D, ничего принципиально нового в ней нет. Современная архитектура GCN, давно применяемая в дискретных графических картах AMD, пока стала достоянием лишь процессоров, построенных на дизайне Jaguar. Более же производительные продукты серии Richland никаких принципиальных улучшений графического ядра в своё распоряжение не получили. Фактически, с точки зрения внутренней структуры Richland являются полным аналогом своих предшественников семейства Trinity, то есть, объединяет в себе вычислительные ядра с микроархитектурой Piledriver и графическое ядро Devastator с архитектурой VLIW4.
Причём, если говорить о графике, то в Richland она не только унаследовала старое строение исполнительных устройств, изначально позаимствованное из видеокарт серии Radeon HD 6900, но и не нарастила их количества. Иными словами, между графическими ядрами Radeon HD 8000D, присутствующими в Richland, и ядрами Radeon HD 7000D, наличествующими в Trinity, можно смело ставить знак равенства. Различия если лишь в частотах, но и их назвать значимыми мы не можем, так как в лучшем случае прирост достигает лишь 11 процентов. Рост же цифровых индексов, используемых для обозначения моделей ускорителей, – не более чем маркетинговый шаг. Причём, не очень честный и совершенно нелогичный.
Всё это означает, что графическая производительность новых Socket FM2-процессоров будет мало отличаться от того, что мы видели ранее, когда в ходу были A10, A8 и A6 пятитысячной серии. Впрочем, 3D-производительность слабым местом Trinity не была, поэтому решение инженеров AMD повременить с революционными рывками вполне объяснимо. Оставшееся до выхода нового семейства гибридных процессоров Kaveri время не столь велико для того, чтобы AMD смогла утратить положение лидера в производительности интегрированной графики. Тем более что интеловские процессоры с графическими ядрами Iris и Iris Pro, которые, возможно, и могли бы составить реальную конкуренцию графическому движку из Richland, в настольном сегменте представлены в гомеопатическом масштабе, а в мобильном – стоят в разы дороже.
Между тем, полное отсутствие архитектурных изменений в Richland – не слишком хорошая новость для тех, кто рассматривает гибридные процессоры AMD в качестве возможной основы для создания мультимедиа-центров и HTPC. Унаследованный из Trinity блок AMD HD Media Accelerator, предлагающий аппаратное декодирование распространённых форматов (UVD3) и аппаратное кодирования в формат H.264 (VCE), по современным меркам не слишком производителен и функционален. Поэтому при перекодировании видео высокого разрешения процессоры Richland будут серьёзно проигрывать предложениям конкурента, располагающим весьма продвинутой технологией Intel Quick Sync, а, кроме того, они не могут предложить аппаратное декодирование набирающего популярность видеоконтента в разрешении 4K.
Intel Haswell В отличие от AMD, Intel с выводом нового поколения процессоров уделила совершенствованию собственного графического ядра гораздо больше внимания. Тем не менее, подход Intel также можно считать экстенсивным. Если не считать отдельных оптимизаций графического конвейера, направленных на перенесение части нагрузки с драйвера на аппаратные блоки и на увеличение производительности большинства функциональных блоков фиксированной функциональности, выполняющих в конвейере 3D-рендеринга подготовительные операции, новое графическое ядро сильно похоже на ядро из процессоров предыдущего поколения с добавленной поддержкой DirectX 11.1. Но главное преимущество нового дизайна — наличие существенно большего, чем ранее, количества универсальных исполнительных устройств. Если максимальная версия графики Ivy Bridge располагала 16 исполнительными устройствами (включающими по 4 ALU каждое), то количество исполнительных устройств в графическом ядре Haswell может доходить до 40 штук. В дополнение к этому, графика Haswell может похвастать и кратным увеличением производительности текстурных сэмплеров.
При этом Intel решила провести более явную сегментацию и на основе единого дизайна графического движка сделала несколько вариантов графики: GT1, GT2, GT3 и GT3e. Базовая версия — это GT2 с 20 исполнительными устройствами, имеющая маркетинговое название HD Graphics 4600. Именно такая версия графического ядра и оказалась реализована в подавляющем большинстве десктопных моделей процессоров, и она предлагает лишь на 4 исполнительных устройства больше, чем старшая графика процессоров поколения Ivy Bridge. Имеющие повышенную 3D-производительность версии графики GT3 и GT3e, число исполнительных устройств в которых доведено до 40 и получившие благодаря этому уникальные имена Iris 5100 и Iris Pro 5200, в общедоступных процессорах для настольных компьютеров применяться не будут. На данный момент известно лишь об одной десктопной модели CPU с Iris Pro 5200, Core i7-4770R, но она выпускаются исключительно в BGA-исполнении и распространяется только по OEM-каналам, то есть предназначаются для жёсткого монтажа на материнские платы посредством пайки в заводских условиях.
Поэтому рассматривая процессоры для настольных систем, нам достаточно сосредоточиться лишь на одном варианте графического ядра из процессоров Haswell – HD Graphics 4600. И в этом можно увидеть изменение интеловского подхода к комплектованию собственных процессоров графическим ядром. Если в десктопных Ivy Bridge можно было встретить два принципиально разных варианта GPU, причём старшая версия присутствовала лишь в избранных представителях модельного ряда, то теперь произошла некая унификация. Единое ядро GT2 присуще любым процессорам в LGA 1150-исполнении. Причём, касается это не только уже выпущенных и доступных в магазинах Core i5, но и серии Core i3, которая ещё только появится в сентябре.
Правда, справедливости ради следует упомянуть, что частота HD Graphics 4600 в различных моделях процессоров может немного отличаться.
Помимо усовершенствований во внутренней структуре 3D-части графического ядра, интеловские инженеры уделили большое внимание и медиаподсистеме. Фактически, можно говорить о том, что интеловская интегрированная графика получила качественную ориентацию на использование в составе медиацентров и HTPC. Этой цели отвечает целый букет аппаратных функций, направленных на улучшение качества картинки при воспроизведении видео: шумоподавление, деинтерлейсинг, адаптивное изменение контраста, стабилизация изображения (снятого незакреплённой камерой), преобразование частоты кадров (от 24/30 кадров в секунду к 60) и прочие.
Существенные улучшения затронули и технологию Quick Sync, направленную на быструю аппаратную конвертацию видео. В ней добавилась поддержка новых форматов и ультра-высоких, вплоть до 4К, разрешений. Также, по сравнению с предыдущей версией Quick Sync, возросло качество и скорость работы аппаратного кодера. Intel добавила в настройки Quick Sync несколько новых высококачественных профилей, и теперь при транскодировании с задействованием этой технологии результат должен быть существенно лучше, чем раньше. Правда, до передовых программных алгоритмов преобразования Quick Sync всё ещё не дотягивает.
Как мы тестировали
Основная цель данного тестирования – сравнение производительности интегрированных графических ядер, имеющихся в современных процессорах AMD и Intel. Это определило и состав участников тестирования. Главными героями стали модификации AMD Richland, обладающие различными версиями графического ядра, и один из Intel Haswell, располагающий графикой HD Graphics 4600. Учитывая, что имеющиеся на рынке процессоры этих семейств нацеливаются на слабо пересекающиеся ценовые категории, для сравнения мы взяли наиболее дорогие A10, A8 и A6 шеститысячной серии и наиболее дешёвый Core i5 четырёхтысячной серии.
Кроме того, в тестирование были включены и процессоры с интегрированной графикой прошлых поколений. Их участие позволит делать выводы о происходящем на этой ниве прогрессе. Кроме того, для сопоставления производительности интегрированных графических ядер со скоростью дискретных видеокарт в тестирование были вовлечены бюджетные ускорители NVIDIA GeForce GT 640 и AMD Radeon HD 7750.
В результате в тестах задействовались следующие аппаратные и программные компоненты:
Процессоры:
AMD A10-6800K (Richland, 4 ядра, 4.1-4.4 ГГц, 4 Мбайта L2, Radeon HD 8670D);
AMD A8-6600K (Richland, 4 ядра, 3.9-4.2 ГГц, 4 Мбайта L2, Radeon HD 8570D);
AMD A6-6400K (Richland, 2 ядра, 3.9-4.1 ГГц, 1 Мбайт L2, Radeon HD 8470D);
AMD A10-5800K (Trinity, 4 ядра, 3.8-4.2 ГГц, 4 Мбайта L2, Radeon HD 7660D);
AMD A8-5600K (Trinity, 4 ядра, 3.6-3.9 ГГц, 4 Мбайта L2, Radeon HD 7560D);
AMD A6-5400K (Trinity, 2 ядра, 3.6-3.8 ГГц, 1 Мбайт L2, Radeon HD 7540D);
Intel Core i5-4430 (Haswell, 4 ядра, 3.0-3.2 ГГц, 6 Мбайт L3, HD Graphics 4600);
Intel Core i3-3240 (Ivy Bridge, 2 ядра + HT, 3.4 ГГц, 3 Мбайта L3, HD Graphics 2500);
Intel Core i3-3225 (Ivy Bridge, 2 ядра + HT, 3.3 ГГц, 3 Мбайта L3, HD Graphics 4000).
Процессорный кулер: NZXT Havik 140.
Материнские платы:
ASUS Crosshair V Formula (Socket AM3+, AMD 990FX + SB950);
ASUS F2A85-V Pro (Socket FM2, AMD A85);
ASUS P8Z77-V LX (LGA1155, Intel Z77 Express);
Gigabyte Z87X-UD3H (LGA 1150, Intel Z87 Express).
Видеокарты:
Gigabyte GeForce GT 640 (GV-N640D3-2GI, 2 Гбайта/128-бит DDR3, 900/1800 МГц);
Sapphire Radeon HD 7750 (11202-13, 2 Гбайта/128-бит DDR3, 800/1600 МГц).
Память: 2 x 8 GB DDR3-2133 SDRAM, 9-11-11-31 (G.Skill [TridentX] F3-2133C9D-16GTX).
Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
Блок питания: Corsair AX760i (80 Plus Platinum, 760 Вт).
Операционная система: Microsoft Windows 8 Enterprise x64.
Драйверы:
AMD Catalyst 13.6 Beta2 Driver;
AMD Chipset Driver 13.4;
Intel Chipset Driver 9.4.0.1017;
Intel HD Graphics Driver 15.31.9.64.3165;
Intel Management Engine Driver 9.5.0.1345;
Intel Rapid Storage Technology 12.5.0.1066;
NVIDIA GeForce 320.49 Driver.
К списку участвовавших в тестировании компонентов необходимо добавить, что дискретные графические ускорители NVIDIA GeForce GT 640 и AMD Radeon HD 7750 тестировались в платформе, построенной на базе процессора AMD A10-6800K.
3D-производительность
Для предварительной оценки относительного быстродействия графических ядер гетерогенных процессоров Trinity и Ivy Bridge мы прибегли к синтетическому бенчмарку Futuremark 3DMark. Из состава пакета мы использовали два подтеста: Cloud Gate, предназначенный для определения DirectX 10-производительности типовых домашних компьютеров, и более ресурсоёмкий Fire Strike, нацеленный на DirectX 11-игровые системы.
Результаты, выданные тестом Cloud Gate, весьма любопытны. Хотя процессор Core i3-3240 с интегрированным графическим ядром HD Graphics 2500 не смог пройти этот тест, два других варианта интеловской графики продемонстрировали чрезмерно выдающиеся результаты. Ядро Intel HD Graphics 4000 показало производительность выше, чем графика AMD с 192 шейдерными конвейерами, а новая версия встроенного акселератора HD Graphics 4600 и вовсе, смогла превзойти результаты всех конкурирующих CPU, включая и семейство AMD A10. Тем не менее, делать выводы о превосходной производительности HD Graphics 4600 пока преждевременно. Дело в том, что тест Cloud Gate весьма чувствителен не только к графической, но и к вычислительной производительности процессоров, поэтому Core i5-4430 мог оказаться на первом месте и благодаря четырём высокоэффективным x86-ядрам. Подтверждением этому могут служить результаты другого теста из того же пакета – Fire Strike.
Здесь оценка новой интеловской графики уже не столь оптимистична. Да, графическое ядро HD Graphics 4600 быстрее старшей интегрированной графики из процессоров поколения Ivy Bridge почти в полтора раза, но этого всё равно недостаточно, чтобы в тесте Fire Strike Haswell смог дотянуться до флагманов семейства Richland. Несмотря на то, что прирост графической производительности при смене поколений гибридных процессоров AMD составляет всего 5-8 процентов, результат HD Graphics 4600 уступает показателям Radeon HD 8570D и Radeon HD 7560D из процессоров линейки AMD A8.
Впрочем, 3DMark – это сугубо синтетический тест, и делать какие-то общие выводы, опираясь лишь на его показатели, было бы не совсем верным. Потому давайте посмотрим, как проявляют себя встроенные графические ядра в реальных играх. Тесты в них запускались в двух режимах: при полноценном FullHD-разрешении 1920x1080 с низкими или средними настройками качества и при разрешении 1366x768 с выбором среднего или высокого качества. Полноэкранное сглаживание, естественно, не применялось.
Battlefield 3 – один из самых популярных многопользовательских шутеров. На сегодняшний день эта игра – далеко уже не новинка, но, тем не менее, мы продолжаем использовать её при тестах флагманских видеокарт, так как создаваемая ей нагрузка совсем не легковесна. Поэтому совершенно неудивительно, что на встроенной графике при использовании FullHD-разрешения получить заманчивый уровень fps не представляется возможным даже с самыми слабыми настройками качества. Максимум, на который можно рассчитывать – это чуть более 24 кадров в секунду в среднем с провалами до 20 fps. Причём такую производительность обеспечивают лишь старшие процессоры AMD A10, интегрированная графика прочих CPU вообще сколь-нибудь приемлемую скорость в FullHD-разрешении не выдаёт. Так, производительность графики процессоров AMD A8 ниже, чем у A10, примерно на 15 процентов, а A6 отстают от флагманских Richland на 33 процента. Интеловское же графическое ядро HD Graphics 4600 позволяет получить средний между Radeon HD 8570D и Radeon HD 8470D результат – оно медленнее Radeon HD 8670D из старшего представителя линейки A10 примерно на 25 процентов.
Игра Bioshock Infinite интересна тем, что в её основе лежит широко распространённый игровой движок Unreal Engine 3. Который, судя по полученным результатам, взаимодействует с интегрированным графическим ядром интеловских процессоров далеко не самым лучшим образом. Bioshock Infinite оказалась одной из немногих игр, где HD Graphics 4600 работает медленнее младшей версии конкурирующего интегрированного видеоускорителя AMD Radeon HD 8470D, располагающего лишь 192 шейдерными конвейерами. Что же касается производительности флагманского Radeon HD 8670D из процессора AMD A10-6800K, то этот встроенный акселератор оказывается вполне в силах обеспечить удовлетворительную производительность в FullHD-разрешении с низким качеством изображения. Достаточно любопытно, что в этом случае производительность Radeon HD 8670D находится примерно на одном уровне со скоростью 90-долларового дискретного видеоускорителя Radeon HD 7750.
Компания Crytek славится созданием игр, ставящих на колени даже самые мощные графические карты. Crysis 3 не стала исключением, а потому на интегрированной графике этот шутер исполняется крайне медленно. Даже в разрешении 1366x768 графические ядра из процессоров Haswell и Richland не обеспечивают приемлемую играбельность, что уж тут говорить о FullHD. Попутно заметим, что Crysis 3 – это ещё один пример игры, где графика процессоров Intel выступает хуже видеоядер любых Socket FM2-процессоров, а встроенное графическое ядро флагманского представителя семейства Richland, AMD A10-6800K, оказывается в силах соперничать с дискретной видеокартой Radeon HD 7750.
GRID 2 — компьютерная игра в жанре автосимулятора, разработанная компанией Codemasters и базирующаяся на технологии EGO 3.0, используемой также в семействах DiRT и F1. Подобные игры не отличаются слишком высокими требованиями к графической производительности системы, поэтому даже на интегрированной графике GRID 2 можно использовать с повышенными настройками качества. Однако, несмотря на то, что в стартовой заставке игры демонстрируется реклама Intel HD Graphics, наилучший водительский опыт можно получить, если предпочесть встроенную графику компании AMD. Гибридные процессоры семейств AMD A10 и A8 превосходят Core i5-4430 со встроенным графическим ядром HD Graphics 4600, которое выигрывает лишь у Radeon HD 8470D из процессора A6-6400K. В то же время мы не можем не отметить заметный прогресс в быстродействии интеловской графики: HD Graphics 4600 опережает HD Graphics 4000 полуторагодичной давности на внушительные 40 процентов. Для сравнения: компания AMD за тот же период смогла нарастить мощность своего интегрированного графического ядра не более чем на 7 процентов.
Metro: Last Light – ещё один новейший шутер от первого лица, который можно отнести к числу наиболее требовательных к аппаратным компонентам компьютера. Так что совершенно неудивительно, что, как и в Crysis 3, при установке FullHD-разрешения производительность интегрированных ядер падает до неудовлетворительных величин. Кстати, немногим лучше выступают в этом случае и стодолларовые дискретные графические карты. Что же касается относительной производительности встроенных видеоядер процессоров Haswell и Richland, то она вполне типична. Результаты HD Graphics 4600 находятся между показателями Radeon HD 8470D и Radeon HD 8570D. Иными словами, интеловская графика с 20 исполнительными устройствами быстрее движка Devastator, построенного на 192 шейдерных конвейерах, но медленнее, чем тот же движок, использующий 256 конвейеров.
Последний приключенческий боевик от третьего лица, вышедший в серии Tomb Raider, предлагает чрезвычайно насыщенный, реалистичный и богатый графическими эффектами игровой мир. Тем не менее, игра с минимальными настройками неплохо идёт и на интегрированной графике, выдавая приемлемый уровень fps на многих гибридных процессорах даже в FullHD разрешении. Причём, это касается не только Richland, но и Haswell, графика которых оказывается в полтора раза быстрее, чем лучшее видеоядро носителей микроархитектуры Ivy Bridge. В результате, мощности HD Graphics 4600 вполне хватает для того, чтобы выйти на один уровень с процессорами AMD A8. Флагманский же процессор компании AMD, A10-6800K, в разрешении 1920x1080 и при низких настройках качества, не требующих интенсивной прокачки текстур из видеопамяти, оказывается способен превзойти дискретную видеокарту Radeon HD 7750.
War Thunder – стремительно набирающая популярность многопользовательская 3D-игра, посвященная боевой авиации Второй Мировой войны и послевоенного периода. Проект разрабатывается и издается компанией Gaijin, хорошо известной своими игровыми авиасимуляторами. Как и другие подобные онлайн-проекты, War Thunder не отличается жёсткими требованиями к аппаратной конфигурации, тем не менее, к визуальной составляющей игры трудно предъявить какие-то серьёзные претензии. Надо сказать, что подобные многопользовательские проекты могут работать на встроенной в современные гибридные процессоры графике с достаточно неплохой скоростью. И War Thunder исключением не является, игра может исполняться на интегрированных видеоядрах в FullHD-разрешении даже со средними настройками качества. Процессоры AMD A10 и A8 в этом случае предлагают вполне достаточный уровень fps, с определёнными оговорками приемлемыми можно назвать и результаты, демонстрируемые графикой процессоров AMD A6 и Haswell.
Подводя итог игровым тестам, отметим, что графические ядра новых процессоров AMD Richland, как и ожидалось, по сравнению с Trinity смогли обеспечить лишь крайне незначительное, соизмеримое с увеличением их тактовых частот, увеличение быстродействия в реальных игровых приложениях. Наблюдаемый прирост производительности составляет от 2 до 9 процентов, но этого с лихвой хватает для того, чтобы представители серий AMD A10 и A8 остались недосягаемыми лидерами по игровой 3D-производительности встроенных графических ядер среди всех настольных гибридных процессоров.
Компания Intel в новой микроархитектуре Haswell, вне всяких сомнений, совершила куда более заметный шаг на пути модернизации своего графического движка, но в настольные модификации процессоров его старшие версии, к сожалению, не попали. Конечно, присутствующее во всех десктопных CPU ядро Intel HD Graphics 4600 на практике оказывается почти в полтора раза лучше HD Graphics 4000, но этого хватает лишь для того, чтобы Core i5 и Core i3 четырёхтысячной серии достигли производительности Radeon HD 8470D, встраиваемого в процессоры AMD A6.
AMD Dual Graphics
Каждый раз, когда дело касается тестирования встроенной процессорной графики, компания AMD пытается предъявить свой уникальный козырь – технологию Dual Graphics. На первый взгляд технология Dual Graphics, позволяющая создание ассиметричных CrossFire-конфигураций с участием встроенного в процессор графического ядра, представляется весьма интересной функций, дающей возможность повысить производительность с использованием бюджетных и устаревших графических карт. Всё работает предельно просто: в систему устанавливается дополнительный дискретный видеоускоритель семейства Radeon HD, в BIOS материнской платы разрешается одновременная инициализация внешней и встроенной графики, а в драйвере активируется Dual Graphics.
Использование такого симбиоза действительно приносит свои плоды. Например, в следующей таблице мы привели сравнение 3D-производительности системы с процессором A10-6800K с интегрированной графикой, с внешней видеокартой Radeon HD 6670 и в случае, если процессорная графика работает с дискретной картой совместно в режиме Dual Graphics.
Фактически, можно говорить о том, что c добавлением в систему с процессором A10-6800K видеокарты стоимостью порядка $70 графическая производительность выходит на новый уровень, давая возможность запускать современные игры в FullHD-разрешении со средними настройками качества. Графическая производительность при этом во многих случаях действительно возрастает более чем в полтора раза. Однако в технологии Dual Graphics кроется целый ряд неприятных ограничений и обидных дефектов, которые сводят на нет все преимущества такого подхода.
Начать следует с того, что прирост от включения Dual Graphics можно получить лишь в том случае, если дискретная видеокарта обладает сравнимой со встроенным в процессор видеоядром производительностью. AMD ограничивает список рекомендуемых для Dual Graphics видекокарт моделями Radeon HD 6450, 6570 и 6670, которые можно смело отнести к числу устаревших. В принципе, в режиме Dual Graphics с Richland можно попробовать использовать и более новую карту Radeon HD 7750, но, как мы убедились во время практической проверки, графический драйвер в этом случае недостаточно отточен. В результате, прирост количества fps в более чем половине игровых приложений отсутствует.
Второй недостаток Dual Graphics заключается в том, что эта программная технология работает исключительно с DirectX 10 и DirectX 11 графическими движками. То есть, старые игры в Dual Graphics-конфигурациях прирост производительности получить не смогут вообще. Это же касается и некоторых новых игр, для которых AMD не успела оптимизировать свой драйвер. Примером данной ситуации служит War Thunder: в этом сетевом авиасимуляторе прироста при включении Dual Graphics не наблюдается даже несмотря на его новизну.
Но, пожалуй, окончательный крест на этой технологии следует поставить, если внимательно присмотреться к тому, что же на самом деле выводит на экран ассиметричная Crossfire-конфигурация, собранная из внешней видеокарты и встроенного в процессор графического ядра. Дело в том, что инженеры AMD не стали акцентировать своё внимание на рендеринге гладкого и монолитного изображения, поэтому на самом деле Dual Graphics выводит на экран монитора не цельные кадры, а части кадров, отрендеренные либо интегрированным, либо дискретным графическим ядром. Вопрос же согласования этих частей никого не волнует, поэтому в достаточно большом количестве случаев на экране монитора можно наблюдать разорванную картинку, состоящую из нестыкуемых частей кадров, сгенерированных в разные моменты времени. На скриншотах ниже мы приведём несколько примеров, однако следует иметь в виду, что подобные изображения – это не единичные артефакты, а систематически наблюдаемая проблема, серьёзно ухудшающая восприятие игр.
Подобный тиаринг, но в существенно меньших масштабах, часто можно встретить при проблемах синхронизации кадров с частотой обновления монитора, но в системах с Dual Graphics он наблюдается и при включённом параметре VSync.
Таким образом, мы не рекомендуем связывать с Dual Graphics какие-либо серьёзные ожидания. На данный момент это – всего лишь экспериментальная технология, позволяющая маркетинговому департаменту AMD рисовать красивые слайды с диаграммами. Но в реальной жизни она малополезна, не всегда работоспособна и попросту глючна. Причём, на исправление сложившейся ситуации в будущих ревизиях драйверов рассчитывать явно не приходится: Dual Graphics имеет уже вполне солидный возраст, и если AMD не озаботилась исправлением дефектов изображения до настоящего момента, маловероятно, что она сделает это в ближайшем будущем.
Производительность медиа движка
Как уже было сказано, в графических ядрах любых современных гибридных процессоров имеются специализированные функциональные блоки, направленные на работу с видеоконтентом – его декодирования или кодирования. В случае Intel это – Quick Sync, у AMD же такие блоки носят название UVD3 и VCE. Отличия кроятся не только в терминологии, расходятся и принципы их работы. Если AMD во многом опирается на уже имеющиеся в графическом ядре шейдерные процессоры, то подход Intel предполагает добавление в графическое ядро специализированных выделенных блоков узкой функциональности, направленных на аппаратную реализацию ключевых операций кодирования и декодирования видео. Поэтому совершенно неудивительно, что в том, как Richland и Haswell справляются с медиа-нагрузкой, существуют значительные отличия.
Причём проявляются они даже при обычном воспроизведении. В большинстве случаев с проигрыванием HD-видео в разнообразных форматах современные процессоры справляются без каких-либо проблем. Аппаратное декодирование в таких случаях работает превосходно, и даже если дело доходит до необходимости проигрывания 1080p-потока при 60 fps с высокими показателями битрейта, никаких затруднений почти никогда не возникает. Дефекты воспроизведения могут возникать только с видеороликами, закодированными с какими-то экзотическими параметрами, и связаны они скорее с недоработками в программных плеерах, а не с самими процессорными медиа движками.
Вместе с тем постепенно в обиход начинают входить и более высокие разрешения видеопотока, для декодирования которых у рассматриваемых процессоров может не хватать мощностей. Эта ситуация имеет далеко не частный характер, поэтому изучению того, насколько хорошо проигрывают 4K-видео графические ядра процессоров Richland и Haswell, мы уделили отдельное внимание. Для целей тестирования мы воспользовались широкоэкранным 4K-роликом с разрешением 3840x2160p@30 fps, закодированным в формате H.264 с битрейтом порядка 100 Мбит/сек. Его проигрывание даже с задействованием всех аппаратных возможностей специализированных движков может вызывать существенные проблемы, наличие которых проверялось в программном плеере Media Player Classic – Home Cinema версии 1.6.8.7413 c установленным пакетом кодеков K-Lite Codec Pack 9.9.5 и с активированным декодированием видеоконтента (в том числе, и UHD) через LAV Filters 0.58.0.
На следующем графике показана загрузка вычислительных ядер процессора.
Результаты оказались весьма неожиданными. В то время как любые процессоры Intel, включая и представителей семейства Ivy Bridge, воспроизводят 4K-контент без каких-либо проблем, предложения AMD, относящиеся к поколениям Trinity и Richland, раскрывают свою полную несостоятельность. Очевидно, декодирование видео сверхвысокого разрешения силами UVD3 в этом случае невозможно, поэтому нагрузка в Trinity и Richland перекидывается на вычислительные ядра. Однако их мощности для полноценного декодирования 4K-видео не хватает, что приводит к почти 100-процентной процессорной загрузке и к выпадению кадров при отображении. Иными словами, Socket FM2-системы перед 4K-видео оказываются бессильны, так что целесообразность их использования для современных мультимедийных систем и HTPC можно подвергнуть серьёзным сомнениям. Актуальные же предложения Intel, в силу более высокой производительности их медиа-движка, напротив, кажутся более подходящим выбором для HTPC.
Другой тип распространённой нагрузки, связанной с обработкой видео, это – его транскодирование. Для тестирования скорости работы соответствующих аппаратных технологий мы традиционно используем утилиту Cyberlink MediaEspresso 6.7, поддерживающую как технологию Intel Quick Sync, таки и AMD VCE. В качестве тестовой задачи выполнялось перекодирование полуторагигабайтного 1080p-ролика в формате H.264 (который представлял собой 20-минутную серию популярного телесериала) с уменьшением разрешения для просмотра на iPhone 4S. Соответственно, целевой формат видео – H.264, 1280x768 c битрейтом порядка 6 Мбит/с.
Технология Intel Quick Sync даёт в разы лучший результат, нежели AMD VCE. Преимущество любых Haswell и Ivy Bridge над Richland и Trinity в скорости перекодирования видео – подавляющее. Интеловская реализация перекодирования использует высокоэффективную комбинацию из специализированных аппаратных блоков и выполнения части задачи на исполнительных устройствах графического ядра. Решение же AMD состоит в чистом переносе вычислений на параллельные потоковые процессоры, что, с учетом специфики алгоритма перекодирования, порождает многочисленные узкие места.
Кстати, заметьте, новое графическое ядро Intel HD Graphics 4600 показало более низкую скорость транскодирования, нежели ядра прошлого поколения. Однако связано это не с ухудшением технологии Quick Sync, а с вводом новых профилей соотношения скорости и качества, в которых акцент делается на получении лучшего результата. Перекодированное видео, выдаваемое графическим ядром процессоров поколения Haswell, по умолчанию лучше, нежели у предыдущих решений, однако это стоит некоторого падения темпа транскодирования.
Каждый раз, говоря о реализованных в современных графических ядрах аппаратных технологиях для транскодирования видео, и в первую очередь об Intel Quick Sync, мы сетуем на то, что поддерживаются они по большей части не слишком распространёнными коммерческими утилитами. Однако наконец-то эта ситуация начала меняться. Поддержка Quick Sync и OpenCL появилась в бета-версии популярной свободной утилиты HandBrake. Давайте посмотрим, какую производительность продемонстрируют тестируемые графические ядра, если для перекодирования воспользоваться этим программным инструментом.
Скорость работы Intel Quick Sync вновь поражает. Вовлечение в процесс перекодирования этой интеловской технологии позволяет получить многократное превосходство над Socket FM2-конфигурациями. Однако пока ещё у процессоров AMD не всё потеряно. Поддержка OpenCL в HandBrake доделана не до конца, сейчас она используется лишь для изменения размера картинки, но не задействуется при пережатии кадров. Так что в будущих релизах этой утилиты результаты процессоров AMD должны будут улучшиться.
Энергопотребление
Одним из преимуществ интегрированных систем, ставших темой этой статьи, выступает их более низкое энергопотребление и тепловыделение в сравнении с системами, оборудованными дискретными видеоускорителями. Такие платформы нередко приобретаются из соображений минимизации расходов на обслуживание и находят своё место в компактных корпусах. Поэтому вопрос энергопотребления гибридных процессоров отнюдь не праздный, этот параметр может существенно влиять на выбор решения того или иного производителя.
Учитывая, что в данном случае в тестировании вынужденно принимают участие процессоры с принципиально разными тепловыми пакетами, мы коснёмся лишь вопроса потребления энергии при нагрузке исключительно на графическое ядро, частота которого от ограничений по максимальному TDP практически не зависит. Более же подробную информацию о потреблении тех или иных процессоров при различном характере нагрузки вы всегда можете найти в прочих обзорах, опубликованных на нашем сайте.
Используемый нами в тестовой системе новый цифровой блок питания Corsair AX760i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и пользуемся для наших измерений. На следующих ниже графиках, если иное не оговаривается отдельно, приводится полное потребление систем (без монитора), измеренное на выходе из блока питания и представляющее собой сумму энергопотреблений всех задействованных в системе компонентов. КПД же самого блока питания в данном случае не учитывается. Во время измерений нагрузка на процессоры создавалась специализированной утилитой FurMark 1.10.6. Кроме того, для правильной оценки энергопотребления в простое и при низкой нагрузке мы активировали турбо-режим и все имеющиеся энергосберегающие технологии: C1E, C6, Enhanced Intel SpeedStep и AMD Cool'n'Quiet.
Мы всегда начинаем знакомство с практическим энергопотреблением различных процессоров с состояния покоя. В данном случае диаграмма не несёт нам ничего нового, подобные результаты мы уже получали в других тестированиях. При активации интегрированного графического ядра процессоры Intel обеспечивают слегка меньшее потребление, нежели различные Socket FM2-конфигурации.
При предельной графической нагрузке обнаруживается, что более производительные видеоядра компании AMD требуют для своей работы больше энергии. Однако переход на новый дизайн Richland, как это ни странно, дополнительный рост потребления за собой не повлёк. Хотя ядро Devastator в более новых процессорах AMD функционирует на более высоких тактовых частотах, общее энергопотребление системы оказывается ниже, чем в случае конфигураций, построенных на представителях семейства Trinity. Что же касается интеловского Haswell, то с ним картина обратная. Увеличение графической производительности привело к росту потребления, хотя графика HD Graphics 4600 всё равно оказалась существенно экономичнее графического ядра Radeon HD 8470D. Иными словами, как и раньше, гибридные процессоры AMD требуют для своей работы больше энергии, нежели интеловские Core i3 и Core i5, то есть, выбирая их из-за высокой графической производительности для эксплуатации в компактных системах, во внимание следует принимать большее число факторов.
В заключение давайте посмотрим, какое потребление будет характерно для испытуемых систем при их использовании не c 3D-нагрузкой, а при обычном воспроизведении видео высокого разрешения.
Отличие между платформами AMD и Intel достигает почти полуторакратного размера. Это значит, что процессоры Intel как с новой микроархитектурой Haswell, так и с более старой микроархитектурой Ivy Bridge, позволяют строить не только более универсальные и производительные, но и более энергоэффективные мультимедийные компьютеры.
Выводы
Новые десктопные процессоры семейств Haswell и Richland смогли в очередной раз поднять планку 3D-производительности интегрированных графических ядер. Получилось это у них различными способами: в процессорах AMD увеличилась частота взятого из прошлого дизайна ядра Devastator, а в продуктах Intel мощность графического движка возросла за счёт добавления исполнительных устройств и переработки ряда блоков фиксированной функциональности. Различным вышел и прирост скорости. Графика Richland по сравнению с Trinity предлагает увеличение 3D-быстродействия в пределах 5-10 процентов, у Haswell же в сравнении с Ivy Bridge 3D-производительность возросла раза в полтора.
Но, несмотря на всё это, ничего принципиально нового при тестировании 3D-быстродействия мы не увидели. Гибридные процессоры компании AMD, относящиеся к сериям A10 и A8, продолжают оставаться непревзойдёнными лидерами в графическом быстродействии. Несмотря на то, что графическое ядро Intel HD Graphics 4600 и предложило значительное увеличение 3D-производительности по отношению к HD Graphics 4000, и уж тем более к HD Graphics 2500, на данный момент оно может соперничать лишь с интегрированной графикой уровня Radeon HD 8470D, устанавливаемой AMD в бюджетные процессоры класса A6.
Иными словами, для развлекательных систем начального уровня, по каким-то причинам лишённым возможности использования дискретной графической карты, следует продолжать предпочитать процессоры AMD в Socket FM2 исполнении. Однако существует один нюанс. Если во времена Trinity мы могли говорить о том, что интегрированная графика AMD почти всегда позволяет получать приемлемую играбельность в FullHD-разрешении с низкими настройками качества, то теперь, видимо, следует забрать эти слова обратно. Аппаратные требования свежих шутеров, вышедших в течение последнего года, возросли гораздо сильнее, нежели производительность графических ядер процессоров AMD A10 и A8. Поэтому, на данный момент появилось достаточное количество игр, которые в FullHD разрешении с минимальным качеством изображения даже на Radeon HD 8670D из гибридных процессоров класса A10 работают недостаточно хорошо. То есть, чтобы стать полноценным и современным игровым решением начального уровня, интегрированная графика должна теперь сделать ещё один рывок. В этой связи большие надежды возлагаются на следующее поколение интегрированных процессоров AMD, Kaveri, графическое ядро которых получит актуальную архитектуру и возросшее количество исполнительных устройств.
Однако если не требовать от интегрированной графики полной всеядности, то и сегодняшние старшие модели Socket FM2-процессоров могут предложить очень многое, ведь по скорости исполнения многих 3D-игр они почти дотягивают до уровня дискретного ускорителя Radeon HD 7750. Это позволяет им достойно справляются с визуализацией сетевых игровых проектов или не слишком требовательных игр, основанных на зрелых игровых движках.
В пользу интегрированных решений AMD говорят и цены. Стоимость процессоров Intel с HD Graphics 4600 начинается на данный момент с $182, но и даже после выхода семейства Core i3, базирующегося на микроархитектуре Haswell, купить интеловский процессор с достаточно производительной и функциональной графикой можно будет лишь за сумму более $120. Младшие же представители семейства Richland, обладающие, пусть и урезанным, но всё же неплохим графическим ядром класса Devastator, стоят почти вдвое меньше, что делает их отличным выбором для систем нижнего ценового диапазона.
Но есть свои недостатки и у Richland. В первую очередь это – их высокое практическое энергопотребление и тепловыделение. В целом ряде сценариев, связанных как с 3D, так и с мультимедийным использованием, процессоры AMD оказываются примерно вдвое прожорливее, нежели интеловский Core i5. Очевидно, что с выходом Core i3 четырёхтысячной серии эта ситуация только усугубится. Поэтому для использования в компактных и тихих домашних системах или HTPC представители серий A10, A8 или A6 могут быть далеко не самым оптимальным выбором, тем более что медийный движок Richland на фоне Haswell производит впечатление устаревшего решения. Он не только не способен справиться с 4K-контентом, но и предлагает достаточно унылую производительность при перекодировании видео с задействованием аппаратных возможностей графического ядра. Впрочем, для воспроизведения FullHD-видео, закодированного в общеупотребительных форматах, представители семейства Richland вполне подходят, так что, если закрыть глаза на указанные недостатки, в дешёвых мультимедийных конфигурациях их использование тоже может быть вполне оправданным.