AMD Richland и платформа Socket FM2: вычислительная производительность

Автор: Gavric
Дата: 24.06.2013
Все фото статьи

Введение


Все впечатляющие инновации, которые проводит AMD в этом году на процессорном рынке, так или иначе вращаются вокруг новой микроархитектуры Jaguar. Опираясь на неё и на графические ядра с архитектурой GCN, компании удалось провести не только незаурядный прорыв в сфере игровых консолей, но и выпустить энергоэффективные мобильные процессоры семейств Kabini и Temash, нацеленные на планшеты и ультра-компактные ноутбуки. Однако в микроархитектуре Jaguar на первом месте стоит экономичность, а потому основанные на ней APU не слишком производительны и плохо вписываются даже в ноутбуки среднего уровня. То есть, Jaguar ни в коей мере не может выступать заменой микроархитектуры Piledriver, присутствующей в подавляющем большинстве настольных и заметной доле мобильных процессоров. Именно поэтому капитальная перестройка модельного ряда с его переводом на принципиально новый дизайн старшие модели APU не затронула. Для этого рыночного сегмента в недрах AMD зреет Steamroller – новое поколение процессорного дизайна Bulldozer. Но выхода первых процессоров на базе Steamroller придётся подождать. Запуск в серию производительных APU с кодовым именем Kaveri, в основе которых будет лежать эта перспективная микроархитектура, а также графические ядра семейства GCN, запланирован только на конец этого – начало следующего года.

Тем не менее, текущая стратегия AMD подразумевает ежегодное обновление мобильных платформ, поэтому гибридные процессоры семейства Trinity в стороне от масштабных преобразований всё-таки не остались. Для них AMD затеяла ребрендинг, в результате чего родилось новое название Richland, скрывающее под собой почти такие же, как и ранее, производительные гибридные процессоры, собранные из вычислительных ядер Piledriver и графических ядер VLIW4. Причём, хотя на уровне внутреннего строения Richland – это всё те же Trinity, совершенствование 32-нм технологического процесса и изменения в работе технологии Turbo Core позволили производителю заметно увеличить частоты новых моделей с сохранением старых рамок тепловых пакетов. В результате, с точки зрения конечных пользователей, Richland можно считать некоторым шагом вперёд, тем более что отсутствие архитектурных нововведений было отчасти скомпенсировано дополнительными программными функциями.

Собственно, со всеми этими кульбитами в маркетинговой политике AMD мы знакомы уже несколько месяцев: новая мобильная платформа и её компоненты представлены компанией ещё в марте. Теперь же подошла очередь рынка настольных процессоров. Превращение Trinity в Richland в сегменте процессоров для ноутбуков не могло не вызвать симметричных преобразований в линейке настольных решений, среди которых гибридные APU занимают немалое место и формируют собой отдельную платформу Socket FM2. Так, пару недель назад AMD представила набор новых моделей APU для этой платформы, носящих кодовое имя Richland и дополняющих имеющуюся линейку Trinity.

Нововведений в десктопных Richland ещё меньше, чем в их мобильных собратьях. Приросли лишь тактовые частоты, плюс немного агрессивнее стала работать технология Turbo Core. Но хотя по сути ничего не изменилось, AMD сочла себя вправе присвоить новым процессорам и встроенной в них графике новые серии модельных номеров. На первый взгляд такой шаг выгладит как бесчестный маркетинг. Тем не менее, может быть, мы что-то упускаем из вида, и десктопные Richland могут предложить принципиальный прирост производительности? Чтобы ответить на этот вопрос, мы провели подробное и всестороннее тестирование полной линейки серийных Richland для десктопов. В данном материале мы предлагаем познакомиться с вычислительной скоростью новинок, а примерно через неделю ждите продолжения – рассказа о быстродействии встроенной в Richland графики.

Обновление платформы Socket FM2: подробности


Производительные гибридные процессоры для десктопов в модельном ряду компании AMD образуют отдельную и замкнутую экосистему. Сначала это была платформа Socket FM1 и APU семейства Llano, а в 2012 году им на смену пришла платформа Socket FM2 и процессоры Trinity, использующие прогрессивную микроархитектуру Piledriver и более производительные графические ядра поколения VLIW4. Десктопные гибридные процессоры образца 2013 года, Richland, по сравнению со своими предшественниками не предлагают никаких принципиальных улучшений, но хорошая новость заключается в том, что это означает и стабильность платформы. Старые материнские платы, предназначенные для Trinity и основанные на наборах логики A85X, A75 и A55, абсолютно нормально работают с Richland после обновления BIOS.


AMD обещала, что процессорный разъём Socket FM2 приходит на продолжительное время, и пока ей удаётся держать данное слово. Однако будущие APU семейства Kaveri, собранные из вычислительных и графических компонентов с новыми архитектурами и поддерживающие единое адресное пространство для всех типов ядер, к сожалению, потребуют смены процессорного разъёма, что попутно будет сопровождаться и появлением новых наборов логики. Иными словами, с существующими Socket FM2 материнскими платами Kaveri применяться уже не смогут, так что на горизонте уже замаячила потеря текущей платформой своей актуальности.

Выход Richland не повлёк за собой никаких изменений в Socket FM2-экосистеме, и это воспринимается как нечто само собой разумеющееся. Хотя для производства процессоров Kabini и Temash AMD использует 28-нм технологию, Richland основываются на полупроводниковом кристалле, изготавливаемом по старым 32-нм нормам. Причём кристалл этот как две капли воды похож на кристалл Trinity: он имеет площадь 246 кв. мм и состоит из 1.3 млрд. транзисторов, что однозначно указывает на отсутствие каких бы то ни было модификаций в дизайне.


Тем не менее, также как и в мобильных Richland, в новых десктопных гибридных процессорах сделаны определённые оптимизации в части функционировании технологии Turbo Core. На процессорном кристалле появились дополнительные датчики, позволяющие судить о текущем температурном режиме более точно, а сам алгоритм увеличения частоты претерпел небольшие изменения и получил большее число промежуточных состояний. В результате, с одной стороны улучшилась отзывчивость частоты на изменения тепловыделения APU, а с другой – возросла продолжительность промежутков времени, в течение которых процессорные ядра пребывают в турбированном состоянии.

Достаточность такого набора изменений для объявления Richland новым поколением гибридных процессоров можно поставить под серьёзные сомнения, тем не менее, для новых моделей APU AMD не постеснялась задействовать новую серию модельных номеров. Несмотря на то, что Richland идентичны Trinity и базируются на вычислительных ядрах Piledriver и графическом движке c VLIW4-архитектурой, их номера выросли на тысячу, а графическое ядро формально отнесено к серии Radeon HD 8000D.


В спецификациях Richland по сравнению с процессорами семейства Trinity можно отметить увеличение частот вычислительных ядер примерно на 300 МГц, а также рост частоты графики, составляющий для разных моделей от 40 до 84 МГц. В количестве же вычислительных модулей Piledriver, размере кэш-памяти и в числе шейдерных процессоров графического ядра нет никаких перемен. Поэтому, между старыми процессорами A10, A8 и A6, относящимися к пятитысячной серии и имеющими дизайн Trinity, и их последователями шеститысячной серии нетрудно провести параллель. Сохранилась даже общая структура модельного ряда. Он делится на две группы. В первую попадают оверклокерские процессоры с тепловым пакетом 100 Вт, которые обладают максимальными частотами x86 и графической части, а также допускают разгон через изменение коэффициента умножения. Ко второй же принадлежат 65-ваттные модели, которые чуть медленнее, но зато открывают путь к сборке достаточно экономичных систем. Цены на Richland при этом чуть выше, чем на Trinity, но новые APU своих предшественников не заменяют, а лишь дополняют сформированный ранее модельный ряд.


В результате, новые модельные номера могут сильно вводить в заблуждение, и особенно это касается индексов, относящихся к графическому ядру. Но, похоже, AMD совершенно не смущает тот факт, что дискретная графика семитысячной и восьмитысячной серий имеет архитектуру GCN, а графическое ядро Trinity и Richland по своему строению является родственником Radeon HD 6900. Что же до самих процессоров, то ориентироваться, пожалуй, на модельные номера внутри семейств A10, A8 и A6 всё-таки можно. В их рамках процессоры Richland предлагают более высокие тактовые частоты, что конвертирует превосходство новинок по модельному номеру в немного большую скорость работы.

Правда, учитывая масштабы роста частот, на особенно сильный прогресс в быстродействии надеяться не приходится. Очевидно, в большинстве случаев он будет лежать в пределах 5-7 процентов. Учитывая это, AMD попыталась добавить дополнительную толику производительности за счёт разгона контроллера памяти. И старшая модель A10-6800K получила официальную поддержку DDR3-2133 SDRAM. Впрочем, такая память без проблем (пусть и неформально) поддерживалась и в старших процессорах поколения Trinity, так что полновесным нововведением это назвать нельзя. Более того, остальные модели Richland такую же быструю память всё ещё не поддерживают.

Как мы тестировали


Вполне естественно, что получив в своё распоряжение полную линейку процессоров Richland, в качестве первостепенных объектов для сравнения с ними мы выбрали представителей семейства Trinity. Но вот с подбором конкурирующих процессоров компании Intel всё получилось не так просто. Дело в том, что компания AMD позиционирует свои гибридные процессоры следующим образом:


Между тем, по нашим прошлым тестированиям платформы Socket FM2 известно, что с точки зрения вычислительной производительности даже старшие представители линейки A10 до Core i5 серьёзно не дотягивают. На это же намекают и установленные компанией официальные цены.


Поэтому, со стороны Intel в тестирование мы включили почти полную линейку Core i3, плюс один из процессоров Pentium и младший Core i5. При этом, учитывая прогремевший недавно анонс микроархитектуры Haswell, Core i5 был выбран в наиболее современном LGA 1150-варианте.

Кроме этого, учитывая, что в данном материале мы не затрагиваем 3D-производительность встроенных в процессоры графических ядер, в число участников мы включили и Socket AM3+ процессор AMD FX-4350, система с которым за отсутствием интегрированного видеоядра была снабжена дискретным графическим ускорителем Radeon HD 6670.

Все же остальные конфигурации, принявшие участие в данном исследовании, использовались со встроенной графикой. Правда, в одном случае из этого правила было сделано исключение. При оценке вычислительных ресурсов процессоров в современных 3D-играх, тестовые системы снабжались высокопроизводительной внешней графической картой NVIDIA GeForce GTX 680.

Также необходимо отметить, что, учитывая всё большее распространение скоростной DDR3-памяти, мы приняли решение перейти на использование в тестовых системах модулей DDR3-2133 SDRAM. «Оверклокерская наценка» на такие модули практически полностью сошла на нет, а это значит, что никаких препятствий к началу их широкого распространения в пользовательских системах не существует. Большинство современных платформ способно работать с такой памятью без каких-либо ограничений. Более того, как мы видим, производители начинают постепенно говорить об официальной совместимости своих процессоров с памятью, работающей на данной частоте. В первую очередь это касается A10-6800K – поддержка DDR3-2133 даже декларируется в его официальных спецификациях. Среди же остальных процессоров, принявших участие в данном тестировании, с DDR3-2133 SDRAM не могут работать лишь AMD A10-6700 и AMD A8-6500. Для них режим работы памяти мы ослабляли до DDR3-1866.

В итоге, перечень использовавшихся в тесте компонентов получился более чем внушительным:

Процессоры:

AMD A10-6800K (Richland, 4 ядра, 4.1-4.4 ГГц, 4 Мбайта L2, Radeon HD 8670D);
AMD A10-6700 (Richland, 4 ядра, 3.7-4.3 ГГц, 4 Мбайта L2, Radeon HD 8670D);
AMD A8-6600K (Richland, 4 ядра, 3.9-4.2 ГГц, 4 Мбайта L2, Radeon HD 8570D);
AMD A8-6500 (Richland, 4 ядра, 3.5-4.1 ГГц, 4 Мбайта L2, Radeon HD 8570D);
AMD A6-6400K (Richland, 2 ядра, 3.9-4.1 ГГц, 1 Мбайт L2, Radeon HD 8470D);
AMD A10-5800K (Trinity, 4 ядра, 3.8-4.2 ГГц, 4 Мбайта L2, Radeon HD 7660D);
AMD A8-5600K (Trinity, 4 ядра, 3.6-3.9 ГГц, 4 Мбайта L2, Radeon HD 7560D);
AMD A6-5400K (Trinity, 2 ядра, 3.6-3.8 ГГц, 1 Мбайт L2, Radeon HD 7540D);
AMD FX-4350 (Vishera, 4 ядра, 4.2-4.3 ГГц, 4 Мбайта L2 + 8 Мбайт L3);
Intel Core i5-4430 (Haswell, 4 ядра, 3.0-3.2 ГГц, 6 Мбайт L3, HD Graphics 4600);
Intel Core i3-3240 (Ivy Bridge, 2 ядра + HT, 3.4 ГГц, 3 Мбайта L3, HD Graphics 2500);
Intel Core i3-3225 (Ivy Bridge, 2 ядра + HT, 3.3 ГГц, 3 Мбайта L3, HD Graphics 4000);
Intel Core i3-3210 (Ivy Bridge, 2 ядра + HT, 3.2 ГГц, 3 Мбайта L3, HD Graphics 2500);
Intel Pentium G2130 (Ivy Bridge, 2 ядра, 3.2 ГГц, 3 Мбайта L3, HD Graphics).

Процессорный кулер: NZXT Havik 140.
Материнские платы:

ASUS Crosshair V Formula (Socket AM3+, AMD 990FX + SB950);
ASUS F2A85-V Pro (Socket FM2, AMD A85);
ASUS P8Z77-V LX (LGA1155, Intel Z77 Express);
Gigabyte Z87X-UD3H (LGA 1150, Intel Z87 Express).

Видеокарты:

AMD Radeon HD 6670 (1 Гбайт/128-бит GDDR5, 800/4000 МГц);
NVIDIA GeForce GTX 680 (2 Гбайт/256-бит GDDR5, 1006/6008 МГц).

Память: 2 x 8 GB DDR3 SDRAM (G.Skill [TridentX] F3-2133C9D-16GTX):

DDR3-2133 SDRAM 9-11-11-31 при использовании процессоров AMD A10-6800K, AMD A8-6600K, AMD A6-6400K, AMD A10-5800K, AMD A8-5600K, AMD A6-5400K, AMD FX-4350, Intel Core i5-4430, Intel Core i3-3240, Intel Core i3-3225, Intel Core i3-3210 и Intel Pentium G2130.
DDR3-1866 9-10-9-27 при использовании процессоров AMD A10-6700 и AMD A8-6500.

Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
Блок питания: Corsair AX760i (80 Plus Platinum, 760 Вт).
Операционная система: Microsoft Windows 8 Enterprise x64.
Драйверы:

AMD Catalyst 13.6 Beta Driver;
AMD Chipset Driver 13.4;
Intel Chipset Driver 9.4.0.1017;
Intel HD Graphics Driver 15.31.3.64.3071;
Intel Management Engine Driver 9.5.0.1345;
Intel Rapid Storage Technology 12.5.0.1066;
NVIDIA GeForce 320.18 Driver.

Производительность



Общая производительность

Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тест Bapco SYSmark 2012, моделирующий работу пользователя в распространённых современных офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера. С выходом Windows 8 бенчмарк SYSmark 2012 обновился до версии 1.5, и мы теперь используем именно эту адаптированную версию.


Как и ожидалось, процессоры Richland ушли от своих предшественников, построенных на дизайне Trinity, совсем недалеко. Разница в средневзвешенной производительности представителей этих семейств составляет порядка 6-7 процентов и находится в прямой зависимости от изменения тактовой частоты. Такой же посыл даёт и ценовая политика AMD: стоимость процессоров серий A10, A8 и A6 с новым дизайном возросла примерно на такую же величину. В результате, никаких принципиальных изменений в рыночном положении гибридных процессоров для платформы Socket FM2 не произошло. Их вычислительная производительность в общеупотребительных приложениях на фоне конкурирующих продуктов компании Intel выглядит достаточно тускло. Фактически, представители серий A10 и A8, основанные на паре модулей Piledriver, могут конкурировать лишь с представителями серии Intel Pentium, в то время как процессоры A6, располагающие только одним процессорным модулем Piledriver, серьёзно проигрывают и им.

Более глубокое понимание результатов SYSmark 2012 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы. Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 10, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 и WinZip Pro 14.5.


В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты компании Adobe: Photoshop CS5 Extended, Premiere Pro CS5 и After Effects CS5.


Web Development — сценарий, в рамках которого моделируется создание web-сайта. Используются приложения: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 и Microsoft Internet Explorer 10.


Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию рыночных тенденций, которые выполняются в Microsoft Excel 2010.


Cценарий 3D Modeling всецело посвящён созданию трёхмерных объектов и рендерингу статичных и динамических сцен с использованием Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 и Google SketchUp Pro 8.


В последнем сценарии, System Management, выполняется создание бэкапов и установка программного обеспечения и апдейтов. Здесь задействуются несколько различных версий Mozilla Firefox Installer и WinZip Pro 14.5.


Различие в скорости работы процессоров Richland и Trinity одного класса остаётся постоянным вне зависимости от сценария их использования. Так как единственный источник увеличения вычислительной производительности – это рост тактовой частоты, то закономерно, что представители шеститысячной серии выигрывают у своих предшественников в скорости работы лишь порядка 5-7 процентов. Именно поэтому линейке Richland свойственны все те же самые слабые места, которые мы отмечали и у предшествующей серии процессоров для платформы Socket FM2. А именно, на конкурентный уровень вычислительной производительности можно рассчитывать лишь в том случае, когда нагрузка носит многопоточный характер. Малопоточная производительность Richland, как и любых других процессоров, основывающихся на микроархитектуре Piledriver, мягко говоря, хромает. Всё это выливается в то, что процессоры серий A10 и A8 могут соперничать с линейкой Intel Core i3 лишь в сценарии 3D Modeling, так как задачи рендеринга отлично распараллеливаются на любое количество вычислительных ядер, а также в сценарии System Management.

Тесты в приложениях

Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR 5.0, при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1.7 Гбайт.


Результаты тестирования скорости при архивации данных представляют собой вполне типичную картину. Процессоры AMD A10 и AMD A8, вне зависимости от того, к какому поколению APU – второму или третьему – они относятся, c точки зрения производительности попадают в промежуток, образовавшийся между Core i3 и Pentium. Двухъядерные же AMD A6 по современным меркам выглядят вообще крайне слабо. Всё, что дал AMD новый дизайн Richland – это примерно 5 процентов дополнительной производительности, полученной за счёт увеличения тактовой частоты.

Для оценки скорости работы платформ в офисных приложениях компании Microsoft мы использовали специальный тестовый скрипт компании Futuremark, моделирующий типовую работу пользователя в Word 2013, Excel 2013 и PowerPoint 2013.


Офисные приложения при своей работе почти всегда довольствуются однопоточностью, то есть являются неблагоприятными для процессоров, построенных на микроархитектуре Piledriver. Поэтому не стоит удивляться, что большинство APU для платформы Socket FM2 уступило даже Pentium G2130. Иными словами, мы вновь убеждаемся, что для офисных применений A10, A8 и уж тем более A6, подходят плохо.

Скорость работы с интернет-приложениями мы оценивали с использованием браузерного бенчмарка Futuremark Peacekeeper, который реализует основные передовые и ресурсоёмкие веб-технологии. Запуск данного теста проводился в Google Chrome 27.


Такая же картина, как и в офисных приложениях, возникает и в интернет-приложениях. К сожалению, до появления гибридных процессоров с дизайном Kaveri у AMD не может быть предложений с хорошей x86-производительностью в малопоточных средах. Как-то исправить эту неприятную ситуацию сможет лишь перспективная микроархитектура Steamroller.

Измерение производительности в Adobe Photoshop CS6 мы проводим с использованием собственного теста, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, включающий типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.


Не лучше для процессоров AMD ситуация и в Photoshop. Производительность любых четырёхъядерников AMD заметно ниже скорости двухъядерных процессоров Intel. Иными словами, ввод в строй дизайна Richland принципиально ничего не изменил, а лишь позволил слегка нарастить тактовые частоты. Если же сравнить между собой скорость работы A10-5800K и A10-6700, а эти процессоры работают на близких частотах, то отсутствие в x86-части новинок каких-то скрытых достоинств становится совершенно очевидным. В итоге, производительность старшего Socket FM2-процессора A10-6800K способна дотянуть лишь до уровня AMD FX-4350, но для соперничества с LGA 1155-системами этого недостаточно.

Для тестирования скорости перекодирования аудио в формат mp3 нами используется утилита Xilisoft Audio Converter 6.5, при помощи которой осуществляется преобразование сохранённого в формате flac аудио альбома.


Мы подошли к тем приложениям, которые могут распараллеливать вычислительную нагрузку на четыре ядра, а потому соотношение результатов сразу поменялось. A10-6800K смог обогнать Core i3-3240, а A10-6700 и A8-6600K затесались в рядах средних моделей Core i3. Иными словами, многопоточная нагрузка по перекодированию аудио-файлов ставит знак примерного равенства между производительностью четырёхъядерных процессоров AMD и двухъядерных процессоров Intel, поддерживающих технологию Hyper-Threading. До Core i5 же никакие Socket FM2 процессоры по своему быстродействию не дотягивают даже близко, так что приведённая нами выше иллюстрация об относительном позиционировании Richland, где серия A10 противопоставляется Core i5, – не более чем фантазии AMD.

Для измерения скорости перекодирования видео в формат H.264 использовался тест x264 FHD Benchmark 1.0.1 (64bit), основанный на измерении времени кодирования кодером x264 r2334 исходного видео в формат MPEG-4/AVC с разрешением 1920x1080@50fps и настройками по умолчанию. Следует отметить, что результаты этого бенчмарка имеют огромное практическое значение, так как кодер x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч.


Здесь производительность процессоров AMD тоже находится на относительно неплохом уровне. До Core i5 они, конечно, серьёзно не дотягивают, но любым четырёхъядерным Socket FM2-процессорам удаётся превзойти показатели линейки Core i3, что на фоне результатов в других приложениях, кажется весьма впечатляющим достижением. Различие же в быстродействии A10-6800K и A10-5800K, а также A8-6600K и A8-5600K, составляет вполне обычные 7-8 процентов.

Тестирование скорости финального рендеринга выполнялось путём использования специализированного теста Cinebench 11.5, базирующегося на движке профессионального пакета Maxon Cinema 4D.


Хотя рендеринг наряду с перекодированием медиаконтента можно отнести к числу задач, нагрузка в которых хорошо распараллеливается, в Cinebench четырёхъядерные процессоры AMD с микроархитектурой Piledriver могут предложить лишь сравнимую с Intel Core i3 производительность. Причём, касается это только старших модификаций. A8-6500 и A8-5600K, например, работают медленнее младшего Core i3-3210, а двухъядерные процессоры серии A6 проигрывают представителю серии Pentium более чем в полтора раза.

На следующей диаграмме приводится один из промежуточных показателей бенчмарка Futuremark 3DMark Fire Strike — Physics Score. Эта характеристика отражает скорость выполнения специального игрового физического теста, моделирующего поведение сложной системы с большим количеством объектов.


Физический тест 3DMark Fire Strike – многопоточный, а потому результаты достаточно типичны. Серии AMD A10 и A8 сопоставимы по x86-быстродействию с Core i3, а процессоры A6, сделанные из одного условно двухъядерного модуля Piledriver, обладают недостаточной по современным меркам производительностью. Это в равной степени касается как представителей поколения Richland, так и процессоров Trinity – разница между ними не столь принципиальна и составляет в данном случае около 9 процентов. Однако заметим, старшие Richland могут составить серьёзную конкуренцию четырёхъядерным процессорами для платформы Socket AM3+. Оба A10 шеститысячной серии немного превосходят по производительности FX-4350, который аналогичен им по микроархитектуре, но дополнительно обладает L3-кэшем.

Гетерогенная производительность

Даже исследуя банальную вычислительную производительность, мы не должны забывать о том, что процессоры AMD для платформы Socket FM2 – это гибридные устройства, объединяющие в себе не только традиционные x86, но и графические ядра. При этом графическое ядро Devastator, присутствующее в процессорах Richland и Trinity, обладает поддержкой OpenCL – фреймворка, позволяющего перекладывать часть вычислительной нагрузки на шейдерные конвейеры графического движка. Взаимодействие разнородных ресурсов гибридного процессора для решения единой задачи – основная идея концепции APU, активно продвигаемой AMD. Компания надеется, что ей удастся повлиять на рынок программного обеспечения, добившись, чтобы использование OpenCL стало повсеместным.

И, откровенно говоря, прогресс в этом направлении идёт. Число программных продуктов, способных переносить часть работы на вычислительные ресурсы графического ядра планомерно увеличивается, и с выходом Richland AMD даже смогла предъявить достаточно внушительный список программ, способных работать с привлечением разнородных ядер посредством OpenCL.


К сожалению, далеко не во всех программах из этого списка поддержка OpenCL носит полноценный характер. Зачастую графическое ядро может привлекаться к работе лишь при обращении к отдельным и далеко не самым распространённым функциям. Объясняется это спецификой вычислений на графическом ядре: его аппаратные особенности таковы, что эффективно оно может быть лишь на несложных параллельных операциях. Поэтому концепция APU при всём желании не сможет вывести производительность гибридных процессоров AMD на новый уровень в широком спектре применений. Однако в целом ряде ресурсоёмких задач, например, при обработке изображений или видео, графическое ядро способно оказать неплохую поддержку для x86-ядер.

Конечно, в идеале, мы бы не хотели прибегать к отдельным тестам производительности в приложениях, работающих через OpenCL. Гораздо приятнее было бы обнаружить поддержку гетерогенных вычислений в тех общеупотребительных программных продуктах, которые мы используем в наших обычных тестах. Однако такого нет и в ближайшем будущем не предвидится. Поэтому, желая посмотреть на скорость работы процессоров с интегрированном графическим ядром в случае нагрузки, ложащейся на разнородные вычислительные ресурсы, нам приходится специально отбирать подходящие задачи.

Первой из таких задач стал бенчмарк Luxmark 2.0, построенный на базе рендера LuxRender, использующего физическую модель распространения света. Для оценки гетерогенной производительности процессоров мы используем сцену средней сложности Sala, а её рендеринг выполняем с задействованием как графических, так и x86-ядер.


Как нетрудно заметить, подключение к работе вычислительных ресурсов графических ядер меняет не слишком многое. Процессоры Intel, как и APU компании AMD, вполне способны предложить похожую функциональность: их современные модели поддерживают OpenCL полноценно и без каких-либо ограничений. Поэтому те интеловские CPU, графическое ядро которых сравнительно мощно, своего лидерства не теряют. Хотя Richland и Trinity обладают достаточно сильной графикой, на первые места она их не выводит и при гетерогенной нагрузке. Лидирующие позиции занимает Core i5-4430 с графикой Intel HD Graphics 4600 и Core i3-3225 с графическим ядром Inlel HD Graphics 4000. Заметьте, в верхней части диаграммы затесался и AMD FX-4350, но это произошло главным образом благодаря используемой в тестовой системе с этим CPU дискретной видеокарты Radeon HD 6670.

В результате, процессоры серий A10 и A8, как и раньше, могут предложить быстродействие лишь уровня Core i3, а серия A6 всё также не дотягивает по своей производительности до процессоров семейства Intel Pentium. При этом между скоростью работы Richland и Trinity вновь нет заметных различий: например, A10-6800K превосходит A10-5800K всего на 4 процента.

Одним из самых значительных достижений концепции APU, свидетельствующим о её принятии рынком программного обеспечения, стало появление поддержки OpenCL в популярном архиваторе WinZIP. Поэтому измерение скорости архивации в WinZIP 17.5 мы обойти стороной не могли. В целях тестирования сжатию подвергалась папка с файлами общим объёмом 2.53 Гбайта.


Помимо поддержки OpenCL последние версии WinZIP могут похвастать и качественной работой с многоядерными архитектурами, поэтому преимущества того или иного графического ядра скрадываются тут за традиционной x86-производительностью. Иными словами, несмотря на задействование ресурсов графического ядра, скорость работы WinZIP на разных процессорах и платформах качественно мало отличается от скорости работы прочих архиваторов, OpenCL не поддерживающих.

Более традиционными приложениями, способными предложить OpenCL-ускорение, являются графические редакторы и программы для обработки видеоконтента. Хорошим примером из первой группы можно считать Corel AfterShot Pro – популярный инструмент для пакетной обработки фотографий, снятых цифровой камерой. Использовавшийся нами для тестирования производительности сценарий включал пост-обработку и экспорт в JPEG двухсот 12-мегапиксельных изображений в RAW-формате.


И действительно, тут коэффициент полезного действия графических ядер гибридных процессоров AMD кажется заметно более высоким. Представители серий A10 и A8 легко справляются с любыми Core i3 вне зависимости от того, какое у них графическое ядра, и лишь немного не дотягивают до результата младшего Core i5. Невиданный результат демонстрирует и семейство AMD A6 – эти двухъядерные процессоры опережают Intel Pentium.

Другой пример популярного приложения, поддерживающего OpenCL, это – профессиональная программа для редактирования и монтажа видео Sony Vegas Pro 12. При выполнении в ней рендеринга видео нагрузка достаточно равномерно распределяется по разнородным ресурсам гибридных процессоров.


Процессоры Intel с графическими ядрами HD Graphics 4600 или HD Graphics 4000 могут предложить заметно лучшую производительность, нежели разнообразные Richland и Trinity. Иными словами, продвигая концепцию гетерогенных вычислений, AMD льёт воду и на мельницу конкурента, который, как оказывается, не дремлет, а своевременно реализует качественную поддержку OpenCL и встраивает в свои процессоры вполне быстродействующие в вычислительном плане графические ядра. В результате, старшие системы с Socket FM2 процессорами не могут похвастать слишком хорошим уровнем относительной производительности даже в том случае, если для тестов мы используем благоприятные для APU приложения с поддержкой OpenCL. Сказывается тут и то, что преимущество Richland над Trinity, которое смогла обеспечить AMD, составляет всего 5 процентов. К сожалению, современная графическая архитектура GCN, которая могла бы улучшить эту ситуацию, в Richland не пришла.

В заключение мы воспользовались и бенчмарком SVPMark 3. Это – тест производительности системы при работе с пакетом SmoothVideo Project, направленным на повышение плавности воспроизведения видео путём добавления в видеоряд новых кадров, содержащих промежуточные положения объектов. Данный пакет достаточно активно использует предоставляемые через OpenCL возможности графических ядер.


До результата младшего Core i5 процессоры Richland не дотягивают. Однако по сравнению с Core i3, основанными на старой микроархитектуре Ivy Bridge, они выглядят достаточно убедительно. Даже Core i3-3225 с графическим ядром HD Graphics 4000 проигрывает всем A10 и A8. А процессору A6-6400K удаётся превзойти не только Pentium, но и представителей семейства Core i3 с младшей версией графического ядра.

Иными словами, в некоторых специфических задачах оптимизация под OpenGL может творить настоящие чудеса. Но, к сожалению, примеры таких чудес надо выискивать специально. И это означает, что расхваленную гетерогенность процессоров AMD для платформы Socket FM2 киллер-фичей назвать невозможно. Более того, даже в самых благоприятных для APU компании AMD случаях мы не увидели ни единого примера, когда процессоры серии A10 могли бы предложить производительность на уровне младшего Core i5. Так что в любом случае десктопные Richland могут конкурировать лишь с Core i3, и не более того.

Игровая производительность c дискретной видеокартой

3D-производительность графических ядер, встроенных в рассматриваемые в данном материале процессоры, это – тема нашей следующей статьи. В настоящем же исследовании мы решили сосредоточиться исключительно на вычислительной производительности процессоров Richland. Поэтому здесь мы предлагаем результаты тестов быстродействия систем при установке в них внешней производительной графической карты NVIDIA GeForce GTX 680.

Тестирование в реальных играх предваряют результаты синтетического бенчмарка 3DMark Fire Strike.


Ничего утешительного для платформы Socket FM2 этот график показать не может. Если верить 3DMark Fire Strike, то с точки зрения игровой производительности процессоры Richland, включая и верхние модели A10 и A8, предлагают более низкое быстродействие, чем младший из Core i3. Переход на новый дизайн APU дал лишь 3-процентный прирост результата в этом тесте, и это, естественно, погоды не делает.

Как известно, производительность платформ, оснащенных современными процессорами, в подавляющем большинстве игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы выбираем наиболее процессорозависимые игры, а измерение количества кадров выполняем дважды. Первым проходом тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. Такие настройки позволяют оценить то, насколько хорошо проявляют себя процессоры с игровой нагрузкой в принципе, а значит, позволяют строить догадки о том, как будут вести себя тестируемые вычислительные платформы в будущем, когда на рынке появятся более быстрые варианты графических ускорителей. Второй проход выполняется с реалистичными установками – при выборе FullHD-разрешения и максимального уровня полноэкранного сглаживания. На наш взгляд такие результаты не столь интересны, но они отвечают на часто задаваемый вопрос о том, какой уровень игровой производительности могут обеспечить процессоры прямо сейчас – в современных условиях.








Во всех играх повторяется одна и та же картина. Конфигурации с дискретным видеоускорителем, построенные на основе процессоров в Socket FM2-исполнении, предлагают сравнительно низкий уровень производительности в играх, заметно уступающий быстродействию систем на базе любых представителей семейства Core i3. Этот момент следует иметь в виду и тем, кто присматривается к процессору Athlon X4 760K, в основе которого тоже лежит дизайн Richland. Новое поколение APU компании AMD с точки зрения игровой вычислительной производительности предлагает лишь 5-процентное улучшение по сравнению с предшественниками, и этого для качественного рывка явно недостаточно. Особенно удручающе выглядят результаты процессора A6-6400K. Один модуль Piledriver, лежащий в основе этой модели, с присущей современным играм нагрузкой справляется крайне плохо.

Энергопотребление


Скорость гибридных процессоров Richland по сравнению с Trinity подросла за счёт увеличения, пусть и небольшого, тактовых частот. Между тем, никаких изменений в архитектуре или в технологии их производства нет, и это навевает определённые опасения о возможном росте их уровня энергопотребления. Что, вообще говоря, было бы очень нежелательным, так как и Trinity по сравнению с интеловскими процессорами экономичностью не отличались. Впрочем, AMD обещает, что тепловыделение новых гибридных процессоров не изменилась, и им установлены те же, что и раньше, тепловые пакеты – 65 и 100 Вт.

Развеять же все сомнения относительно энергопотребления и тепловыделения может только практическое тестирование. Используемый нами в тестовой системе новый цифровой блок питания Corsair AX760i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и пользуемся для наших измерений. На следующих ниже графиках, если иное не оговаривается отдельно, приводится полное потребление систем (без монитора), измеренное на выходе из блока питания и представляющее собой сумму энергопотреблений всех задействованных в системе компонентов. КПД же самого блока питания в данном случае не учитывается. Во время измерений нагрузка на процессоры создавалась 64-битной версией утилиты LinX 0.6.4 с поддержкой наборов инструкций FMA (для процессоров AMD) и AVX (для процессоров Intel). Кроме того, для правильной оценки энергопотребления в простое и при низкой нагрузке мы активировали турбо-режим и все имеющиеся энергосберегающие технологии: C1E, C6, Enhanced Intel SpeedStep и AMD Cool'n'Quiet.


В состоянии простоя наилучшую экономичность могут предложить интеловские платформы – LGA 1155 и LGA 1150. Платформа же Socket FM2 вместе с гибридными процессорами AMD требует на несколько ватт больше электроэнергии. При этом никаких изменений в её потреблении при переходе от процессорного дизайна Trinity к Richland не произошло. Однако заметим, что в состоянии простоя процессоры Richland теперь сбрасывают свою частоту лишь до 2.0 ГГц, в то время как их предшественники Trinity снижали частоту заметно сильнее – до 1.4 ГГц.


Полная нагрузка на x86-ядра выявляет худшую энергоэффективность платформы Socket FM2 гораздо более явно. Даже те системы, в основе которых применены 65-ваттные гибридные процессоры AMD, в действительности потребляют примерно на 50 Вт больше, нежели аналогичные по производительности конфигурации, построенные на базе процессоров Core i3, предлагающих близкий уровень производительности. Ситуация же со 100-ваттными A10 и A8 ещё хуже. Иными словами, соперничать с Intel по вычислительной производительности в пересчёте на каждый ватт затраченной электроэнергии процессоры в Socket FM2-исполнении совершенно неспособны. Очевидно, надежды следует возлагать на перспективный дизайн Kaveri, с внедрением которого AMD должна освоить новый 28-нм технологический процесс. Пока же никаких принципиальных изменений нет: Richland под нагрузкой потребляют примерно столько же, сколько симметричные модели APU предыдущего поколения.

Для получения исчерпывающей картины потребления мы решили провести ещё одно измерение – при одновременной вычислительной нагрузке на x86 и графическое ядра. Такое использование процессора характерно для гетерогенных вычислений, и для создания нагрузки мы воспользовались тестом Luxmark 2.0, запущенном в режиме CPU+GPU.


Качественно картина не меняется, но следует отметить одну особенность. Процессоры AMD со 100-ваттным тепловым пакетом при гетерогенной нагрузке потребляют примерно на 15 Вт больше, чем при максимальной нагрузке на x86-ядра. Процессоры же с 65-ваттным тепловым пакетом, напротив, снижают свои энергетические аппетиты. Столь нелогичное их поведение связано с тем, что нагрев интегрированного в процессор графического ядра выводит x86-ядра из турбированного состояния: в противном случае такие APU не вписались бы в установленные спецификацией пределы тепловыделения. Именно поэтому производительность 100-ваттных и 65-ваттных APU компании AMD при одновременном задействовании ядер всех типов различается сильнее, нежели в обычном программном обеспечении.

Разгон


Процессоры Trinity были не слишком благосклонны к оверклокингу. Конечно, среди них, как и среди новых Richland, имелись специальные модели K-серии с разблокированными коэффициентами умножения. Однако нераскрытый частотный потенциал ядер Piledriver не слишком высок, даже в номинальном режиме процессоры на их основе работают на заметно превышающих 4 ГГц частотах. У Richland же без каких-либо изменений в техпроцессе и дизайне полупроводникового кристалла рабочие частоты поднялись ещё сильнее. Учитывая, что Socket FM2-процессоры поколения Trinity разгонялись при воздушном охлаждении до частот порядка 4.5 ГГц, примерно таких же результатов разгона мы ожидали и от Richland.

Однако реальность оказалась немного лучше ожиданий. Процессор A10-6800K при повышении напряжения питания до 1.5 В и активации функции Load-Line Calibration смог порадовать стабильной работой на частоте 4.7 ГГц. Для охлаждения применялся воздушный кулер NZXT Havik 140.


На самом деле частота 4.7 ГГц, хотя и определённо выше частоты разгона процессоров предыдущего поколения, особенно впечатляющим достижением совсем не кажется. Она лишь на 300 МГц превышает штатную частоту A10-6800K в турбо-режиме, а потому даёт небольшой выигрыш в производительности относительно номинального состояния.

Препятствует же достижению более высоких результатов высокий нагрев 32-нм процессорного кристалла. Дело в том, что для обеспечения стабильности на частотах выше номинальных, требуется достаточно агрессивное увеличение напряжения на процессорном ядре. Это, в свою очередь, влечёт рост температуры, пределом для которой является величина 120 градусов. При превышении этой границы срабатывает термозащита, поэтому главный ключ к успеху при разгоне процессоров поколения Richland - эффективное охлаждение.

Второй разблокированный процессор из участвующих в тестировании, A8-6600K в плане оверклокерских возможностей оказался ровно таким же, как и его старший собрат. Он продемонстрировал стабильную работу при максимальной частоте 4.7 ГГц. Напряжение при этом было повышено до 1.5 В.


Иными словами, с точки зрения нераскрытого частотного потенциала A10 и A8 совершенно идентичны.

А вот процессор A6-6400K, основанный на одном модуле Piledriver, удалось разогнать несколько сильнее. Скудность вычислительных ресурсов этого процессора позволяет без риска перегрева поднимать напряжение сильнее, чем у четырёхъядерных A10 и A8. В результате, при его установке в 1.525 В стабильной работы удалось добиться даже при частоте 4.9 ГГц.


В целом же, о разгоне процессоров Richland можно сказать то же самое, что и о разгоне всех прочих современных продуктов AMD. Везде, где используется микроархитектура Piledriver, частотный потенциал примерно одинаков, и при использовании воздушного охлаждения он не позволяет выйти за символичный 5-гигагерцовый рубеж. В то же время совершенствование 32-нм производственной технологии приводит к тому, что постепенно верхняя граница частот всё-таки отодвигается. Выход Richland как раз и выступает иллюстрацией этого процесса, ведь отличаются данные APU от предшественников именно возросшими тактовыми частотами. Похожие изменения происходят и с платформой Socket AM3+, для которой AMD совсем недавно представила пару процессоров серии FX-9000.

Выводы


В целом, о гибридных процессорах Richland, которые компания AMD предложила для обновления экосистемы Socket FM2, у нас сформировалось не слишком позитивное впечатление. Всё дело в том, что AMD не вложила в свой дизайн APU образца 2013 года никаких значимых инженерных нововведений. Микроархитектура x86-ядер, как и графическое ядро позаимствованы из Trinity без каких-либо корректив: новые APU вновь построены по старой формуле «Piledriver + VLIW4». Не претерпела изменений и основная масса формальных характеристик: количество ядер, число шейдерных процессоров, размер кэш-памяти и проч. В итоге, в виде Richland мы получили слегка разогнанные процессоры Trinity с заметно увеличенными модельными номерами, и ничего сверх этого.

Тестирование показывает, что средний уровень превосходства в вычислительной производительности представителей нового шеститысячного модельного ряда над симметричными процессорами Trinity, относящимися к пятитысячной серии, составляет в среднем смешные 6-7 процентов. Максимальное же преимущество Richland над Trinity наблюдается при многопоточной нагрузке, но и в этом случае оно не превышает 9-10 процентов. А это означает, что обновление ассортимента Socket FM2 процессоров следует считать лишь примитивной косметической мерой. Никаких переломов в рыночном позиционировании платформы Socket FM2 в результате произошедшего пополнения линеек A10, A8 и A6, совершенно очевидно, не произошло.

В итоге, если подходить к рассмотренным APU с точки зрения их традиционной вычислительной производительности, то четырёхъядерные модели серий A10 и A8 можно рассматривать лишь в качестве конкурентов процессорам Core i3, да и то, исключительно в тех случаях, когда речь идёт о многопоточной нагрузке. В тех же ситуациях, когда нагрузка носит слабопоточный характер, A10 и A8 скатываются до промежуточного между Core i3 и Pentium уровня. А двухъядерная серия A6 при этом вообще выглядит совершенно неспособной к борьбе с LGA 1155-процессорами аналогичной стоимости.

Попутно выясняется, что разрекламированная AMD поддержка гетерогенных вычислений средствами OpenCL на самом деле мало что меняет. Как мы убедились, в большинстве приложений, умеющих перекладывать часть вычислительной работы на графические ядра, прирост производительности происходит и у продуктов конкурента, которые, также как Richland или Trinity, имеют вполне полноценную совместимость с OpenCL. В итоге, даже в самых благоприятных для гибридных процессоров ситуациях, старшие представители линейки AMD A10 не могут предложить скорость работы хотя бы на уровне младших четырёхъядерников Intel, предлагая лишь быстродействие, сравнимое с производительностью модификаций Core i3 с графическим ядром HD Graphics 4000.

Таким образом, Richland, как и их предшественники, не могут рассматриваться в качестве возможной основы для мощных систем среднего уровня. Эта линейка больше подойдёт для бюджетных компьютеров, где она может закрепиться благодаря неплохой 3D-производительности встроенной в процессор графики, позволяющей в ряде случаев отказаться от приобретения дискретного видеоускорителя. Но не будем забегать вперёд, ведь тестирование графики из Richland в 3D-применениях – тема нашей следующей статьи.