Настоящий Fusion. Обзор APU AMD Llano A8-3800

Автор: Gavric
Дата: 30.06.2011
Все фото статьи

Введение


Компании AMD никогда не удавалось превзойти Intel по объёмам продаж процессоров. Однако это совершенно не значит, что данная компания играет в мире x86-процессоров сугубо второстепенную роль. Есть немало примеров того, как шаги, предпринимаемые AMD в развитии микроархитектуры собственных x86-процессоров, перерастают в глобальные рыночные тенденции и впоследствии принимаются и Intel. Так, именно компания AMD разработала и первой внедрила в конечных продуктах 64-битные расширения архитектуры x86, которые сегодня являются её неотъемлемой частью. AMD была и той компанией, которая указала на выгоды интеграции процессора с северным мостом набора логики и первой перенесла контроллер памяти в процессор. Если покопаться в истории, подобных эпизодов можно вспомнить немало. Все они говорят о том, что «второй игрок» процессорного рынка — это не аутсайдер, он располагает немалым инженерным и технологическим потенциалом.

Несколько лет тому назад этот потенциал был дополнительно усилен приобретением компании ATI, благодаря которому в распоряжении AMD оказались передовые графические технологии. Используя их, компания AMD вновь выступает с идеями глобальных нововведений, имя которым Fusion. Суть Fusion заключается в объединении традиционных вычислительных ядер с графическим ядром, содержащим большое количество потоковых процессоров, хорошо подходящих для параллельных вычислений.

Центральными процессорами с интегрированным графическим ядром сегодня никого не удивишь. Подобные продукты компания Intel поставляет уже очень давно. Но AMD предлагает иной подход к использованию симбиоза вычислительных и графических ядер. По замыслу инженеров компании, графическое ядро должно не просто заниматься выводом изображения на монитор. Оно должно быть вовлечено в процесс обычной работы процессора. Архитектура современных графических ядер такова, что они способны превосходно справляться с параллельной обработкой больших массивов данных. Поэтому целый ряд задач, таких как обработка изображений и видео, криптографические алгоритмы и некоторые научные алгоритмы, может эффективно решаться вычислительными средствами графического ядра. Конечно, это требует специальной оптимизации существующего программного обеспечения, но получаемый в итоге прирост производительности не оставляет никаких сомнений в том, что идея Fusion смысла не лишена.

С первыми продуктами, сделанными в рамках концепции Fusion, мы уже хорошо знакомы. Известные под кодовыми именами Ontario и Zacate процессоры семейств «E» и «C» хорошо зарекомендовали себя в недорогих настольных и мобильных системах, построенных на базе платформы Brazos. Однако они ориентируются в первую очередь на использование в компактных и экономичных системах, а потому имеют сравнительно невысокую производительность и достаточно ограниченную сферу применения. Очевидно, что для полноценного внедрения Fusion компании AMD необходимы общеупотребительные и массовые платформы и процессоры, обладающие достаточной для этого рыночного сегмента производительностью. Именно поэтому вслед за платформой Brazos AMD выпускает две свежие Fusion-платформы: мобильную Sabine и десктопную Lynx. Обе эти платформы основаны на новых процессорах серии «A» с кодовым именем Llano, которые и должны будут отстаивать честь Fusion в среднем секторе рынка.

В этой статье мы познакомимся с первыми процессорами Llano для настольных компьютеров и попробуем оценить, насколько востребована та революционная гибридная архитектура, которую пытается насадить AMD.

Llano: что внутри?



Llano — это Fusion

Глобально, концепция Fusion предполагает сращивание на аппаратном и программном уровне традиционных процессорных ядер и ядер графических. Поэтому любые APU (Accelerated Processor Unit), спроектированные в соответствии с заложенными в Fusion принципами, имеют типовую структуру, с которой мы уже познакомились на примере Ontario и Zacate. Также как и эти энергоэффективные APU, процессоры Llano содержат в себе вычислительные x86-ядра, графическое ядро и северный мост. Однако сходство между Llano и Zacate существует лишь на поверхностном уровне.

Более высокий статус процессоров Llano, которые ориентируются на использование в системах среднего уровня, потребовал от инженеров AMD интеграции в эти APU более производительных, чем в Zacate, составляющих. Вычислительные x86-ядра в Llano базируются на полноценной микроархитектуре Stars, а не на упрощённой Bobcat. Число таких ядер в составе APU может быть не только два, но и три или четыре. Графическое ядро Llano содержит 320 или 400 потоковых ядер, что в 4-5 раз больше, чем у процессоров для платформы Brazos. А встроенный в APU северный мост поддерживает скоростную двухканальную память и имеет полноценный интерфейс PCI Express для подключения внешних видеокарт.


При этом, несмотря на то, что Llano — это уже второй процессор в семействе Fusion, в нём нет практически никаких принципиально новых составляющих. Проще говоря, весь новый APU собран из старых деталей с минимальными нововведениями. Не вдаваясь в подробности, новинке можно дать такую характеристику: это гибрид процессора Athlon II X4, графического ядра Radeon HD 5570 и чипсета AMD 870, собранный в едином корпусе и на едином полупроводниковом кристалле. Конечно, такое описание несколько условно, на самом деле в Llano есть и небольшие добавки, и оригинальные технические решения, но ничего принципиально нового в этом APU всё-таки нет.

Впрочем, уже то, что сразу несколько столь сложных блоков оказались совмещены на едином полупроводниковом кристалле — это уже достаточно серьёзный шаг вперёд. Он стал возможен благодаря использованию технологического процесса с нормами производства 32 нм, который наконец-то успешно освоен мощностями производственного партнёра AMD — компании GlobalFoundries. Таким образом, в ассортименте у AMD появляются процессоры, выполненные по современному техпроцессу, освоенному Intel уже примерно год назад.


Полупроводниковый кристалл Llano

Сложность полупроводниковых кристаллов Llano возросла до уровня 1,45 млрд. транзисторов. По этой характеристике новые гибридные процессоры AMD немного обошли интеловские Sandy Bridge. Но площадь полупроводникового кристалла у Llano и Sandy Bridge похожа — 228 против 216 кв. мм. Это значит, что эти процессоры должны быть сравнимы по себестоимости, если, конечно, пренебречь тем, что в Sandy Bridge вложены гораздо более серьёзные трудозатраты инженерной команды.

Однако подобие Llano и Sandy Bridge по характеристикам полупроводниковых кристаллов ровным счётом ничего не значит. Распределение «транзисторного бюджета» в этих процессорах отличается кардинально. Если интеловский продукт — это просто процессор с интегрированным графическим ядром, на долю которого отводится не более 20 % площади кристалла, то в Llano на мощности графического ядра сделан очень серьёзный упор. А потому на кристалле занимает оно не менее чем четыре x86-ядра в сумме.


Лучшей иллюстрации того, что же может предложить пользователям Llano, и желать не приходится. Компания AMD делает ставку на то, что у неё в данный момент получается делать лучше всего — на графическое ядро. Процессорные же ядра отошли на второй план, а потому успех нового процессора будет тесно связан с успехом концепции Fusion в целом. Если AMD действительно удастся добиться переноса основной нагрузки на потоковые процессоры GPU, то Llano, вне всяких сомнений, превзойдёт все конкурирующие решения. Только сейчас говорить об этом явно преждевременно — основная масса программного обеспечения работает по старинке, целиком полагаясь на традиционные x86-ядра.

CPU-ядра Husky

Вычислительные x86-ядра, на которых строится процессор Llano, имеют новое кодовое имя Husky. Однако действительно нового в них немного. Они имеют ту же самую микроархитектуру K10 «Stars», которая используется во всех Socket AM3 процессорах. Многообещающая же микроархитектура Bulldozer в гибридные процессоры AMD придёт лишь в следующем году. Так что пока ожидать от Llano чудес производительности (по крайней мере, в традиционных применениях), явно не приходится.

Вместе с тем инженеры AMD попытались как-то подреставрировать старую микроархитектуру, и хотя бы немного поднять производительность ядер Husky по сравнению с ядрами, используемыми в процессорах Athlon и Phenom. Насколько это удалось сделать, мы увидим в тестах, но официальные данные говорят о средневзвешенном 6-процентном приросте быстродействия.

Достигается это главным образом самым простым путём — увеличением объёма кэш-памяти второго уровня. Так, каждое из ядер Llano имеет собственный L2-кэш размером 1 Мбайт. Впрочем, при этом процессоры полностью лишены общего L3 кэша, так что суммарный объём кэш-памяти у новинок не так уж и велик по современным меркам.

В дополнение к увеличению кэша в Husky была улучшена работа блока предсказания переходов, а также оптимизированы размеры основных буферов: буфер переупорядочивания инструкций стал вместительнее на 20 %, а буферы загрузки/сохранения увеличили свой размер вдвое. Также, в Husky появился отдельный блок целочисленного деления, благодаря которому соответствующие операции исполняются быстрее. Как видим, изменений немного, и все они относятся к разряду косметических. Основы микроархитектуры K10 остались непоколебимы, а потому Husky, как и предшествующие ядра могут обрабатывать не более трёх инструкций за такт.


Очевидно, разработчики не особенно-то и боролись за рост производительности x86-ядер процессоров Llano. У них были другие приоритеты. В первую очередь им нужно было постараться улучшить энергетическую эффективность Husky, так как процессоры с микроархитектурой K10 хорошими показателями потребления похвастать не могут. Во-вторых, нужно было серьезно подумать и над тем, каким образом организовать взаимодействие между системной памятью, вычислительными ядрами и графическим ядром. Именно там, а не в микроархитектуре и сосредоточены кардинальные улучшения.

GPU-ядро Sumo

Не стоит забывать и о том, что в составе Llano появилось производительное графическое ядро, названное AMD Sumo. Также как и в случае с процессорами Zacate, архитектура этого ядра позаимствована из дискретных графических решений. Но, учитывая позиционирование Llano, AMD решила встроить в этот процессор значительно более мощную графику, аналогичную Radeon HD 5570 по числу исполнительных устройств.

Собственно, так оно и есть — Sumo является близким родственником дискретного GPU Redwood, построенного на архитектуре AMD VLIW5. То есть, в максимальной версии APU семейства Llano получил графический ускоритель с 400 потоковыми процессорами, 20 текстурными блоками и 8 блоками растеризации. В более дешёвых версиях APU один из SIMD-блоков GPU может отключаться производителем, и число потоковых процессоров будет сокращаться до 320, делая Sumo подобным Radeon HD 5550.


Изменений по сравнению с оригинальным Redwood в Sumo всего два. Во-первых, переделан интерфейс памяти с тем, чтобы адаптировать GPU для работы с двухканальной DDR3 не напрямую, а через процессорный северный мост. Скорость работы с памятью — традиционно слабое место интегрированной графики, поэтому, внедряя в свой APU скоростной GPU, разработчики должны были предусмотреть какие-то специальные оптимизации. К сожалению, в Llano нет ничего подобного интеловской кольцевой шине, и Sumo не может использовать для своих нужд процессорную кэш-память. Зато появилась другая принципиально новая для графического ядра возможность — запись в общую память напрямую, минуя процессорные ядра. Кроме того, все проводимые графическим ядром операции с памятью получают в Llano более высокий приоритет чем обращения вычислительных ядер и обслуживаются контроллером памяти в первую очередь.

Во-вторых, в Sumo заменён на более новую версию блок UVD (Unified Video Decoder). Используемая в Llano третья версия видеодекодера поддерживает все распространённые форматы HD-видео и совместима с MVC (Multi-View Codec), который применяется для 3D-видео. Таким образом, платформа Lynx, в отличие от платформы Brazos, способна воспроизводить 3D Blu-Ray через HDMI-интерфейс. Кроме того, UVD3 более экономичен, он может работать независимо от остальной части графического ускорителя, что позволяет отключать потоковые процессоры при воспроизведении видео.

Описанные изменения позволили компании AMD дать графическому ядру Sumo маркетинговое название из шеститысячной серии. Так, в Llano это ядро может именоваться в зависимости от числа активных потоковых процессоров либо Radeon HD 6550D, либо Radeon HD 6530D.

Встроенный в процессор аналог видеокарты Radeon HD 5570 — весьма заманчивое предложение, но, тем не менее, устроить оно может далеко не всех. Поэтому AMD предусмотрела возможность апгрейда встроенного в APU видеоускорителя с использованием технологии CrossFire. В данном случае эта технология именуется Dual Graphics и позволяет добавлять к мощностям интегрированного в процессор GPU внешнюю видеокарту семейства Radeon, объединяемую с ним в асимметричный CrossFire-массив.


Технология выглядит впечатляюще, ведь для создания системы Dual Graphics подходят совершенно разнородные видеокарты. Однако такая универсальность влечёт за собой и целый ряд проблем. Во-первых, выигрыш в производительности может быть достигнут только в том случае, если дополнительный видеоускоритель не слишком быстр и не превосходит по мощности встроенное в APU ядро Sumo более чем в два раза. То есть, имея, например, Radeon HD 6850, выгоднее будет использовать его независимо, полностью выключив встроенную в процессор графику. Второе ограничение ещё более серьёзно. Асимметричные режимы CrossFire работают лишь в DirectX 10 или 11, поэтому в DirectX 9 или OpenGL-играх Dual Graphics эффекта не даёт, а производительность снижается до уровня самого медленного GPU в системе. Тем не менее, для не слишком притязательных пользователей Dual Graphics предоставляет прекрасную возможность сэкономить, что серьёзно повышает привлекательность Llano как решения начального уровня для геймеров.

Северный мост

На встроенный в процессор северный мост AMD возложила не только работу с памятью, но и поддержку шины PCI Express. Это означает, что по своему строению платформа Lynx стала подобна интеловским системам, а чипсет на материнской плате выродился в южный мост.

Контроллер памяти Llano по сравнению с процессорами прошлого поколения приобрёл более широкую функциональность. Да, как и ранее, он поддерживает двухканальную память, но теперь официально декларируется совместимость не только с DDR3-1333, но и с DDR3-1600/1866 SDRAM. Правда, в случае использования скоростной DDR3-1866 её работоспособность гарантируется только лишь при установке одного модуля на канал.

Вполне очевидно, что рост пропускной способности шины памяти необходим для обеспечения нужд графического ядра. А AMD даже прямо указывает на то, что использование в системах с Llano DDR3-1333 памяти может существенно снизить производительность встроенной графики. Однако поддержка северным мостом скоростных модулей памяти - не главная его особенность. Гораздо интереснее то, что в нём реализованы новые пути следования данных, призванные оптимизировать графическую производительность APU. Помимо традиционной связи «процессор — северный мост», в Llano появились две дополнительных шины «GPU-северный мост».


Первая связь, так называемая Radeon Memory Bus, нужна для работы обычных графических приложений. Эта шина имеет пропускную способность 29.8 Гбайт/с, равную пропускной способности двухканальной DDR3-1866. Обращения к памяти, идущие по ней, обладают самым высоким приоритетом и обрабатываются контроллером памяти даже вперёд процессорных обращений.

Вторая шина, соединяющая графическое ядро и контроллер памяти, носит название AMD Fusion Compute Link и предназначается для прямого доступа графического ядра в память с сохранением когерентности кэш-памяти процессора. Иными словами, Fusion Compute Link нужна для прямого обмена данными между графическим и вычислительными ядрами при их совместной работе над одной задачей. В настоящее время эта шина практически не применяется, но впоследствии, по мере роста популярности концепции Fusion и появления программ, задействующих одновременно все мощности APU, значение Fusion Compute Link должно будет проявиться в полной мере.

Что же касается контроллера шины PCI Express, то в Llano поддерживается 24 линии второго поколения. Четыре линии отводятся на связь с южным мостом чипсета, ещё четыре линии отданы для подключения периферийных устройств. Оставшиеся 16 линий формируют шину PCIe x16, отведённую для внешних видеокарт. При желании эта шина может быть расщеплена на две PCIe x8, так что технология CrossFire поддерживается в платформе Lynx не только в варианте Dual Graphics, но и для работы с парой дискретных видеоускорителей.

Управление питанием и Turbo Core


Снижение энергопотребления было одной из основных целей, которую преследовали разработчики при создании дизайна Llano. Как мы помним, процессоры с микроархитектурой K10 особенной скромностью в энергетических аппетитах не отличались. А теперь к x86-ядрам добавилось и мощное графическое ядро. Поэтому AMD нужно было найти какие-то новые подходы к улучшению потребления, иначе Llano не смог бы претендовать на достойное место на рынке, и в особенности в мобильных компьютерах, где APU с мощной интегрированной графикой могут быть особенно востребованы.

Часть проблемы высокого энергопотребления решилась сама собой при переходе на новый технологический производственный процесс. Использование 32-нм технологии позволило понизить рабочие напряжения Llano до величин порядка 1.2-1.25 В, то есть до того уровня, который ранее использовали только энергоэффективные модификации процессоров Athlon II.

Однако главной новинкой стало то, что в Llano появилась новая внутренняя схема управления питанием, позволяющая отключать от питающего напряжения неиспользуемые участки APU. Несмотря на то, что на процессоры Llano в платформе Lynx отведено всего две независимые линии питания — для процессорных ядер и для графического ядра с северным мостом — внутренняя схема управления питанием может автономно и гибко обесточивать те или иные части процессора. Независимо отключаться могут отдельные x86-ядра, графическое ядро или встроенный в него блок UVD.


В результате, для настольных систем AMD смогла предложить процессоры с тепловыми пакетами 100 и 65 Вт, а для мобильных компьютеров — 45 и 35 Вт. То есть, AMD наконец-то выпустила такие процессоры, тепловыделение которых сравнимо с тепловыделением интеловских Sandy Bridge.

Впрочем, урезание тепловых пакетов для Llano обернулось и тем, что эти процессоры получили достаточно низкие тактовые частоты. Так, ни одна из представленных к настоящему времени моделей не достигает даже и 3-гигагерцовой отметки. Что же касается мобильных представителей семейства, то они и вовсе имеют частоты, не превышающие 2,6 ГГц.

В этих условиях AMD решила задействовать все доступные методы повышения быстродействия, в том числе и технологию динамического разгона Turbo Core, наращивающую частоту работы процессора в случае пассивности части из вычислительных ядер. Эта технология уже была реализована в процессорах Phenom II X6, но в Llano её немного переработали. В APU возможность повышения тактовой частоты устанавливается исходя не из температуры отдельных ядер, а основываясь на их загрузке. Температура же является второстепенным фактором, в случае превышения допустимого предела она может лишь спровоцировать отключение турбо-режима.

Новая реализация Turbo Core лучше тем, что она в общем случае даёт повторяемые результаты и практически не зависит от эффективности системы охлаждения или температуры окружающей среды.

К сожалению, технология динамического разгона в процессорах Llano прилагается только к вычислительным ядрам. Графическое ядро может лишь снижать свою частоту для уменьшения энергопотребления и не может автоматически разгоняться. Однако разработчики учли тот факт, что при работе графического ядра на полной скорости его тепловыделение возрастает, и в этом случае перевод процессорных x86-ядер в турбо-режим может приводить к выходу тепловыделения за установленные пределы. Поэтому, в 3D-или в Fusion-приложениях, активно задействующих потоковые процессоры графического ядра, технология Turbo Core может не включаться даже в том случае, если активно всего одно из четырёх процессорных x86-ядер.

Чипсеты и материнские платы


Платформа Lynx помимо собственно процессоров Llano включает и сопутствующие наборы системной логики. Так как APU уже содержат в себе контроллер памяти и контроллер шины PCI Express, наборы логики состоят всего из одной микросхемы — южного моста, называемого также FCH (Fusion Controller Hub).


AMD предлагает два варианта FCH: младший — A55 и старший — A75. В старшей версии присутствует врождённая поддержка всех современных интерфейсов, включая USB 3.0 и SATA 6 Гбит/с. Младший же чипсет лишён этой роскоши, поддерживая лишь старые версии интерфейсов SATA 3 Гбит/с и USB 2.0.

Полностью возможности FCH можно оценить по блок-схеме A75.


Формальные спецификации версий FCH и их различия видны из таблицы:


Поддерживающие десктопные процессоры Llano материнские платы, в основе которых лежат описанные наборы логики, оборудуются специальным процессорным разъёмом Socket FM1. То есть, они не совместимы с имеющимся парком Socket AM3 процессоров, точно также как Llano не могут быть установлены в старые материнские платы.


Внешний вид Socket FM1

По габаритным размерам Socket FM1 похож на привычный разъём Socket AM3, однако имеет меньшее число контактов — 905. Материнские платы с новым разъёмом подготовили практически все ведущие производители, поэтому проблем с выбором подходящей платформы у покупателей Llano явно не будет.


Что касается систем охлаждения, то AMD постаралась по возможности сохранить совместимость с существующей инфраструктурой, и для новых процессоров полностью подходят старые кулеры, предназначенные для Socket AM3-систем.

Модельный ряд Llano для настольных систем


Первая партия процессоров Llano для настольных систем, выходящая на рынок в эти дни, включает четыре модели APU с четырьмя вычислительными x86-ядрами. Также как и в случае с мобильными Llano, они не имеют маркетингового имени, а обозначаются модельными номерами серий A8 и A6. К серии A8 относятся старшие модели APU, снабжённые графическим ядром Sumo с 400 потоковыми процессорами, а к серии A6 относятся более медленные модификации с заниженными тактовыми частотами и урезанным графическим ядром с 320 потоковыми процессорами.

То есть, до появления двухъядерных Llano, которые будут относиться к серии A4, классификация серий APU происходит в первую очередь по мощности графического ядра. Базовые характеристики входящих в состав процессоров Llano графических ускорителей Radeon HD 6550D и Radeon HD 6530D приводятся в следующей таблице.


Полный же список доступных в данный момент процессоров Llano для новой настольной платформы Lynx приведён в таблице:


Сильные различия в характеристиках прослеживаются не только между APU серий A8 и A6. Пара моделей внутри каждой серии — это, фактически, тоже два принципиально разных продукта с кардинально различным тепловыделением. Наиболее производительные варианты относятся к 100-ваттному тепловому пакету, но вместе с этим AMD предлагает и модификации с более приемлемым расчётным тепловыделением 65 Вт и с поддержкой технологии Turbo Core. Тактовая частота экономичных процессоров снижена относительно 100-ваттных APU примерно на 20-25 %, но частота и характеристики графического ядра остаются на том же самом уровне.

Сразу же бросается в глаза, что тактовые частоты Llano явно ниже частот, которые достигнуты современными Athlon II и Phenom II. А это означает, что Llano — ещё более медленные процессоры, главным козырем которых должна быть не скорость x86-ядер, а мощность графического ядра. Поэтому, апгрейд с платформы Socket AM3 на платформу Socket FM1 имеет смысл разве только в погоне за экономичностью, но никак не за производительностью.

В мобильном секторе рынка AMD рассматривает процессоры Llano в качестве конкурирующих решений для систем на базе Sandy Bridge серий Core i3 и Core i5. На рынке же настольных систем всё немного печальнее — тут Llano конкурировать с Core i5 явно не сможет из-за своих невысоких тактовых частот и использования устаревшей микроархитектуры K10, разработанной ещё в 2007 году. Поэтому в десктопах ценовая политика AMD строится таким образом, чтобы старшие Llano линейки A8 рассматривались в качестве альтернативы младшим Core i3, которые, напомним, являются двухъядерными процессорами.

Описанные четыре модели настольных процессоров Llano станут далеко не единственными представителями семейства. К началу сезона «back-to-school» ряды Socket FM1 процессоров будут пополнены бюджетными 65-ваттными двухъядерными и трёхъядерными продуктами серий A6 и A4, снабжёнными графическими ядрами с 320 и 240 потоковыми процессорами. То есть, семейство Llano будет активно расширяться в нижние ценовые сегменты. Выпуск же производительных решений для платформы Lynx у AMD не планируется.

Как мы тестировали


Дабы создать у журналистов наиболее благоприятное впечатление о новой платформе Lynx, компания AMD разослала в адрес изданий старший из процессоров Llano, A8-3850. Однако нам показалось, что этот процессор не слишком привлекателен для пользователей из-за своего непомерно высокого энергопотребления. К счастью, нам удалось получить на тесты второй процессор, A8-3800, на испытаниях которого мы и сосредоточились.


A8-3800 интересен сразу по нескольким причинам, но самое главное, он сравним с процессорами Core i3 не только по цене, но и по энергопотреблению, то есть именно его, а не A8-3850 следует считать прямым конкурентом для двухъядерных Sandy Bridge.


Собственно, исходя из этих соображений, в нашем тестировании мы сопоставляли A8-3800 с двумя интеловскими процессорами, снабжёнными разными версиями графического ядра HD Graphics — Core i3-2100 (с графическим ядром HD Graphics 2000) и Core i3-2105 (с графическим ядром HD Graphics 3000). Также, часть тестов была проведена и с использованием более дешёвого и более медленного Sandy Bridge — Pentium G850.

Учитывая невысокую тактовую частоту процессора A8-3800, для его сравнения с предложениями предыдущего поколения мы выбрали самый медленный Athlon II X4, который только смогли найти — Athlon II X4 630.

В результате, в тестовых испытаниях были задействованы следующие компоненты:

Процессоры:

AMD A8-3800 (Llano, 4 ядра, 2,4/2,7 ГГц, 4 Мбайта L2, Radeon HD 6550D)
AMD Athlon II X4 630 (Propus, 4 ядра, 2,8 ГГц, 2 Мбайта L2);
Intel Core i3-2100 (Sandy Bridge, 2 ядра, 3,1 ГГц, 3 Мбайта L3, HD Graphics 2000);
Intel Core i3-2105 (Sandy Bridge, 2 ядра, 3,1 ГГц, 3 Мбайта L3, HD Graphics 3000);
Intel Pentium G850 (Sandy Bridge, 2 ядра, 2,9 ГГц, 3 Мбайта L3, HD Graphics);

Материнские платы:

ASUS Crosshair IV Formula (Socket AM3, AMD 890FX + SB850, DDR3 SDRAM);
ASUS P8Z68-V Pro (LGA1155, Intel Z68 Express);
Gigabyte GA-A75-D3H (Socket FM1, AMD A75)

Память — 2 x 2 GB DDR3-1600 SDRAM 9-9-9-27-1T (Kingston KHX1600C8D3K2/4GX);
Графические карты:

AMD Radeon HD 5570;
AMD Radeon HD 6450;
AMD Radeon HD 6570;
AMD Radeon HD 6970.

Жёсткий диск: Kingston SNVP325-S2/128GB.
Блок питания: Tagan TG880-U33II (880 Вт).
Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
Драйверы:

Intel Chipset Driver 9.2.0.1030;
Intel Management Engine Driver 7.1.10.1065;
Intel Rapid Storage Technology 10.5.0.1027;
AMD Catalyst 11.6 Display Driver.

Исследование Llano проводилось в два этапа. На первом мы протестировали этот процессор в составе платформы, оснащённой дискретной графической картой AMD Radeon HD 6970. Второй этап был всецело посвящён исследованию Lynx как интегрированной платформы. Поэтому во второй части тестирования Radeon HD 6970 не использовался, зато для сравнения с графическим ядром Llano применялись недорогие видеокарты AMD Radeon HD 5570, AMD Radeon HD 6450 и AMD Radeon HD 6570.

Предварительная оценка: Llano против Propus


Перед тем, как приступить к «серьёзному» тестированию, мы решили провести небольшое сравнение процессоров Llano и Athlon II X4 при их функционировании на одинаковой тактовой частоте. Это нам даст понимание того, насколько серьёзны улучшения, сделанные в ядрах Husky. AMD говорит о 6-процентной прибавке в скорости, однако компания принимает во внимание и увеличение кэш-памяти второго уровня. Мы же решили сосредоточиться исключительно на усовершенствованиях микроархитектуры, которые можно проверить небольшими синтетическими тестами, не загружающими при своей работе кэш-память второго уровня. Хороший набор таких тестов предлагает популярная утилита SiSoftware Sandra.

Для сравнения в одинаковых условиях тактовая частота Llano и Athlon II X4 была выровнена на уровне 2,4 ГГц, а технология Turbo Core была отключена.


Микроархитектурные улучшения, сделанные в Husky, дают совсем незначительный практический эффект. При этом наибольший выигрыш наблюдается при работе процессора с целочисленными данными. Таким образом, большинство случаев, когда Llano, работая на той же тактовой частоте, превосходит по скорости процессоры предыдущего поколения, будет объясняться либо увеличенной кэш-памятью, либо вовлечением в работу мощностей потоковых процессоров продвинутого графического ядра.

Впрочем, есть и ещё один момент. AMD в процессорах Llano переделала контроллер памяти. Он стал поддерживать более быструю DDR3 и стал обслуживать три независимых пути доступа в память, имеющих разные приоритеты. Для оценки скорости его работы мы провели тесты в утилите Cachemem из пакета Aida64. Во всех случаях использовалась DDR3-1600 память с задержками 9-9-9-27-1T.


Здесь улучшений нет вообще. То, что с памятью теперь работают не только процессорные, но и графические ядра, потребовало реализации в контроллере памяти дополнительного арбитража. А это повлекло за собой снижение практической скорости работы вычислительных ядер с памятью, ведь x86-ядра с точки зрения контроллера имеют теперь не самый высокий приоритет. Также замедлился и L2-кэш, что, впрочем, объясняется и компенсируется ростом его ёмкости.

Производительность Llano в системе с дискретной графикой


При установке в систему, построенную на базе процессора Llano, мощной графической карты встроенное в APU видеоядро Radeon HD 6550D целесообразно отключить, так как использование режима Dual Graphics приведёт лишь к снижению производительности. В этом разделе мы посмотрим на то, как себя проявит система Lynx при работе в нашей стандартной тестовой конфигурации — с видеокартой AMD Radeon HD 6970.

Общая производительность

Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тест Bapco SYSmark, моделирующий работу пользователя в распространённых офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера.

Не так давно компания Bapco обновила свой тест, выпустив новую версию SYSmark 2012, включающий новые версии распространённых приложений и ещё более приближенные к действительности сценарии работы. К сожалению, AMD не устроили результаты, показываемые её процессорами в SYSmark 2012, и компания инициировала скандал, направленный на подрыв доверия к SYSmark. Но аргументы AMD нас не убедили. Её главной претензией стало то, что SYSmark 2012 не включает приложения, ускоряемые графическими ядрами APU. Однако не стоит забывать, что таких приложений не так много, и их распространение нельзя назвать повсеместным. Более того, при тестировании систем, использующих внешние графические карты, потоковые процессоры графического ядра APU оказываются недоступны для использования.

Иными словами, мы не стали отворачиваться от SYSmark 2012 и пока продолжим пользоваться этим тестом для оценки производительности. Тем более что список приложений, используемых в тесте, кажется нам вполне актуальным для того, чтобы основываясь на скорости системы в них выдавать заключение об общей производительности системы. В частности, SYSmark 2012 включает: ABBYY FineReader pro 10.0, Adobe Acrobat Pro 9, Adobe After Effects CS5, Adobe Dreamweaver CS5, Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Flash player 10.1, AutoDesk 3DS Max 2011, AutoDesk AutoCAD 2011, Google Sketchup Pro 8, Microsoft Internet Explorer 9, Microsoft Office 2010, Mozilla Firefox Installer, Mozilla Firefox 3.6.8 и Winzip Pro 14.5.


То, что результаты в SYSmark не нравятся AMD — вполне логично. Отставание A8-3800 от процессора Core i3-2100 составляет 33 %, однако такой результат вряд ли можно назвать нелогичным. Да, A8-3800 — четырёхъядерный процессор, а в Core i3-2100 всего лишь два ядра. Но интеловский продукт поддерживает Hyper-Threading, имеет более прогрессивную микроархитектуру и работает на частоте, превышающей частоту A8-3800 на 30 %.

Более того, из-за своей низкой тактовой частоты A8-3800 отстаёт и от Pentium G850, и даже от своего предшественника Athlon II X4 630. К сожалению, это большая проблема новинки, и в её решении не помогает даже имеющаяся технология Turbo Core. Снабдив Llano мощным графическим ядром и стараясь после этого уменьшить тепловыделение до приемлемых величин, AMD пришлось пожертвовать традиционной x86-производительностью. Поэтому в привычных применениях, не адаптированных под концепцию AMD Fusion, Llano явно не блещет, выступая на уровне бюджетных процессоров.

Более глубокое понимание результатов SYSmark 2012 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы.

Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 и WinZip Pro 14.5.


В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты компании Adobe: Photoshop CS5 Extended, Premiere Pro CS5 и After Effects CS5.


Web Development — сценарий, в рамках которого моделируется создание web-сайта. Используются приложения: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 и Microsoft Internet Explorer 9.


Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию рыночных тенденций, которые выполняются в Microsoft Excel 2010.


Сценарий 3D Modeling всецело посвящён созданию трёхмерных объектов и рендерингу статичных и динамических сцен с использованием Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 и Google SketchUp Pro 8.


В последнем сценарии, System Management, выполняется создание бэкапов и установка программного обеспечения и апдейтов. Здесь задействуются несколько различных версий Mozilla Firefox Installer и WinZip Pro 14.5.


По итогам следует отметить, что сравнительно неплохой результат процессору A8-3800 удаётся продемонстрировать только в тесте 3D Modeling, где четыре полноценных x86-ядра являются действительно значимым аргументом в борьбе против двухъядерных Sandy Bridge. Однако заметьте, новый процессор A8-3800 всегда оказывается хуже одного из самых медленных представителей серии Athlon II X4. Так что если подходить к Llano как к традиционному процессору, а не как к APU, назвать его шагом вперёд совершенно невозможно.

Игровая производительность

Как известно, производительность платформ, оснащенных высокопроизводительными процессорами, в подавляющем большинстве современных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы стараемся проводить испытания так, чтобы по возможности снять нагрузку с видеокарты: выбираются наиболее процессорозависимые игры, а тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. То есть, полученные результаты дают возможность оценить не столько уровень fps, достижимый в системах с современными видеокартами, сколько то, насколько хорошо проявляют себя процессоры с игровой нагрузкой в принципе. Следовательно, основываясь на приведённых результатах, вполне можно строить догадки о том, как будут вести себя процессоры и в будущем, когда на рынке появятся более быстрые варианты графических ускорителей.












Играм приходится по вкусу вместительная кэш-память второго уровня процессора A8-3800. Поэтому, несмотря на более низкую тактовую частоту, он выступает с тем же результатом, что и 2.8-гигагерцовый Athlon II X4 630. Впрочем, вряд ли это можно назвать хорошим результатом, ведь даже двухъядерные Sandy Bridge без Hyper-Threading показывают более высокую производительность почти во всех играх.

Архивация и шифрование

Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR, при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1.4 Гбайт.


Алгоритмы архивации требуют активной работы с данными, поэтому превосходство A8-3800 над Athlon II X4 630 объяснимо — Llano имеет более вместительную кэш-память второго уровня. Но это не спасает новинку от разгрома со стороны недорогих LGA1155-процессоров, результат которых в тесте WinRAR лучше почти на 30 %.

Производительность процессоров при шифровании измеряется встроенным тестом популярной криптографической утилиты TrueCrypt. Следует отметить, что она не только способна эффективно загружать работой любое количество ядер, но и поддерживает новый специализированный набор инструкций AES.


Двухъядерные Sandy Bridge не всегда опережают четырёхъядерные процессоры AMD. Обратная ситуация — на диаграмме. При шифровании данных A8-3800 работает существенно быстрее Core i3-2100, который по странному решению Intel лишён поддержки криптографических инструкций. Однако до Athlon II X4 630 новинке всё-таки далеко — сказывается низкая тактовая частота.

Редактирование изображений

Измерение производительности в Adobe Photoshop мы проводим с использованием собственного теста, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, включающий типичную обработку четырёх 10-мегапиксельных изображений, сделанных цифровой камерой.


Adobe Photoshop никогда не благоволил к процессорам AMD. Теперь же ситуация усугубилась до абсурда. Core i3-2100, который стоит примерно столько же, как и AMD A8-3800, обгоняет этот процессор почти на 70 %. AMD давно нуждается в кардинальном обновлении микроархитектуры и, хочется надеяться, что с выходом Bulldozer таких позорных результатов мы больше не увидим.

Также нами был проведено тестирование и в программе Adobe Photoshop Lightroom 3. Тестовый сценарий включает пост-обработку и экспорт в JPEG ста 12-мегапиксельных изображений в RAW формате.


Пакетная обработка фотографий в Lightroom хорошо оптимизирована под многоядерные архитектуры. Поэтому тут, в отличие от Phоtoshop, результаты A8-3800 выглядят вполне приемлемо. Особенно приятно видеть, что Llano обгоняет Athlon II X4 630, так что в ряде случаев ядра Husky могут обеспечить видимый прирост скорости по сравнению с процессорами предыдущего поколения.

Перекодирование аудио и видео

При тестировании скорости перекодирования аудио используется утилита Apple iTunes, при помощи которой осуществляется преобразование содержимого CD-диска в AAC-формат. Заметим, что характерной особенностью этой программы является способность использования лишь пары процессорных ядер.


Единственное, на что может опираться процессор AMD в соперничестве с Core i3-2100, это — на четыре полноценных x86 ядра. В том же случае, если приложение не может их задействовать в полной мере, результат предрешён. Поэтому столь медленному выступлению A8-3800 в iTunes удивляться не приходится.

Для измерения скорости перекодирования видео в формат H.264 используется x264 HD тест, основанный на измерении времени обработки исходного видео в формате MPEG-2, записанного в разрешении 720p с потоком 4 Мбит/сек. Следует отметить, что результаты этого теста имеют огромное практическое значение, так как используемый в нём кодек x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч.


Кодек x264 неплохо работает на процессорах AMD, а кроме того, может эффективно задействовать все процессорные ядра. Поэтому в данном тесте A8-3800 превосходит и Pentium G850, и Core i3-2100. Впрочем, от своего собрата, Athlon II X4 630, он отстаёт из-за своей главной проблемы — невысокой тактовой частоты.

Производительность в Adobe Premiere Pro тестируется измерением времени рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.


Неплохо показывает себя A8-3800 и в Premiere Pro CS5. В задачах обработки видео четыре медленных ядра Husky превосходят два быстрых ядра Sandy Bridge, и картина в целом не сильно-то и отличается от того, что мы уже видели на прошлой диаграмме.

В число тестов, которыми мы измеряем скорость перекодирования видеоконтента, была добавлена утилита Cyberlink MediaEspresso 6.5. Она предназначается для преобразования видео из одного формата в другой, а интересна для нас тем, что может вовлекать в процесс транскодирования мощности графического ускорителя. В качестве тестового задания выполнялось перекодирование 10-минутного H.264 1080p видеоклипа в формат, пригодный для воспроизведения на iPhone 4 (H.264, 1280x720, 4Mbps). Для ускорения обработки во всех случаях задействовалась поддерживаемая видеокартой Radeon HD 6970 технология ATI Stream.


Третье приложение для обработки HD-видео, а результат всё тот же. Быстродействие A8-3800 находится в промежутке между Core i3-2100 и Pentium G850.

Финальный рендеринг

Тестирование скорости финального рендеринга в Maxon Cinema 4D выполняется путём использования специализированного теста Cinebench.


Рендеринг в чём-то сродни перекодированию видео. И та, и другая задача прекрасно масштабируется с увеличением количества доступных процессорных ядер. Поэтому результаты вполне ожидаемы. A8-3800 превосходит двухъядерный Pentium G850, но уступает двухъядерному Core i3-2100, который дополнительно усилен поддержкой технологии Hyper-Threading.

Производительность рендеринга в Autodesk 3ds max 2011 с использованием как Scanline, так и Mental Ray, мы измеряем, прибегая к услугам специализированного теста SPECapc.


Во всех приложениях, эффективно задействующих многопоточность, новый A8-3800 демонстрирует примерно одинаковое быстродействие. Можно сказать, что в таких случаях четырёхъядерным процессорам AMD удаётся показать приемлемое для этой ценовой категории быстродействие, однако в ней они соревнуются с двухъядерными Sandy Bridge. Поэтому, если речь заходит о скорости работы в задачах, использующих многоядерность не столь хорошо, A8-3800 сразу превращается в аутсайдера. Отдельное разочарование, связанное с Llano — это его очень низкая тактовая частота. Из-за этого процессор A8 отстаёт от Athlon II X4, так как сделанные в нём микроархитектурные улучшения дают микроскопический эффект.

Иными словами, процессоры Llano — это плохой вариант для системы с внешней графической картой. Четырёхъядерные Socket AM3-процессоры прошлого поколения, не говоря уже о предложениях конкурента, могут предложить куда более высокое быстродействие.

Энергопотребление


С производительностью вычислительных ядер у Llano революции не получилось, посмотрим, что стало с энергопотреблением. Посмотреть на эту характеристику особенно любопытно, так как в наших руках оказался 65-ваттный A8-3800, который по идее должен быть сопоставим по энергетическим и тепловым характеристикам с Core i3-2100, TDP которого равен тем же 65 Вт.

На следующих ниже графиках приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД же самого блока питания в данном случае не учитывается. Во время измерений нагрузка на процессоры создавалась 64-битной версией утилиты LinX 0.6.4. Кроме того, для правильной оценки энергопотребления в простое мы активировали все имеющиеся энергосберегающие технологии: C1E, AMD Cool'n'Quiet и Enhanced Intel SpeedStep.


В состоянии простоя результат, показываемый A8-3800, выглядит очень неплохо. Этот процессор среди всех участников тестирования имеет самое большое число транзисторов, но проигрывает по экономичности только лишь Athlon II X4. Похоже, что внедрённое AMD отключение неиспользуемых блоков процессора от линий питания действительно работает.


Ещё более впечатляюще выглядит потребление, если вычислительная нагрузка ложится только на одно ядро. Тут система на базе A8-3800 может похвастать минимальным уровнем потребления.


При максимальной загрузке процессорных ядер работой платформа Lynx с процессором A8-3800 потребляет больше конкурирующих систем. Но, тем не менее, мы видим реальное сокращение энергетических аппетитов по сравнению с процессорами AMD прошлого поколения. И это весьма отрадный факт, открывающий Llano дорогу не только в экономичные системы, но и в мобильные компьютеры.

Производительность интегрированного графического ядра


При использовании в системе со внешней графикой результаты Llano оптимизма не вселяют. И дело даже не в том, что A8-3800 проигрывает Core i3-2100 в большинстве случаев. Главное разочарование заключается в том, что Llano оказался медленнее Athlon II X4.

Однако это не диагноз. Всё-таки Llano — не обычный процессор, а APU, который помимо традиционных вычислительных ядер включает и графическое ядро. Очевидно, что отключение этого ядра делает Llano малоинтересным предложением, но ведь существует и другая модель его использования — с задействованием интегрированной графики. Именно исследованию этой модели и будет посвящена вторая часть нашего тестирования, в которой мы посмотрим на графическую производительность APU в игровых тестах и приложениях, знакомых с концепцией Fusion.

Для получения полного представления о производительности графической части Llano производительность системы на базе A8-3800, использующей встроенное графическое ядро Radeon HD 6550D, сравнивалась со скоростью этой же платформы, но снабжённой различными внешними графическими картами нижнего ценового диапазона: Radeon HD 5570, Radeon HD 6450 и Radeon HD 6570. Кроме того, в тестах приняли участие системы, использующие интегрированную графику, но построенные на интеловских процессорах Core i3-2100 и Core i3-2105. Эти CPU аналогичны по характеристикам, но оборудованы разными версиями графики — Intel HD Graphics 2000 и Intel HD Graphics 3000. И в дополнение к перечисленному, мы заодно протестировали работу технологии AMD Dual Graphics, объединив в CrossFire-массив встроенное в A8-3800 графическое ядро с видеокартой Radeon HD 6570 и получив в итоге комбайн Radeon HD 6630D2.

Тесты в игровых приложениях выполнялись в двух режимах: в разрешении 1280x800 при установке низкого качества графики и в разрешении 1680x1050 при установке среднего уровня качества. Если в этих режимах A8-3800 показывал хороший уровень производительности, тестирование проводилось и в разрешении 1920x1080 с установкой высокого качества изображения.

3DMark Vantage






Популярный среди геймеров тест сразу же расставляет всё по своим местам. Если в тестах с дискретной графикой A8-3800 и смотрелся неубедительно, то встроенное в него графическое ядро Radeon HD 6550D полностью перечёркивает первое впечатление. Интегрированная система на базе Llano существенно опережает интеловские графические ядра, еще совсем недавно вызывавшие восторженные отзывы благодаря своей производительности, и вплотную приближается к результату 60-долларовой видеокарты Radeon HD 5570.

3DMark 11








Ещё одно преимущество Llano перед конкурирующими интегрированными решениями — это поддержка встроенной графикой Radeon HD 6550D DirectX 11. Поэтому, с прохождением теста 3DMark 11 у системы на базе A8-3800 не возникает никаких проблем, чего нельзя сказать об интеловских решениях.

Параллельно хочется обратить внимание ещё на одну особенность — результат процессорного теста A8-3800 при использовании внешней графики оказывается выше, чем в случае использования встроенного GPU. Разгадка этого феномена кроется в реализации технологии Turbo Core. Активизация интегрированного Radeon HD 6550D уменьшает «тепловой» бюджет, отводимый на вычислительные x86-ядра, в результате чего турбо-режим включается реже, чем когда встроенный GPU полностью неактивен.

Alien vs Predator (2010)




Ещё одна DirectX 11 игра, не работающая на интеловских интегрированных системах. Зато A8-3800 смотрится очень неплохо, серьёзно превосходя Radeon HD 6450. Заметьте, скорость встроенного ядра Radeon HD 6550D близка к результатам внешнего прообраза этого ядра — Radeon HD 5570. Однако отсутствие независимой видеопамяти всё-таки сказывается на производительности и о паритете между Sumo и Redwood речь не идёт.

Неплохо работает и конфигурация Dual Graphics. Этой технологии удаётся бесплатно поднять производительность видеокарты Radeon HD 6570 почти на 50 %.

Dirt 3






Эта игра поддерживает DirectX 11, но на интеловской графике по понятным причинам работает через DirectX 9. Впрочем, это совершенно не спасает даже старшую версию Intel HD Graphics 3000 от разгрома. Предлагаемое AMD графическое ядро процессора A8-3800 быстрее примерно вдвое.

Процессоры Llano устанавливают для интегрированных графических решений новые стандарты производительности. Весьма показательно, что эта красочная современная игра может приемлемо работать на платформе Lynx даже в Full HD-разрешении и при высоком качестве изображения.

Far Cry 2






A8-3800 хорошо справляется с графической нагрузкой в Far Cry 2. Тем не менее, данная игра весьма требовательна к пропускной способности видеопамяти, поэтому отставание встроенного видеоядра Radeon HD 6550D от его дискретного аналога достигает 20 %.

Left 4 Dead 2






Эта достаточно старая игра поддерживает только DirectX 9, а потому конфигурация Dual Graphics тут не работает. Выражается это в том, что мы получаем даже более низкую производительность, чем при использовании одиночной внешней видеокарты.

Lost Planet 2




Игра поддерживает DirectX 11, но интеловская графика работает через DirectX 9. Возможно, поэтому в разрешении 1680х1050 система с Core i3-2105 умудряется выдать большее число fps, чем платформа с процессором A8-3800.

Mafia 2




Mafia 2 нельзя назвать старой игрой, однако она использует лишь DirectX 9, что тут же становится понятно по низкому результату асимметричной CrossFire-конфигурации. В остальном же интегрированная система AMD нареканий не вызывает. Как и положено, она более чем вдвое превосходит систему с процессором Core i3-2105 и графическим ядром Intel HD Graphics 3000 и почти «дотягивает» до результата видеокарты Radeon HD 5570.

Metro 2033




Metro 2033 поддерживает несколько путей рендеринга, мы в тестах использовали DirectX 10. В этом случае Intel HD Graphics и Radeon HD 6550D находятся в равных условиях, а технология Dual Graphics должна нормально работать. Но что-то в драйвере AMD не заладилось, и Dual Graphics дала лишь минимальное преимущество в разрешении 1680х1050. Впрочем, система с одним APU A8-3800 работает замечательно: Intel HD Graphics 3000 остаётся далеко позади.

Starcraft 2




Уникальность Starcraft 2 заключается в том, что эта игра создаёт очень серьёзную нагрузку на процессор. Поэтому тут всё выглядит совсем не так, как в других играх. Более высокая вычислительная производительность процессоров Sandy Bridge позволяет системам на их основе опередить интегрированную платформу на базе A8-3800 в минимальном разрешении. Впрочем, при переключении на среднее качество картинки и 1600х1050 результаты Llano возвращаются в привычное русло. Но вот у Dual Graphics в Starcraft 2 вновь проблемы. Как видим, эта технология к ускорению графики подходит очень выборочно, и данная игра не попала в число «удачных» вариантов.

Tom Clancy's H.A.W.X. 2






Соотношение результатов между Intel HD Graphics 3000 и Radeon HD 6550D совершенно привычно. Времена, когда интеловское графическое ядро казалось превосходным, закончились, и теперь лидерство в сфере интегрированного видео перехватывает AMD. Однако не всё хорошо и в «красном» лагере. Dual Graphics вновь не работает — и это, к сожалению, приходится констатировать слишком часто на протяжении всего тестирования. Так что хотя эта технология выглядит многообещающе, в реальности работает она не очень гладко.

Приложения GPGPU

Тестируя возможности нового APU компании AMD, мы не могли обойти стороной те приложения, которые используют возможности графического движка не для вывода 3D-графики, а для вычислений. Тем более что в этом и заключается суть концепции Fusion — потоковые процессоры GPU должны быть вовлечены в вычислительную работу и должны вносить свой вклад в увеличение общего быстродействия APU.

Для начала мы вновь воспользовались синтетическими тестами из SiSoftware Sandra 2011. Этот пакет предлагает в том числе и измерение вычислительной производительности шейдеров, используя программные интерфейсы OpenCL и DirectCompute. Встроенная в Llano графика поддерживает оба интерфейса, и с этим нет никаких проблем. Что касается процессоров Sandy Bridge, то Intel не даёт доступа к вычислительным ресурсам графического ядра, поэтому в интеловских системах соответствующие вычисления выполняются x86-ядрами.




Вот именно ради таких результатов AMD и ввязалась в продвижение концепции Fusion. Графическое ядро прекрасно приспособлено для параллельных вычислений, и потому его включение в обработку данных может стать хорошим подходом к повышению производительности.

Но то был синтетический тест, целенаправленно нагружающий потоковые процессоры. Гораздо же интереснее посмотреть на то, какие результаты может дать использование APU в реальных приложениях. Маркетинговый отдел AMD непрерывно возвещает о том, что число адаптированных под APU приложений неуклонно растёт. Что это за приложения — можно посмотреть в специальном разделе корпоративного сайта. Честно говоря, список этот нельзя назвать особенно впечатляющим, но среди перечисленных программ есть несколько интересных наименований. Их мы и выбрали для ознакомления с тем, насколько APU работает лучше традиционных CPU в оптимизированной среде.

В первую очередь — тест на скорость транскодирования HD-видео, выполняемый в Cyberlink MediaEspresso 6.5. Эта утилита может использовать движок UVD3 для декодирования и потоковые процессоры для ускорения кодирования видео. Вместе с этим на интеловских процессорах она способна пользоваться технологией Quick Sync.


Хорошая новость заключается в том, что встроенное в A8-3800 графическое ядро Radeon HD 6550D может стать хорошим подспорьем при транскодировании видео. Включение его мощностей в дополнение к вычислительным x86-ядрам уменьшает время перекодирования почти вдвое. Однако есть и плохая новость. Производительность A8-3800 в режиме с использованием потоковых процессоров графического ядра дотягивает лишь до скорости Core i3-2100 без использования Quick Sync. Включение же интеловского аппаратного кодера приводит к тому, что APU компании AMD с Core i3-2100 конкурировать не может.

Среди приложений, оптимизированных для APU, AMD называет Microsoft Internet Explorer 9. Он действительно может использовать силы графических ядер для отображения веб-страниц и исполнения JavaScript и HTML5 кода. Однако что на счёт реальной производительности? Для получения её численных характеристик мы воспользовались двумя специализированными тестами. Futuremark Peacekeeper, который ориентирован в первую очередь на тестировании скорости при работе с JavaScript, и новым HTML5-тестом Stimulant WebVizBench.




При отображении HTML5-страниц производительность A8-3800 оказывается в промежутке между Core i3-2100 и Core i3-2105. И это можно назвать неплохим результатом на фоне того, что в JavaScript-тесте предложение AMD с треском проигрывает даже Core i3-2100.

Развивая тему об оптимизации APU для интернет предложений, AMD сообщает нам и о приспособленности для Fusion последних версий Flash-плеера. То, что он умеет использовать движок UVD3 для ускорения воспроизведения видео, мы знаем уже давно. Но как обстоит дело с другими приложениями? Ответить на этот вопрос нам поможет многопользовательская онлайновая танковая аркада Tanki Online, построенная на одном из самых продвинутых 3D Flash-движков Alternativa3D. Тестирование проводилось с использованием Adobe Flash Player 10.3.181.34.


Мощности графического процессора тут действительно нагружаются даже несмотря на то, что десятая версия Flash не использует видеокарту для отображения 3D-графики. Однако APU компании AMD это помогает не сильно. Процессоры Core i3-2100 и Core i3-2105 обгоняют A8-3800 примерно на 30 %.

Ещё одно приложение, в котором, по мнению AMD, эффективно используются мощности графического ядра — это Windows Live Movie Maker 2011. Мы провели тест по созданию в нём небольшого HD-видеоролика — компиляции из фрагментов видео, изображений и музыкального ряда.


Графическое ядро A8-3800 тут действительно нагружается, но та же самая задача решается на процессорах Core i3 куда быстрее, так как они располагают весьма полезным при работе с видео специализированным аппаратным кодером Quick Sync.

И, завершая поиски приложений, в которых гибридный процессор Llano может выступить во всей своей красе, мы протестировали скорость в ещё одной утилите — ArcSoft Panorama Maker 5 Pro. Она предназначена для склейки панорам из нескольких фотографий. Именно такой и была наша тестовая задача, на примере которой мы измерили производительность.


APU тут тоже поддерживается в полной мере, нагрузка на графические ядра видна, но Core i3, вновь показывает существенно лучший результат, работая исключительно своими x86-ресурсами.

Таким образом, хотя нам удалось найти немало реальных приложений, которые действительно используют APU «по полной программе», в реальности это не приносит желаемого эффекта. Серьёзного скачка в быстродействии не наблюдается, и интеловские CPU семейства Core i3, решающие аналогичные задачи одними лишь x86-ядрами, в большинстве случаев остаются недосягаемы для процессора AMD Llano.

Тем не менее, отрицать заложенный в Llano потенциал не следует. На примере синтетических тестов мы видим, что вычислительная мощность графического ядра Radeon HD 6550D весьма велика. Так что будем надеяться, что появление программ, которые смогут получить серьёзный выигрыш от концепции Fusion, ещё впереди. А на сегодня единственная реальная задача, в которой Llano наверняка окажется сильно быстрее Core i3 благодаря потоковым процессорам графического ядра, это — подбор (взлом) паролей по известной хеш-функции.

Энергопотребление


Энергопотребление Llano в системе со внешней графической картой уже было измерено, однако теперь подошло время узнать, как покажет себя с этой точки зрения интегрированная система на базе A8-3800. Условия и методология измерений остались теми же.


В состоянии бездействия A8-3800 очень экономичен. Базирующаяся на нём система потребляет существенно меньше, чем система с Core i3 в основе.


При нагрузке на x86-ядра картина меняется. Core i3 способен в этом случае похвастать не только более высокой производительностью, но и меньшим энергопотреблением. В защиту же A8-3800 следует сказать, что система на его основе выглядит тоже неплохо, её энергетические аппетиты весьма умеренны.


Графическая нагрузка приводит к тому, что разница между потреблением процессоров Core i3 и A8-3800 становится сильно заметна, причём явно не в пользу новинки. Но не забывайте, производительность графического ядра Radeon HD 6550D примерно в два раза выше быстродействия Intel HD Graphics 3000.


Вместе с этим A8-3800 выглядит как довольно неплохой вариант для медиацентра. При воспроизведении видеоконтента его потребление не хуже энергопотребления процессоров Core i3. Всё это говорит о том, что применённые в Llano энергосберегающие технологии очень эффективны при небольшой частичной нагрузке.

Разгон


Платформа Lynx не предназначена для оверклокеров — это AMD даёт понять сразу. Среди процессоров Llano нет и не будет модификаций Black Edition c разблокированным множителем. Все процессоры этого семейства имеют жёстко зафиксированные коэффициенты умножения для формирования частоты процессорных ядер и для частоты графического ядра. Не работает с Socket FM1-процессорами и утилита AMD Overdrive.

Однако полностью возможностей разгона это не отменяет. Socket FM1-материнские платы не лишены инструментов для изменения частоты базового тактового генератора, и этим свойством можно пользоваться для увеличения тактовой частоты процессора. Но надо иметь в виду, что этот тактовый генератор в равной мере влияет на частоты всех составляющих системы. Поэтому, увеличение базовой частоты выше штатных 100 МГц приводит к одновременному и пропорциональному разгону процессора, графического ядра, частоты памяти и частот внешних интерфейсов системы. Единственный же подверженный изменению в Llano множитель — это тот, что отвечает за частоту работы памяти, он может принимать значения из диапазона 10,66, 13,33, 16 и 18,66.

Именно здесь и скрывается основная проблема. Увеличение частоты тактового генератора достаточно быстро натыкается на проблемы с детектированием и работой SATA-или USB- устройств. И именно этот фактор, а не возможности процессора, ограничивают разгон. Судя по имеющимся данным, максимальная частота базового тактового генератора, при которой можно надеяться на стабильную работу системы, не превосходит 120 МГц. Однако после прохождения 133-мегагерцового рубежа большинство материнских плат переключают делители для формирования частот внешних интерфейсов, поэтому в промежутке 133-150 МГц может существовать ещё один «островок работоспособности». При этом, подмножество частот тактового генератора, при которых система нормально функционирует при разгоне, может зависеть как от набора дополнительных контроллеров на материнской плате, так и от состава дисковой подсистемы и, например, с некоторыми SSD-носителями оно способно оказаться существенно уже.

Мы попробовали разогнать имеющийся в нашей лаборатории процессор A8-3800, используя материнскую плату Gigabyte GA-A75-D3H. Максимальная частота тактового генератора, при которой система сохраняла способность к стабильному функционированию, в нашем случае составила 146 МГц.

Таким образом, процессор разогнался до частоты 3,5 ГГц, а частота графического ядра пропорционально возросла со штатных 600 МГц до 876 МГц. Что касается памяти, то для неё удалось задействовать множитель 13,33, что позволило тактовать её в режиме DDR3-1946. Устойчивая работа системы в таком состоянии была подкреплена увеличением напряжения на процессоре на 0,175 В.


Описанный разгон вылился в достаточно существенный прирост быстродействия. Если опираться на результаты 3DMark 11, то можно констатировать, что скорость работы встроенной в A8-3800 графики доросла до уровня Radeon HD 6570, а вычислительная производительность увеличилась примерно на 40 %.

С разгоном Socket FM1 связан и курьёзный момент. Как оказалось, BIOS некоторых материнских плат имеет настройку для повышения множителей процессоров и независимую настройку для частоты графического ядра. Опции эти на самом деле не работают, но некоторые диагностические утилиты, например популярная программа CPU-Z, берут значение множителя напрямую из BIOS. Поэтому системы на базе Llano позволяют легко получать сколь угодно впечатляющие скриншоты про покорение этими процессорами самых невероятных рубежей. Однако вопреки показаниям CPU-Z реальный множитель у Llano не меняется, а действительная частота процессора и графического ядра зависит только от частоты базового тактового генератора.

Выводы


В первую очередь следует напомнить, что Llano — это не столько новые процессоры для десктопов, сколько решение, позволяющее, наконец, AMD уверенно заявить о себе на рынке мобильных компьютеров. Однако сегодня нам предъявили именно вариант для настольных систем, а вот с этой позиции Llano оставляет двойственное впечатление.

Если посмотреть на него просто как новый процессорный продукт AMD, приходящий на смену Phenom II и Athlon II, то энтузиазма он совершенно не вызывает. Конечно, в приложениях, хорошо оптимизированных под многопоточность, четыре вычислительных ядра процессоров A8 могут вывести их вперёд Core i3, однако утешение это слабое. Дело в том, что в системах с дискретной графикой Llano работает определённо хуже своих предшественников серии Athlon II X4. Процессоры Llano продолжают использовать x86-ядра с микроархитектурой K10 образца 2007 года, и сделанные в них улучшения — это лишь «косметический ремонт», в то время как давно назрела необходимость тотальной перестройки. Более того, в погоне за приемлемыми значениями TDP AMD пришлось дополнительно снижать тактовые частоты, а призванная компенсировать этот шаг технология Turbo Core со своей задачей не справляется. Нет возможности поправить эту ситуацию и через оверклокинг. Разгоняются Llano не лучшим образом, да и само строение платформы Lynx разгону не потворствует.

К счастью, Llano — это не традиционный CPU, а APU, в состав которого входят не только х86-ядра, но и быстродействующее графическое ядро. И благодаря этой особенности на Llano можно посмотреть совсем под другим углом. Встроенная в этот процессор графика — не просто самое быстрое на рынке интегрированное решение. Она превосходит Intel HD Graphics 3000 примерно в два раза и способна показать 3D-производительность на уровне видеокарт стоимостью 50-60 долларов. При этом Llano может похвастать и неплохой энергоэффективностью (в особенности это касается моделей с TDP 65 Вт), что делает интегрированные системы на его основе отличным вариантом для домашних игровых компьютеров начального уровня или для производительных HTPC.

Так что в конечном итоге вопрос о целесообразности использования Llano в той или иной системе будет решаться исходя из того, что вы хотите получить в итоге. Если на первом месте стоит игровая производительность, но вы не готовы тратиться на видеокарту среднего или верхнего уровня, то вряд ли можно найти вариант лучше процессоров серии AMD A8. Тем более, что существует по меньшей мере две возможности добиться дополнительного улучшения быстродействия графической части этого процессора с минимальными затратами. Во-первых, разгон, а, во-вторых, технология Dual Graphics, позволяющая объединить графику из APU с недорогой внешней видеокартой в асимметричный CrossFire-массив.

Однако если вам необходима платформа с высокой вычислительной мощностью, то тут Llano ничего хорошего предложить не может. И в этом случае переплачивать за встроенное в этот APU высококачественное графическое ядро нет никакого смысла. Несмотря на то, что концепция Fusion декларирует возможность использования потоковых процессоров из графического ядра APU для вычислений и ускорения работы общеупотребительных приложений, пока на практике это не работает или работает, но недостаточно хорошо.

Впрочем, этот вердикт не окончательный, идея APU в принципе жизнеспособна, и она ещё вполне может засиять с новой силой. Сейчас внедрение гибридных процессоров находится на начальном этапе, и через пару-тройку лет ситуация может измениться кардинально. Но тогда править бал будут уже APU будущих поколений, а Llano в этом эволюционном процессе отведено место локомотива, при поддержке которого концепция Fusion должна овладеть умами пользователей и разработчиков программного обеспечения.

Другие материалы по данной теме


На счету — каждый ватт: AMD E-350 против Intel Core i3-2100T
Обзор платформы AMD Brazos и процессора AMD E-350 (Zacate)
Обзор процессоров Pentium G850, Pentium G840 и Pentium G620