DDR3 SDRAM для Sandy Bridge: какая память лучше?

Автор: Gavric
Дата: 12.05.2011
Все фото статьи

Введение


Принято считать, что частота работы и задержки памяти в современных системах оказывают небольшое влияние на итоговую производительность. И вкладываться в приобретение высокоскоростных модулей памяти имеет смысл только в том случае, если быстродействие других компонентов — процессора, видеокарты, жёсткого диска — уже доведено до предела. Такое суждение родилось не на пустом месте. Действительно, тесты показывают, что максимум, который можно отвоевать улучшением параметров подсистемы памяти в платформах на базе процессоров Phenom II, Core i7 или Core i5, это — лишь незначительная прибавка к быстродействию, в пределах 3—7 процентов.

Однако подобные выводы были сделаны давно и поэтому относятся в первую очередь к платформам прошлого поколения. Полноценного исследования о влиянии скорости работы подсистемы памяти на общую производительность конкретно в современных LGA1155-системах мы до сих пор не проводили. Переносить же старые результаты на новые платформы, базирующиеся на процессорах семейства Sandy Bridge, очевидно, не совсем корректно. Ещё во время первого знакомства с этой новаторской микроархитектурой мы отмечали, что реализация контроллера памяти в Sandy Bridge существенно отличается от его исполнения в более ранних процессорах класса Westmere и Nehalem. В частности, теперь контроллер памяти находится в разных функциональных блоках с L3-кэшем, а для его связи с вычислительными ядрами используется новая кольцевая шина. Всё это могло повлиять на роль подсистемы памяти в общей производительности системы как угодно. Поэтому мы решили провести специальное тестирование, в рамках которого посмотреть, какая же память оптимальнее всего подходит для LGA1155-процессоров.

Особенности контроллера памяти


Формально процессоры семейства Sandy Bridge имеют такие же характеристики контроллера памяти, как и их предшественники. Производителем декларируется совместимость с двухканальной DDR3-1066/1333 SDRAM, общий объём которой может достигать 32 Гбайта. При этом, как и ранее, допускается применение одного или двух небуферизованных модулей памяти в каждом канале. Технология ECC для процессоров, ориентированных на десктопы, не поддерживается. Нет изменений с одноканальным и асимметричным режимами — идентичность количества и характеристик модулей в каждом канале не требуется, но максимальная производительность достигается в том случае, если в системе применяется чётное число одинаковых модулей DDR3 SDRAM.


Несмотря на то, что внешне характеристики контроллера памяти Sandy Bridge выглядят так же как и у более ранних контроллеров памяти, использующихся в LGA1156-процессорах, внутри он устроен совершенно иначе. Напомним, в первых носителях микроархитектуры Nehalem контроллер памяти и L3-кэш объединялись в едином функциональном узле Uncore, который работал на собственном напряжении и с собственной частотой, и соединялся с вычислительными ядрами перекрёстной шиной. Позднее, с выходом процессоров Westmere, контроллер памяти был объединён с графическим ядром процессора и вообще находился на отдельном (относительно вычислительных ядер) полупроводниковом кристалле. В Sandy Bridge внутренняя структура процессора вновь кардинально изменилась, в обиход вошла связывающая все блоки кольцевая шина, а кэш-память третьего уровня стала самостоятельной функциональной единицей. В результате, контроллер памяти окончил своё скитание по различным частям процессора, стал самостоятельным блоком и нашёл своё пристанище рядом с System Agent.


Эта реорганизация отразилась на скорости работы подсистемы памяти самым положительным образом. Контроллер памяти, если можно так выразиться, «приблизился» к вычислительным ядрам. Теперь он не только находится на едином с ними и с L3-кэшем полупроводниковом кристалле, но и не отделён от них логически, так как подключен к той же самой кольцевой шине, которая выступает главным связующим звеном для всех внутрипроцессорных компонентов. Такое подключение к работающей на частоте процессора кольцевой шине обеспечило значительное увеличение пропускной способности магистрали на участке между процессорными ядрами, L3-кэшем и контроллером памяти.

Рост скорости работы памяти в системах с процессорами поколения Sandy Bridge хорошо виден на практике. Для иллюстрации, с помощью распространённых синтетических тестов AIDA64 Cachemem и MaxxMem2 мы измерили практическую пропускную способность и латентность подсистемы памяти в платформах с LGA1156- и LGA1155-процессорами. В тестах использовались процессоры Lynnfield (микроархитектура Nehalem), Clarkdale (микроархитектура Westmere) и Sandy Bridge, работающие на одинаковой частоте 3,2 ГГц и оснащённые одинаковой двухканальной DDR3-1333 SDRAM с таймингами 7-7-7-21.








Как видим, Sandy Bridge не просто исправляет недостатки микроархитектуры Westmere, где скорость контроллера памяти стала чуть ли не главным разочарованием, но и идёт ещё дальше. С точки зрения практических показателей контроллер памяти Sandy Bridge стал даже быстрее, чем в процессорах Lynnfield, а ведь до недавних пор именно контроллер Lynnfield заслуженно считался самым эффективным в индустрии. Особенно серьёзный выигрыш виден в пропускной способности, что вполне закономерно, учитывая подключение контроллера памяти напрямую к кольцевой шине Sandy Bridge. Таким образом, влияние скорости памяти на производительность в LGA1155-системах может оказаться куда существеннее, чем в платформах прошлого поколения, ведь на магистрали между вычислительными ядрами и собственно памятью стало меньше узких мест.

Частоты DDR3 и её разгон


Преимущество нового контроллера памяти заключается не только в повысившейся эффективности. В процессорах семейства Sandy Bridge Intel значительно расширила число фактически поддерживаемых частот памяти. Несмотря на официальную поддержку лишь DDR3-1066 и DDR3-1333 SDRAM, контроллеры памяти процессоров Core могут тактовать память и на более высоких частотах — и это далеко не новость. Например, процессоры серии Core i7 в LGA1156-исполнении предлагают настройки, позволяющие использовать DDR3-1600 SDRAM, а оверклокерские процессоры Core i7-875K и Core i5-655K могут устанавливать на памяти и большие частоты. В LGA1155-процессорах, относящихся к семейству Sandy Bridge, число доступных частот памяти было расширено за номинальные величины не только за счёт поддержки DDR3-1600, но и далее. Любыми процессорами Core i3, Core i5 и Core i7 в LGA1155-исполнении неофициально поддерживается также DDR3-1866, DDR3-2133 и DDR3-2400 SDRAM.


Частота памяти в процессорах Core задаётся как произведение частоты базового тактового генератора (BCLK) на соответствующий коэффициент. Множество доступных коэффициентов для каждого типа процессоров и определяет диапазон частот памяти, который доступен для той или иной разновидности процессоров. В Sandy Bridge это множество по сравнению с предшествующими процессорами увеличено. Поэтому в LGA1155-системах настройка BIOS, отвечающая за выбор частоты памяти, выглядит следующим образом.


Впрочем, не следует забывать о том, что в новых LGA1155-системах мы лишились возможности разгона системы через наращивание частоты базового генератора. Из-за изменений, внесённых в схему тактования компонентов LGA1155 систем, частота BCLK подвержена лишь незначительному изменению — в большинстве случаев при её увеличении со штатных 100 МГц более чем на 5 % стабильность системы нарушается. Это значит, что если ранее, в LGA1156-системах, при увеличении BCLK одновременно с процессором разгонялась и память, то в LGA1155-платформах такого пути нет. Теперь разгон сведён к манипулированию множителями, и поэтому появление в процессорах Sandy Bridge широкого диапазона настроек для частоты DDR3 SDRAM вполне закономерно. Intel таким образом сохраняет лазейку для использования оверклокерских модулей. То есть, ранее для работы памяти на высоких частотах требовалось разгонять и процессор, а теперь для задействования высокоскоростных комплектов DDR3 SDRAM разгонять процессор вовсе не обязательно. Не нужны даже и оверклокерские модификации CPU со свободным коэффициентом умножения — доступ к включению режимов вроде DDR3-1866 или DDR3-2133 есть в любом LGA1155-процессоре.

При этом для достижения стабильной работы Sandy Bridge с памятью на высоких частотах никаких особенных ухищрений не требуется. Если сама установленная в системе память способна работать на какой-либо частоте с какими-то задержками, то кроме установки этой частоты и этих таймингов в BIOS не требуется ровным счётом ничего. Контроллер памяти надёжно функционирует при любых доступных настройках на своём штатном напряжении. Разве только для достижения лучшей стабильности при работе с DDR3-2400 рекомендуется немного увеличить напряжение на System Agent (VccSA), но не более чем до 1,2 В. Что же касается напряжения на самих модулях памяти, то тут остаются в силе те же рекомендации, что и для других процессоров класса Nehalem. Повышение этого напряжения выше 1,65 В не рекомендуется, так как потенциально может привести к повреждению контроллера памяти процессора.

Как мы тестировали


Процессоры Sandy Bridge открывают широкое поле для экспериментов с системной памятью. Использовать скоростные модули DDR3 SDRAM можно даже в тех LGA1155-системах, которые на разгон не рассчитаны, и где процессор функционирует в штатном режиме. Поэтому исследование влияния скорости работы памяти на производительность мы провели дважды. В системе, работающей в штатном режиме, и в системе с разогнанным процессором. И хотя отличие между разогнанными и неразогнанными процессорами Sandy Bridge состоит лишь в используемом множителе, скорость системной памяти может оказывать в этих случаях различное влияние на общее быстродействие. Оверклокинг увеличивает потребность процессора в обрабатываемых данных, поэтому в производительных системах высокая скорость памяти может играть более значимую роль. Кроме того, увеличение частоты CPU приводит и к росту пропускной способности внутрипроцессорной кольцевой шины, в результате чего с разгоном увеличивается и эффективность работы контроллера памяти.

Для проверки высказанных гипотез мы вооружились LGA1155-системой на базе четырёхъядерного процессора Core i5-2500K, относящегося к оверклокерской K-серии и обладающего свободным коэффициентом умножения. Эту систему мы дополнили DDR3-2133 SDRAM модулями GeIL EVO ONE PC3-17000, способными к работе с широким диапазоном частот и задержек. Таким образом, тестовая система включала следующий набор компонентов:

Процессор: Intel Core i5-2500K (Sandy Bridge, 4 ядра, 3,3 ГГц, 6 Мбайт L3);
Процессорный кулер: Thermalright Ultra-120 eXtreme с вентилятором Enermax Everest;
Материнские платы: ASUS P8P67 Deluxe (LGA1155, Intel P67 Express);
Память: 2 x 2 Гбайта, DDR3 SDRAM, GeIL EVO ONE PC3-17000 (GE34GB2133C9DC);
Графическая карта: ATI Radeon HD 6970.
Жёсткий диск: Kingston SNVP325-S2/128GB.
Блок питания: Tagan TG880-U33II (880 Вт).
Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
Драйверы:

Intel Chipset Driver 9.2.0.1025;
Intel Rapid Storage Technology 10.1.0.1008;
ATI Catalyst 11.3 Display Driver.

При тестах в номинальном состоянии технологии интерактивного управления тактовой частотой процессора — Turbo Boost и Intel Enhanced SpeedStep — оставались активны.

При тестах с разогнанным процессором технология Turbo Boost отключалась, но Intel Enhanced SpeedStep — продолжала работать. Частота же самого процессора устанавливалась равной 4,7 ГГц.


Память тестировалась в следующих режимах, соответствующих характеристикам наиболее популярных комплектов DDR3 SDRAM:

DDR3-1066 CL7 (7-7-7-21-1T);
DDR3-1333 CL9 (9-9-9-27-1T);
DDR3-1333 CL7 (7-7-7-21-1T);
DDR3-1600 CL9 (9-9-9-27-1T);
DDR3-1600 CL8 (8-8-8-24-1T);
DDR3-1600 CL7 (7-7-7-21-1T);
DDR3-1866 CL9 (9-9-9-27-1T);
DDR3-1866 CL8 (8-8-8-24-1T);
DDR3-2133 CL10 (10-10-10-30-1T);
DDR3-2133 CL9 (9-9-9-27-1T).

Производительность



Синтетические тесты подсистемы памяти

В первую очередь мы уделили внимание синтетическим тестам подсистемы памяти. Оценка реальной пропускной способности и латентности была проведена с использованием встроенного в утилиту AIDA64 теста Cachemem.








Полученные результаты позволяют подметить несколько интересных фактов. Во-первых, сразу следует отметить значительное различие в практических скоростях работы подсистемы памяти при использовании модулей с различной частотой и таймингами. Простое увеличение скорости работы DDR3 SDRAM с 1067 до 2133 МГц вызывает гигантский рост практической пропускной способности, достигающий 60 %. В системах, основанных на других процессорах, столь сильного эффекта мы ещё не наблюдали, и это явно указывает на то, что в Sandy Bridge на магистрали между вычислительными процессорными ядрами и системной памятью действительно нет никаких серьёзных узких мест.

Во-вторых, весьма симптоматично, что от частоты работы модулей памяти зависит не только скорость чтения, но и скорость записи. Системы, использующие процессоры предыдущих поколений, такой зависимости не обнаруживали вообще, либо она была совсем слабой. Эта особенность контроллера Sandy Bridge будет вносить дополнительный вклад в рост производительности системы при увеличении частоты памяти.

В-третьих, следует сказать о том, что более существенное влияние на скорость работы подсистемы памяти оказывает частота модулей DDR3, а не их задержки. Фактически, низкие задержки позволяют получить лишь слегка более низкую практическую латентность, но простое увеличение частоты памяти на один 266-мегагерцовый шаг с лихвой перекрывает эффект от снижения таймингов.

Исходя из этого, можно утверждать, что использование оверклокерской памяти в системах LGA1155 смысл, безусловно, имеет. Но предпочтение следует отдавать в первую очередь не низким таймингам, а высокой частоте. Впрочем, пока речь идёт лишь о результатах синтетических тестов, целенаправленно оценивающих именно скорость работы процессора с памятью.

Общая производительность: PCMark Vantage, 3DMark 11


Для оценки средневзвешенной производительности платформы тест PCMark Vantage измеряет скорость работы реальных алгоритмов, широко используемых пользователями в повседневной деятельности. И здесь мы уже не видим столь разительного разрыва в быстродействии систем, оснащённых памятью с разными характеристиками. Увеличение частоты памяти на один шаг в 266 МГц позволяет получить еле заметный прирост производительности, лежащий в пределах 1—2 %. Разница же в скорости систем, оснащённой самой быстрой DDR3-2133 и самой медленной DDR3-1067 памятью составляет 5 % для системы, работающей в штатном режиме, и 6 % — для разогнанной.


Производительность графической подсистемы, по оценкам популярного в широких кругах теста 3DMark 11, можно сказать, вообще от скорости памяти не зависит.

Однако помимо общего показателя производительности графики, 3DMark 11 выдаёт и другое, представляющее в нашем случае интерес, число — рейтинг Physics. Эта характеристика является результатом работы специального физического теста, моделирующего поведение сложной игровой механической системы с большим количеством объектов.


Как оказывается, проводимые в рамках теста интенсивные математические расчёты весьма чувствительны к скорости работы памяти. И простым наращиванием её частоты можно добиться существенного прироста быстродействия, который в общей сложности может доходить до 15—20 %. При этом, заметьте, гораздо сильнее скорость подсистемы памяти влияет на быстродействие в системе с разогнанным процессором. При работе же тестового Core i5-2500K на его номинальной частоте основной рост производительности вообще приходится на диапазон от DDR3-1067 до DDR3-1600. Применение же более быстрых модулей памяти имеет гораздо менее выраженное влияние на результат физического теста.

Производительность в приложениях

Для измерения быстродействия при компрессии информации мы воспользовались архиватором WinRAR, при помощи которого с максимальной степенью сжатия архивировалась папка с различными файлами общим объёмом 1.1 Гбайта.


Различные приложения реагируют на изменение параметров подсистемы памяти по-разному. И хотя в среднем зависимость между производительностью и частотой или таймингами памяти бывает не столь заметна, существуют и совершенно иные случаи. К ним как раз и относится архивация — тут скорость подсистемы памяти трудно переоценить. Показательно, например, то, что разогнанный до 4,7 ГГц Core i5-2500K, но работающий при этом с медленной DDR3-1066 или DDR3-1333 SDRAM, оказывается медленнее, чем неразогнанный процессор, но укомплектованный быстрой DDR3-1866 или DDR3-2133 памятью. Оно и неудивительно, ведь увеличение частоты памяти на 266 МГц влечёт за собой ускорение сжатия данных на 5—10 %. Влияние же таймингов гораздо меньше — их уменьшение или увеличение на один цикл приводит к 2—3-процентному изменению времени архивации.

Измерение производительности в Adobe Photoshop мы проводим с использованием собственного теста, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, включающий типичную обработку четырёх 10-мегапиксельных изображений, сделанных цифровой камерой.


Влияние скорости работы подсистемы памяти на производительность системы при обработке изображений существует, но оно не особо заметно. Даже если сопоставить время прохождения теста с самой медленной и самой быстрой памятью, получится всего лишь 3,5-процентное отличие в системе с неразогнанным процессором и 5,5-процентное — в разогнанной системе.

Для измерения скорости перекодирования видео в формат H.264 используется тест x264 HD, основанный на измерении времени обработки исходного видео в формате MPEG-2, записанного в разрешении 720p с битрейтом 4 Мбит/сек. Следует отметить, что результаты этого теста имеют огромное практическое значение, так как используемый в нём кодек x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч.


Примерно такая же картина, как в Photoshop, наблюдается и при перекодировании видео. Этот процесс также относится к числу нетребовательных к производительности подсистемы памяти.
Тестирование скорости финального рендеринга в Maxon Cinema 4D выполняется путём использования специализированного теста Cinebench.


Похоже, что малая зависимость быстродействия систем от скорости и таймингов подсистемы памяти — типичная ситуация и для платформ, основанных на Sandy Bridge. Впрочем, дело тут скорее не в самой платформе, а в программах — большинство из них не работает с большими массивами данных, и вместительная кэш-память современных процессоров вполне удовлетворяет их нужды в быстром доступе к информации.

Производительность в 3D-играх

В то же время существует целый класс приложений, который использует оперативную память весьма активно, а потому чутко реагирует на изменение её скоростных характеристик. Эти приложения — игры.

Как известно, производительность быстродействующих платформ в подавляющем большинстве современных игр определяется в первую очередь мощностью графической подсистемы. Именно поэтому в данном тестировании мы постарались провести испытания так, чтобы по возможности снять нагрузку с видеокарты. Были выбраны наиболее процессорозависимые игры, а тесты проводились без включения сглаживания и с установкой далеко не самых высоких разрешений. То есть, полученные результаты дают возможность оценить не столько уровень производительности, достижимый в системах с современными видеокартами, сколько то, насколько хорошо тестовые системы с разной памятью проявляют себя с игровой нагрузкой в принципе.






Геймеры, как мы видим, на скорость памяти закрывать глаза явно не должны. Конечно, ситуация в различных играх складывается по-разному, но, в среднем, увеличение частоты памяти на один 266-мегагерцовый шаг увеличивает число fps примерно на 2 % в системе с неразогнанным процессором и на 3—4 % — в системе с разогнанным CPU. Поэтому к выбору подходящей памяти для геймерских компьютеров следует относиться со вниманием. Медленные модули DDR3 SDRAM вполне могут стать в системе тормозом, не дающим раскрыться потенциалу процессора и видеокарты. Тем более что существуют игры (в данном случае это F1 2010), в которых даже простым варьированьем таймингами можно отвоевать один-два лишних fps, не говоря уже о том, насколько заметный прирост быстродействия можно получить увеличением частоты работы модулей памяти.

Выводы


Очередное изменение контроллера памяти, произошедшее с выходом процессоров, построенных на микроархитектуре Sandy Bridge, заслуживает самых лестных оценок. Инженерам Intel удалось не только исправить недостатки контроллера памяти процессоров прошлого поколения Westmere, но и создать контроллер, обладающий наивысшей эффективностью среди всех существующих вариантов. В результате ликвидации всех основных узких мест между вычислительными ядрами и контроллером памяти Sandy Bridge демонстрирует более сильную зависимость от параметров установленных в системе модулей DDR3, нежели предшествующие и конкурирующие CPU.

Но качественно это ситуацию не меняет. Каждый раз, рассуждая о воздействии скорости памяти на общую производительность в тех или иных конфигурациях, мы неминуемо приходили к выводу о том, что влияние это незначительно. Это заключение, сделанное нами ранее для Socket AM3 и для LGA1156 систем, оказывается вновь справедливым. Оно распространяется и на платформы, построенные на процессорах Sandy Bridge, и подтверждается тестами. По их результатам, увеличение частоты работы памяти на 266 МГц приводит к росту среднего быстродействия лишь в пределах 2-4 %. Уменьшение же всех задержек на один цикл способно увеличить производительность ещё меньше — на 1—2%.

Однако это вовсе не означает, что грамотным подбором оперативной памяти для LGA1155 систем можно пренебречь. Незначительный практический эффект от применения более быстрой памяти — это лишь усреднённая картина. В то же время существуют приложения, интенсивно работающие с большими объёмами данных, скорость работы которых от характеристик модулей DDR3 SDRAM зависит гораздо более явно. К таким приложениям, например, относятся некоторые современные игры, в которых благодаря простому апгрейду подсистемы памяти в существующей платформе порой можно выжать несколько дополнительных кадров в секунду.

Такая неопределённость вкупе с достаточно серьёзным разбросом цен на модули DDR3 с разными параметрами не позволяет дать нам однозначные рекомендации по выбору памяти для Sandy Bridge. Но в целом следует учитывать две вещи. Во-первых, частота работы памяти для итоговой производительности значит больше, чем её задержки. Во-вторых, погоня за максимально быстрой памятью приводит к серьёзным дополнительным финансовым затратам, которые в конечном итоге вряд ли способны окупиться. В частности, скоростные модули DDR3-2133 и DDR3-1866 могут стоить в полтора-два раза дороже, нежели ординарная DDR3-1333 память.

Поэтому наиболее разумным вариантом для современных LGA1155 систем представляется недорогая DDR3-1600 SDRAM с неагрессивными таймингами — именно она на наш взгляд обеспечивает наилучшее сочетание между ценой и производительностью.

Другие материалы по данной теме


Kingston LoVo HyperX – память с низким энергопотреблением
Выбираем DDR3-память для платформы LGA1156
Трёхканальные комплекты памяти DDR3-1600 для LGA1366-систем