Clarkdale и скоростная DDR3 SDRAM: а есть ли смысл?

Автор: Gavric
Дата: 21.07.2010
Все фото статьи

Введение


Во время первого же знакомства с новыми двухъядерными LGA1156-процессорами компании Intel, принадлежащими к семейству Clarkdale, мы обратили внимание на неприятные особенности его контроллера памяти. Как показало тестирование, скорость работы с памятью у этих процессоров находится на достаточно низком уровне, что хорошо видно при сопоставлении результатов тестов пропускной способности и латентности подсистемы памяти в аналогичных системах, базирующихся на двухъядерных Core i5 и четырёхъядерных Core i7. Например, тест Everest Memory Benchmark, запущенный на двухъядерном Clarkdale и четырёхъядерном Lynnfield, работающих на одинаковой тактовой частоте, выдаёт следующие числа:


Отставание двухъядерного процессора, выпущенного позднее своего четырёхъядерного собрата с применением более современного 32-нм технологического процесса, более чем заметно. Но, откровенно говоря, оно для нас не является необъяснимым феноменом. Дело в том, что в отличие от четырёхъядерных Lynnfield, двухъядерные процессоры Clarkdale имеют не монолитную структуру, а состоят из двух полупроводниковых кристаллов, размещённых внутри единой упаковки. При этом контроллер памяти относительно вычислительных ядер находится в другом кристалле. Это-то и влечёт за собой замедление работы подсистемы памяти, вызванное возникновением на магистрали процессор-память дополнительной шины QPI, посредством которой кристаллы, входящие в состав Clarkdale, поддерживают между собой связь.


Собственно, именно по указанной причине тонкости функционирования подсистемы памяти в системах на базе двухъядерных Core i3 и Core i5 заслуживают отдельного исследования. Обобщать результаты, полученные ранее в LGA1156-системах, оснащённых четырёхъядерными процессорами, на данный случай явно неправомерно. Именно поэтому мы и решили провести отдельное тестирование, в рамках которого изучить влияние частоты работы и задержек памяти на общую производительность систем с процессорами, относящимися к семейству Clarkdale.

Дополнительную актуальность такому исследованию добавило появление в нашей лаборатории (да и в широкой продаже) оверклокерского разблокированного процессора Core i5-655K, который позволяет не только изменять множитель для формирования тактовой частоты, но и открывает доступ к широкому диапазону режимов работы памяти. В то время как обычные Clarkdale в штатном режиме позволяют эксплуатировать память лишь на скоростях до DDR3-1333, версия процессора со свободным множителем даёт формальную возможность тактования памяти в более скоростных режимах: DDR3-1600, DDR3-1866 и DDR3-2133.


Хочется верить, что доступность высокоскоростных режимов памяти у Core i5-655K позволит хоть как-то компенсировать тормознутось контроллера памяти, ведь именно он зачастую становится узким местом архитектуры процессоров Clarkdale, не давая им раскрыть собственную производительность в полной мере.

GeIL EVO ONE PC3-17000 (GE34GB2133C9DC)


Для тестирования процессора, обладающего контроллером памяти, способным без разгона базового тактового генератора использовать DDR3-2133 SDRAM (в теории), мы постарались найти подходящую память, не испытывающую проблем с работой на столь высоких частотах. Наш выбор пал на DDR3 серии EVO ONE компании GeIL, давно состоящей на хорошем счету у оверклокеров. Избранный нами для тестов комплект памяти с артикулом GE34GB2133C9DC состоял из пары двухгигабайтных модулей, рассчитанных на работу при частоте 2133 МГц с таймингами 9-9-9-27. Сразу же отметим, что это — достаточно редкое предложение на рынке памяти для энтузиастов, поэтому оно вполне заслуживает отдельного рассмотрения.


Хотя поставляются модули GeIL GE34GB2133C9DC во вполне стандартной упаковке, при её вскрытии нас ожидает встреча с памятью весьма нестандартного вида. Оно и неудивительно — работа на высоких тактовых частотах, пусть и без значительного превышения напряжения питания, требует организации продвинутого отвода тепла от чипов — простыми штампованными алюминиевыми пластинами, как установлены на основной массе модулей для энтузиастов, тут явно не отделаешься.


Система охлаждения модулей серии EVO ONE состоит из двух частей. Первая — это достаточно типичные алюминиевые пластины, которые приклеены к чипам клейким ленточным термоинтерфейсом. Вторая часть включает прямую тепловую трубку с нанизанными на неё 25 тонкими рёбрами, развёрнутыми поперёк модуля. Своими краями эта тепловая трубка зажата между пластинами-радиаторами, примыкающими к чипам, поэтому тепло на неё попадает не напрямую, что вызывает некоторые сомнения в высокой эффективности применённого решения. Впрочем, у данной конфигурации системы охлаждения есть один несомненный плюс — она построена так, что легко продувается насквозь воздушным потоком от процессорного кулера.

Среди плюсов памяти EVO ONE следует отметить и её предварительное тестирование, выполненное по технологии DBT (Die-hard Burn-in Technology). Суть этого процесса заключается в том, что модули проходят 24-часовое предпродажное тестирование при существенно повышенном напряжении в условиях увеличенной до 100 градусов температуры окружающего воздуха. Такой подход позволяет производителю с хорошей вероятностью выявлять сбойные чипы, которые могут выйти из строя в течение первого периода эксплуатации, на который приходится большая часть отказов.

Но даже эти весомые преимущества не могут затмить серьезный недостаток модулей памяти GeIL серии EVO ONE — их система охлаждения уж слишком массивна. Высота радиаторов такова, что установить эти модули можно далеко не в каждую систему. Достаточно большая часть производительных процессорных кулеров «нависает» над слотами DIMM, и в таком случае поместиться в слотах DIMM шансов у модулей EVO ONE нет никаких.

Артикул комплекта памяти, а также их все основные характеристики, важные при настройки системы, указаны на стикерах, имеющихся на обоих модулях, входящих в набор. Полные же спецификации GeIL GE34GB2133C9DC выглядят так:

Двухканальный комплект состоит из двух модулей по 2 Гбайта каждый;
Номинальная частота: 2133 МГц;
Тайминги: 9-9-9-27-1T;
Рабочее напряжение 1,65 В.

Иными словами, работоспособна на частоте 2133 МГц рассматриваемая память на привычном напряжении 1.65 В, ставшем негласным стандартом для оверклокерских модулей, направленных на применение в системах с LGA1156 и LGA1366 процессорами.

Модули GE34GB2133C9DC поддерживают профили XMP, в одном из которых продублирована информация из спецификации.


Кроме того, из профилей можно почерпнуть информацию о том, что производитель готов обещать беспроблемное функционирование своего комплекта при задержках 8-8-8-25 на частоте 1900 МГц, а при таймингах 7-7-7-22 — на частоте 1666 МГц. В SPD же, как и водится, занесены настройки, гарантирующие запуск ещё ненастроенной системы.

Безо всяких проблем DDR3-2133 память компании GeIL подтвердила свои высокие характеристики на практике. Используя её в системе с процессором Core i7-860, фигурирующим в наших обзорах DDR3 SDRAM, на плате ASUS P7P55D Premium с набором логики Intel P55 Express, мы смогли добиться стабильного функционирования памяти в режиме DDR3-2214 с таймингами 9-9-9-27-2T. При этом напряжение питания модулей DDR3, как и положено согласно их спецификации и рекомендациям Intel, составляло 1,65 В.


Это — весьма позитивный результат, характеризующий продукт GeIL с самой лучшей стороны. Но вдвойне приятно то, что и при агрессивных таймингах комплект памяти GeIL EVO ONE PC3-17000 тоже не ударяет лицом в грязь. Конкретнее, эта память вполне устойчиво заработала в режиме DDR3-1745 с набором задержек 7-7-7-20-1T.


Причём, как видно из приведённых на скриншоте результатов, в таком режиме производительность подсистемы памяти оказывается лишь немногим хуже, чем при использовании максимальной частоты и «ослабленных» таймингов.

На этом рассказ о замечательных модулях DDR3-2133 компании GeIL вполне можно было бы закончить, если бы не одно но. Вы, наверное, обратили внимание на то, что проверка разгонных способностей памяти GeIL GE34GB2133C9DC была выполнена нами в LGA1156-системе, основанной на процессоре Core i7, который к теме данной статьи относится лишь опосредованно. И сделано это было неспроста. Дело в том, что контроллер памяти процессоров Clarkdale отличается от контроллера памяти, применённого в Lynnfield, не только с точки зрения его расположения в отдельном полупроводниковом кристалле. Как показала практическая проверка, DDR3 при использовании двухъядерных LGA1156-процессоров работает совершенно по-другому — столь же высоких результатов при разгоне памяти, используя процессор семейства Clarkdale, добиться нам не удалось. И, судя по всему, проблема эта носит общий характер — любая скоростная память для энтузиастов при использовании двухъядерных LGA1156-процессоров работает хуже, чем в тех случаях, когда в основе тестовой системы используется четырёхъядерный процессор.

Например, комплект GeIL EVO ONE PC3-17000, изначально предназначенный для работы в режиме DDR3-2133, а по факту способный похвастать стабильным функционированием на частоте свыше 2,2 ГГц, при установке в систему Core i5-655K «скатился» до такого результата:


DDR3-2000 — это тот максимум, который при использовании памяти GeIL GE34GB2133C9DC оказался способен обеспечить Clarkdale. Иными словами, разгон контроллера памяти двухъядерных LGA1156-процессоров таит в себе неожиданные подводные камни, и то, что оверклокерский Core i5-655K позволяет установить для частоты памяти режим DDR3-2133, ещё ничего не значит. Фактически, нам так и не удалось получить практического подтверждения возможности использования такой памяти с этим процессором.

Кстати, как показала дальнейшая практическая проверка, проблемы с контроллером памяти Clarkdale возникают не только при попытке использования скоростной DDR3. Некоторые трудности возможны и при установке агрессивных таймингов, правда, тут уже многое зависит для используемого делителя, формирующего частоту памяти. Тем не менее, тот факт, что контроллер памяти двухъядерных процессоров для LGA1156 систем обладает меньшей гибкостью, чем контроллер памяти в Lynnfield, — налицо.

Описание тестовой системы


Для тестирования был использован стенд со следующей конфигурацией:

Процессор: Core i5-655K (Clarkdale, 2 ядра/4 потока, 3,2 ГГц, 4 Мбайта L3);
Материнская плата: ASUS P7P55D Premium (LGA1156, Intel P55 Express);
Память: 2 x 2 GB, DDR3 SDRAM, GeIL EVO ONE PC3-17000 (GE34GB2133C9DC);
Графическая карта ATI Radeon HD 5870;
Жёсткий диск Western Digital VelociRaptor WD3000HLFS;
Процессорный кулер Thermalright Ultra-120 eXtreme с вентилятором Enermax Everest;
Блок питания: Tagan TG880-U33II (880 Вт);
Операционная система: Microsoft Windows 7 Ultimate x64;
Драйверы:

Intel Chipset Driver 9.1.1.1025;
ATI Catalyst 10.5 Display Driver.

Тест первый: номинальный режим


Первая часть тестирования была посвящена работе системы в номинальном состоянии, когда никакие из аппаратных компонентов не были подвержены разгону. Изменялись лишь множитель, задающий частоту памяти, и её задержки. Следует отметить, что во время этого теста мы пытались смоделировать наиболее типичные условия функционирования платформы, а потому не стали деактивировать какие-либо процессорные технологии. Hyper-Threading, Turbo Mode и Enhanced Intel SpeedStep работали, как им и положено: процессор Core i5-655K представлялся в операционной системе как четырёхъядерный, а его частота при вычислительной нагрузке различной интенсивности повышалась до 3,33 или 3,46 ГГц.

Изначально мы намеревались протестировать Core i5-655K во всех доступных для этого процессора режимах памяти, которых он предлагает несколько больше, чем обычные LGA1156-процессоры. Так, обычные Core i5 могут тактовать память лишь как DDR3-800, DDR3-1066 или DDR3-1333, но оверклокерский Core i5-655К к этим режимам добавляет DDR3-1600, DDR3-1866 и DDR3-2133. По крайней мере, такой вывод напрашивается из того, какие настройки предлагает при использовании этого процессора BIOS Setup материнской платы. Однако практические эксперименты показали, что не все конфигурации памяти реально работоспособны. В частности, как уже было указано в описании использовавшейся DDR3-2133 памяти, Core i5-655К так и не смог с ней работать стабильно на частоте 2133 МГц. Поэтому режим DDR3-2133 нам пришлось из тестов исключить. Ещё одна проблема возникла при выборе режима DDR3-1600. В нём стабильная работоспособность подсистемы памяти достигалась лишь при установке «ослабленных» таймингов 9-9-9-27 или 8-8-8-24. Установка же задержек по схеме 7-7-7-21 приводила к зависанию системы на этапе загрузки, несмотря на то, что этот режим у наших модулей GeIL GE34GB2133C9DC совершенно точно находится в множестве поддерживаемых. Иными словами, контроллер памяти процессоров Clarkdale не так прост, как кажется на первый взгляд, и то, что обычные представители этого семейства не имеют коэффициентов, позволяющих тактование памяти на частоте выше DDR3-1333, на самом деле скрывает многие его странности.

Оценку реальной пропускной способности подсистемы памяти, а также её латентность мы провели, используя встроенный в утилиту Lavalys Everest тест Cachemem.








Ситуация очень любопытная. С одной стороны увеличение частоты работы памяти и уменьшение задержек приводит к вполне закономерному уменьшению практической латентности. Однако с другой, если смотреть на производительность при чтении из памяти (а это один из важнейших на практике показателей), её рост оказывается не столь уж и заметен. Кажется, что при использовании памяти со скоростью, превышающей DDR3-1333, пропускная способность на магистрали «вычислительные ядра — память» искусственно ограничивается каким-то препятствием. И вполне логично предположить, что этим препятствием оказывается внутренняя шина, связывающее процессорный кристалл с кристаллом, в котором находится собственно контроллер памяти. Иными словами, использование вместе с процессорами семейства Clarkdale скоростной памяти без разгона через увеличение частоты базового тактового генератора даёт не самые лучшие результаты.

Собственно, это находит вполне логичное отражение и в результатах тестов в реальных приложениях.






















Несмотря на то, что быстрая DDR3 обеспечивает лишь уменьшение латентности подсистемы памяти, практически не влияя на рост реальной пропускной способности, увеличение производительности при установке в систему более скоростных модулей отмечается в целом ряде тестов. В среднем, использование DDR3-1866 вместо DDR3-1333 позволяет получить преимущество в быстродействии порядка 3 %. Именно столько и не более того «скрадывает» у нас компания Intel, запрещая в обычных процессорах Core i3 и Core i5 использование памяти с частотой, превышающей 1333 МГц. На наш взгляд, это — весьма эфемерный прирост в реальной скорости, заставляющий на полном серьёзе засомневаться в целесообразности применения в неразогнанных LGA1156 системах быстрой DDR3 памяти. Как это ни прискорбно, контроллер памяти в системах на базе Clarkdale по своей эффективности не может сравниться с контроллером Lynnfield ни при каких условиях, и увеличение частоты работы памяти в этом отношении ровным счётом ничего не меняет.

Тест второй: разгон


Приведённые выше результаты тестов вряд ли могут служить хорошей мотивацией для использования скоростной памяти в системах с двухъядерными LGA1156 процессорами. Впрочем, и такая модель её использования — без увеличения частоты базового тактового генератора — доступна лишь избранным пользователям, обладающим процессорами c разблокированным множителем, относящимся к K-серии. В подавляющем большинстве же систем, основанных на процессорах семейства Clarkdale, при эксплуатации памяти с частотой более 1333 МГц используется разгон процессора, проведённый через увеличение частоты BCLK. Именно поэтому вторая часть тестов была посвящена исследованию влияния параметров подсистемы памяти на быстродействие в разогнанной таким путём системе.

Сразу же следует заметить, что разгон процессора, проводимый через увеличение базовой частоты тактового генератора, приводит к ускорению работы всех шин в системе. Вместе с процессорной частотой, в частности, растёт и частота шины QPI, соединяющей кристаллы внутри CPU. Соответственно, в этой части тестирования мы ожидаем появления более выраженной взаимосвязи между производительностью и скоростью работы подсистемы памяти.

Для того чтобы приблизить условия тестирования к реальности, мы разогнали наш процессор Core i7-655K до частоты 4,4 ГГц. Эту частоту мы получили, используя коэффициент умножения 22 и частоту BCLK 200 МГц. Такой множитель доступен у всех двухъядерных процессоров, относящихся к семейству Clarkdale, а потому результаты тестов без какой либо корректировки могут быть легко применены к большому количеству реальных систем.


Во время тестов динамически изменяющая множитель процессора технология Turbo Mode была выключена, так как именно в этом случае при разгоне достигаются наиболее высокие результаты.

Рост частоты базового тактового генератора привёл к тому, что задаваемые через отдельные множители доступные частоты работы памяти претерпели изменения. Вместо DDR3-800, DDR3-1067 и DDR3-1333 процессор автоматически получил возможность работы с памятью DDR3-1200, DDR3-1600 и DDR3-2000. Все эти три режима одинаково доступны не только в системах с разблокированными процессорами, их задействование возможно в любых CPU семейства Clarkdale. Собственно, поэтому мы использовали частоту BCLK, разогнанную именно до 200 МГц — этот трюк открывает доступ к DDR3-2000 на любом LGA1156 процессоре.

И вновь в первую очередь в ход пошли синтетические тесты.








Как и ожидалось, при разгоне процессора частота памяти оказывает куда большее влияние на практическую пропускную способность подсистемы памяти. Если при работе процессора в штатном режиме при изменении частоты памяти на 40 % мы получили лишь 7-процентный прирост в скорости чтения из памяти, то теперь 66-процентное увеличение частоты DDR3 SDRAM влечёт за собой рост практической пропускной способности более чем на 21 %. Иными словами, разгон внутрипроцессорной шины QPI действительно положительно сказывается на производительности подсистемы памяти.

Существует лишь одна загвоздка — низкие результаты, полученные при использовании в тестовой системе DDR3-1600 SDRAM. Но тут нет никакой ошибки — контроллер памяти Clarkdale преподнёс нам ещё один неожиданный сюрприз. Такова уж особенность множителя частоты памяти 8х (который в штатном режиме позволяет тактовать DDR3 на 1067 МГц) — его активация приводит к снижению реальной пропускной способности.

С точки зрения же латентности никаких аномальных отклонений не наблюдается. Установка более агрессивных таймингов, либо увеличение частоты работы памяти всегда приводит к адекватному снижению практической латентности.

Давайте теперь посмотрим, как столь неоднозначная работа контроллера памяти отражается на производительности в других тестах и приложениях.






















Режим DDR3-1600, выбираемый при увеличении базовой частоты до 200 МГц, действительно, оказывается далеко не самым оптимальным вариантом. Согласно полученным данным, DDR3-1200 с низкими таймингами практически всегда позволяет получить более высокие результаты. Зато в адрес DDR3-2000 мы не можем высказать никаких претензий. Скоростная память с такой частотой при разгоне оказывает вполне позитивное влияние на общую производительность. В среднем, при установке DDR3-2000 в разогнанной системе с двухъядерным LGA1156 процессором можно выиграть в быстродействии порядка 5 %, а в приложениях, чутко реагирующих на параметры подсистемы памяти (например, в играх) величина прироста скорости может доходить и до 10 %.

Выводы


Однако основной вывод, который можно сделать по результатам проведённого тестирования, состоит в том, что производительность двухъядерных процессоров LGA1156 мало зависит от скорости работы памяти. И в этом CPU семейства Clarkdale совершенно неоригинальны: о том, что выбор памяти влияет на производительность достаточно слабо, мы говорим уже далеко не в первый раз.

Однако в данном случае есть один нюанс. Хотя формально считается, что процессоры Clarkdale обладают интегрированным контроллером памяти, на деле этот контроллер находится в отдельном полупроводниковом кристалле, который связывается с процессорным кристаллом по шине QPI. Наличие этой дополнительной шины оказывается узким местом, в результате чего использование более скоростной, чем DDR3-1333, памяти приводит к совсем незначительному росту производительности. Впрочем, DDR3-1600 или DDR3-1866 SDRAM без разгона частоты базового тактового генератора BCLK можно использовать лишь совместно с разблокированным процессором Core i5-655K, который вряд ли можно считать широко распространённым. Обычные же двухъядерные Core i5 или Core i3 тактовать память на частоте, превышающей 1333 МГц, в штатном режиме не позволяют.

Разгон же, проводимый увеличением частоты BCLK, увеличивает и частоту пресловутой шины QPI, поэтому подобных проблем при установке скоростной памяти в системе с разогнанным Clarkdale не наблюдается. Вместо этого обнаруживается иная тонкость — нежелательность выбора для частоты памяти множителя 8, при установке которого по какой-то причине существенно снижается реальная пропускная способность подсистемы памяти. Поэтому для получения максимальной производительности предпочтительнее использовать либо самый маленький множитель — 6, устанавливая минимальные тайминги, либо старший множитель — 10.

При самом же благоприятном стечении обстоятельств варьирование скоростными характеристиками подсистемы памяти позволяет получить выигрыш в производительности, не превышающий 8—10 %. Стоит ли ради этого тратиться на покупку оверклокерской памяти — каждый должен решить для себя сам. Но вот что точно не имеет смысла, так это приобретение для системы на базе двухъядерного LGA1156 процессора более скоростной памяти, нежели DDR3-2000. Без использования экстремальных методов охлаждения реально применить такую память не удаётся даже с разблокированным процессором Core i5-655K, так что уж говорить о системах, построенных на его ординарных собратьях.

И к сказанному остаётся только добавить, что, несмотря на все перепробованные ухищрения, нам удалось лишь немного приблизить реальную скорость работы контроллера памяти Clarkdale к той производительности, что на операциях с памятью показывает его старший собрат — Lynnfield. Чтобы достичь похожей практической пропускной способности подсистемы памяти, как у Lynnfield с DDR3-1333 памятью, нам пришлось прибегнуть к 50-процентному разгону всех шин в системе с Clarkdale и использованию оверклокерской DDR3-2000 SDRAM. Так что более дорогие четырёхъядерные LGA1156 процессоры безоговорочно превосходят двухъядерных собратьев не только по вычислительной мощности, но и с точки зрения скорости работы с подсистемой памяти.

Другие материалы по данной теме


Kingston LoVo HyperX – память с низким энергопотреблением
Выбираем DDR3-память для платформы LGA1156
Трёхканальные комплекты памяти DDR3-1600 для LGA1366-систем