Новый хит Intel: процессоры Core i7

Автор: Gavric
Дата: 05.11.2008
Все фото статьи
Введение

Вчера компания Intel сняла NDA (Non-Disclosure Agreement, соглашение о неразглашении информации) на публикацию обзоров процессоров Core i7 для настольных систем, в основе которых лежит новая микроархитектура Nehalem. Естественно, мы не могли обойти это событие стороной и подготовили подробный обзор имеющегося у нас процессора, который дополняет сведения о новинке, раскрытые в нашей статье о новой микроархитектуре. Тем не менее, сразу же предупредим, что появление этого обзора отнюдь не означает официальный анонс нового процессора. Официальный выпуск семейства Core i7 состоится лишь в середине ноября, тогда же начнутся и розничные продажи новинки.

Первые процессоры нового семейства будут относиться к верхней ценовой категории. Их выход до середины следующего года не повлияет на массовый рынок, где продолжат предлагаться весьма успешные процессоры Core 2 Quad и Core 2 Duo.


Но, тем не менее, процессоры Core i7 – это весьма значимое для компьютерного рынка событие. И не только потому, что Intel в очередной раз поднимает на новый уровень производительность настольных систем. Процессоры этого семейства привносят значительные перемены в архитектуру платформы. Начиная с нынешнего момента, Intel встаёт на путь повышения уровня интеграции своих процессоров и перемещения в них функций северного моста чипсета. Новые процессоры, о которых пойдёт рассказ в этой статье, получили встроенный контроллер памяти и монолитное четырёхъядерное строение. Однако это только начало: последователи сегодняшних новинок будут включать и интегрированное графическое ядро, и контроллер шины PCI Express.

Вместе с процессорами Core i7 Intel выпускает и очередной набор логики X58 Express. И хотя, по большому счёту, в нём нет никаких новаторских особенностей, за исключением собственно поддержки Core i7, его появление означает, что энтузиастам, гонящимся за достижением максимальной производительности, придётся обновить целиком всю платформу. Именно этой платформе и будет посвящена данная статья.
Новый процессор: Core i7

Ввиду того, что Core i7 относятся к новому поколению процессоров, использующему микроархитектуру Nehalem, начать следует с краткого перечисления тех нововведений, с которыми нам придётся столкнуться. В числе характерных особенностей строения новинки следует отметить:

Врождённое четырёхъядерное строение. Единый процессорный кристалл включает четыре ядра с 256-килобайтным L2 кэшем и общий разделяемый L3 кэш.
Замену процессорной шины Quad Pumped Bus новым последовательным интерфейсом QuickPath с топологией точка-точка, который может использоваться не только для соединения процессора и чипсета, но и для связи процессоров между собой.
Встроенный в процессор контроллер памяти, поддерживающий трёхканальную DDR3 SDRAM. При этом каждый канал способен работать с двумя небуферизованными модулями DIMM.
Поддержку технологии SMT (Simultaneous multithreading), аналогичную памятной технологии Hyper-Threading. Благодаря ей каждое ядро Core i7 может исполнять два вычислительных потока одновременно, в результате чего процессор представляется в операционной системе восемью ядрами.
Разделяемый кэш третьего уровня общим объёмом 8 Мбайт.
Встроенный микроконтроллер PCU, независимо управляющий напряжением и частотой каждого из ядер, обладающий возможностями автоматического разгона отдельных ядер при сниженной нагрузке на другие ядра.
Поддержку нового набора инструкций SSE4.2.
Core i7 производится по технологии с нормами производства 45 нм, состоит из 731 млн. транзисторов и имеет площадь ядра 263 кв.мм.


Также нельзя упускать из виду и собственно микроархитектурные улучшения, сделанные в глубине ядра, подробный рассказ о которых можно прочитать в нашей специальной статье. Здесь же мы просто заметим, что все эти нововведения не несут в себе революционных изменений в ядре, а в основном обуславливаются оптимизацией давно существующей микроархитектуры Core под работу с технологией SMT. Основные же новации, приходящие в настольные системы вместе с процессорами Core i7, касаются платформы в целом.

Именно поэтому совершенно неудивительно, что процессоры Core i7 отличаются от своих предшественников поколения Core 2 не только с точки зрения внутренностей, но и снаружи. Так, новые процессоры используют разъём LGA1366, существенно превосходящий по числу контактов и габаритам привычный LGA775.


Стал массивнее и сам процессор. Причём, в отличие от предшественника, он имеет явно выраженную прямоугольную, а не квадратную форму.


Увеличение числа контактов, очевидно, обусловлено появлением в процессоре трёхканального контроллера памяти, в то время как ранее в интеловских системах он размещался в северном мосте набора логики.

Всего будет доступно три модели процессоров Core i7, ориентированных на настольные системы.


Как видно из таблицы, по тактовым частотам новые процессоры мало отличаются от своих предшественников из четырёхъядерного семейства Core 2 Quad. А это значит, что преимущество процессоров нового поколения в скорости будет обеспечиваться исключительно архитектурными решениями и новыми технологиями.

Что же касается типичного тепловыделения, то у Core i7 оно на 45 Вт выше, чем у процессоров Core 2 Quad. Однако в то же время старшие представители четырёхъядерного семейства с микроархитектурой Core, относящиеся к серии Extreme Edition, имеют значение TDP 136 Вт. Отсутствие же качественных изменений в тепловыделении Core i7 вполне логично: микроархитектура Nehalem ушла от Core совсем недалеко, а технологический процесс, по которому выпускаются Core i7, не сменился и вовсе.

Тем не менее, Intel посчитал невозможным использование старых систем охлаждения с новыми процессорами и изменил систему их крепления, разнеся крепёжные отверстия несколько шире. Очевидно, таким путём производитель призывает пользоваться более эффективными кулерами. Это наглядно иллюстрируется новым кулером, пришедшим в комплекте с нашим тестовым процессором Core i7-965 Extreme Edition. Если раньше с процессорами Core 2 поставлялись кулеры, использующие алюминиевые радиаторы с медным сердечником, то теперь половина рёбер радиатора также сделана из меди. Сами рёбра при этом стали тоньше, их количество сильно возросло, да и диаметр радиатора увеличился. Впрочем, справедливости ради следует заметить, что вентилятор на этом кулере работает с гораздо меньшей скоростью, обеспечивая вполне комфортный шумовой фон.


Процессоры Core i7 с включённой технологией SMT видны в системе как восьмиядерные. Половина ядер при этом «виртуальна», но Windows Vista никак не фиксирует этот факт.


Последние версии диагностических утилит вполне свободно справляются с определением характеристик процессоров Core i7.


Здесь необходимо сделать важное замечание относительно детектируемой в CPU-Z частоты шины, 133 МГц. Дело в том, что также как и в современных процессорах AMD, Intel в Core i7 отказалась от использования фронтальной шины в её классическом понимании. Частота 133 МГц в данном случае – это просто частота тактового генератора, формирующего все остальные частоты. Например, частота процессора получается как произведение этой величины на коэффициент умножения, аналогичным образом формируется и частота шины памяти, которая использует свой собственный набор множителей. Интерфейс QPI, связывающий процессор с северным мостом, также использует эту частоту в качестве базовой, умножая её на свой собственный коэффициент.

Процессорный коэффициент умножения, также как и в предыдущих моделях CPU, будет фиксироваться. Исключение здесь составит ориентированная на оверклокеров модель Core i7-965 Extreme Edition, которая будет обладать разблокированным множителем.

Для частоты шины памяти процессоры Core i7 предложат несколько доступных множителей. Например, побывавший в нашей лаборатории Core i7-965 Extreme Edition предлагал выбор между 6x, 8x, 10x и 12x, что означает поддержку этим процессором DDR3-800/1067/1333/1600 SDRAM.

Частота интерфейса QPI будет варьироваться на разных моделях CPU. Так, в Core i7-965 Extreme Edition эта шина работает на частоте 3,2 ГГц, в то время как на Core i7-940 и i7-920 её частота понижена до 2,4 ГГц.

Тестовый процессор Core i7-965 Extreme Edition, как видно по скриншоту, имеет степпинг C0. Это – финальный номер, именно такой степпинг будут иметь серийные процессоры. Напряжение нашего экземпляра составило 1,2 В, и это вполне нормально для CPU, выпущенного по 45-нм технологии.
Новый чипсет: Intel X58 Express

Очевидно, что поскольку процессоры Core i7 используют совершенно новый интерфейс для связи с северным мостом, они нуждаются в специализированном чипсете. На сегодня существует лишь единственный набор логики для процессоров нового поколения, это – Intel X58 Express. Данный чипсет относится к классу высокопроизводительных продуктов, нацеленных на энтузиастов, что совершенно неудивительно, так как и сами процессоры Core i7 принадлежат к верхней ценовой категории.


Впрочем, несмотря на это Intel X58 Express – гораздо более простой набор логики по сравнению с его предшественниками X-серии, X38 и X48. Так как контроллер памяти перекочевал в новых платформах в процессор, на роль северного моста X58 отводится лишь поддержка графической шины PCI Express 2.0. При этом набор логики сохранил привычную двухчиповую структуру. Поэтому северный мост оборудован и контроллером интерфейса QPI, посредством которого он соединяется с процессором, а также снабжён поддержкой шины DMI, которая традиционно используется в интеловских чипсетах для связи между мостами.


Следует отметить, что Intel уделил большое внимание реализации шины PCI Express 2.0 в северном мосту с тем, чтобы обеспечить наилучшую поддержку видеоподсистемам, использующим более одной видеокарты. Так, в целом северный мост имеет 36 линий PCI Express, которые могут разделяться на четыре графических слота. В итоге, PCI Express x16 слоты на материнских платах, основанных на X58, могут работать в режимах 1 x 16, 2 x 16 или даже 4 x 8. При этом материнскими платами под Core i7 может поддерживаться не только технология ATI Crossfire, но и NVIDIA SLI. Правда, использование технологии SLI будет возможным лишь в некоторых основанных на X58 продуктах, только после прохождения конкретной моделью платы процедуры сертификации у NVIDIA, повышающей её стоимость из-за необходимых отчислений в адрес этой компании.

Южный мост, входящий в состав набора логики для X58 – это знакомый нам по Intel P45 ICH10. Этот чип поддерживает 12 портов USB 2.0, 6 портов SATA с возможностью объединения дисков в RAID-массивы, встроенный гигабитный сетевой MAC и High Definition Audio звуковой интерфейс. Также в ICH10 имеется поддержка шести дополнительных линий PCI Express и обычной шины PCI.

В общем, в Intel X58 нет реализации никаких новых революционных технологий, и этот чипсет просто решает вопрос с поддержкой LGA1366 процессоров семейства Core i7. Однако несмотря на произошедшую «разгрузку» северного моста (за счёт вывода из него контроллера памяти), его тепловыделение не стало ниже, чем у чипсетов для платформы LGA775. И хотя на собственной плате для Core i7 для отвода тепла от этой микросхемы Intel предлагает использовать обычный пассивный радиатор из алюминия, во время интенсивной работы её температура может достигать пугающих значений. Поэтому производители материнских плат для энтузиастов явно не упустят шанса установить на свои продукты навороченные и внушительно выглядящие конструкции, использующие тепловые трубки и вентиляторы, которые действительно могут потребоваться при разгоне шины QPI и установке в систему нескольких видеокарт.
Материнская плата Intel DX58SO – Smackover

Для тестирования нового процессора Core i7 Intel прислала нам LGA1366 материнскую плату собственной разработки – DX58SO или, как её ещё называют, Smackover. Надо заметить, что ранее мы остерегались тестировать новые процессоры, используя платы Intel, однако в последнее время ситуация несколько изменилась. Производитель стал подходить к разработке материнок куда ответственнее, и это вылилось в явное улучшение их потребительских качеств: они стали показывать не худшее, чем у конкурентов, быстродействие, и даже предлагать развёрнутые возможности для разгона процессоров. Не подвела наши ожидания и Intel DX58SO – она показала себя как вполне приемлемая платформа для энтузиастов, хотя, к сожалению, и не лишённая некоторых мелких недостатков.


Первое, что бросается в глаза при знакомстве с Intel DX58SO, это её несколько необычный дизайн: слоты для модулей памяти перемещены вверх от процессорного гнезда. Такое размещение памяти мы ранее встречали только у некоторых плат под процессоры AMD, но не у интеловских решений. Однако теперь и Intel использует встроенный в процессор контролер памяти, что позволяет устанавливать слоты DIMM именно таким образом, тем более, что это расположение имеет некоторые преимущества. Оно даёт возможность лучше организовать охлаждение модулей DDR3 SDRAM, поскольку они располагаются вдоль типичного воздушного потока внутри корпуса. Кроме того, находясь непосредственно над процессорным гнездом, слоты памяти придвинуты вплотную к процессору, что минимизирует нежелательные наводки.

Благодаря переносу разъёмов DIMM с их привычного места, инженерам удалось придвинуть к процессору и северный мост. Таким образом, дорожки интерфейса QPI на плате также имеют небольшую протяжённость.

Необходимо заметить, что Intel развела на собственной LGA1366 плате лишь четыре слота памяти из шести возможных. В результате, первый канал памяти позволяет установить в него два модуля DDR3 SDRAM, в то время как к остальным двум каналам можно подключить лишь по одному модулю. Поэтому Intel DX58SO, как и платы под LGA775 процессоры, поддерживает только до 8 Гбайт памяти, когда большинство LGA1366 платформ других производителей будет способно работать с 12-гигабайтными массивами DDR3 SDRAM.

Северный мост охлаждается относительно небольшим алюминиевым радиатором. В дополнение к нему в комплект поставки платы будет включаться вентилятор с крепёжной рамкой, который мы рекомендуем сразу же водрузить на северный мост, так как его температурный режим при пассивном охлаждении внушает некоторое беспокойство.


На южном мосту также имеется небольшой алюминиевый радиатор с вполне достаточной в данном случае эффективностью.

Конвертер питания процессора выполнен по шестифазной схеме. В нём применены ставшие традиционными твердотельные конденсаторы с полимерным электролитом, а на транзисторы установлены обычные алюминиевые радиаторы. Всё это в очередной раз указывает на то, что разработчики платы решили не уделять слишком много внимания охлаждению компонентов платы, используя лишь самые простые решения.


Зато в отсутствие громоздкой системы охлаждения вокруг процессорного разъёма осталось достаточно свободного места для установки многих эффективных систем охлаждения, которые, судя по всему, будут в основном теми же, что и для LGA775 процессоров. По крайней мере, большинство производителей кулеров в свете выхода Core i7 анонсируют не новые модели своих изделий, а адаптированные для LGA1366 крепления старых систем охлаждения.

Надо заметить, что есть у дизайна Smackover и незаметные невооружённым глазом особенности. Например, в нем используется 8-слойная, а не 6-слойная печатная плата. Это, по утверждению производителя, позволяет обеспечить процессор более стабильным питанием и улучшить разводку с целью минимизации взаимного электромагнитного влияния сигналов.

Впрочем, порадовать способны далеко не все решения разработчиков платы. Например, в элементной базе прослеживается некоторая экономия: на плате можно обнаружить достаточное количество выходящих из моды конденсаторов с жидким диэлектриком, которые, как известно, имеют более низкую надёжность и меньший срок жизни, чем повсеместно применяемые твердотельные электролитические конденсаторы.

Говоря о характеристиках Intel DX58SO, необходимо отметить, что она оснащёна двумя полноценными слотами PCI Express x16, поддерживающими версию протокола 2.0 с удвоенной пропускной способностью. Плата способна работать с несколькими видеокартами, объединёнными по технологии ATI Crossfire, но не NVIDIA SLI. Также на плате имеется реализованный через северный мост слот PCI Express x4, в который благодаря хитрой конструкции можно устанавливать и третью видеокарту, например, занимающуюся физическими расчётами.

В целом, разработка Intel DX58SO шла по пути отказа от излишнего усложнения и увеличения цены. Практически все внешние интерфейсы работают через встроенные в южный мост контроллеры. Впрочем, есть на плате и два дополнительных чипа: первый – FireWire контроллер компании Texas Instruments; а второй – SATA II контроллер Marvell, который отвечает за работу eSATA портов. Соответственно, на заднюю панель платы вынесено восемь портов USB 2.0, порт IEEE1394, гигабитный сетевой порт, два порта eSATA, и звуковые разъёмы: пять аналоговых и оптический S/PDIF выход.


Остальные порты представлены игольчатыми разъемами на плате: дополнительно можно подключить ещё четыре USB 2.0 устройства и FireWire-порт. Для винчестеров и оптических приводов предусмотрено шесть SATA-300 портов. Intel, похоже, на личном примере решил продолжить пропаганду отказа от устаревших интерфейсов. По крайней мере, на Smackover нет ни последовательных, ни параллельных портов, а также, что более существенно, отсутствуют разъёмы для подключения дисковода и накопителей с PATA-интерфейсом.

Зато разработчики Smackover проявили некоторую заботу о тестерах и снабдили плату кнопкой включения питания и светодиодом активности жёсткого диска.
Настройка системы на базе Core i7

Ввиду того, что процессоры семейства Core i7 имеют новую платформенную архитектуру, необходимо уделить некоторое внимание их конфигурированию через BIOS Setup материнской платы, тем более, что этот процесс с непривычки, скорее всего, покажется нетривиальным для большинства пользователей. Рассказывать о настройке мы будем на примере BIOS описанной выше материнской платы Intel DX58SO Smackover.

Главный параметр системы, влияющий на частоту практически всех узлов системы – частота тактового генератора (Host Clock Frequency) – задаётся на первом же экране раздела «Performance». Штатное значение этой частоты – 133 МГц, однако плата предлагает широкие возможности для её увеличения до 240 МГц.


Настройка параметров процессора производится через страницу «Processor Overrides» раздела «Performance».


Начинается эта страница тремя опциями, регулирующими напряжение питания процессора. Они позволяют задать абсолютные и относительные значения подаваемого напряжения, а также включить специальный режим, уменьшающий отрицательное влияние «эффекта Vdroop» (падения напряжения питания процессора на проводниках материнской платы и контактах разъёма при повышении силы тока).

Далее следует настройка для штатного множителя, задающего частоту процессора – как произведение множителя на частоту тактового генератора.

Следующая большая группа параметров управляет работой технологии «Turbo Boost», или как она называется в терминах BIOS, «Intel Dynamic Speed Technology». Благодаря тому, что эта технология реализована посредством специализированного микроконтроллера PCU, встроенного в процессор, возможности очень широкие. Здесь можно «подредактировать» используемые PCU значения TDP и максимальной допустимой силы тока на процессоре, разрешить или запретить автоматическое повышение напряжения на процессорных ядрах и задать максимальные коэффициенты умножения при работе процессора в режимах с различным количеством активированных ядер. Однако опции по изменению процессорных множителей доступны только при наличии в системе процессора серии Extreme Edition.

По спецификации турбо-режима, если загрузка процессора работой такова, что его частота может быть повышена без риска выхода из установленных рамок тепловыделения и энергопотребления, Core i7 могут поднимать свой множитель выше номинального значения. На единицу – при работе с 2, 3 или 4 активными ядрами, или на два – в случае активности единственного ядра. Но, как видно из представленных настроек, возможности этой технологии гораздо шире благодаря доступности для изменения всех её ключевых параметров. В частности, обладая процессором Core i7 Extreme Edition с незафиксированным множителем, оверклокеры наверняка смогут приспособить Turbo Boost Technology для своих нужд. Ведь PCU, как оказывается, можно запрограммировать на весьма агрессивное управление частотой процессора, при котором его энергопотребление может даже заходить за 130-ваттную границу.

Страница «Memory Configuration» посвящена настройке работы памяти.


Обратить внимание в первую очередь следует на то, как устанавливается частота работы памяти. Для неё предусмотрен собственный множитель, задающий частоту DDR3 SDRAM относительно частоты тактового генератора. Набор множителей от 6 до 12 позволяет использовать память, работающую на частоте от 800 до 1600 МГц. Рядом имеется ещё один множитель UCLK, определяющий частоту работы интерфейсных частей процессора, к которым относится встроенный в процессор контролер памяти, L3 кэш и контроллер шины QPI. Этот множитель должен быть как минимум вдвое больше множителя для частоты памяти. Дальнейшее его повышение дополнительно увеличивает производительность, но снижает стабильность подсистемы памяти.

На этой же странице есть и настройка напряжения питания памяти. Следует иметь в виду, что Intel крайне не рекомендует поднимать это напряжение выше 1,65 В, так как это может привести к повреждению встроенного в процессор контроллера памяти. В результате, системы, основанные на процессорах Core i7, сильно ограничены в использовании скоростной DDR3 памяти прошлого поколения, требующей для своей работы на номинальных частотах более высоких значений напряжения, чем положенные стандартом 1,5 В. К счастью, эта проблема решается в новых DDR3 модулях памяти, которые используют чипы, работающие на высоких частотах при близком к 1,5 В напряжении. Большинство производителей памяти для энтузиастов уже представили свои продукты этого класса.

На странице «Bus Overrides» главное внимание следует уделить настройкам шины QPI.


BIOS позволяет изменить её частоту, а также напряжение. Обе эти возможности могут быть необходимы при разгоне процессора повышением частоты тактового генератора. Кроме того, увеличение напряжения QPI может потребоваться и при установке высоких значений множителя, управляющего частотой интерфейсных блоков процессора.

Кроме перечисленных настроек, при конфигурировании системы может быть полезна и опция для включения и отключения технологии SMT. Она вынесена на первую страницу BIOS.


Рядом присутствует ещё одна настройка, посредством которой можно отключить два или три процессорных ядра, превратив, соответственно, Core i7 в двухъядерный или одноядерный процессор.

Управление энергосберегающими режимами и технологией Intel Enhanced SpeedStep производится из раздела «Power».


Все же прочие опции, которые можно встретить в глубине BIOS материнской платы Intel DX58SO, вполне привычны и не заслуживают специального внимания в рамках этого обзора.
Описание тестовых систем

Тестирование производительности новых процессоров Core i7 логично проводить в сравнении со старшими четырёхъядерными процессорами предыдущего поколения Core 2 Quad. Поэтому нами использовалось две платформы.

LGA1366 платформа:

Процессоры:

Core i7-965 Extreme Edition (LGA1366, 3,2 ГГц, 6,4 ГГц QPI, 8 Мбайт L3, ядро Bloomfield);
Core i7-940 (LGA1366, 2,93 ГГц, 4,8 ГГц QPI, 8 Мбайт L3, ядро Bloomfield);
Core i7-920 (LGA1366, 2,66 ГГц, 4,8 ГГц QPI, 8 Мбайт L3, ядро Bloomfield).


Материнская плата: Intel DX58SO Smackover (LGA1366, Intel X58).
Память: 3 x 1GB DDR3-1067 SDRAM, 7-7-7-20 (OCZ DDR3 PC3-14400 Platinum Edition).

LGA775 платформа:

Процессоры:

Core 2 Extreme QX9770 (LGA775, 3,2 ГГц, 400 МГц FSB, 2 x 6 Мбайт L2, ядро Yorkfield);
Core 2 Quad Q9650 (LGA775, 3,0 ГГц, 333 МГц FSB, 2 x 6 Мбайт L2, ядро Yorkfield);
Core 2 Quad Q9550 (LGA775, 2,83 ГГц, 333 МГц FSB, 2 x 6 Мбайт L2, ядро Yorkfield).


Материнская плата: ASUS P5E3 Premium/Wi-Fi@n (LGA775, Intel X48, DDR3 SDRAM).
Память: 4 x 1GB DDR3-1600 SDRAM, 7-7-7-20 (OCZ DDR3 PC3-14400 Platinum Edition).

Отличия в объёме и конфигурациях подсистемы памяти были обусловлены не только различным числом поддерживаемых каналов, но и тем, что имеющаяся у нас в лаборатории память не способна работать на высоких частотах без крайне нерекомендуемого Intel повышения её напряжения питания.

Остальные комплектующие были одинаковы в обоих случаях, это:

Видеокарта: ATI RADEON HD 4870;
Дисковая подсистема: Western Digital WD1500AHFD;
Операционная система: Microsoft Windows Vista x86.
Производительность подсистемы памяти

В первую очередь мы решили сосредоточиться на рассмотрении очевидных преимуществ Core i7. Одно из главных достоинств этого процессора – новая трехуровневая кэш-память с разделяемым между всеми ядрами L3 кэшем и встроенный в процессорное ядро контроллер памяти. Напомним, что несмотря на родство между процессорами с микроархитектурами Nehalem и Core, в Core i7 подобен кэшу Core 2 Quad лишь кэш первого уровня. L2 кэш в новом процессоре получил несколько иную организацию: он стал значительно меньшим по объёму, но зато индивидуальным для каждого ядра.


Core 2 Extreme QX9770


Сore i7-965 Extreme Edition

Заметьте, число областей ассоциативности L2 кэша процессора семейства Core 2 равно 24 при объёме 6 Мбайт. Это значит, что для ускорения поиска кэш разбит на 256-килобайтные области. У процессора же Core i7 весь кэш второго уровня имеет объём 256 Кбайт, но при этом его ассоциативность равна 8. Это означает, что для нахождения данных в L2 кэш-памяти процессоры с микроархитектурой Nehalem должны тратить существенно меньше времени.

Чтобы оценить производительность всей подсистемы, состоящей из кэша и памяти, мы воспользовались синтетическим тестом пропускной способности и латентности, встроенным в Everest 4.60.


Core 2 Extreme QX9770


Сore i7-965 Extreme Edition

В первую очередь обращает на себя внимание различие в латентности L1 кэша. Несмотря на то, что процессоры Core i7 унаследовали кэш первого уровня от своих предшественников, Intel придал им слегка большую латентность для поддержки более эффективных энергосберегающих состояний. Этот факт и находит отражение в практических результатах.

Зато L2 кэш-память в новых процессорах действительно работает гораздо быстрее. Её практическая латентность оказывается почти вдвое меньше, чем у процессоров с микроархитектурой Core. Более высокую скорость L2 кэш Core i7 показывает и при измерении пропускной способности при чтении, записи и копировании данных. Близкую же к показателям кэша второго уровня Core 2 скорость работы демонстрирует в процессоре Core i7 L3 кэш.

Иными словами, трёхуровневая кэш-память новых процессоров должна быть как минимум не менее эффективна, чем у предшественников: единственное её слабое место – возросшая латентность L1 кэша. Однако этот недостаток должен нивелироваться быстрым кэшем L2, который, фактически, занимает место промежуточного буфера между L1 и L3 кэшами, скорость которых близка к скорости L1 и L2 кэшей процессоров прошлого поколения Core 2 Quad.

Что же касается быстродействия памяти, то тут представители поколения Nehalem оказываются вне конкуренции. Пропускная способность трёхканальной DDR3-1067 памяти превосходит пропускную способность памяти LGA775 системы, использующей двухканальную DDR3-1600 SDRAM, на 45 %. При этом латентность памяти в Core i7-системе оказывается почти на 30 % ниже.

Лидирующие позиции платформа на базе процессора Core i7 продолжает сохранять и при переводе контроллера памяти в двухканальный режим. Несмотря на то, что наша LGA775 использует более быстрые модули памяти, она всё равно проигрывает и по скорости доступа, и по пропускной способности.


Двухканальный режим работы контроллера памяти на Сore i7-965 Extreme Edition

Кстати, нетрудно заметить, что производительность подсистемы памяти Core i7 системы при сокращении числа каналов с трёх до двух падает не столь ощутимо. А латентность и вовсе не возрастает, а сокращается. Это говорит о том, что в использовании в LGA1366 платформах двухканальной памяти нет ничего зазорного. Процессор достаточно эффективно способен задействовать и два канала вместо трёх. Можно даже ожидать, что в некоторых случаях трёхканальная память может оказаться менее эффективной, чем двухканальная, из-за её более высокой латентности, которая не будет скомпенсирована незначительным превосходством в пропускной способности.

В заключение нашего небольшого исследования подсистемы памяти Core i7 необходимо сказать о ещё одном параметре, позволяющим увеличить скорость её работы. Это – частота L3 кэша и контроллера памяти, которая, как было указано выше, изменяется через BIOS Setup материнской платы. Так, приведённые выше результаты были получены нами при работе интерфейсных частей процессора на частоте, вдвое превосходящей частоту памяти – при 2133 МГц. Если же для их тактования выбрать более высокий множитель, например, 20x, то частота L3 кэша и контроллера увеличится до 2667 МГц, и, соответственно, возрастут результаты тестов.

Вот, например, какие цифры получаются в этом случае в трёхканальном режиме.


Частота интерфейсных блоков - 2,66 ГГц

Частота L3 кэша и контроллера памяти увеличилась на 25 %. Итогом этого изменения стало ощутимое, на 24 %, повышение пропускной способности памяти при записи и менее ощутимое – на 10 % – при копировании. Также на 8-9 % понизилась латентность L3 кэша и памяти. Но, к сожалению, столь эффективный способ повышения производительности имеет несколько ограниченную применимость. Дело в том, что рост частоты интерфейсных блоков процессора зачастую приводит к падению стабильности. Например, дальнейшее повышение соответствующего множителя в нашем случае приводило к снижению надёжности функционирования системы.

Поэтому все дальнейшие тесты проводились при установке частоты работы L3 кэша и контроллера памяти именно 2667 МГц.


Технология SMT и производительность

Говоря об архитектурных особенностях процессоров Core i7, мы подчёркивали, что одним из важнейших его свойств, способных повлиять на итоговую производительность, является поддержка технологии SMT (Simultaneous Multi-Threading). Благодаря ей каждое ядро процессора может выполнять два вычислительных потока одновременно, что способствует более эффективной загрузке исполнительных устройств.

Однако, как мы помним по опыту процессоров Pentium 4, в которых была реализована аналогичная технология Hyper-Threading, в некоторых ситуациях она способна оказывать и отрицательное влияние. Происходит это, обычно, по двум причинам. Первой причиной падения производительности бывает неправильное поведение диспетчера задач операционной системы, который может не различать аппаратные и программные ядра и возлагать выполнение двух потоков на одно физическое ядро, несмотря на простой соседних ядер. Вторая причина состоит в том, что часть внутренних процессорных буферов при включении SMT жёстко разделяется между потоками напополам. Поэтому скорость работы ядра, выполняющего один поток, в некоторых случаях может оказываться ниже при активации SMT.

Чтобы оценить, как включение SMT в Core i7 сказывается на производительности, мы сравнили скорость работы Core i7-965 Extreme Edition в популярных приложениях при включении и выключении этой технологии (технология Turbo Boost была отключена).


Технологию SMT нельзя оценить однозначно. Эффект от её включения, действительно, достаточно часто может быть и отрицательным. Чувствуется, не даром в BIOS Setup материнской платы Intel DX58SO Smackover соответствующая опция вынесена на первый экран...

Понять же, в каких случаях влияние SMT положительно, достаточно просто. Прирост получают приложения, нагрузка в которых хорошо распараллеливается: в этом случае увеличение производительности может доходить до впечатляющих значений порядка 25-35 %. Но в тех ситуациях, когда приложения создают ограниченное число вычислительных потоков, например, в играх, скорость работы Core i7 при включении SMT зачастую снижается. Впрочем, справедливости ради необходимо заметить, что падение быстродействия в этом случае совсем не катастрофическое, оно редко превышает 4-5 %.
Turbo Boost Technology – действительно ли турбо?

Технология SMT призвана поднять производительность процессора при его работе под многопоточной нагрузкой. Если же активные процессы недозагружают мощности процессора, то на первый план выходит Turbo Boost Technology, добивающаяся дополнительного прироста быстродействия увеличением тактовой частоты выше номинального значения на 133 или 266 МГц. Конечно, это не столь ощутимый прирост, но всё же лучше, чем ничего. Тем более, что при исследовании нюансов работы турбо-режима выяснилось, что указанное увеличение частоты – это отнюдь не экзотическое состояние процессора, оно может быть активно даже при достаточно существенной многопоточной нагрузке.

Дабы не быть голословными, приведём результаты тестов, показывающие эффект активации турбо-режима на примере процессора Core i7-965 Extreme Edition. Тесты приводились при включенной технологии SMT.


Активация Turbo Boost Technology позволяет поднять производительность на величину до 7 %. Это – вполне логичный результат, если принять во внимание то, что в турбо-режиме тактовая частота процессора может возрастать на 8 %. При этом, некоторые приложения получают и минимальный, почти незаметный прирост. К ним относятся такие, которые создают сильно распараллеленную многопоточную нагрузку. Иными словами, SMT и Turbo Boost Technology составляют прекрасную пару: вместе они весьма эффективны практически при любой нагрузке на процессор. И там, где одна из этих технологий оказывается бессильна, на помощь приходит другая.

Любопытно что, судя по всему, наибольшую эффективность Turbo Boost Technology будет иметь в системах, основанных на младших процессорах Core i7. В них не только прирост частоты при активации турбо-режима окажется более заметен, но и сам этот режим будет включаться гораздо чаще. Ведь решение о повышении частоты принимается процессором, основываясь на текущем энергопотреблении, которое сравнивается с TDP, установленным для всей линейки Core i7 на одном уровне – 130 Вт. При этом очевидно, что у младших процессоров с меньшей тактовой частотой реальное энергопотребление будет ниже, чем у их старших собратьев, а следовательно, и возможностей для задействования турбо-режима – больше.
Core i7 против Core 2 Quad: сравниваем по-честному

Очевидно, что одних лишь технологий SMT и Turbo Boost Technology уже достаточно для того, чтобы процессоры Core i7 показывали более высокую производительность, чем их четырёхъядерные предшественники, относящиеся к семейству Core 2. Поэтому особенно интересно посмотреть, как соотносится производительность процессоров старого и нового поколений, если эти свежеприобретённые технологии не активируются.

Для этого сравнения мы сопоставили результаты, показанные процессорами Core i7-965 Extreme Edition поколения Nehalem и Core 2 Extreme QX9770 поколения Penryn. Обе модели работают на одинаковой частоте 3,2 ГГц, так что полученные в этом тесте результаты позволят сделать вывод о том, насколько новая микроархитектура оказалась прогрессивнее старой, в отрыве от SMT и турбо-режима.


В целом, процессор Core i7 работает быстрее, чем модели предыдущего поколения, даже если его лишить главных козырей – поддержки технологий SMT и Turbo Boost Technology. Честно говоря, мы не ожидали ничего другого, так как новые интеловские процессоры могут похвастать очень сильным контроллером памяти и эффективной подсистемой кэш-памяти. Настораживает другое. Оказывается, существуют приложения, в которых «стерилизованный» Core i7 может отставать от процессора предыдущего поколения, работающего на той же тактовой частоте. И что особенно удивительно, к таким приложениям относятся многие игры, весьма чувствительные к скорости работы подсистемы памяти. По всей видимости, так сказываются на быстродействии отличия в строении кэш-памяти старых и новых процессоров.

L1 кэш новых процессоров работает медленнее, чем у представителей семейства Core 2, а быстрый L2 кэш не компенсирует этот недостаток в полной мере в силу своего недостаточного объёма. Кроме того, четырёхъядерные процессоры Core 2 могут похвастать и просто большим обобщённым объёмом кэша.

Таким образом, опираясь на приведённые результаты, мы вынуждены констатировать, что микроархитектура Nehalem не содержит никаких глубоких революционных нововведений, ставящих эти процессоры на голову выше своих предшественников.
Производительность


Общая производительность: PCMark Vantage и 3DMark Vantage














Приведённые на диаграммах результаты вряд ли могут вызвать удивление, если вы внимательно ознакомились с предшествующей частью статьи. Да, процессоры Core i7 показывают в целом более высокое быстродействие, чем их предшественники. В среднем, можно говорить, что старшая модель прошлого поколения – Core 2 Extreme QX9770 – сравнима по производительности со средней моделью новой серии Core i7-940, а Core 2 Quad Q9650 соперничает на равных с младшим Core i7-920. Однако не обходится и без исключений из этого правила. Так, в тесте «Communications», в котором моделируется сетевая активность пользователя, процессоры старого поколения оказываются более выгодны, чем их новоиспечённые конкуренты. Зато в тесте «Gaming» ситуация совершенно обратна: за счёт скоростного контроллера памяти Core i7 внушительно обгоняют процессоры прошлого поколения.




Тест 3DMark Vantage способен измерять процессорную производительность, моделируя игровой искусственный интеллект и игровую физику окружающей среды. Оба используемых в тесте алгоритма хорошо оптимизированы под многопоточность, а потому процессоры Core i7, поддерживающие технологию SMT, показывают здесь просто блестящие результаты.

Игровая производительность










Речь о том, что Core i7 плохо приспособлен для игр, заходила уже не раз. Тем не менее, ситуация вовсе не катастрофична. Заметное отставание CPU с микроархитектурой Nehalem от четырёхъядерных процессоров семейства Core 2 наблюдается лишь в отдельных играх. В целом же Core i7 и Core 2 Quad показывают вполне сравнимое быстродействие.

Кстати, следует заметить, что игры вообще не спешат оптимизироваться под многоядерные процессорные архитектуры. Мы регулярно обновляем список используемых нами игровых тестов в поисках таких оптимизаций, однако качественно ситуация практически не меняется. Даже самые новые шутеры, такие как Crysis Warhead или Far Cry 2 лучше всего работают на двухъядерных процессорах. Поэтому основывать чисто игровой компьютер на четырёхъядерном процессоре всё ещё не имеет смысла.

Кодирование медиа








Кодирование видео превосходно выполняется на новых процессорах. Технология SMT и быстрый контроллер памяти – два важных преимущества Core i7, благодаря которым они удерживают лидирующие позиции в этой группе тестов.

Обработка изображений и видео






В приложениях компании Adobe новые процессоры поколения Nehalem сильно обгоняют своих собратьев – носителей микроархитектуры Core. Причём в данном случае неважно, идёт ли речь о редактировании изображений или о нелинейном видеомонтаже. Очевидно, профессионалы составят существенную долю покупателей Core i7 сразу после их появления в розничной продаже.

Финальный рендеринг






Сказанное выше подтверждают измерения скорости финального рендеринга в различных приложениях. Здесь Core i7 вновь смотрятся на фоне своих предшественников весьма привлекательно.

Прочие приложения






Большинство современных ресурсоёмких приложений уже давно оптимизированы под многопоточность, которая сегодня выступает главным вектором повышения производительности компьютерных систем. Поэтому удивляться победе процессоров, поддерживающих SMT, явно не следует. Тем более что их успех укрепляет контроллер памяти, способный похвастать феноменально высокой пропускной способностью при поразительно низкой латентности.
Разгон

Разгон процессоров семейства Core i7 – ещё одна «горячая» тема. С ней связано два основных вопроса: как сильно отличается разгонный потенциал Core i7 от разгонного потенциала процессоров прошлого поколения, и насколько новая платформенная архитектура даёт этим потенциалом воспользоваться.

Собственно, для ответов на эти вопросы мы и провели серию экспериментов по разгону имеющегося в нашей лаборатории процессора Core i7-965 Extreme Edition. К сожалению, для оверклокерских опытов мы не сумели найти подходящей системы охлаждения процессора, поэтому опыты пришлось производить со штатным кулером, предлагаемым Intel. Однако мы надеемся, что это не сильно помешало нам раскрыть частотный потенциал нового процессора.


Поскольку выбранный для опытов процессор относится к серии Extreme Edition, он обладает незафиксированным множителем. Это означает, что для первичной оценки разгонного потенциала Core i7 мы можем воспользоваться самым простым и безболезненным методом – увеличением его тактовой частоты с помощью множителя.

Так, без повышения напряжения процессора свыше штатных для нашего экземпляра 1,2 В мы смогли добиться его стабильной работы при частоте 3,6 ГГц.


В таком состоянии процессор проходил часовое тестирование при помощи утилит OCCT Perestroïka 2.0.1 и Prime 95 25.7. Температура ядер процессора в таком состоянии оставалась во вполне приемлемом диапазоне и не превышала 78 градусов.

Кстати, разгон Core i7 коэффициентом умножения, по крайней мере, на материнской плате Intel DX58SO, имеет некоторые тонкости. Дело в том, что эта плата не позволяет просто так повышать множитель выше штатного значения. Поэтому для его увеличения приходится прибегать к услугам технологии Turbo Boost, задавая высокие множители для турбо-режимов, одновременно отодвигая верхние границы для предельного энергопотребления и тока. Иными словами, при разгоне мы заставляли процессор работать в турбо-режиме постоянно, выставляя для этого состояния множители, сильно превышающие штатные значения.

Как и в случае с 45-нм процессорами предыдущего поколения, повышение напряжения питания позволяет добиться стабильной работы Core i7 и на более высоких частотах. Например, повышение напряжения питания нашего экземпляра до 1,45 В позволило разогнать его до 3,87 ГГц.


К сожалению, при работе на частоте 4 ГГц процессор уже терял способность к стабильному функционированию, поэтому нам пришлось ограничиться лишь таким разгоном. Надеемся, что впоследствии, когда в нашу лабораторию поступят новые LGA1366 платы и производительные кулеры с соответствующим креплением, мы сможем улучшить достигнутый сегодня результат. Ведь уже при прохождении тестов стабильности на частоте 3,87 ГГц тестовый процессор в нашей системе нагревался до более чем 90-градусной температуры – а это значит, что именно система охлаждения стала главным сдерживающим разгон фактором. Так что пока мы вынуждены признать, что новые Core i7 разгоняются несколько хуже своих предшественников.

Обратимся теперь ко второму животрепещущему вопросу – смогут ли разгонять свои системы обладатели более доступных по стоимости не-Extreme Edition версий процессоров Core i7, не обладающих такой роскошью, как разблокированный коэффициент умножения. Для чистоты эксперимента мы попытались провести разгон тестового Core i7-965 Extreme Edition, понизив его множитель до 20x, ведь именно такой коэффициент умножения будет иметь младшая модель в этом семействе, Core i7-920.

И, к радости многих, мы можем сообщить: никаких серьёзных препятствий на пути разгона процессора частотой тактового генератора не встаёт. Можно даже сказать, что такой разгон выполняется несколько проще, чем в случае с четырёхъядерными процессорами прошлого поколения как минимум потому, что с Core i7 не требуется никакого лавирования напряжениями шины и уровнями GTL процессора и чипсета, так как этот процессор попросту не использует шину FSB. Главное, за чем нужно следить при повышении частоты тактового генератора выше номинальных 133 МГц в LGA1366 платформе – это за своевременным снижением всех множителей, задающих итоговую частоту различных шин и блоков процессора.

Например, снизив множитель для частоты памяти до 6x, для интегрированного контроллера памяти и L3 кэша – до 12x, и для частоты шины QPI – до 18x, мы легко добились стабильной работы тестовой системы при частоте тактового генератора 190 МГц.


Итоговая частота процессора с учётом избранного коэффициента умножения 20x составила 3,8 ГГц. К сожалению, стабильность при более высоких частотах генератора уже нарушалась, и мы не смогли достичь тех же результатов, что и при разгоне множителем. Но мы склонны отнести эту мелкую неудачу на счёт «сырости» материнской платы, а не на счёт каких-либо платформенных проблем.
Энергопотребление системы

Для полноты картины мы провели измерение энергопотребления систем (без монитора), построенных на процессорах двух поколений: Penryn и Nehalem. Для этих тестов мы избрали два старших процессора, относящих к разряду Extreme Edition и работающие на одинаковой частоте 3,2 ГГц: Core 2 Extreme QX9770 и Core i7-965 Extreme Edition. Все управляющие энергопотреблением технологии, в том числе Enhanced Intel SpeedStep и Turbo Boost Technology, были активированы. Нагрузка на процессоры создавалась утилитой Prime95.


Энергопотребление платформ, основанных на процессорах разных поколений, близко не только в официальных спецификациях, но и при практических измерениях. При одинаковой тактовой частоте оно различается не более чем на 4 %. При этом в состоянии простоя меньшее энергопотребление демонстрирует процессор Core i7, обладающий более агрессивными энергосберегающими состояниями и способный отключать от линии питания отдельные ядра, а под нагрузкой слегка более экономичным кажется Core 2 Extreme.

Впрочем, не следует забывать о том, что при близком тепловыделении Core i7 способен показать на многопоточной нагрузке ощутимо большую производительность, а значит, новый процессор с микроархитектурой Nehalem может похвастать лучшим соотношением «производительность на ватт».

Для подтверждения этого утверждения мы измерили расход электроэнергии при выполнении системами одного и того же теста PCMark Vantage, моделирующего реальную нагрузку различного характера. Эта величина прекрасно характеризует количество электрической энергии, необходимое системам для решения одних и тех же задач. И в этом случае платформа на базе Core i7-965 Extreme Edition показала себя с лучшей стороны, израсходовав примерно 140 Вт*ч, в то время как система с процессором Core 2 Extreme QX9770 затратила для аналогичных целей 159 Вт*ч электроэнергии.
Выводы

Вот и состоялось практическое знакомство с процессорами Core i7 – первыми носителями микроархитектуры Nehalem, ориентированными на десктопный рыночный сегмент. И, подводя итоги, мы вынуждены признать, что знакомство это оставило несколько двойственные впечатления.

Нет, мы совсем не хотим сказать, что Core i7 – это неудача или что-то подобное. Напротив, этот процессор очень хорош по многим показателям. Он получил поддержку новых интересных и полезных технологий SMT и Turbo Boost, приобрёл встроенный контроллер памяти с непревзойденной производительностью. Почти во всех приложениях, за исключением некоторых игр, быстродействие новых процессоров оказалось выше, чем у аналогичных по частоте или стоимости моделей семейства Core 2. Но, честно говоря, мы ждали от Core i7 большего. И виновата в этом Intel, которая на протяжении двух последних лет твердила о стратегии «Tick-Tock» и том, что Nehalem – это новая микроархитектура. На самом же деле сегодня мы увидели лишь следующий шаг в развитии микроархитектуры Core, но никак не революционный продукт, каким, например, казался Core 2 Duo, пришедший на смену Pentium 4. Иными словами, после тестов остаётся чувство лёгкого разочарования.

В то же время нельзя не отметить, что инженеры Intel провели большую и важную работу по модернизации всей платформы. Процессоры Core i7 устроены «более правильно» с точки зрения ликвидации узких мест и возможности их эволюционного развития. Монолитная на уровне кристалла и модульная на уровне дизайна конструкция, межпроцессорный интерфейс с топологией точка-точка и встроенный контроллер памяти, безусловно, сослужат добрую службу разработчикам Intel в будущем ещё не раз. Сегодня же реальный эффект от этих нововведений смогут почувствовать не столько обычные пользователи, сколько потребители серверных многосокетных систем, где все эти изменения придутся как нельзя более кстати.

И именно поэтому, на наш взгляд, Intel избрала неправильную стратегию по выведению процессоров с микроархитектурой Nehalem на рынок. Если бы этот обзор был посвящён серверным, а не десктопным процессорам, несомненно, выводы были бы не просто более оптимистичны, а скорее всего, нашему восторгу не было бы предела. Однако первая встреча с Nehalem произошла на примере настольных компьютеров, где наиболее важные качества новинки не могут проявиться в полной мере.

Впрочем, мы бы не хотели, чтобы у читателя сложилось мнение, будто мы остались недовольны протестированным процессором Core i7. Процессор и новая платформа, построенная на базе набора логики Intel X58, – это, вне всяких сомнений, прекрасный продукт. Новые Core i7 безусловно превосходят процессоры семейства Core 2 Quad аналогичной стоимости по многим потребительским качествам. Особенно хорошо это заметно при многопоточной нагрузке, где может проявить себя технология SMT, вернувшаяся из Pentium 4 явно не напрасно. Да и новые технологии управления частотой и питанием ядер процессора выглядят очень заманчиво: Core i7 не только может сам разгоняться, но и не уступает предшественникам с точки зрения экономичности. К тому же новая платформа, основанная на наборе логики Intel X58, предлагает более широкие возможности по конфигурированию мульти-GPU видеоподсистем. А дополнительным козырем Core i7, также ориентированным на энтузиастов, может стать и их простой разгон.

Конечно, мы не остановимся на достигнутом, и в ближайшее время подготовим новые материалы про процессоры Core i7, которые позволят нам лучше понять достоинства и недостатки микроархитектуры Nehalem. А пока что мы можем разве только посокрушаться, что переход на свежую LGA1366 платформу потребует не только смены процессора, но и покупки новой материнской платы, а также, скорее всего, и DDR3 памяти нового поколения. Так что, несмотря на кажущуюся дешевизну младших моделей Core i7, официально оценённых Intel в 284 доллара, модернизация системы на новый процессор потребует достаточно серьёзных вложений, которые, наверняка, многих заставят призадуматься о её целесообразности.

Уточнить наличие и стоимость процессоров Intel Core i7

Уточнить наличие и стоимость материнских плат для Intel Core i7

Другие материалы по данной теме

Первое знакомство с микроархитектурой Intel Nehalem
Недорогие четырёхъядерники: сравнительное тестирование
Бюджетные процессоры Intel: Core 2 Duo E7300 и Pentium Dual-Core E5200