Через тернии к звездам


Три царицы под окном
Пряли как-то вечерком
"Кабы я была девица" -
Говорит одна царица…
Народ


О пользе фантазии


Некоторое время назад мы позволили себе некий небольшой творческий эксперимент: попробовать в статье "Куда едем, Intel" предсказать поведение корпорации Intel. Руководствуясь известными нам фактами и простым здравым смыслом. Который, несмотря на некоторую неопределенность этого понятия, весьма неплохо описывает поведение любой корпорации на рынке. Просто потому, что без этого самого здравого смысла никакой корпорации на рынке не выжить, сколь бы крупной она ни была.
Безусловно, таким методом не предскажешь событий заранее, не имея на то вообще никакой информации. Но, учитывая предысторию событий, зная стиль поведения корпорации, можно примерно представить себе направление "основных ударов". Можно выделить стратегические направления развития. Можно, исходя из сильных сторон тех или иных продуктов корпорации, предсказать наиболее вероятные события. Ну а справедливость таких наполовину аналитических, наполовину интуитивных догадок все равно будет судить история. Такова уж судьба всех "Кассандр"; в том числе "Кассандр" от IT-индустрии.
Припомним, что именно мы предсказывали в качестве предположительных событий:

  1. Затягивание вопроса с поддержкой "64 бит" до последнего момента – что ж, ситуация налицо. О выбранном корпорацией Intel варианте знало разве что высшее руководство корпорации, рядовые сотрудники (не говоря уже о прессе или партнерах компании) не имели ни малейшего представления о том, будет ли Intel поддерживать 64 бита в десктопных процессорах. И, если да, то какой именно набор команд? Сейчас ситуация прояснилась – корпорация все же выбрала здравый смысл и набор команд AMD64 (хоть дала ему другое имя). Но тогда это была одна из центральных интриг. Кстати, именно этот вариант мы указывали как наиболее вероятный.

  2. Ситуация вокруг нового, 90нм ядра Prescott. Слухи о феврале оказались правдивыми. Доступность этих процессоров пока также под вопросом (особенно старших моделей), выпуск в некоторой степени был "бумажным" - даже сейчас, спустя несколько месяцев после анонса, явного изобилия старших моделей новых процессоров не наблюдается, хотя некоторое количество образцов тестеры действительно получили. Производительность не только не стала выше, а как бы даже несколько упала (или осталась примерно на том же уровне, это уж как кто предпочитает). И Hi-End процессор, Pentium 4 Extreme Edition, новое ядро не обогнало. Все именно так, как мы предполагали.

  3. Мы предполагали, что в такой ситуации основная "война" разгорится на смежном фронте? Что ж, пожалуйста: с третьего квартала на конец второго (!) переносится анонс новых платформ под Pentium 4. Видимо, в силу совершенно неожиданных успехов в разработке. Грядет разъем LGA775 и шина PCI Express. Активно муссируются преимущества новой шины (в варианте PCI Express x16) для графики. Что с того, что графическая шина будет функционировать первоначально в полудуплексном режиме, а все обещанные "вкусности" перенесены на следующее поколение чипсетов? Кроме того, позволим себе продолжить "предсказание" - в этих условиях Intel должна всячески поощрять переход на PCI Express x16 и активно противиться установке на новые системы разъема AGP 8x. Хоть, как показывает практика, никакого особого выигрыша от перехода даже на AGP 8х с AGP 4x мы пока не ощутили. Но и это не все. Руководство Intel недавно напомнило, что необходимо (так и хочется спросить "кому"?) активнее переходить на оперативную память нового стандарта, DDRII, которая и поможет достичь невиданной доселе производительности. Производители памяти начали бодро рапортовать о прохождении процедуры сертификации новых модулей памяти у Intel. Правда, стыдливо умалчивая о цене этой самой новой памяти – а она даже по оптимистичным расчетам будет вдвое больше нынешней цены на DDR, при этом не давая никаких преимуществ в пропускной способности, и имея заметно большие задержки; только и удовольствия, что DDRII позднее сможет покорить более высокие частоты. Bingo! А ведь именно этого мы и ждали – маркетингового "упора" прежде всего на новую шину и новую память. Особенно на память – ее поддержка станет для AMD в достаточной степени хлопотной в силу технических особенностей процессоров Athlon 64 (таких, как интегрированный контроллер памяти).

  4. Мы обещали, что Prescott на Socket 478 будет не слишком распространенным? Что ж, недоверчивые могут посмотреть на роадмэп компании Intel. Ну что, каковы перспективы? Больших частот достигнет это ядро на данной платформе? Ах, начиная с 3.6ГГц, только для Socket LGA775? Надо же, как "неожиданно"…

Ну что, достаточно совпадений? Лично для нас – вполне. Скажем честно, от совпадения практически всех предсказанных тогда событий с "наблюдаемой действительностью" мы испытываем несколько нескромное, но вполне [по нашему мнению] заслуженное чувство внутреннего удовлетворения. Отныне мы будем считать, что такое "гадание на гуще" вполне имеет право на жизнь. Соответственно, попробуем его продолжить, только теперь уже в отношении другой стороны. В отношении корпорации AMD.
Напомним, что мы не владеем никакой внутренней информацией и фактически высказываем только свои догадки и выводы относительно дальнейшего развития событий.

Ударим автопробегом по бездорожью и разгильдяйству!


Отныне для AMD знаменитый девиз Остапа Бендера как нельзя более справедлив. В роли "чаши Святого Грааля" маркетинговой политики корпорации AMD – технология AMD64. Собственно, оно и понятно – это первое значительное расширение х86 архитектуры со времен 386 процессора и перехода на 32-х битные вычисления. Кстати, напомним, что прошлый переход (на 32 бита) длился порядка 10 (!) лет. Так что не стоит ожидать, что вся индустрия бодрым шагом побежит переводить программы на 64 бита – многим программам это совершенно не нужно. Впрочем, хуже от такого перехода явно не станет, а некоторые категории задач уже давно нуждаются в 64-х битной архитектуре. Что ж, отныне у разработчиков есть такая возможность. Но еще более важно для AMD то, что это расширение придумала именно она – это достаточно весомый плюс имиджу корпорации.
Также напомним, что предыдущее заметное дополнение х86 архитектуры можно связать с технологией ММХ. Все последующие SIMD расширения – 3DNow!, SSE, 3DNow! Enhanced, SSE2, 3DNow Professional, SSE3 – по сути лишь продолжения идеи SIMD инструкций, только теперь уже на другие типы данных.
В общем-то, можно уже говорить о том, что индустрией технология AMD64 принята достаточно благосклонно: на сегодняшний момент (фактически, спустя год после официального появления AMD64) более 1000 компаний сотрудничают с AMD в разработке аппаратного и программного обеспечения. Причем это весьма немаленькие компании – IBM, SUN, HP, ряд известных производителей программного обеспечения. Более того, Microsoft уже предоставила для апробирования пользователями Windows XP 64 for Athlon 64 and Opteron. Пока запускать на этой системе еще особо нечего (кроме 32-х битных программ, разумеется), но появление операционной системы – знаковое событие для большинства разработчиков программного обеспечения, поскольку до появления операционной системы разрабатывать приложения попросту никто не будет. Так что в целом, повторим, можно сказать, что АMD 64 свое место "под солнцем" нашла. Станет ли она массовой, будет ли это главным направлением развития х86 архитектуры – вопрос уже практически решенный (кстати, ситуация не имеет исторических аналогов в прошлом) в силу того, что Microsoft поддержала этот набор инструкций. Заметим, что эту технологию изобрела и "продвигает" фирма, имеющая примерно пятую часть рынка. Поэтому, в общем-то, возможны "нюансы".
С другой стороны, как бы там ни было, с маркетинговой точки зрения наличие 64 бит действительно мощный козырь для рекламы собственной продукции. Посему AMD безусловно будет делать на этом упор в своей маркетинговой политике. Наиболее вероятно, что это совпадет с моментом активного продвижения архитектуры Athlon 64 в массовые системы, ведь пока присутствие этих процессоров ощущается разве что в секторе дорогих систем. Произойдет это, как вполне понятно, с анонсом платформы Socket 939 [ориентировочно в апреле этого года]; именно она должна стать наиболее массовой платформой с поддержкой AMD64. Массовой эта платформа останется еще несколько лет – сколько именно, сказать трудно. Слишком уж от многих факторов это зависит….
Собственно, привлекательность такого лозунга, как "64 бита каждому", понимает и Intel. Скрипя зубами, тщательно намекая, что, "дескать, никакой необходимости не видно, но раз уж народ требует, то извольте", корпорация объявила о том, что во второй половине года будут представлены процессоры Xeon с технологией СТ (видимо, маркетинговое название этой технологии будет EM64T, от Extended Memory 64 Technology). Эта технология фактически повторяет технологию AMD64, но не включает некоторые дополнительные ее возможности, такие, как 3DNow!. Кроме того, не поддерживается так называемый NX бит (сокращение от No eXecute), позволяющий организовать аппаратную защиту от такого бича 32-х битных операционных систем, как "переполнение буфера". Правда, Intel добавила поддержку технологии SSE3 – но в данном случае, по нашему мнению, как раз стоило придерживаться полной совместимости с AMD64, а не делать "хорошую мину при плохой игре". Тем более, что набор инструкций SSE3 отнюдь не такой значительный шаг вперед, каким был набор SSE2. Ведь набор SSE2 фактически позволил обойтись без х87 сопроцессора, который достаточно сложно использовать эффективно, а SSE3 всего лишь добавляет несколько пропущенных ранее инструкций.
Одной из причин такой неполной поддержки может быть то обстоятельство, что этот самый NX бит поддерживается более высокоуровневой платформой Itanium, и, возможно, Intel сочла нужным таким образом дистанционировать платформы друг от друга.
Кстати, есть сведения, что первый процессор с EM64T технологией, Xeon 3.6ГГц c 1МБ L2 cache, будет объявлен заметно ранее, чем планировалось. Тоже своеобразный показатель того, что Intel в некоторой степени опасается упустить часть рынка серверов, где процессор Opteron в данный момент показывает весьма хорошие скоростные показатели.

И вновь продолжается бой, и сердцу тревожно в груди…


Попробуем представить, какие действия в силах предпринять AMD. Естественно, ответ на действия Intel должен быть по возможности несложным в реализации и при этом приносить ощутимые маркетинговые "барыши" (это для продаж частенько даже важнее, чем реальные технические преимущества). Итак:

  1. Переход на двухканальную память и платформу Socket 939. В общем-то, процесс этот был объявлен заранее и является вполне логичным. В качестве ответа не слишком годится, поскольку никаких сюрпризов в нем не заключается – от этого перехода ждут разве что некоторого выигрыша в производительности систем. В следующей главе попробуем поразмыслить о ситуации с памятью, пока же подытожим: в качестве ответа не годится.

  2. Переход на память DDRII. В качестве быстрого ответа не годится по нескольким причинам, поскольку требует переработки и процессора, и материнских плат. Да и необходимость памяти DDRII для процессоров Athlon 64 является не таким уж очевидным вопросом – далее мы вернемся к изучению этой ситуации.

  3. Увеличение частоты процессора (создание большого запаса в производительности). В данный момент производство более быстрых процессоров Athlon 64 (Opteron), чем 2.4ГГц по технологии 130нм + SOI достаточно затруднительно. Похоже, у нынешнего ядра частотный "потолок" как раз находится на уровне примерно 2.4ГГц, так что перейти этот рубеж и при этом получить высокий выход годных кристаллов вряд ли возможно. Конечно, некоторую часть работающих на 2.4ГГц (и более) кристаллов мы получим, но вопрос в том, насколько массовым будет такой процессор. Для анонса новой платформы AMD наверняка подготовит некоторое количество образцов, но распространенными и дешевыми они не будут. В общем случае, процессоры такой частоты станут распространенными после перехода на технологию 90нм + SOI; переход этот AMD рассчитывает совершить в третьем квартале этого года. В третьем квартале, однако же, будет уже поздно отвечать таким образом – во всю мощь маркетинговой машины Intel будут рекламироваться PCI Express и DDRII, как "шина и память будущего", соответственно. Ответ нам нужен раньше.

  4. Увеличить объем кэша второго уровня. Здесь слишком много проблем: и большая площадь модели с кэшем 1МБ (193мм^2, чего же ожидать от большего кэша?), и необходимость переделывать контроллер кэша, что явно не будет быстрым делом. К тому же увеличение объема кэша неизбежно увеличивает время доступа к нему. И самое главное – на примере Pentium 4 XE мы видим, что увеличение кэша до 2МБ, будучи востребованным на серверном рынке, на задачах для десктопов редко дает ощутимый выигрыш. Это еще относительно приемлемый вариант для Athlon 64 FX или Pentium 4 XE, которые по определению "процессоры для экстремалов", но не выход для большинства случаев.

  5. Ускорить шину Hyper Transport. Это должно принести определенные дивиденды, хоть их и трудно заранее предсказать. Пожалуй, эта идея действительно хороша – и, поскольку платформа Socket 939 еще не объявлена, сравнительно легко реализуема. Достаточно изменить спецификации (с технической точки зрения всех проблем – либо изменить несущую частоту с 200МГц до 250МГц, либо, что еще проще, увеличить коэффициент умножения для шины с 4х до 5х), и все новые системы будут поддерживать именно такую частоту шины…

Надо сказать, что сначала авторы внутренне противились идее ускорения шины и даже выступали с критикой этой идеи. На первый взгляд, незачем это делать: и так на сегодняшний момент скорости текущей реализации Hyper Transport вполне хватает. Но в дальнейшем поразмыслили и решили: "Собственно, а почему бы и нет? Кому от этого хуже?".
Итак, что же выиграет AMD от более скоростной шины Hyper Transport? Во-первых, увеличится пропускная способность шины. Вместо 6.4ГБ/сек., которые сегодня есть и у конкурента с его шиной 800МГц, получим 8ГБ/сек., которые у конкурента появятся нескоро, только после появления шины 1066МГц. Уже плюс, особенно с точки зрения маркетинга. Во-вторых, что, возможно даже более важно, еще более усилим наиболее выигрышную черту архитектуры Athlon 64 – низкую латентность обменов данными. Благодаря повышению несущей частоты шины с 800МГц до 1000МГц латентность передачи снизится на те же самые 25%. Есть и в-третьих: что красивее звучит с маркетинговой точки зрения, шина 1.6ГГц (предыдущий вариант шины Hyper Transport) или же 2ГГц? Не говоря уже о том, что конкурента можно бить его же оружием: ранее шина 800МГц на платформе Pentium 4 сражалась в глазах покупателей с шиной 400МГц на платформе Athlon XP. Кто выигрывал в таком "сравнении", вполне очевидно. Теперь же эти же 800МГц будут противостоять красивой и круглой цифре 2ГГц! Согласитесь, в глазах покупателя, незнакомого с техническими деталями, преимущество шины AMD весьма и весьма впечатляющее. Можно даже применить слово "подавляющее".
Выигрыш от ускоренной шины, между тем, должен быть особо заметен в секторе многопроцессорных плат под Opteron-ы. В силу архитектуры многопроцессорных систем на Opteron-ах. Поскольку все межпроцессорные обмены происходят именно по шинам Hyper Transport, ускорение этой шины делает такие обмены более быстрыми, снижая задержки пересылки и уменьшая время, необходимое на пересылку данных. А системы на Opteron делает более "плоскими" для операционной системы: в том смысле, что выравниваются времена доступа к своей и чужой памяти. Особенно этот эффект [выравнивания памяти] будет заметен в ситуации, когда пропускная способность шины Hyper Transport превзойдет пропускную способность индивидуальной памяти каждого процессора. В этих условиях архитектура систем на Opteron, скорее всего, будет иметь наибольшую эффективность. Кроме того, чем быстрее межпроцессорная шина, тем лучше масштабируются системы с ростом количества процессоров. Идеальным следовало бы признать случай, когда пропускной способности межпроцессорных шин достаточно для пересылок всех запросов между памятью всех процессоров. То есть, пропускная способность шины в идеале должна быть равна суммарной полосе памяти для всех процессоров. Для двухпроцессорных систем в данный момент необходимо 12.8ГБ/сек (этой цифры достаточно, чтобы процессоры читали данные из памяти другого процессора на полной скорости), для 4-х процессорных такой расчет заметно сложнее в силу неоднозначности пути запросов. Очень приблизительно можно считать, что утроенной скорости памяти должно быть в большинстве случаев вполне достаточно. То есть искомая цифра находится в районе 20 ГБ/сек (предполагается, что пропускная способность памяти равна 6.4ГБ/сек и соответствует двухканальной памяти DDR400).
А теперь припомним, что недавно AMD анонсировала новую версию стандарта Hyper Transport, версию 2.0. Отличительными ее особенностями являются – поддержка совместимости с PCI Express (что, в общем-то, очевидно, поскольку индустрия обязательно поддержит новую периферийную шину, скорости PCI уже многим устройствам недостаточно) и новые скорости. Наиболее интересна максимальная скорость: 22.4 ГБ/сек. О как! (с) Опять неожиданное и случайное совпадение? Впрочем, не будем потакать несколько параноидальной "теории мировых заговоров". Не надо забывать, что текущие системы используют шину шириной 16 бит, скорость которой вдвое меньше. Впрочем, даже этого вполне достаточно для двухпроцессорной машины, которая в случае применения такой шины станет практически "плоской" для операционной системы с точки зрения скоростей доступа к своей и "чужой" памяти.
Вполне возможно, что в более отдаленном будущем для соответствующих платформ (особенно это интересно для четырех- и восьмипроцессорных платформ) будет подготовлена эталонная система на новой версии шины – благо, прирост производительности вполне покроет затраты на ее создание. Правда, это потребует, чтобы новую версию шины Hyper Transport 2.0 поддерживали также и процессоры. Только вот что-то подсказывает, что в одном из очередных степпингов процессора Opteron (Athlon 64) вполне может оказаться недокументированная поддержка такой шины. Как вариант, эта поддержка может появиться в выпущенном недавно новом степинге CG.
Впрочем, это все дело достаточно отдаленного будущего, а пока нас ждет "банальное", но такое приятное ускорение шины Hyper Transport до 1ГГц. Что не может не радовать.
Правда, подобная идиллия может нарушаться тем фактом, что первое поколение плат под Opteron уж точно не рассчитано ни на какое ускорение шины Hyper Transport. Возможно, эта проблема поддается "решению" путем обновления BIOS – конкретные ситуации будут уже зависеть от производителя тактового генератора, а также от "запаса прочности" шины при разводке платы. У автора есть ощущение, что платформы сразу создавались с достаточным запасом помехоустойчивости шины. Впрочем, ни подтвердить, ни опровергнуть эту догадку мы не в силах, для этого недостаточно данных. Кстати, в случае, если опорная частота не изменится, все станет еще проще – поменять коэффициент умножения не должно быть большой проблемой. Например, одна из первых плат под Opteron-ы небезызвестной компании Arima уже поддерживает такую частоту шины.
Подытожим: внедрение более быстрой шины принесет заметные дивиденды: ускорение систем, маркетинговые преимущества в виде круглых цифр и превосходства над соответствующими цифрами конкурентов. Кроме того, в силу более высоких характеристик удлинится жизненный цикл платформы. Некоторым подтверждением наших построений может служить тот факт, что довольно давно тема ускорения Hyper Transport муссируется различными новостными агентствами; а дыма без огня, как известно, не бывает.

Что-то с памятью моей стало…


Как уже неоднократно говорилось, корпорация Intel приложит все усилия для популяризации памяти DDRII. Ну а поскольку усилия Intel обычно оправдываются (исключения, такие, как давняя история с Rambus, только подтверждают правило), корпорации AMD необходимо иметь план действий в случае широкого распространения этой памяти.
Посмотрим, что вообще представляет собой память DDRII. Напомним, что любая память характеризуется несколькими параметрами: задержками доступа и пропускной способностью. С пропускной способностью все нормально – она (в расчете на мегагерц) такая же, как и у памяти DDR, но при этом DDRII будет заметно легче набирать частоту. Кроме того, есть и некоторые сугубо технологические преимущества: например, внутрикристальное терминирование, что позволит несколько упростить разводку плат.
Гораздо хуже дело обстоит с другой характеристикой – с задержками. Они у DDRII велики. Заметно выше, чем у DDR. Такое впечатление, что эту память специально придумали, чтобы нивелировать основное преимущество архитектуры Athlon 64 – низкую латентность. На самом деле, конечно, никто настолько "коварным" не был – просто пути повышения производительности динамической памяти практически исчерпаны, удается лишь сравнительно медленно растить частоту ее работы, в меру сил постоянно улучшающегося технологического процесса производства. Ну а поскольку элементарная ячейка памяти принципиально не изменилась, никаких значительных улучшений на этом фронте не ожидается. Увы, физика неумолима: до тех пор, пока не изменится организация элементарной ячейки памяти, принципиального прорыва в этой области ожидать не следует. В общем-то, в силу неизменности самой ячейки DRAM основное направление совершенствования памяти состоит в ускорении канала передачи данных от контроллера памяти к самой микросхеме. То есть постоянно растет скорость передачи данных и предельная пропускная способность модуля памяти, а сравнительно низкая скорость самой ячейки компенсируется применением всевозможных конструкций со сдвигом передачи по фазе от различных ячеек.
Перейдем к цифрам. Типичная временная диаграмма для памяти DDR400 "среднего качества" сейчас выглядит как 2.5-3-3, либо как 3-3-3. То есть, задержка доступа составляет 12.5 или 15 наносекунд. Такая же по частоте память "типичная" DDRII-400, произведенная в данный момент, имеет диаграмму 4-4-4. То есть, 20 наносекунд доступа. Вот такой вот "прирост" с отрицательным знаком.
Повторим еще разок – память DDRII не имеет преимуществ перед DDR в пропускной способности на равной частоте. Память DDRII имеет большие задержки, нежели предыдущий стандарт. Память DDRII имеет внутрикристальную терминацию и, вследствие этого, больше нагревается, нежели DDR (сомневающиеся могут припомнить память DDRII на видеокартах – в отличие от работающих на тех же частотах микросхем DDR, микросхемы DDRII приходится снабжать радиаторами). То-то Intel озаботилась новым форм-фактором корпуса, ВТХ – ведь внутри компьютера появится еще один источник тепла. Единственное преимущество памяти DDRII состоит в том, что она сможет достичь более высоких частот, нежели DDR. Хотя даже DDR уже достигла скоростей в 550 - 560МГц (пока в модулях для оверклокеров). Впрочем, DDRII со временем дорастет до 800МГц, которые памяти DDR уж точно не под силу. Будет это, правда, не очень скоро.
Кроме того, память DDRII будет просто банально дороже. На сегодняшний момент производители памяти обещают соотношение цен, равное двум. То есть, поддержка "прогрессивных технологий" обойдется покупателю вдвое дороже памяти DDR того же объема. Выиграют от этого разве что производители памяти, не зря они так радостно приветствуют и поддерживают этот переход.
Позднее, с отладкой технологии, появится память DDRII-400 с диаграммой 3-3-3, но вариантов 2-2-2, как у наиболее качественных модулей современной DDR, нам не дождаться. А ведь даже распространенный среди "нонейм" производителей вариант 2.5-3-3 имеет характеристики лучше, нежели "торжество технологий" в лице DDRII. Первой технологией DDRII, которая появится, будет DDRII-400 с диаграммой 4-4-4, затем она ускорится до 3-3-3. Впрочем, данные удобнее привести в виде таблицы.


* - данные DDR400 приведены для сравнения;
** - данные DDR500 приведены для сравнения. Стандарт DDR500 комитетом JEDEC не утвержден;
*** - более поздний вариант, примерно вторая половина 2005 года.


Данная таблица в особых пояснениях не нуждается. Видно, что, по сравнению с выпускаемой серийно памятью DDR400 реальные преимущества обеспечивает разве что память DDRII-533 и то с задержками не хуже 3-3-3, тогда как первоначально она будет выпущена с консервативными задержками 4-4-4, или ужасающими 5-5-5. Только во второй половине 2005 года появится действительно быстрая память с характеристиками 3-3-3. Именно она выделена цветом, как первая память, которая действительно продемонстрирует преимущества стандарта DDRII.
Корпорация AMD вполне обоснованно полагает, что применять в своих процессорах память DDRII следует с варианта DDRII-667. Только он даже в стартовой модификации обеспечивает разумные задержки. А этот вариант появится в заметных количествах не ранее второй половины 2005 года. Так что пользователи даже нынешних модификаций Athlon 64 могут не особо расстраиваться из-за отсутствия поддержки DDRII. Они ничего существенного не потеряли.
Поскольку первые варианты DDRII для AMD малоинтересны, следует предполагать, что поддержка этого типа памяти появится разве что с переходом на новое ядро. Разумно предположить, что поддержку этого типа памяти введут одновременно с переходом на 90 нм – зачем делать лишнюю работу?!
Надо также понимать, что поддержка памяти DDRII потребует новых материнских плат – как для платформ Intel, так и для платформ AMD. В частности, платформа Socket 939 на память DDRII не рассчитана. Видимо, желающие применить эту память должны будут ждать следующего года и как минимум памяти DDRII-533, иначе никакого преимущества от перехода они не получат, скорее проигрыш. Логично будет предположить, что в следующем году (скорее во второй половине) AMD предложит новую платформу. Будет ли она совместима с процессорами в формате Socket 939? Скорее всего, нет. Будет ли продолжаться эволюция платформы Socket 939? Наверное, да, ниже мы изложим причины такого мнения.
Есть еще одно забавное следствие ускорения шины Hyper Transport, первоначально пропущенное нами. Итак, теперь несущая частота шины будет 1000МГц. Как мы уже писали, 1000МГц можно получить либо как 200 х 5, либо как 250 х 4. Причем второй вариант интересен вот чем; припомним совсем несвязанную с данной шиной вещь. Некоторые производители памяти, такие, как Samsung или HYNIX, наладили производство памяти DDR500 (естественно, это название несколько условно, комитет JEDEC такого стандарта памяти не утверждал; это наименование всего лишь обозначает, что память работает на частоте 500МГц). Конечно же, это опять никак не связанные события. Но каким же волшебным образом эти события подходят друг другу! Это развитие событий весьма устраивает AMD, которой обеспечить поддержку DDR500 намного проще, чем DDRII. Это устраивает и производителей, которые получают возможность продать часть памяти по более высокой цене не только оверклокерам, каковых всегда было немного, а в качестве одного из основных продуктов на гораздо более широком и массовом рынке. Пожалуй, в "проигравших" (косвенно) здесь разве что Intel, которой переход на DDRII ничем особым не грозит – ну, увеличатся слегка задержки доступа к памяти, ну так они и так были заметно больше, чем у конкурента.
Посмотрим в таблицу. Для памяти DDR500 все более чем неплохо – только DDRII-667 (причем поздней ревизии, с небольшими задержками) способна превзойти ее. Таким образом, мнение AMD становится достаточно обоснованным – действительно, зачем переходить на новый стандарт памяти, если "старый" еще совсем не исчерпал своих возможностей?! Тем паче, что DDR500 будет заметно дешевле, чем DDRII-667 со сниженными задержками (уже сейчас разница модулей 256МБ для стандартов DDR400 и DDR500 порядка трех долларов). По крайней мере, в ближайшем будущем такое соотношение стоимостей сохранится.

К вопросу о легендарных непарнокопытных, принадлежащих некоему Буридану


Дальше ситуация слегка отличается для двух вариантов ускорения шины Hyper Transport.

Вариант А: 1000 = 200 х 5

Этот вариант наиболее вероятен – его внедрение вообще не потребует какой-либо серьезной переделки платформы, необходимо только изменить коэффициент умножения опорной частоты. Поэтому есть основания всерьез рассчитывать именно на этот вариант.
В этом случае все остальное достаточно предсказуемо: будет две платформы, Socket 754 и Socket 939 (и "отживающая свое" на рынке десктопов платформа Socket 940). Первая одноканальная, вторая – двухканальная (Socket 940 также двухканальная платформа, но ее главное предназначение – серверы). Количество каналов памяти и есть ключевое отличие между двумя платформами – производительной и бюджетной. Судя по последним слухам (в частности, опубликованным на сайте), нумерация моделей будет такой:


В принципе, нумерация моделей для Socket 754 измениться не должна, поэтому мы в дальнейшем ее приводить не будем. Варианты Socket 939 также вполне предсказуемы – частоты нарастают по 200МГц, модели добавляют к нумерации по 300 единиц. Обратим внимание, что номера моделей для Socket 939 несколько выше таковых для Socket 754 при равной частоте процессора (и большем размере кэша у процессоров для Socket 754). Предположив, что прирост номера модели на 300+ единиц примерно равен 10% приросту производительности, получим, что системы на Socket 939 будут быстрее своих Socket 754 собратьев примерно на 5%. Цифры, естественно, очень приблизительные. Также обратим внимание, что для Socket 939 объем кэша второго уровня составляет 512КБ (ядро Newcastle).
В случае применения памяти DDR500 результирующие частоты памяти легко определить из того факта, что делитель памяти в процессорах Athlon 64 может быть только целым числом. Посмотрим в таблицу:


В скобках указан делитель для памяти.

Видно, что весьма эффективно применение памяти DDR500 для процессоров частотой 2.0ГГц, 2.2 ГГц и, в чуть меньшей степени, для 2.4 ГГц. То есть в том самом диапазоне, в котором и будут находиться [в ближайшее время] частоты процессоров. Прирост скорости работы памяти для этих процессоров будет весьма заметен. Кстати, указанные выше частоты памяти будут справедливы для обеих платформ, ведь для Socket 754 также весьма вероятен выход обновленной ревизии процессоров Athlon 64. Впрочем, как бы там ни было, но разница между частотами DDR400 и DDR500 вполне различима и должна быть заметна в тестах и реальных приложениях.

Вариант В: 1000 = 250 х 4

Это гораздо менее вероятный вариант. Но этот вариант заметно более интересен в силу нескольких следствий из него.
Следствие первое: частота процессора будет нарастать теперь не по 200МГц, а по 250МГц. Учитывая, что это довольно большой шаг, а масштабироваться по частоте ядро К8 может отнюдь не бесконечно, можно предположить, что в таком варианте имеет смысл ввести полуцелые коэффициенты умножения. Тогда частоты процессоров Athlon 64 могут получить шаг прироста частоты в 125МГц, а их модельный ряд, например, может меняться с шагом 200+. Это позволит сохранить "каноническое" [для данной платформы] отношение прироста частоты и модельного номера. В таблице указано предполагаемое соответствие частот и моделей (Socket 939):


Видим, что ряд моделей получается достаточно логичным. Посмотрим, что творится со скоростью памяти в случае таких "нецелых" частот.


* - хотя при делителе памяти 13 формально частота памяти выше, чем 200МГц, разница (2МГц) не настолько велика, чтобы это хоть как-то сказалось на стабильности. Почему мы предполагаем, что для данной частоты лучше использовать именно такой делитель, невзирая на то, что формально надо использовать делитель 14.

В общем-то, со скоростью памяти "не ахти", почти везде частота памяти отличается от номинальной. Не то, чтобы очень сильно, но все же… Почти везде использовать память DDR400 оказывается не так выгодно, память DDR500 же оказывается вполне эффективной. Хотя в процентном отношении память DDR400 работает ближе к номинальной частоте, чем DDR500.
Повторим, что, тем не менее, этот вариант весьма маловероятен, тем более, что память DDR500 все же является на сегодня скорее экзотикой. Делать для основной платформы ставку на экзотическую память достаточно рискованно. Так что готовиться стоит именно к первому варианту, когда шина тактируется частотой 200МГц. Тем более, что и там есть варианты, позволяющие задействовать память DDR500 в полную силу.
Кстати, если позволят чипсеты, всем оверклокерам стоит присмотреться к варианту превращения варианта 1 в вариант 2: это должно давать достаточно высокие дивиденды. В самом деле, заставив работать процессор вместо 2.0 ГГц на 2.25 ГГц, память вместо 400МГц на 500МГц, а шину Hyper Transport вместо 800МГц на 1000МГц (то есть установив как 250 х 4), мы получим заметный прирост производительности. Единственный нюанс: для успешности такого разгона необходимо, чтобы частоты AGP PCI были асинхронными по отношению к частоте Hyper Transport. Впрочем, и NVidia, и VIA, два самых крупных производителя чипсетов под платформу AMD, обещают, что необходимые возможности асинхронного тактирования будут присутствовать в новых чипсетах.

Отставить разговоры! Вперед, и вверх! А там…


Присматриваясь к некоторым действиям производителей процессоров, поневоле приходишь к выводу, что все они сплошь поклонники Высоцкого. Например, это касается ситуации с производительностью "экстремальных" процессоров серий Athlon 64 FX и Pentium 4 Extreme Edition. В данный момент очередную высоту взяла компания AMD, выпустив процессор Athlon 64 FX53 частотой 2.4 ГГц. Кстати, он основан на той самой ревизии CG, про которую мы писали чуть выше. В данный момент выпуск этого процессора позволил AMD перехватить флаг "наиболее производительного процессора" - впрочем, как обычно, до появления соответствующего конкурирующего процессора. Интересно другое: все тестеры отмечают, что этот процессор в большинстве случаев спокойно при штатном охлаждении разгоняется примерно до 2.6 ГГц. То есть, при большой необходимости, AMD может выбросить на рынок процессор Athlon 64 FX55.
Отметим, что, невзирая на почти полную идентичность процессоров Opteron 1хх серии и Athlon 64 FX, соответствующие Opteron-ы серий 150, 250 и 850 не были объявлены. Видимо, AMD ждет объявления соответствующего Xeon 3.6 ГГц, чтобы при необходимости ответить на него новым "залпом" процессоров для серверного рынка. Что ж, вполне логичная позиция – зачем выбрасывать козыри раньше времени? Выпуск этого процессора еще может быть востребован, если новый Xeon покажет заметно улучшившиеся скоростные характеристики. Тогда надо будет опять создавать задел в производительности, потому что именно преимущество в производительности и более широкие возможности процессоров Opteron и являются тем "двигателем", который заставляет корпорации выпускать системы на его основе. Таким образом, наш вывод звучит так: если новый Xeon 3.6 ГГц с 1МБ L2 продемонстрирует рывок вперед в плане производительности, AMD выпустит новый процессор. Иначе выпуск нового серверного процессора будет отложен примерно до третьего квартала. Если же новый Xeon продемонстрирует сильное увеличение производительности, то "неожиданно" появятся процессоры Opteron не только х50, но x52 серий с частотой 2.6ГГц. Их на текущем технологическом процессе 130нм + SOI будет явно немного, но и этого на первое время достаточно. Насколько нам известно, пока дефицита процессоров Opteron не наблюдается, то есть производственные возможности AMD вполне в состоянии удовлетворить спрос на эти процессоры.
Основные же усилия AMD ныне будут направлены на переход на технологию 90нм + SOI. Это необходимо и для снижения себестоимости, и для увеличения количества выпускаемых процессоров. Здесь многое будет зависеть от технологов AMD. Кстати, их деятельность вызывает уважение и вот по какой причине: на одной и той же (!) фабрике Fab 30 в Дрездене одновременно идет выпуск процессоров Athlon XP по технологии 130нм, процессоров Athlon 64 и Opteron по технологии 130нм + SOI (которая довольно заметно отличается от предыдущей), и в то же самое время технологи осваивают технологический процесс 90нм + SOI. Автору не удалось навскидку придумать другой такой пример подобного совмещения трех технологий одновременно. Понятно, что подобные "подвиги" совершаются, в общем-то, не от хорошей жизни, а от недостатка фабрик, но отдать должное технологическому подразделению AMD необходимо.
Достаточно сдержанный, но все же оптимизм в отношении технологии 90нм + SOI вызывает тот факт, что работающий (хоть и на небольшой частоте, 800МГц) прототип процессора Opteron по этой технологии уже демонстрировался AMD. За оставшееся до третьего квартала время корпорация вполне может подготовить массовый выпуск по этой технологии – если, конечно, не столкнется с какими-то принципиальными трудностями. Например, корпорация Intel столкнулась с тем, что ее технология 90нм + "strained silicon" демонстрирует неожиданно большие (большие, чем предсказанные теоретически) токи утечки. В силу этого продукция, произведенная по новому техпроцессу, нагревается ощутимо сильнее предыдущего ядра, сделанного по более старой технологии. В случае корпорации AMD применяется другая разновидность технологии, 90нм + SOI, у которой все в порядке с токами утечки. Но есть и свои минусы – эта технология хуже масштабируется по частоте, к тому же потенциально имеет некоторые проблемы с распределением температуры внутри процессора. Впрочем, ответ на этот вопрос даст только практика: если все будет нормально, то в третьем квартале мы увидим изобилие новых процессоров для Socket 754 и Socket 939, произведенных по технологии 90нм + SOI.
Этот переход сильно снизит себестоимость кристалла (вместо 193мм^2 площадь нового кристалла будет составлять примерно 102мм^2), что должно стать заметным подспорьем в конкурентной борьбе с Intel. Это тем более важно, что Intel на 90нм практически уже перешла, да еще у нее в активе пластины 300мм, которые сами по себе заметно снижают себестоимость процессора. Кроме того, была опубликована величина максимального тепловыделения для Socket 939, 105Вт. Учитывая, что это касается всего срока жизни Socket 939, это внушает определенный оптимизм. И, по крайней мере, это заметно меньше, чем максимальное тепловыделение платформы Prescott для LGA775 (до 120Вт) и платформы Tejas (~150Вт). Соответственно, можно с позиций осторожного оптимизма ожидать, что на этой технологии удастся достичь частоты 2.8 – 3.0ГГц (пусть даже и не в первой ревизии процессоров). Это примерно модели 4000+ - 4300+ в номенклатуре AMD. Кроме того, от нового ядра вполне резонно ожидать поддержки технологии SSE3 (на самом деле, кроме команд, относящихся к Hyper Threading, почти все остальные команды давно имеют функциональные аналоги в Extended 3DNow!; таким образом, их поддержка сводится к "обучению" декодера команд преобразовывать их во внутренние макрооперации). Естественно, за исключением команд MWAIT и MONITOR, относящихся к технологии Hyper Threading – они процессору Athlon 64 совершенно ни к чему. А также, вероятно, появится поддержка памяти DDRII – впрочем, использование такой памяти гарантированно потребует новых материнских плат и нового форм-фактора процессора.
Кстати, не исключено, что даже по текущей технологии 130нм + SOI будет представлено новое ядро (Newcastle), в котором будет 512КБ кэша. Даже такой вариант сравнительно выгоден, поскольку позволяет снизить площадь кристалла примерно до 150мм^2, что благотворно сказывается на себестоимости процессора. И, следовательно, на прибыли AMD, каковая ей, учитывая строительство новой фабрики Fab 36, весьма сильно понадобится. На самом деле это, видимо, все же запасной вариант на случай, если внедрение 90нм + SOI по какой-то причине задержится. Тогда переход на промежуточное ядро позволит примерно на треть увеличить количество выпущенных процессоров на том же количестве пластин.

А в это время…


Кроме запуска нового технологического процесса, AMD есть над чем поработать. Это и создание нового моста Hyper Transport – PCI Express 16x (tunnel в терминологии AMD), разработка которого, кстати, не должна быть особо сложной в силу большого сходства этих шин. Разве что придется применить более новую версию Hyper Transport 2.0, чтобы шина успевала прокачивать 8ГБ/сек графического интерфейса. Правда, учитывая, что первые системы будут содержать порт PCI Express 16x, работающий в полудуплексном режиме, можно пока обойтись без перехода на новую версию Hyper Transport, благо ускоренная шина Hyper Transport по пропускной способности полностью соответствует новому графическому порту. Это, например, создание нового "южного" моста взамен слегка устаревшего морально AMD8111 – в самом деле, пора уже обеспечить и Gigabit Ethernet, и Serial ATA, и PCI Express 1x. Иначе системы на базе Athlon 64 будут проигрывать "по очкам", в силу отсутствия новых технологий. Впрочем, вполне возможно, что в этом вопросе AMD полагается на смежников, VIA, NVidia, а также на SiS. Правда, по нашему мнению, подстраховаться в этом вопросе было бы вполне логично.
Кроме вышеперечисленного, у AMD есть еще один достаточно привлекательный козырь: технология Cool’n’Quiet. Суть ее в том, что при загрузке процессора менее 80% процессор переходит на более низкую частоту и уровень энергопотребления. Одновременно с этим снижается частота вращения вентилятора охлаждения. Если загрузка все еще невелика, можно снижать частоту и далее. Минимальной частотой в этой технологии являются 800МГц (1000МГц для новых ревизий процессоров и для систем Socket 939). В общем-то, надо признать, что производительности даже 1ГГц процессора Athlon 64 абсолютно достаточно для большинства офисных и домашних задач. А если производительности не хватает, система автоматически увеличивает частоту до номинального значения.
Как легко заметить, технология Cool’n’Quiet достаточно интересна тем, что, будучи не слишком сложной технологически (фактически это адаптированная к настольным платформам технология энергосбережения для мобильных систем), она является весьма заманчивой для конечного пользователя. Суть имеющейся сегодня проблемы в том, что работать за скоростными компьютерами становится попросту некомфортно. Нагрев, шум вентиляторов охлаждения – все это не улучшает эргономику рабочего места пользователя. Вплоть до того, что создание малошумящих систем стало для многих пользователей превалирующим мотивом. На этой волне даже получила некоторую популярность платформа Eden от VIA, которая мало нагревается и мало шумит (правда, производительностью эта платформа также похвастаться не может). Это заметил маркетинговый отдел AMD, и результат чаяний пользователей воплотился в технологию Cool’n’Quiet.
В результате имеем заметно более разумный график режима работы компьютера – на полную мощность он работает только тогда, когда максимальная производительность процессора действительно необходима. В остальное же время он бережет уши пользователя и его кошелек, создавая меньше шума и потребляя меньше энергии. Что ж, это к лучшему, тем более, что никаких особых недостатков в этой идее найти не удается.
Собственно, уже современные платформы на Socket 754 поддерживают эту технологию. Более того, материнские платы, не поддерживающие эту технологию, не будут приниматься на тестирование корпорацией AMD. Так что у нас нет сомнений в том, что большинство систем под Athlon 64 данную технологию поддерживать будет.
Мы же обратим внимание на другой конец "процессорной шкалы", на процессоры Opteron. В общем-то, их эволюция будет вполне предсказуемой: выйдут модели х50 (еще по технологии 130нм + SOI), затем, по мере необходимости, будут выпущены более высокочастотные модели.
Заметно интереснее проанализировать те слухи, которые доносятся из AMD в ответ на вопросы "а почему у AMD нет аналога технологии Hyper Threading?". Отметим, что эта технология в некоторых случаях позволяет выйти в лидеры процессору фирмы Intel. Соответственно, наличие подобной технологии у AMD позволило бы нивелировать практически единственный оставшийся козырь конкурента.
Собственно, причин, видимо, две. Первая состоит в том, что микроархитектура Athlon 64 заметно отличается от микроархитектуры Pentium 4. В силу этого ввести туда аналог технологии Hyper Threading представляется достаточно сложным, необходимо кардинально переделывать декодер и некоторые другие блоки. В данном случае процессор Pentium 4 изначально разрабатывался для поддержки этой технологии (частично для этого и понадобилось существование Trace cache), соответственно, и прирост производительности от нее весом и заметен. В процессоре Athlon 64 без кардинального редизайна ядра не достичь той степени прироста производительности, каковой достиг процессор Pentium 4. Причина кроется в той самой микроархитектуре процессора Athlon 64, из-за которой выигрыш от такого усовершенствования весьма сомнителен; ведь одна из основных проблем процессора Pentium 4 состояла в частом простое исполнительных блоков. Прежде всего, в силу высокой частоты процессора и особенностей работы его декодера. Соответственно, внедрение технологии Hyper Threading позволило во многих случаях замаскировать задержки загрузки данных и увеличить "коэффициент полезного действия" процессора. Тогда как в процессоре Athlon 64 эта проблема стоит не так остро, там исполнительные устройства простаивают гораздо реже. Да и решена проблема загрузки исполнительных устройств совсем по-другому.
Вторая причина была озвучена представителями AMD на одной из конференций: "уж лучше выпустить настоящий двуядерный процессор, чем заставлять процессор притворяться двумя". Что ж, что правда, то правда – два физических процессора действительно будут быстрее, чем один физический процессор, изображающий два логических. Безусловно, лучше быть здоровым и богатым, чем бедным и больным. Правда, AMD не стоит забывать, что технология Hyper Threading действительно помогает конкурирующим процессорам в ряде случаев, особенно в многозадачной среде. Так что какой-то ответ на эту технологию предоставить надо. Двуядерные процессоры являлись бы наиболее эффективным ответом.
Если предположить, что именно в этом направлении ведутся работы в AMD, то все становится довольно логичным. Во-первых, при переходе на технологию 90нм + SOI площадь процессора (правда, с кэшем 512КБ) становится равной 102мм^2. Это позволяет интегрировать два процессора в один кристалл при площади получившегося изделия, примерно равной 200мм^2. То есть, примерно равной текущей площади процессоров Athlon 64. Для высокоуровневых и серверных процессоров вполне допустимая площадь.
Во-вторых, сама архитектура процессоров Athlon 64 как нельзя лучше приспособлена для создания дву- (и более) ядерных процессоров. Напомним, что собственно ядро процессора соединено с внутренним коммутатором (X-bar), который уже затем соединен с контроллером памяти и шиной Hyper Transport. Таким образом, нам нужно интегрировать в кристалл еще одно ядро и сделать еще один порт у вышеупомянутого коммутатора, после чего два ядра легко и непринужденно будут соединены в одном процессоре. Более того, внутрикристальное соединение может быть достаточно высокоскоростным – настолько, чтобы, например, позволить ядрам без особых задержек работать в L2 cache друг друга, что увеличит эффективное значение кэша каждого из них. А также слегка снизит необходимость в загрузке данных из оперативной памяти (наиболее длительный процесс по меркам процессора). Естественно, что такая конструкция будет масштабироваться по производительности с ростом частоты весьма эффективно. И, опять же, наиболее естественной областью применения таких двуядерных процессоров видится серверный рынок и рынок рабочих станций. Именно там наибольшее число приложений, активно использующих многопроцессорность, и оптимизированных под такие системы.
Правда, есть у таких процессоров и потенциальные проблемы. Одна из них давно известна, это нагрев. Два таких процессора должны достаточно сильно греться, поэтому распространенными они станут разве что с переходом на технологию 65нм, до которой еще не менее года. Поэтому весьма вероятно, что двуядерными будут не наиболее быстрые процессоры, а процессоры на пару ступенек ниже по частоте. Впрочем, в серверах тепловыделение не является особой проблемой, там уже давно научились бороться с тепловыделением серверных процессоров. Поэтому наиболее вероятно появление таких процессоров именно для серверного рынка.
Также рискнем сделать предположение, что устанавливаться они будут по-прежнему в Socket 940. Во-первых, это избавляет от необходимости разрабатывать и затем проверять новую инфраструктуру. Кроме того, это позволит сохранить вложенные в рекламу средства и усилия, сберечь труд партнеров. И еще сэкономит деньги пользователей, что только прибавит привлекательности такому варианту модернизации систем, и, безусловно, должно понравиться потенциальным покупателям платформы Opteron. Не говоря уже о том, что в таком варианте цену на подобный процессор "для модернизации предыдущего поколения систем" можно назначить сообразно целевому рынку. То есть "вкусную" (для AMD), к тому же более высокую, чем цена на одноядерный вариант процессора.
Вторая потенциальная проблема связана с программным обеспечением. Если технология Hyper Threading вполне работоспособна на "домашней версии" Windows XP Home, поскольку физический процессор все-таки один, то в случае двуядерного процессора такой "поблажки" практически гарантированно не будет. То есть, придется покупать заметно более дорогую Windows XP Professional, которая лицензирована для двух физических процессоров. В принципе, это не слишком большая проблема, если речь идет о наиболее дорогих процессорах линейки – того, кто решится на покупку топового процессора, лишние 80 долларов за другую версию операционной системы не остановят. Но в среднем и младшем сегменте это может стать препятствием для широкого распространения таких процессоров.
В серверном же рынке такие процессоры будут приняты "на ура" в силу заметно более высокой производительности – равно, впрочем, как и двуядерные процессоры конкурента, который также обозначил существование внутри корпорации подобных разработок. Тем более, что есть замечательный пример такого процессора, Power4+ от IBM, который известен как раз как одно из самых производительных решений на серверном рынке. В принципе, подобные ожидания вполне понятны, многоядерные процессоры есть альтернативный путь увеличения производительности систем, поскольку линейное увеличение частоты процессора далеко не всегда возможно. Да и многопроцессорные системы заметно меньше "проседают" при увеличении нагрузки, что есть заметный их плюс.

Тихо шифером шурша, крыша едет не спеша…


А вот в этой главе мы позволим себе роскошь помечтать без оглядки на такую скучную вещь, как здравый смысл. А заодно посмотрим, куда нас приведут эти "мечтания". Еще раз подчеркнем – все, изложенное в этой главе, есть целиком и полностью измышления, не базирующиеся ни на каких данных, кроме самых общих и доступных сведениях.
Речь пойдет вот о чем. Понятно, что рано или поздно, но на DDRII переходить все же придется. Просто потому, что магия цифр все равно действует на покупателя, а "DDRII это же новее, чем DDR". Да и II больше, чем I. Да, AMD перейдет на DDRII разве что с DDRII-533, а то и позднее. Но в любом случае наращивать скорость надо, а другого кандидата на замену DDR пока не видно. Эх, вот где остается пожалеть о том, что из-за неразумной лицензионной политики разработки компании Rambus вряд ли будут востребованы на компьютерном рынке. Решив заработать "все деньги сразу", компания сделала стратегическую ошибку. Причем ошибку, никак не связанную с техническими характеристиками продукции. К сожалению, стиль работы компании оказался весьма далек от понятия "честный бизнес". Да и саму ситуацию, когда участник комитета JEDEC вдруг втайне от остальных членов комитета патентует открытые изначально (!) разработки и спецификации (а затем требует за эти патенты лицензионные отчисления (!) от партнеров), иначе как свинством, не назовешь. Посему особой надежды на то, что производители будут снова делать ставку на Rambus (или в какой-то другой форме сотрудничать с ним), попросту нет. К чему мы вспомнили про Rambus? А вот к чему: в данный момент в активе этой компании числится такая интересная разработка, как XDR SDRAM, представляющая собой воплощение идеологии Yellowstone. Суть ее в том, что данные передаются 8 (!!!) раз за такт (сравните с 2 передачами за такт в технологии DDR). Впечатляет, не так ли? К сожалению, лицензионные отчисления за эту технологию слишком высоки для большинства производителей оперативной памяти. И, хоть некоторые производители (такие, как Samsung) имеют лицензию на эту память, применяется она в силу своей высокой стоимости в основном в коммуникационном оборудовании, где важна прежде всего высочайшая производительность памяти. Шутка ли сказать, для XDR памяти в данный момент доступна производительность почти 100ГБ/сек! Никаким другим технологиям памяти (в том числе и Full Buffered DRAM, о которой "ненавязчиво" начинает поговаривать Intel) подобные скорости передачи данных еще даже и не снились. Скажем честно, вот такая подсистема памяти сделала бы наши системы намного более производительными, да и позволила бы еще сравнительно долго не беспокоиться о скорости памяти: ведь не секрет, что в настоящий момент рост производительности систем сдерживается именно скоростями оперативной памяти.
Впрочем, об этом не приходится мечтать – по крайней мере, до тех пор, пока лицензионные условия компании Rambus не изменятся. Да и в силу вышеупомянутой истории отношение к этой компании весьма неоднозначное. Ведь техническое совершенство продукции – еще не все.
Посмотрим, что можно "скомбинировать" из имеющихся технологий. Поддержка памяти DDRII потребует новой упаковки процессора и нового процессорного разъема. Назовем его Socket X, поскольку числа контактов мы заранее не знаем (можно предположить, что их будет больше 1000). Соответственно, рано или поздно надо будет выпускать модель процессора Athlon 64 под этот тип памяти и разъема. На эту платформу имеет смысл выпускать прежде всего старшие модели процессоров, ведь и память, и материнские платы будут заметно дороже своих аналогов для DDR. Таким образом, наиболее вероятным является перевод на эту платформу прежде всего процессоров Athlon 64 FX. Кстати, это ни в коей мере не отменяет предыдущий Socket 939 – "есть мнение, и не только мое" (с), что эти платформы будут довольно долго (не менее года) мирно сосуществовать. Это вполне понятно, ведь преимущество памяти DDRII перед DDR в производительности не так уж велико. Будем рассчитывать разводку наших плат таким образом, чтобы захватить не только DDRII-533, но и DDRII-800, ведь рано или поздно, но до нее обязательно дойдет. В результате память DDRII-800 сможет доставлять нам 6.4ГБ/сек на каждый модуль. Если предположить, что процессор так и остался двухканальным, это дает 12.8ГБ/сек на процессор. Что ж, неплохо, хотя мы по-прежнему жалеем об отсутствии XDR SDRAM.
Пойдем дальше. Раз уж мы все равно вводим новую платформу, то есть смысл снабдить ее новой шиной Hyper Transport 2.0, тем паче, что она вполне совместима с текущей версией 1.05. Выше мы уже говорили, что производительность новой версии шины Hyper Transport заметно увеличилась, до 22.4 ГБ/сек в наиболее производительном варианте.
Ну и припомним, что уже проскакивали слухи о том, что AMD в данный момент ведет работу над процессором следующего поколения, кодовое название проекта К9. В принципе, вполне логично – разработка нового процессора обычно длится несколько лет (а то и четыре-пять лет), поэтому в том, что подобная работа внутри корпорации уже идет, нет никаких сомнений.
Посему рискнем высказать ничем не подкрепленное предположение: процессор К9 может быть вполне совместимым с нашим нововведенным Socket X. Более того, это было бы весьма в духе обычных высказываний AMD о сохранении инвестиций. Да и послужило бы дополнительным аргументом "за" при выборе платформы. В принципе, не исключен еще более смелый вариант, что появятся варианты процессора К9 для Socket 939. Да, на такой платформе производительность будет более низкой, но какой смысл отказываться от части потенциальных покупателей нового процессора? Так что зерно здравого смысла в этих предположениях имеется.
Здесь мы умышленно отказываемся от догадок о том, каким же будет К9 внутри. Разве что выскажем догадку, что наработки AMD в области декодера х86 команд получат дальнейшее развитие. Это означает, что весьма вероятно появление еще одного конвейера и, соответственно, исполнение четырех макроопераций за такт. Наверняка также будут предприняты усилия по наращиванию рабочей частоты процессора, а также улучшена производительность процессора в 64-битном режиме; ведь не секрет, что для многих пользователей необходимость такого перехода прямо связана с тем приростом производительности, который они получат. Да, расширенное адресное пространство, NX бит – все это здорово, но пользователю хочется получить подтверждение интуитивному ощущению: "64 бита больше 32 бит, соответственно, 64-х битный процессор должен быть быстрее 32-х битного". Тогда как это не всегда так – некоторые 64-х битные операции (такие, как умножение) несколько медленнее своих 32-х битных аналогов. Не потому, что процессор плох, а потому, что для умножения двух 64-х битных чисел действительно надо проделать заметно больше работы, чем для умножения двух 32-х битных. Отсюда понятно, что повышение скорости работы процессора в 64-х битном режиме является архиважным направлением для AMD.
Другими словами, примерное направление дальнейшего развития ядра К8 нам видится именно в этом. По-видимому, ждать подтверждения или опровержения наших догадок придется не менее года, более ранний выпуск К9 вряд ли возможен.
Что ж, поживем – увидим, насколько мы ошиблись в своих предположениях. В любом случае, нынешний год обещает быть весьма интересным, слишком уж плотно конкуренты идут друг за другом. Да и количество объявленных в этом году новшеств заставляет предположить, что нас ждет немало интересного.