Особое мнение – 2: никто не уйдет обиженным!

Совершенно свежее оправдание словоблудию


Как-то так исторически сложилось, что некоторые авторы больше всего на свете любят заниматься наиболее неблагодарным занятием: попыткой предугадать будущее. Попыткой вычислить, каким путем пойдет развитие тех или иных технологий, зарождение которых мы наблюдаем в текущий момент времени.
Этот факт тем удивительней, что результативность и эффективность таких предсказаний, по всей видимости, не оказывают никакого существенного влияния на желание авторов предсказывать все дальше и дальше. Угадали (вычислили)? Хорошо! Не угадали? Тоже хорошо! Пожалуй, это наиболее удачное воплощение олимпийского принципа «главное – не побеждать, а участвовать».

Что ж, должен признаться: я, как и вышеупомянутые абстрактные авторы, более всего на свете люблю рассуждать в стиле «кабы не снега да морозы, то и зимой росли бы розы». Поэтому не стану кривить душой: весь дальнейший текст являет собой лишь некий (вероятно, не очень точный) прогноз. А, возможно, даже не прогноз, а просто смесь из фактов и вымыслов. Своеобразный винегрет из мыслей, фактов, и абстрактных логических построений.

Кстати, спустя некоторое время очень забавно перечитывать свои собственные более ранние прогнозы. С одной стороны, огорчаешься наивности некоторых пожеланий и предположений. С другой, вдвойне радуешься, если что-то угадал или предсказал с достаточной степенью точности на основе всего лишь логических построений. Сразу становишься выше, стройнее, а в душе вновь появляется вера в торжество человеческого разума. Впрочем, хватает ее ненадолго.
Как бы там ни было, авторы, как и актеры, нуждаются во внимании. А лучший способ для автора обратить на себя внимание – написать чего-нибудь «эдакое», дабы читатель восхитился прихотливому ходу авторской мысли. И, если уж не согласился целиком и полностью, то хотя бы отдал должное вычурности авторских построений.

Я вполне отдаю себе отчет в том, что живу и работаю отнюдь не в «Силиконовой Долине». И, весьма вероятно, что эта статья сотрудникам соответствующих компьютерных корпораций будет напоминать нечто вроде «впечатлений деда Игната после балета» – если, конечно, они вообще ее прочитают. Ничего страшно, пусть так и будет. В конце концов, такие статьи хороши прежде всего тем, что это великолепная гимнастика для ума.
Поэтому я прекращаю заранее выдумывать себе оправдания «на всякий случай»: даже если я совсем ничего не угадаю, мне было интересно писать эту статью. И, надеюсь, хоть кому-нибудь будет интересно ее читать.
По крайней мере, один человек – редактор – ее прочтет точно. :D У него выхода нет. :D

О чем будет эта статья


Я долго думал, стоит ли мне писать очередные «итоги и прогнозы», или же обратиться к другому жанру: «размышления на тему»?
Учитывая, что в Интернете хватает отчетов, описаний, и прогнозов специально предназначенных для этого аналитических корпораций, идея обратиться к вольному жанру становится все заманчивей. Тем паче, что в данный момент недостатка в изданиях, тщательно освещающих любые хоть сколько-нибудь заметные события в мире компьютеров, не наблюдается. Соответственно, надеяться, что я смогу изложить нечто решительно новое и никем не изложенное ранее, слишком самонадеянно.
Решено! Пусть это будет легкомысленное эссе на вольную тему. Скажем, что-нибудь вроде «что я слышал в последнее время, и как я это воспринимаю».

В конце концов, в подобном эссе я могу себе позволить гораздо большее, нежели любая солидная аналитическая корпорация. Как раз в силу того, что я никоим образом не являюсь солидной аналитической корпорацией. Мне не страшно ошибиться, это никому не принесет убытков, и потому тем заманчивей возможность остановиться, оглянуться вокруг, и попытаться понять, куда нас несет бурная фантазия производителей.
Точнее сказать, бурное желание производителей заработать еще немножко денег. Какое желание, впрочем, я нахожу вполне естественным.
Итак, определились: нашим жанром будет эссе, нашим оружием станет легкомыслие и вольнодумие, а нашим поводом – действия лидеров процессорного рынка. И, разумеется, сопутствующие всему этому события.
Посмотрим, куда заведет нас эта кривая.

Определяемся на местности: Кто у нас в лидерах? AMD?


Начнем, пожалуй, с нынешнего лидера в разработке процессоров: корпорации AMD. Да-да, здесь нет никакой ошибки. Разумеется, я не хуже других знаю, что, по сложившейся традиции, принято начинать с корпорации Intel, и это есть хорошо и правильно. Потому что традиционно, проверено, и надежно. Так сказать, «классический подход к описанию ситуации на рынке».
Но мы ведь пытаемся начать разговор с описания событий вокруг лидера? Ну так вот, в данный момент времени корпорация Intel, увы и ах, лидером не является. Фактически, большинство существенных изменений архитектуры за последнее время произошло с подачи корпорации AMD.
Несогласные со мной читатели могут попытаться назвать нечто более существенное по своим последствиям для х86-совместимых компьютеров, нежели внедрение архитектуры AMD64, и появление двухъядерных процессоров. И то, и другое ключевое нововведение принадлежит «перу» AMD. Согласные – могут читать дальше. Несогласных со мной прошу перечитать этот и следующий абзацы вновь и вновь, до полного усвоения ситуации: на этом витке спирали развития процессоров все существенные нововведения в архитектуру х86 предложены именно AMD.

Приходится признавать, что корпорация Intel, скажем так, весьма неосмотрительно прозевала достаточно существенные изменения и усовершенствования, которые были привнесены корпорацией AMD в изначально разработанную Intel архитектуру IA32. И в результате Intel достаточно долгое время находилась фактически в роли догоняющей. По сути, находится в этой роли она и сейчас, но к этому вопросу мы вернемся в соответствующем, посвященном Intel разделу.
Со стороны AMD есть повод сдержанно порадоваться. Порадоваться потому, что два наиболее существенных изменения в архитектуре х86 внесены AMD. Разумеется, это не было экспромтом: AMD заранее готовилась к этой ситуации, и тщательно, последовательно «двигала» рынок к нужному для себя раскладу. Поэтому сейчас пожинает плоды своей предусмотрительности. Но радоваться надо сдержанно, не теряя головы, при этом долго радоваться категорически нельзя. Могут и подвинуть с пьедестала. И без того забраться на него было очень нелегко: фактически, к нынешней ситуации AMD целеустремленно ползла (мгновенной вылазкой это уж точно не назвать) примерно с 1999 года, когда с появлением процессорной архитектуры К7 стало понятно, что они умеют делать не только дешевые, но еще и быстрые микропроцессоры.

Позднее оказалось, что у AMD есть не только хорошие разработчики, но даже, оказывается, есть и маркетинг. А в результате действий маркетинга средневзвешенная цена ее процессоров заметно, в разы, выросла (чему, как позднее выяснилось, заметная часть ее поклонников вовсе даже не обрадовалась).
Зато этот рост средневзвешенной цены крайне благотворно сказался на финансовых показателях AMD. В долгосрочной перспективе это очень хорошо, поскольку только успешная финансово корпорация сможет разрабатывать новые процессорные архитектуры. Слишком уж высока стоимость, сложность, и длительность исследований в области разработки новых процессоров.
Кроме того, благодаря выросшим доходам (и наличию хорошего продукта) AMD стала постепенно избавляться от висящего над ней постоянно «дамоклова меча»: вечной нехватки производственных мощностей. В данный момент все процессоры AMD производятся на Fab 30, но прямо рядом с ней построена еще одна фабрика, Fab 36. После выхода Fab 36 на проектную мощность AMD сможет производить порядка 100 миллионов процессоров в год. В результате станет возможной реализация давнего желания AMD: захват 30% рынка микропроцессоров. А это лакомый кусочек: весь рынок микропроцессоров архитектуры х86 оценивается примерно в 250 – 260 миллионов единиц.

Конечно же, желание захватить треть рынка было у AMD и ранее, но ранее для этого не было возможностей. Теперь такие возможности появились. Что ж, остается пожелать им удачи. Похоже, произошло как в известном грузинском тосте: наконец-то их желания совпали с их возможностями. Впрочем, радоваться рано: эту треть рынка сначала надо у Intel отобрать. А Intel будет сопротивляться изо всех сил, уж не извольте сомневаться.
Впрочем, все это заслуга прошлых шагов AMD. Да, некоторое время назад они разработали удачную архитектуру К7 и еще более удачную архитектуру К8. Удачные продукты (особенно второй) были замечены покупателями, и принесли AMD соответствующие дивиденды. Повторимся, все это заслуга прошлых лет и прошлых шагов.

А что у нас с нынешними планами? Чем планирует порадовать нас нынешний лидер сегодня и завтра? Будет интересно попробовать предсказать действия корпорации.
Кстати, учитывая, что AMD выбилась в лидеры, относиться к ней теперь следует намного строже, чем ранее. Безо всяких скидок.
Так сказать, QUOD LICET JOVI, NON LICET BOVI, только с обратным знаком.

Ни года без свежего Socket-а


Исторически сильной стороной архитектуры AMD всегда была преемственность. Например, напомним Socket A, который даже сумел переплюнуть по долголетию легендарный чипсет BX. Как ни крути, но четыре года использования одного типа разъемов в нынешней индустрии – событие исключительное. Впрочем, правильней, видимо, сказать: было исключительное. Теперь так уже не будет.
Здесь стоит совершить легкий экскурс в историю. Некоторое время назад, когда Socket A стал уходить в историю, AMD разделила Low End и Middle/High End рынки. Разумеется, все это было приправлено соусом заботы о покупателе: как там традиционно в начале всех презентаций AMD, «инновации, направленные на покупателя». Ага, мы верим. Мы вообще того, доверчивые.

Так вот, по мысли маркетологов AMD (в чьем существовании многие сомневались), рынок Low End будет использовать Socket 754, а рынок Middle/High End будет использовать Socket 939. Серверы и рабочие станции будут использовать Socket 940, который реально отличается только поддержкой Registered памяти вместо обычной DDR SDRAM.
Будущее казалось простым и понятным – впрочем, как и всегда в презентациях маркетологов. Им всегда все ясно, работа такая.
В принципе, здравая логика здесь есть. Но есть и сложности. Суть их в том, что AMD крайне удачно наткнулась на заботливо заготовленные самой себе грабли. Встроенный контроллер памяти – это не только достоинство. Иногда он превращается в недостаток.

Именно так и получилось сейчас. Разумеется, финансовое состояние AMD сейчас несравнимо с таковым во времена Socket A. Поэтому задача поддержки трех различных типов разъемов процессора, в общем-то, в данный момент вполне финансово посильна. Зато AMD таким образом разделила рынки, что позволило на каждом из рынков выставить наиболее эффективные цены. Наиболее эффективные для получения прибыли, разумеется.
С этой стороны претензий нет. И, если бы технологии памяти никогда не менялись, это положение вещей можно было бы признать вполне удачным. Рынки разделены, каждый приносит максимально возможную прибыль. Следи за ситуацией, да корректируй в нужную сторону цены на каждом из рынков раздельно, управляя спросом. Лепота!

Но оно, это положение вещей, меняется. Не в последнюю роль к этому все усилия вот уже более года прилагает Intel. В частности, благодаря усилиям Intel, в последнее время стоимость памяти DDR2 стала, наконец-то, меньше, чем стоимость DDR. Перефразируя классиков, «… Великая Августовская революция, о которой больше года говорили большевики, свершилась! Ура, товарищи!» (с).
Наконец-то, спустя чуть ли не полтора года с момента «удачного запуска платформы 915 + PCI-E + DDR2», эти продукты реально стали доминировать на рынке. Не без драконовских мер по сокращению выпуска архипопулярной i865 серии чипсетов, разумеется, но об этом помолчим. Ёрничать – это не наш стиль.
И теперь, когда память DDR2 стала дешевле, да к тому же еще на ней нарисованы такие привлекательные цифры, как «533» да «667» (что явно больше, чем «400»), игнорировать желание покупателей перейти на новую «высокопроизводительную» память AMD не может. Ну и что с того, что применение DDR2-400 и DDR2-533 на системах AMD снизит реальную производительность? Народ требует хлеба и зрелищ! То есть, извините, новый тип памяти! Потому что 533 больше, чем 400, и все тут!

Разумеется, в этой ситуации Intel радостно и любвеобильно распахнула объятия: а вот вам 945/955 серии чипсетов (ау, «счастливые» обладатели 925Х и 925ХЕ – ну как, долго попользовались «перспективными» чипсетами?), вот память. Извольте.
В этой ситуации AMD отставать нельзя, даже если это будет сугубо формальный ответ.
Но вот беда, установить память DDR2 на системы с любым из трех современных Socket-ов нельзя. Хоть тресни.
Потому что контроллер памяти интегрированный. А, следовательно, чтобы сделать систему на DDR2, нужно переделывать контроллер памяти. И, хоть переделка не слишком велика, но по количеству контактов DDR2 отличается от DDR (240 против 184). Стало быть, воспользоваться старыми процессорами и платами не удастся, даже не смотря на то, что платформа 939 на сегодняшний день обладает вполне актуальными и адекватными характеристиками: поддержкой двухъядерных процессоров, поддержкой шины PCI-E, и так далее по списку.

Таким образом, надо делать новый контроллер, новый процессор с ним, и новый разъем. Четвертого типа. Что-то как-то это становится запутанным: если воспользоваться предыдущей логикой AMD, и сделать такое же разделение платформ на Low End, Middle/High End, и Server & Workstation, то нам потребуются еще три разъема. Всего, с тремя предыдущими, становится шесть.
Мда, «крайне удачное» решение. Я уже предвкушаю «счастливые» лица покупателей, которым предлагается всего лишь выбрать подходящий им разъем из шести различных типов.
С другой стороны, делать общий для всех трех рынков разъем означает лишить себя части прибыли из-за частичного «перехлеста» потенциальных рынков.

Учитывая, что остались жить (и вполне еще имеют право на существование) предыдущие платформы, головная боль маркетологам AMD обеспечена. И поделом! Раньше надо было думать.
Разумеется, в этой ситуации AMD будет поступать единственно разумным способом: поддержкой DDR2 будут обладать два разъема. Первый из них, для десктопов во всем их разнообразии, пока называется Socket M, и имеет (барабанная дробь!) …940 контактов. Вот так сюрприз!
Разумеется, совершенно случайно старый Socket 940 (для серверов) и новый Socket 940 не имеют ничего общего. Процессоры, предназначенные для одного, нельзя будет поставить в другой – это не выйдет ни у кого, кроме, разумеется, очень упорных пользователей. Правда, работать в «чужом» разъеме процессоры не будут даже у самых сильных из них.

Что касается серверного разъема, то он носит предварительное название Socket F, и будет обладать 1207 контактами. Это уже интересней – похоже, с ним все будет гораздо менее банально. Впрочем, об этом ниже, пока вернемся к «новому Socket 940».

Да здравствует DDR2, самая гуманная память всех времен и народов!


Ну что ж, с ближайшей перспективой разобрались: нам, покупателям десктопных платформ от AMD, светит Socket 940. Похвальная экономия пластмассы для разъемов: раз уж механические размеры разъема не поменяются, можно будет сэкономить на переходе :D
Теперь, когда самые новые платформы будут связаны с Socket M (пока оставим ему старое название), необходим какой-то пряник, который мог бы заманить покупателей на покупку новой платформы.
С покупателями новых машин все понятно – им проще сразу купить именно новую платформу. Гораздо сложнее пересадить всех тех покупателей, кто уже вложил средства в платформу Socket 939. В самом деле, какие такие сверхнеобходимые новшества есть в платформе Socket M? Поддержка новой памяти DDR2? Это, безусловно, наполняет наши сердца гордостью, но разве этого достаточно, чтобы все бросить, и покупать новое оборудование?
Разумеется, нет. Поэтому AMD подготовила некоторое количество бонусов, которые достанутся покупателю платформы Socket M.

Прежде всего, это увеличенная полоса пропускания DDR2 памяти. В системах AMD будет использоваться память DDR2-667 и DDR2-800 (возможно использование и более медленной, но толку от нее немного – меньше, чем от DDR). Соответственно, два канала в Socket M позволят получить пропускную способность до 12.8GB/sec. Что ж это прогресс, ничего не скажешь.
С задержками у DDR2-667 и DDR2-800 тоже все относительно приемлемо – они не хуже, чем у DDR-400. Стало быть, мы ничего не теряем. Даже выигрываем в количестве модулей на канал.
С другой стороны, даже старшие процессоры AMD сейчас особой зависимости от пропускной способности памяти не демонстрируют. Стало быть, дальнейшее увеличение пропускной способности мало что даст в плане повышения производительности. Весьма огорчительно для AMD, поскольку отсутствие прироста производительности есть аргумент против перехода.

К счастью, у AMD есть такое решение, как двухъядерные процессоры. Поскольку два ядра сидят на общем контроллере памяти, их потребность в пропускной полосе примерно вдвое выше. Поэтому максимальный прирост от новой памяти должен быть максимален именно при использовании двухъядерных процессоров.
В целом, в данный момент времени двухъядерные процессоры от AMD – не самые дешевые процессоры (у Intel есть более дешевые предложения). С одной стороны, это понятно: в кои-то веки получилось создать безусловно более хорошее решение, нежели у конкурента. Надо этим пользоваться, и заработать денег по максимуму.

С другой стороны, пока такие процессоры стоят более 300 долларов, спрос на них умеренный; его всяко не сравнить со спросом на процессоры ценового диапазона 200 – 300 долларов, и ниже. Стало быть, для создания настоящего ажиотажа необходимо дать рынку недорогие двухъядерные процессоры.
Однако этот вопрос связан еще и с производственными вопросами: в настоящее время AMD использует для производства двухъядерных процессоров два различных ядра, Toledo и Manchester, различающиеся как объемом кэша второго уровня (2 х 1МВ либо 2 х 512КВ), так и площадью (199 мм2 и 145 мм2 соответственно).
Увы, это не очень хороший вариант; лучше было бы иметь одно, унифицированное ядро. Дешевле в производстве. К тому же производство кристалла размером 200 мм2 не слишком рентабельно, с ростом площади кристалла количество брака резко увеличивается.
И предел эффективного в массовом производстве ядра как раз лежит в области 200 мм2, причем и у Intel, и у AMD.

Соответственно, лучше всего было бы совместить ожидаемую волну двухъядерных процессоров с переходом на 65нм, что позволит снизить площадь кристалла до величины порядка 120 мм2 (для варианта с кэшем 1МВ). Тоже не ахти, конечно – но уж не 200 мм2
Что ж, с двухъядерными процессорами все относительно понятно: их появление даст некоторый толчок новому разъему. Хотя, подчеркнем, в большинстве случаев существующие ныне двухъядерники вполне комфортно себя чувствуют и на DDR400.
Стало быть, этого аргумента тоже маловато. Есть ли у AMD что-нибудь еще в качестве завлекательного для покупателя предложения?
Есть. Но пока небольшое лирическое отступление о пользе своевременного исправлении недостатков.

Кое-что о кэше


Уже довольно долгое время меня занимает одна малопонятная мне ситуация, связанная с кэшем второго уровня процессора AMD Athlon 64. Недоумение вызывают как площадь кэша второго уровня, так и скоростные показатели шины между кэшеми первого и второго уровня.
Но обо всем по порядку. Относительный размер кэша второго уровня в кристалле К8 весьма велик. Достаточно сказать, что кэш 1МВ в ядре К8 занимает примерно такую же площадь, как и остальное ядро, то есть почти 50% площади. Для ядра San Diego, имеющего площадь порядка 100 кв. мм., площадь одного мегабайта кэша составляет примерно 50 кв. мм.

В то же самое время результаты Intel в деле размещения кэша на кристалле намного лучше. В частности, площадь ядра Dothan составляет чуть более 90 кв. мм., из которых кэш размером 2МВ занимает примерно 55 кв. мм.! То есть плотность кэша в ядре Dothan практически в два раза выше. Это притом, что ячейки кэша и AMD и Intel делают по одинаковой технологии, и с примерно одинаковыми характеристиками.
Другими словами, ячейки кэш-памяти Intel умеет упаковывать гораздо лучше, чем AMD. Странная ситуация. Тем более странная, что у AMD давно есть вполне подходящий патент (SRAM formation using shadow implantation), в котором описывается возможность сделать ячейку кэш-памяти на 40% – 50% меньше (!) по площади, при этом еще и выиграв в ее быстродействии.
В результате хочется поинтересоваться: а доколе, собственно, столь полезный патент будет пылиться на полке? Ведь чем больше площадь процессора (каковая зависит в том числе и от площади кэша), тем меньше процессоров удастся произвести с одной пластины. Кто там жаловался на нехватку процессоров? Так вот же явные резервы увеличения выпуска, в чем же проблемы?
Но ненормально большая площадь кэша второго уровня не единственная странность. В конце концов, AMD сама решает, что ей делать с местом на кристалле.

Не составляет секрета, что основным рабочим кэшем является кэш первого уровня. Именно к нему, имеющему наименьшее время доступа, обращаются за данными исполнительные устройства. Соответственно, если данных в кэше первого уровня нет, процессор ищет их в следующей иерархии памяти, кэше второго уровня. С достаточно высокой вероятностью они там окажутся. И возникнет необходимость передать их в кэш первого уровня, причем как можно быстрее.
И вот тут-то и возникает вопрос.

До каких пор, позвольте спросить, у AMD будет столь медленная шина между кэшем второго и первого уровней? Нешто нельзя сделать аналог технологии Advanced Transfer Cache от Intel? Это такая неразрешимая проблема? Напомню, что Intel умудрилась справиться с созданием 256-битной шины, работающей каждый второй такт, еще в ядре Coppermine давно «почившего в бозе» процессора Pentium III, а AMD до сих пор даже в новых ядрах обходится двумя 64 битными шинами между двумя иерархиями кэшей. При этом максимальная производительность их равна 64 бита на запись и 64 бита на чтение за такт. Да, они могут работать одновременно, спорить не стану. Но все равно это только 128 бит за такт, то есть уровень процессора Pentium III. В процессоре Pentium 4 Intel умудрилась еще раз вдвое увеличить скорость передачи из кэша второго уровня, до 256 бит каждый такт. И это несмотря на то, что частота работы Pentium 4 заметно выше, чем у Athlon 64/Opteron, а разгонять широкую шину по частоте – более чем непросто.

Неужели невозможно расширить эту шину? В конце концов, для кого-то загадка, что процессоры Pentium 4 иногда выигрывают в некоторых программах просто за счет того, что полоса пропускания их кэша второго уровня намного выше? В частности, есть прямая зависимость от скорости кэша у большинства потоковых алгоритмов. Да и архиваторы обычно зависят от скорости обмена данными между уровнями кэшей.
Самое анекдотичное, что требование расширить шину между кэшами первого и второго уровней на фоне перехода на AMD64 выглядит достаточно логично. Ведь и размер данных, и размер команд увеличиваются по сравнению с 32-битными аналогами, пусть и не намного. Следовательно, нагрузка на шину растет. А в данном случае AMD даже не почесывается. Мол, и так все хорошо.

Между тем, в некоторых ситуациях было бы совсем не лишним улучшить пропускную способность межкэшевых шин: учитывая, что длина строки кэша первого уровня равна 64 байтам, заполнение новой строки из кэша второго уровня потребует не менее 8 тактов. А будь у нас шина с хотя бы такой же пропускной способностью, как у Pentium 4, успели бы за 2 такта. Можно было снизить время передачи данных в четыре раза. Разве это незаметное изменение? Ведь эти шесть тактов разницы можно применить для чего-нибудь более полезного, чем ожидание передачи данных.
Становится обидно от осознания факта, что очевидное и явно не очень сложное в реализации усовершенствование не используется. Более того, даже не планируется к использованию в ближайшее время.
Кроме всего вышесказанного, несколько странная ситуация складывается с эксклюзивной моделью работы кэша. Напомним, что суть такой модели заключается в том, что содержимое кэшей разных иерархий не дублируется и не совпадает ни в коем случае. Они друг друга дополняют: данные находятся либо в кэше первого уровня, либо в кэше второго уровня. В свое время по этому поводу AMD рисовала чудные завлекательные картинки о том, как складывается емкость кэшей первого и второго уровня.

И в то время, что характерно, это было вполне логичное и разумное решение. Потому что при суммарном объеме кэша первого уровня 128КВ и объеме кэша второго уровня в 256КВ для процессора K7 с ядром Thunderbird (в котором появилась эта модель работы кэша) дублировать содержимое кэшей было бессмысленным расточительством трети полезного объема. Поэтому некоторая потеря в скорости обмена между кэшами, которая поневоле возникает из-за более сложного алгоритма работы эксклюзивного кэша, вполне компенсируется в полтора раза большим полезным объемом кэша.
Но пришло время ядра К8. И что мы видим? А мы видим, что по-прежнему используется эксклюзивная модель кэша, не претерпевшая никаких изменений. Но позвольте, объем кэша второго уровня у нас достигает 1024КВ, и для такого процессора разница в производительности, обусловленная отличием между 1152КВ и 1024КВ, уже несущественна. А ведь совсем не исключено, что без эксклюзивной логики латентность доступа в кэш могла бы быть меньше. Правда, сложно сказать конкретно, на какую именно величину.

Отсутствие прогресса в деле улучшения кэша особенно грустно оттого, что AMD уже несколько раз меняла поколения ядер. И при переходе технологического процесса на нормы 90нм, который произошел относительно недавно, сделать мелкие (минорные) исправления ядра было бы очень логично. Я уж молчу, что, по сути, на техпроцессе 90нм поколений ядер было два: ядро Winchester было заменено ядром Venice. Что, оба раза не до этого было?

Попутно это дало бы некоторый прирост производительности, который осторожно можно оценить диапазоном 0% - 10% (по аналогии с приростом скорости в ядре Pentium III Coppermine). Мало? Да, не слишком много. Между прочим, от замены процессора на следующую, более высокую модель, прирост часто меньше. А в некоторых алгоритмах, связанных, например, с медиакодированием, высокая пропускная способность шины между иерархиями кэшей позволяет добиться 20% - 30% прироста. Все еще плохо и мало?
И действительно, ну зачем нам такой прирост? Что с ним потом делать? Совершенно непонятно!
Впрочем, справедливости ради, отмечу, что есть прямо противоположное мнение. Мнение это заключается в том, что текущая ситуация с кэшами процессора К8 вполне нормальна, и ничего переделывать не надо. В частности, речь идет о том, что на самом деле эсклюзивный кэш – это очень хорошо и правильно. Связано оно с тем, что нынешняя эксклюзивная архитектура кэша у ядра К8 достаточно хорошо подходит для работы именно в двухъядерных и многоядерных процессорах.

Собственно, там есть одна простая в понимании, но весьма неприятная по своим последствиям проблема: проблема когерентности данных. Оба ядра могут работать одновременно с одной и той же областью памяти. А тогда возникают неприятные коллизии, связанные с тем, что та или иная копия данных в кэшах разных процессоров оказывается неверной.
Корпорация Intel планирует выходить из этой ситуации введением общего кэша второго уровня. У корпорации AMD есть другой вариант: далее развивать идею эксклюзивного кэша, сделав общий кэш третьего уровня. Собственно, судя по опубликованным планам, AMD придерживается именно такого варианта.

Кроме того, у эксклюзивного кэша есть еще одна крайне полезная особенность: поскольку данные находятся либо в одном, либо в другом кэше, можно вести поиск сразу во всех иерархиях кэша одновременно. Что снижает время поиска в самом худшем случае до максимального времени доступа среди всех кэшей (равнение по самому медленному).
В отличие от этого, не - эксклюзивная модель, применяемая Intel, вынуждена вести поиск по уровням иерархии кэшей поочередно. И в ней поиск данных может задержаться на суммарное время доступа во все кэши (равнение по сумме времен доступа). В конечном итоге выходит медленней, чем в первом варианте.
Что ж, поживем – увидим. В любом случае, если с эксклюзивностью кэша еще возможны варианты, пропускную способность шины между кэшами первого и второго уровня увеличить следовало давно. Просто потому, что нет ни одной ситуации, когда это ухудшило бы производительность. А вот ситуаций, когда улучшило бы – хватает. В частности, расширение двух имеющихся шин с 64 бит до 128 и, главное, конвейеризация запросов в L2 были бы совсем не лишними.
То, что это не сделано до сих пор – явная недоработка.

Pacifica всех спасет


Впрочем, вернемся к теме преимуществ перехода. Пока их все-таки не слишком много. По сути, несколько выросшая производительность двухъядерных решений. Что, впрочем, ставит перед нами другую задачу. А куда, простите, обычному покупателю девать весьма немалую производительность двухъядерного процессора?
Срочно записаться в фанаты кодирования видео и аудио? Даже не знаю, насколько это интересно обычному среднему покупателю. Хотя, признаюсь, в последнее время меня все чаще стали посещать мысли: «а не слишком ли редко я занимаюсь кодированием видео?» :D
Срочно устанавливать себе 3Ds Max и сутками пересчитывать ролики? Забавное занятие, конечно, но я сильно сомневаюсь, что программой 3Ds Max пользуется хотя бы 10% пользователей.
И куда ее девать? Необходимо что-то, что является очень ресурсоемким процессом, и в то же время может быть необходимо достаточно долгое время.

К счастью, такой выход нашелся. Некоторое время назад производителями процессоров были осчастливлены кодировщики видео, сейчас дошли руки до программистов. Чья-то умная голова вспомнила, что бывают такие программы, как эмуляторы. Например, из одной операционной системы нужно эмулировать работу второй. Хотя бы для того, чтобы проверить, как себя будет вести разрабатываемая программа.
Разумеется, наиболее интересна эта возможность именно программистам и разработчикам программ, поэтому эта аудитория должна вполне положительно отнестись к данной идее.
Эмуляция одной операционной системы из другой – достаточно ресурсоемкий процесс. Поэтому любое аппаратное подспорье оной эмуляции будет весьма в масть. И вот результат: и AMD, и Intel объявляют о технологиях поддержки виртуализации (Pacifica и Vanderpool соответственно).

Кстати сказать, первой об этой технологии заговорила корпорация Intel – будем строго относиться к исторической справедливости. Все это помнят. Но вынужден констатировать, что прямое сравнение того, что предлагают нам в этой области два заклятых друга, оказывается не в пользу Intel.
По своим целям Pacifica от AMD и Vanderpool от Intel совпадают. Но Pacifica умеет гораздо больше. Потому что умеет обеспечивать автоматическую (прозрачную для диспетчера виртуализации) трансляцию одних виртуальных адресов в другие. Впрочем, в подробности особо вдаваться не хочется, важно запомнить следующее: технология Pacifica, будучи объявленной позже (на рынок она также попадет позже), имеет более широкие возможности, чем Vanderpool.

Пока же нам важно то, что операция виртуализации – весьма ресурсоемкая операция. Вот здесь двухъядерный процессор подходит как нельзя более: на нем (после появления некоторых специфических аппаратных особенностей) падения производительности после включения такой эмуляции не будет. Или почти не будет, давать количественные оценки сейчас сложно.
Таким образом, нарисовалась область, где применение двухъядерных процессоров дает существенный прирост, и может служить приманкой для перехода на Socket M. Разумеется, таких областей на самом деле достаточно много: например, всевозможные виды научных расчетов. Рискуя вызвать негодование ученых, все же скажу, что объем закупаемых по всему миру научными учреждениями процессоров не настолько велик, чтобы строить политику продаж именно на этих клиентах как на целевой аудитории. Увы и ах.
Так что и AMD и Intel приходится изыскивать, куда же девать все возрастающую производительность систем на основе их процессоров. Впрочем, они делали это достаточно долго, справятся и сейчас.

Подытожим: в настоящий момент у нас есть два скромных плюса от перехода на DDR2 и Socket M. Это некий (не слишком большой) рост производительности двухъядерных процессоров, и технология Pacifica. Которая сама по себе, кстати сказать, требует соответствующей программной базы. Ведь суть ее в том, что между оборудованием и операционной системой функционирует теперь слой специального программного обеспечения, который и осуществляет переключение работающих на компьютере операционных систем так, чтобы они не замечали работы второй системы. И, разумеется, не могли вмешаться в работу друг друга – попутное приятное следствие технологии Pacifica заключается в повышенной безопасности такого решения. Операционные системы полностью отделены друг от друга, и друг друга не видят.

Учитывая, что аргументов за переход на Socket M не так чтобы очень много, будет разумно предположить, что в процессорах для Socket M технология Pacifica будет доступна не только в двухъядерных, но и в одноядерных процессорах. Это позволит создать критическую массу пользователей на новой платформе несколько быстрее. Собственно, последние новости вроде бы подтверждают это намерение AMD: судя по сообщениям, технология Pacifica будет присутствовать во всех процессорах Athlon 64 под Socket M, и даже в некоторых процессорах под Socket 939 (очевидно, у старших моделей). Впрочем, я с трудом себе представляю, чтобы за технологий Pacifica выстроилась очередь покупателей. В конце концов, целевая область для этой технологии выглядит вполне ограниченной, большинству покупателей вовсе нет дела до потенциальной возможности запускать много операционных систем на своем компьютере одновременно.
Кроме всего прочего, у перехода на Socket M есть еще одно, потенциально гораздо более приятное для пользователя (но не для AMD) следствие. Дело в том, что существование двух параллельных линеек продукции у AMD, переход между которыми не столь прост (требует замены процессора и материнской платы), оказался неприятным сюрпризом для многих сторонников продукции этой корпорации.

Теперь же, благодаря единому для Low End и Middle/High End рынкам разъему Socket M, модернизация систем (и переход между данными рынками) станет намного проще. Точнее, станет она проще заметно позднее, когда решения для Socket M появятся не только для Middle/High End рынка, но и для Low End. Первоначально, конечно же, Socket M системы будут позиционироваться в основном для верхнего сегмента.
Пожалуй, для обычного пользователя именно этот аргумент – Socket M останется общей платформой для всех сегментов рынка – может оказаться решающим аргументом за переход на Socket M.
Ну а AMD потеряет некоторую часть прибыли, которую раньше извлекала из разделения рынков. И поделом, если честно: сразу надо было думать. Если бы не путаница с двумя параллельными платформами, Socket 754, и Socket 939, продажи Athlon 64 могли бы быть лучше, а число сторонников этой платформы – больше.

Хотя, конечно, в данный момент AMD в значительной степени лимитирована не столько низким спросом, сколько недостаточным производством процессоров Athlon 64.
Недостатки такого перехода тоже вполне очевидны: покупатели, успевшие купить платформу Socket 939, оказываются вынужденными либо выбрасывать часть оборудования, либо сдавать за бесценок. Либо, разумеется, пока воздержаться от перехода на Socket M, что на самом деле и надо им посоветовать.
Пусть AMD пока подумает, определится с перспективами, а там разберемся. Тем более, что платформа Socket 939 не уходит совсем, а просто смещается в сторону Low End. Более того, на первое время платформа Socket M будет играть только в Middle/High End, это очевидно. А уж позднее, когда жизненный цикл платформы Socket 939 будет заканчиваться (либо понадобится срочно и «неожиданно» переводить всех на Socket M), будут выпущены Low End процессоры для Socket M. Такие, как Sempron. Эх, когда оно еще будет, это счастливое время…

Но ведь два лучше, чем одно?


Интересная ситуация сложилась на рынке вокруг двухъядерных процессоров. Первой заговорив (а затем и представив) двухъядерные процессоры, AMD сделала достаточно сильный ход «конем». Здесь сделаем уточнение: корпорация AMD действительно первой представила двухъядерные процессоры, при этом они были представлены на серверном рынке, в семействе Opteron. Однако на десктопном рынке первой (хоть и после объявления двухъядерных Opteron-ов) двухъядерные процессоры представила именно Intel.
Впрочем, было вполне очевидно, что у Intel это скорее бумажный анонс, вызванный двумя причинами: во-первых, любой ценой опередить AMD в анонсе, это вопрос престижа. Во-вторых, в процессе создания двухъядерных процессоров Intel-у пришлось пойти на «жертвы»: учитывая, что их процессоры и так выделяют заметно больше тепла, чем у конкурентов, пришлось срочно подготовить и запустить целую платформу: наборы чипсетов 945/955, поддерживающие двухъядерные процессоры. Кроме того, созданные на них материнские платы поддерживали TDP 130Вт (!), чего не поддерживали предыдущие платы стандарта 04В на чипсетах 915/925Х(Е).

Но и это еще не все: для того, чтобы вместиться даже в TDP 130Вт, Intel-у пришлось заметно снизить частоту каждого из двух ядер, входящих в двухъядерный процессор. В результате (если отбросить маркетинговую шелуху в виде запуска целой новой марки процессоров Pentium D) частоты двухъядерных процессоров Intel равны 2.8GHz, 3.0 GHz, 3.2 GHz (Pentium D 820, 830, 840 соответственно). Учитывая, что частота Pentium 4 доходит до 3.8 GHz, понятно, что производительность каждого отдельного ядра заметно меньше, чем у старших одноядерных процессоров.
В результате в обычных, не оптимизированных под двухъядерность приложениях (которых на десктопном рынке абсолютное большинство, кстати!), двухъядерные процессоры Pentium D будут заметно проигрывать своим одноядерным, но более высокочастотным собратьям.

Разумеется, все это в очередной раз будет тщательно дезавуировано возражениями вида «это не рост у конкурента выше, это у вас метр неправильный!»… Ой, простите: «это не Pentium D медленные, это тестирующие программы просто не умеют правильно их тестировать».
Да-да, разумеется. Все так и есть. Только вот у AMD переход на двухъядерные рельсы получился не в пример удачнее. Я бы даже выразился, что кардинально удачнее.
Во-первых, AMD гораздо правильнее позиционирует свои двухъядерные процессоры: они вышли именно на тот рынок, на котором в наличии имеется максимальное количество оптимизированных под двухпроцессорные системы приложений. На рынок серверов и рабочих станций.

Это сразу же принесло свои дивиденды: большинство используемого на этом рынке ресурсоемкого программного обеспечения тут же откликнулось сильно повысившимися показателями производительности. Другими словами, потенциальные покупатели двухъядерных Opteron-ов сразу же видят, за что они будут платить деньги. Кстати, немалые деньги – AMD весьма недешево оценила второе ядро в процессоре. С другой стороны, альтернатив-то нет: у конкурента до недавнего времени вообще не было двухъядерного решения для серверного рынка. А когда оно появилось…. В общем, лучше б его до сих пор не было.

Кроме того, стало понятно, что идею сделать свои процессоры двухъядерными (а, возможно, даже многоядерными) AMD вынашивала давно. Только теперь стало понятно, зачем же на схемах устройства ядра Athlon 64/ Opteron AMD всегда указывала наличие коммутатора (crossbar). В одноядерном варианте этот коммутатор не слишком-то и нужен, вполне можно представить себе систему без него. Но вот в многоядерном – совсем другое дело, там его преимущества безусловно велики. Именно благодаря этим коммутаторам двухъядерники AMD показывают столь великолепные результаты: собственно, по скоростным показателям один двухъядерный Opteron практически равен двум системам из двух одноядерных той же частоты. Это весьма, кстати, неординарный эффект, но AMD он удался.
Во-вторых, появление двухъядерных серверных решений привело еще к одному интересному эффекту. Теперь на шасси от двухпроцессорного решения можно собрать «почти четырехпроцессорную платформу»: двухъядерную двухпроцессорную систему. А у такого варианта, кроме вполне понятного прироста производительности, есть еще и очень интересный экономический аспект.
Дело в том, что на серверном рынке х86 процессоров уже довольно давно сложилось следующее разделение по «классам» многопроцессорных систем. Первыми идут двухпроцессорные системы, они стоят (только платы и процессоры) несколько тысяч долларов.

Затем идут четырехпроцессорные системы. Но стоимость платформ для них делает резкий скачок вверх: одна только четырехпроцессорная материнская плата плюс корпус стоят уже в районе 4 000 – 5 000 долларов. При этом стоимость процессоров, умеющих работать в четырехпроцессорной конфигурации, также заметно выше, чем у двухпроцессорных аналогов. В результате стоимость платформы (плата + процессоры) в классическом четырехпроцессорном варианте составляет уже сумму порядка 10 000 долларов – то есть следующий порядок по стоимости.
Стоимость восьмипроцессорного варианта таким же образом создает следующую ступеньку (хотя речь, конечно, уже не о порядке): примерно 20 000 долларов. Кстати сказать, с ростом количества процессоров эффективность их использования падает – впрочем, это общая беда абсолютно всех шинных SMP систем, причем не только на х86 процессорах.

Более чем восьмипроцессорные варианты для х86 рынка, в общем-то, существуют, но их встраивать в нашу цепочку примеров сложно. На этом уровне играют проприетарные решения некоторых корпораций (например, IBM с их чипсетом Summit, позволяющим поддерживать до 64 (!) процессоров Xeon).
Применяя предложенные AMD двухъядерные Opteron-ы, можно добиться весьма существенной экономии в деньгах при повышении класса системы. В частности, установив два двухъядерных Opteron-а в двухпроцессорную плату, получим (даже с учетом более высокой цены двухъядерного Opteron-а) по производительности практически полный аналог четырехпроцессорной платформы, но не за 10 000 долларов и выше, а примерно за 4 000 долларов. Повторю, при практически равном результате. Та же самая история повторяется при установке двухъядерных процессоров в четырехпроцессорную платформу: получаем аналог восьмипроцессорной платформы примерно вдвое дешевле.

Учитывая, что существуют платформы на восемь процессоров, мы после установки в них получаем некий аналог 16-ти процессорной платформы. И, учитывая, что там есть только проприетарные (и, следовательно, сравнительно дорогие) решения, в этой ситуации мы выигрываем в стоимости более чем в два раза. Я уж не говорю, что ранее у AMD решений такого класса просто не было.
Пожалуй, стоимость решений – наиболее яркий аргумент в пользу двухъядерных Opteron-ов из всех, какие только возможны. И покупатели это оценили: в настоящее время спрос на двухъядерные Opteron-ы больше предложения. Другими словами, AMD, продавая эти процессоры достаточно дорого, все равно не может удовлетворить спрос на них. Собственно, в весьма приличных результатах, показанных процессорным подразделением AMD в третьем квартале этого года, немалая заслуга именно двухъядерных Opteron-ов. Это ли не успех?

В-третьих, совершенно удавшимся надо признать переход на двухъядерники и на рынке десктопов. Здесь надо вспомнить, что подавляющее большинство массово продающихся процессоров AMD Athlon 64 имеют частоты 2.4GHz и ниже. Точнее, решения на 2.6GHz и 2.8GHz существуют, но только в виде Athlon FX55 и Athlon FX57 соответственно. А массовыми процессоры Athlon FX назвать сложно, это прежде всего «решения для престижа» (или решения для оверклокеров)..
В результате, представив линейку двухъядерных десктопных процессоров Athlon 64 Х2 4200+, 4400+, 4600+, и 4800+ с частотами поочередно 2.2Hz (L2 cache 512KB и 1024KB) и 2.4GHz (L2 cache 512KB и 1024KB), AMD не уменьшила частоту каждого ядра. Таким образом, даже в приложениях, не умеющих работать с двумя ядрами, никакого падения производительности по сравнению с самыми распространенными одноядерными процессорами не наблюдается.
Это тем более удачное решение, что данные двухъядерные процессоры работают в той же платформе Socket 939, что и раньше. Причем «в той же» здесь означает именно «в той же», а не «в новой с таким же разъемом». Необходимо лишь обновить BIOS, и практически все материнские платы с разъемом Socket 939 смогут работать с двухъядерными процессорами AMD.
Все это, а также недостаточность производственных мощностей, позволило AMD выставить на двухъядерные процессоры Athlon 64 Х2 достаточно высокие цены. В частности, даже объявленный позднее наиболее доступный Athlon 64 Х2 3800+ (2.0GHz, 512КВ) все равно достаточно дорог, до недавнего времени он стоил почти 400 долларов.
Разумеется, такие цены нужны AMD для того, чтобы спрос на двухъядерные Athlon 64 Х2 был не слишком велик, при помощи цен этот спрос попросту регулируют. Потому что произвести необходимое количество дешевых двухъядерников AMD просто не в состоянии.
Занятно, что это спровоцировало некоторое количество истерических выступлений в конференциях, которые лучше всего охарактеризовать словами Goblin-а: «жадные дети требуют снизить цены». Впрочем, оставим эту проблему «жадным детям» ©. Тем, кому действительно нужны двухъядерные решения, нынешние цены AMD вполне по карману. Если не по карману – надо собирать деньги. Либо ждать: с течением времени процессоры, как правило, дешевеют.
Занятно, что в ситуации с Athlon 64 Х2 AMD установила заметно более высокие цены, чем установила Intel на свои Pentium D. Впрочем, я нахожу это вполне справедливым: решения AMD в этой области в данный момент времени действительно заметно лучше, так что более высокая их стоимость вполне адекватна.
Пользуясь случаем, ехидно замечу, что в определенные моменты времени ценообразование в AMD, похоже, продукт работы генератора случайных чисел. Потому что объяснить внятно, каким образом после октябрьского снижения цен линейка двухъядерных Opteron-ов серии 1хх, перешедшая на Socket 939 (модели 165, 170, 175 и 180) оказалась дешевле соответствующих по частоте Athlon 64 Х2, не может никто. А, главное, кто тогда будет покупать двухъядерные Athlon 64 Х2, ежели двухъядерные Opteron-ы с гарантированным кэшем 1МВ стоят дешевле, а рангом они заметно «круче»? Чудеса! :D
Понятно, что позднее цена выровняется, и все опять станет логичным и стройным, но пока это выглядит архизабавно.

Поговорим о Socket F


Кроме нового десктопного разъема, появится у AMD новый разъем и на серверном рынке, Socket F, он же Socket 1207. В нем будет, как понятно из названия, 1207 контактов. Интересно попробовать предугадать, на что пойдут эти «лишние» контакты.
На самом деле есть несколько вариантов, как их употребить. Самый первый и самый банальный выглядит так: увеличить количество токонесущих дорожек (и соответствующих им ножек с заземлением). В общем-то, здравый смысл в этом есть, процессоры при постоянно снижающемся напряжении потребляют все больший по величине ток. В частности, в спецификациях на VRM модули под процессоры Xeon пиковый ток доходит до 120А (!). Процессоры Opteron пока довольствуются током поменьше, но даже у них он доходит до 80А, а ведь было бы неплохо еще иметь некоторый запас на будущее. Хотя бы для того, чтобы следующие модели Opteron-ов могли быть установлены в тот же разъем.

С другой стороны, новый разъем ведь не просто так объявили? Стало быть, изменится технология памяти, иначе нет смысла городить новую платформу. Какой же она будет?
Есть всего два разумных варианта: ECC Registered DDR2, или же FB DIMM, (кстати, так же основанный на технологии DDR2). Так что попробуем разобраться, какой вариант выглядит более логичным в данной ситуации.
Вариант с ЕСС Registered DDR2, в сущности, не потребует ни от AMD, ни от производителей памяти никаких особенных усилий: все технологии по отдельности давно отработаны, структура модуля DDR2 от модуля DDR ничем принципиально не отличается. Стало быть, этот переход должен быть достаточно простым.
Важный вопрос связан с тем, какие частоты будут у ECC Registered DDR2 модулей. Здесь вариантов несколько: от 400MHz до 800 MHz, включая варианты с 533MHz и 667MHz. Конечно, наиболее интересным для потребителей выглядит вариант ECC Registered DDR2-800 модулей. Тогда, предполагая те же два канала, получаем, что Opteron-ы нового образца будут иметь теоретическую пропускную способность памяти до 12.8GB/sec. Что ж, это хорошо. Тем более хорошо, что даже сейчас, когда пропускная способность ECC Registered DDR памяти составляет «всего» 6.4GB/sec, особой нехватки пропускной способности памяти у двухъядерных Opteron-ов не заметно.
Тогда вдвое большей пропускной способности должно хватить на четыре ядра! Выглядит интересно.

Кстати, о четырех ядрах! Недавно почему-то бросилась в глаза новость об анонсе корпорацией AMD процессора Opteron 270 HE. Это означает, что тепловыделение двухъядерного процессора с частотой 2.0GHz (при том, что задействованы оба ядра) не превышает 55Вт! То есть у каждого ядра максимальное тепловыделение не выше 28Вт! Браво, AMD. Конечно же, эти процессоры есть продукт жесточайшего отбора продукции: буквально так и представляются грустные малазийские работники, вручную терпеливо сортирующие процессоры, и укладывающие их в бамбуковые корзины. :D Что ж, остается лишь поздравить корпорацию, выпускающую серверные процессоры с тепловыделением процессоров для ноутбуков!
То есть, четыре ядра с той же частотой 2.0GHz спокойно поместятся в 110Вт! Это несколько выше, чем TDP текущего Socket 940, но будет вполне логично предположить, что, заложив новый Socket F, AMD захочет сделать в нем дополнительный «запас прочности» по тепловыделению. Скажем, разумным выглядит предположение о том, что новое TDP будет составлять для Socket F значение около 125Вт – 130Вт. Собственно, это максимум того, что можно без особых проблем отводить от процессора при помощи существующих сейчас систем воздушного охлаждения. Разумеется, охлаждение будет не слишком тихим, но в серверах вопрос тишины заказчиков волнует заметно меньше, и без того в корпусах серверов достаточно скоростных вентиляторов.

Таким образом, перейдя на Socket F, AMD в любой необходимый ей момент времени может представить образцы четырехъядерных процессоров. Некоторое время, конечно же, понадобится на производство образцов, но его мы пока не учитываем. Причем продукт появится именно на серверном рынке – единственном пока рынке, где многоядерность реально востребована большинством покупателей!
Слегка отвлекаясь, отметим, что 110Вт – это максимальное TDP нынешних платформ Socket 939. Таким образом, при сущей необходимости AMD вполне в силах выкатить такое решение даже на десктопный рынок. Скажем, ради того, чтобы любой ценой обогнать Pentium XE, который имеет два ядра с поддержкой технологии Hyper Threading в каждом, и в приложениях выглядит как четыре логических процессора. Разумеется, в сражении четырех «виртуальных» процессоров с четырьмя настоящими ядрами итог предрешен, виртуальные ядра пойдут дальше пить стероиды и «поддерживать мускулы накачанными» (с). Потому как победить им не светит. Правда, площадь такого решения по нынешней технологии 90нм будет чрезвычайно большой, порядка 400 мм2, но кого и когда это пугало, если победа нужна любой ценой?
Впрочем, вероятнее всего, на подобные варианты AMD решится не ранее, чем перейдет на технологию 65нм. Но даже в этом случае площадь такого процессора будет порядка 200 мм2, то есть будет находиться вблизи верхнего предела для массового производства. Разумеется, сократив кэш второго уровня до 512КВ (а, чем черт не шутит, вдруг еще применив свой собственный патент об уменьшении ячеек кэша второго уровня), площадь можно заметно снизить. Скажем, до примерно 140 – 150 мм2 без технологии уменьшения площади ячеек, и примерно до 90 – 100 мм2 с ее применением.

Это уже вполне разумные цифры, но вначале необходимо дождаться нормального перехода на техпроцесс 65нм. А то при переходах на более мелкие геометрические размеры всякое бывает. Эвон Intel со своим переходом на 90нм намучалась. Не исключено, что и AMD будет «лихорадить» при переходе на более мелкие технологические процессы. Предугадать это мысленно достаточно сложно. Впрочем, похоже, 272 миллиона долларов, которые AMD уплатила IBM за помощь в освоении технологий 90нм и 65нм, были отнюдь не лишними: технологический процесс AMD в данный момент выдает великолепные по характеристикам процессоры. Стало быть, чтобы было все в порядке, надо не забывать вовремя платить IBM. :D В этом плане недавние новости о продлении договора о сотрудничестве AMD с IBM в области технологических процессов 65нм, 45нм, и 32нм внушают вполне приятные надежды.
Но вернемся к серверному Socket F.

До этого момента мы исходили из наиболее приятного для пользователей предположения: частота ECC Registered DDR2 модулей будет равна 800MHz. Это было бы хорошо, но есть нюанс. Чем выше частота памяти, тем сложнее поставить большое количество модулей. Другими словами, максимальная частота стабильной работы модулей зависит и от их количества тоже. Таким образом, не исключен вариант, когда на частоте 800MHz будут работать всего два или в лучшем случае три модуля на канал, а вот большее количество их приведет к снижению рабочей частоты. Хорошо, если до 667MHz, в этом режиме DDR2 все еще быстрее, чем DDR (и по латентности, и по пропускной способности). А вот если будет падать до 533MHz или даже до 400MHz, тогда будет обидно и плохо. Собственно, снижать частоту до 400MHz бессмысленно – на такой частоте она работает в системах на Opteron-ах сейчас. Нет смысла городить огород ради такой замены: пропускная способность одинакова, а латентности DDR2-400 заметно хуже, чем у DDR400.
Так что будем надеяться, что ниже 667MHz частота памяти снижаться не будет. Сразу же оговоримся, что в варианты использования DDR2-1066 автор не верит: эти модули являются разогнанными, и гарантировать их применение в ответственных приложениях никто, скорее всего, не будет.

Наиболее вероятно, что произойдет так же, как уже было при появлении первых систем на Opteron-ах: вначале будут использовать то, что есть на рынке. То есть в лучшем случае ECC Registered DDR2-667, а то и ECC Registered DDR2-533, или даже ECC Registered DDR2-400. Тем более, что последний стандарт на рынке уже реально есть, и используется в системах на базе процессоров Xeon. А затем, постепенно, производители памяти подтянутся, и выдадут «на гора» модули со все более повышающейся частотой, вплоть до ECC Registered DDR2-800. По логике событий это наиболее плавный вариант, а производители обычно резких движений без особых причин не любят.
Таким образом, в рассмотренном нами варианте с переходом на ECC Registered DDR2 AMD скорее выигрывает, чем проигрывает: латентности не ухудшаются или даже немного улучшаются, пропускная способность памяти заметно вырастет (хоть Opteron-ы менее чувствительны к ней, нежели к латентности). Стоит отметить, что в начале перехода, когда на рынке будут только низкочастотные ECC Registered DDR2-400, некоторую долю производительности системы на Opteron-ах потеряют. Но позднее они наверстают упущенное, и даже более того.

Правда, есть и ложка дегтя: если для ECC Registered DDR400 на нынешних Opteron-ах удалось обеспечить функционирование четырех модулей на канал, то для ECC Registered DDR2-800 никакого упоминания более двух модулей на канал мне пока не встречалось. Соответственно, не исключен вариант, когда покупатели будут скованы выбором: либо мало модулей, но быстрых, либо больше, но медленных.
Кстати, мелким, но приятным следствием перехода на ECC Registered DDR2 будет сниженное тепловыделение DDR2 памяти. Хоть тепловыделение памяти в серверах и не критично, но когда оно снижается, это всяко приятно. Послужит хоть некоторой компенсацией увеличившемуся TDP процессоров на Socket F.
Надо подумать, разумен ли переход на FB DIMM.

FB DIMM?! С чем это едят?


Судя по пылкой и яростной любви, которую «вдруг» стала испытывать Intel к технологии FB DIMM, следующие серверные платформы от Intel будут основаны именно на FB DIMM. Поскольку мы сейчас размышляем над вариантами действий AMD, а использование FB DIMM – один из вариантов, есть смысл чуть подробнее остановиться на простеньком описании FB DIMM.

Необходимость в изменении технологии серверной памяти возникла вот в связи с чем. Чем дальше, тем выше частоты модулей, используемых в серверах. Но с ростом их частоты возникает большое число проблем, связанных с такими физическими эффектами, как всевозможные наводки и перекрестные помехи. Чем выше частота работы памяти, тем сложнее с ними бороться. И в результате имеем следующую ситуацию: чем выше частота работы памяти, тем выше электрическая нагрузка на контроллер памяти, и тем меньше модулей у нас может работать одновременно.
Поскольку для серверов большой объем поддерживаемой памяти есть одно из ключевых требований, необходимо как-то выкарабкиваться из этого тупика.
Одним из вариантов такого выхода является технология FB DIMM.

Есть замечательная презентация авторства Intel . Там указаны некоторые преимущества перехода с DDR2 на FB DIMM. И (если отвлечься от некоторых слишком несуразных чисел, которые придется списать на фантазию «хореографов» от Intel, слишком уж увлекшихся поиском преимуществ FB DIMM) складывается вполне понятная картина.
Суть FB DIMM вполне описывается словом «сериализация». А сама идеология находится вполне в современном духе перехода к последовательным шинам везде, где только можно. В частности, оказалось, что можно и в технологиях, связанных с памятью.

Идея FB DIMM состоит в том, что от общей шины памяти, на которой сидят модули памяти, мы уходим. Поэтому избыточная электрическая нагрузка, которую модули создают на контроллер, перестает быть проблемой. Вместо этого есть две шины (одна на чтение, другая – на запись) на которых сидят не сами массивы ячеек, а только управляющие буферы модуля (AMB в терминологии FB DIMM). Таким образом, питание массивов ячеек контроллером памяти более не осуществляется. Массивы ячеек основаны на технологии DDR2, здесь FB DIMM вполне пересекается с текущими технологиями. Благодаря этому, производителям памяти будет проще перейти на технологию FB DIMM.
Кроме того, все передачи контроллер памяти ведет только в буферы AMB, все данные получает оттуда же.
Все это происходит, повторюсь, по узким высокочастотным шинам. Поскольку технология ECC является присущей абсолютно всем пересылкам данных между AMB и контроллером, появляются дополнительные преимущества типа защиты команд ЕСС кодом. В этом плане FB DIMM меньше подвержены ошибкам, поскольку содержат более развитые технологии контроля ошибок и восстановления данных.
Кроме того, поскольку модуль FB DIMM фактически связан с контроллером только буфером AMB, для такой памяти гораздо проще достигнуть пропускной способности, максимально близкой к теоретической. Например, если у нас в наличии два модуля FB DIMM, мы вполне можем одновременно писать в один и читать из другого. Звучит завлекательно, прямо скажем.

Кроме всего прочего, использование буфера AMB позволяет полностью скрывать от контроллера такую служебную операцию, как восстановление содержимого ячейки, refresh. Можно скрывать и некоторые другие операции. Более того, команды в модуле FB DIMM конвейеризированы, и можно отдавать следующую команду на фоне выполнения предыдущей. Неплохо!
К достоинствам отнесем и заметно меньшее число контактов, которые нужно разводить: в частности, в указанном файле приводят пример 69 контактов у FB DIMM модуля против 240 у модуля DDR2. Поэтому вместо двух каналов DDR2 вполне можно разводить четыре канала, и при этом у них разводка будет занимать меньшее число контактов (276 против 480), и к ней предъявляются менее жесткие требования. Ну а результат сравнения пропускной способности двух конкурирующих типов вполне предсказуем: два канала DD2-400 имеют теоретический максимум 6.4GB/sec, а четыре канала FB DIMM способны выдать порядка 17GB/sec. Преимущество впечатляющее.

Это те черты модулей FB DIMM, которые безусловно хороши. Недостатки памяти FB DIMM, увы, прямо следуют из ее достоинств. Прежде всего, это жуткая латентность самого модуля. По некоторым предварительным оценкам, она будет порядка 200нс (!). Более того, при увеличении количества модулей на канал латентность обращения к каждому модулю тоже растет, хоть и не слишком быстро.
Однако ужас. Нет, даже не ужас, а ужас-ужас (с). В этом месте хочется остановиться, и тщательно подумать: корпорация AMD последовательно делала все, чтобы уменьшить латентность подсистемы памяти. В частности, перенесла контроллер памяти в процессор, благодаря чему и получила сильное уменьшение латентности системы.
Если собственная латентность модуля порядка 200нс, никакие переносы контроллера уже не способны ее замаскировать. Вместо примерно 50нс – 60нс, характерных для нынешних систем на Opteron-ах, получить не менее 200нс?

И это в той самой ситуации, когда системы на Opteron-ах гораздо чувствительней к латентности, чем к пропускной способности памяти? Зачем это нужно?
Да, остальные вкусности FB DIMM производят вполне приятное впечатление, но высокая латентность FB DIMM делает их применение абсолютно бессмысленным для AMD: все скоростные качества интегрированных контроллеров памяти будут полностью нивелированы чрезвычайно высокими собственными задержками FB DIMM.
Другими словами, использование FB DIMM в системах на Opteron приведет не к росту, а к падению реальной производительности систем.
Со стороны AMD делать систему на FB DIMM было бы самоубийством. Поскольку в добровольные самоубийства крупных корпораций я не верю, остается предположить, что корпорация AMD технологию FB DIMM для своих систем не выберет.

Таким образом, выбора-то и нет. Реально AMD может перейти только на ECC Registered DDR2, при этом изо всех сил «стимулируя» производителей для того, чтобы как можно быстрее поднять частоту модулей до 800MHz. Сначала будет ECC Registered DDR2-400 и ECC Registered DDR2-533, затем, позднее, ECC Registered DDR2-667 (с этого момента переход уже приносит заметные дивиденды в производительности), и, наконец, ECC Registered DDR2-800.
Все как всегда в бизнесе (и жизни): выбираем между плохим вариантом, и вариантом еще хуже. Впрочем, AMD обязана справиться, отступать некуда.
Ну и на закуску еще немного про FB DIMM: ох, и греются же FB DIMM модули…. В принципе, это вполне логично и понятно: будучи организованными примерно по тому же способу, что и шина PCI-E (то есть высокочастотная последовательная шина), модули имеют некоторые части, работающие на частотах порядка 2GHz (тот же AMB-буфер, например). Например, на IDF демонстрировалась система с FB DIMM, и при этом было хорошо видно, что четыре FB DIMM модуля охлаждаются расположенным прямо над ними вентилятором. Потенциально эта проблема вполне способна осложнить жизнь производителям – особенно если учесть, что в системах с FB DIMM изначально планируется использовать большое количество модулей. Конечно, производители серверных систем что-нибудь придумают, у них работа такая. Но тенденция увеличения тепловыделения откровенно не радует.

Кроме того, косвенным доказательством того, что для FB DIMM модулей существенна проблема тепловыделения, является раздел Thermal Throttling (о как!) в описании стандарта FB DIMM. Иногда складывается впечатление, что инженеры Intel после процессора Pentium 4 с ядром Prescott закладывают технологии Thermal Throttling везде, где только можно. :D Обжегшись на молоке, так сказать, дуют на воду (с). Впрочем, это я дал выход природной язвительности.

Подведем итоги по Socket F


Попробуем подсчитать контакты, это традиционное мероприятие развлекательного плана: каждый модуль ECC Registered DDR2 имеет 240 контактов вместо 184 у ECC Registered DDR. Таким образом, несложно объяснить появление 2 * (240-184) = 112 контактов. А у нас есть 1207 – 940 = 267 контактов. 112 из них мы объяснили, осталось 155 контактов. Ну, накинем штук 50 контактов про запас для дальнейшего увеличения силы тока от VRM-модуля. Останется порядка сотни незадействованных контактов. Что бы это могло быть?
Не хотелось бы впадать в радужные мечты либо выдавать желаемое за действительное, но есть одна такая шина, для которой число 108 является весьма характерным. Эта шина называется Hyper Transport, и поклонники AMD обязаны помнить ее наизусть, включая раскладку по контактам. :D В частности, каждая из трех шин Hyper Transport в нынешних Opteron-ах имеет именно столько контактов (включая контакты «земля»), и пропускает 8GB/sec (по 4GB/sec в каждую сторону).
Соответственно, было бы очень здорово, чтобы эти контакты употребили для еще одной, четвертой шины Hyper Transport.

Этим AMD убьет сразу несколько «зайцев». Во-первых, появится возможность строить без дополнительной логики более чем 8-ми процессорные системы. Это хорошо, поскольку открывает дополнительные горизонты в масштабировании систем. Ведь сейчас системы с более чем 16 ядрами для AMD практически недоступны, на этом рынке безраздельно царит Intel (разумеется, не только и даже не столько он, но с остальными производителями RISC процессоров AMD пока не конкурировала; хотя в данной ситуации все может быть…).
Конечно, можно строить такие системы с дополнительной логикой (например, используя небезызвестный чип HORUS). Но есть с посторонней логикой ряд определенных проблем. Во-первых, это стоимость решения. Платформы с использованием чипов, подобных HORUS-у, заметно ее увеличивают.
Во-вторых, это физика, от которой никуда не деться. Будучи дополнительным коммутатором, HORUS увеличивает задержки в пересылке данных между процессорами. Стало быть, возможность обойтись без него должна поднять реальную производительность.
В-третьих, любая логика поддержки процессоров должна пройти валидацию (проверку) под распространенные операционные системы на стабильность работы и отсутствие проблем. Учитывая количество серверных операционных систем, это достаточно дорогая и, главное, достаточно длительная процедура. Обычно она занимает порядка года. Стало быть, возможность обойтись без дополнительной валидации можно только приветствовать.

Но самое главное совсем другое: имея в процессоре 4 [когерентных] шины Hyper Transport, можно строить сколь угодно продолжительную трехмерную решетку из процессоров Opteron!
Открываются еще более заманчивые перспективы для применения Opteron-ов в суперкомпьютерах. Собственно, эти процессоры и без того не обижены вниманием строителей суперкомпьютеров, кластеров, и прочей публики, заинтересованной в HPC (High Performance Computing). Особенно после того, как у AMD появились двухъядерные решения. А здесь у нас просто напрашивается кубическая решетка (того же вида, что у NaCl) из двухъядерных Opteron-ов, каждый из которых снабжен ECC Registered DDR2-800. Пожалуй, даже специализированным суперкомпьютерам будет сложно тягаться с такой конструкцией в производительности.
Суперкомпьютеры – это занятно, но слишком уж далеко от народа. Принесет ли четвертая шина Hyper Transport что-нибудь для обычных покупателей?

В голову приходит очень простая и элегантная конструкция для четырехпроцессорных систем: обыкновенный правильный тетраэдр, узлами в котором являются Opteron-ы. В природе такая кристаллическая решетка встречается, например, в алмазах. На секунду возвращаясь к суперкомпьютерам, отметим, что такой вариант так же весьма перспективен для построения суперкомпьютеров.
Что такая топология дает для покупателей, и чем она лучше, чем уже существующие четырехпроцессорные системы на Opteron-ах?

Прежде всего тем, что заметно уменьшаются задержки с запросами внутри системы. Думаю, все помнят, что одну пересылку запроса между двумя процессорами AMD называет хопом (hop). В нынешней четырехпроцессорной системе на Opteron-ах среднее количество хопов в системе равно 1. В системе, построенной как тетраэдр, среднее число хопов равно 0.75 – то есть при тех же скоростных характеристиках мы почти на четверть (!) уменьшили задержки, сугубо за счет более эффективной топологии! Система с четырьмя процессорами для Socket F будет заметно ближе к классической SMP систему, чем нынешняя.
Если совсем обнаглеть и помечтать, то можно подумать о двухпроцессорной системе, в которой между процессорами будет задействована не одна шина Hyper Transport, а две или три (в зависимости от того, сколько из них будут когерентными). Впрочем, в случае двухпроцессорной системы особого прироста от этого ждать не стоит (косвенно это подтверждается тем, что переход шины Hyper Transport с частоты 800MHz на частоту 1000MHz особого прироста не дал).

В случае, если AMD захочет сделать четырехпроцессорные системы интересными для народа, обновленная топология четырехпроцессорных систем наверняка произведет прорыв в производительности (и эффективности) четырехпроцессорных систем. Осталась мелочь: сделать их по цене гораздо более доступными. Для этого разница в стоимости между двухпроцессорными и четырехпроцессорными системами не должна превышать 30% - 50%.
Кстати, мелькнула интересная мысль. До этого момента AMD делила Opteron-ы по классам многопроцессорности фактически по количеству шин Hyper Transport, которые могли работать в когерентном режиме. Opteron-ы серии 1хх не имели когерентного режима на шине Hyper Transport, Opteron-ы серии 2хх имели только одну шину Hyper Transport в когерентном режиме, и только серия 8хх могла все три шины Hyper Transport запускать в когерентном режиме.
Теперь же у нас потенциально возможно разделение на такие серии:

Opteron 1хх у нас выбыл (точнее, перешел на Socket 939)
Opteron 2хх (одна когерентная шина), только двухпроцессорные системы (то же, что и сейчас)
Opteron 4хх (две когерентных шины), двух- и четырехпроцессорные системы
Opteron 8хх (три когерентных шины), двух-, четырех- и восьмипроцессорные системы
Opteron с условным модельным номером 16хх (все четыре шины могут работать в когерентном режиме).

Здесь возможно построение систем с любым количеством процессоров. Это позволит установить на серию Opteron 16хх заметно более высокие цены, и увеличить прибыль AMD. Хм… Что-то я не то пишу :D
Пожалуй, все же есть смысл объединить серию 8хх с серией 4хх, чтобы не плодить сущностей без надобности (с). Впрочем, решать это будет AMD – если, конечно, вообще сделает хоть что-нибудь подобное тому, что я здесь нафантазировал. Меня, однако, совсем не удивит разделение Opteron-ов на четыре серии, это вполне в духе идеи разделения рынков на сегменты, и максимизации прибыли на каждом сегменте.
Кстати сказать, вполне вероятен с одновременно переходом на Socket F переход на новую версию шины Hyper Transport, Hyper Transport 2. Она характеризуется более высокими частотами работы (1.3GHz, 1.4GHz, 2.0GHz) c соответствующим увеличением пропускной способности, 10.4GB/sec, 11.2GB/sec, и 20GB/sec соответственно. Понятно, что это пойдет только на пользу производительности систем на Opteron-ах. Особенно важно увеличение производительности в гипотетическом семействе Opteron 16хх, поскольку производительность трехмерной структуры с узлами из Opteron-ов будет существенно ограничиваться только скоростями соединений между процессорами.

Впрочем, пора закругляться со своими фантазиями: как бы там ни было, но у AMD сейчас, при переходе на разъем Socket F, есть достаточно редкая возможность скачкообразно увеличить доступные своим процессорам рынки, распространившись на сектор действительно многопроцессорных систем. Воспользуются ли они этой идеей – вопрос коммерческой целесообразности, каковая так просто не вычисляется, и доброй воли AMD.
Не знаю, как насчет коммерческой целесообразности, но определенные доводы в пользу уже назревшей необходимости качественно нового скачка есть. В частности, Intel уже объявлял, что работает над шиной CSI, которая должна быть аналогична в какой-то степени шине Hyper Transport, и точно так же будет шиной точка-точка. Но даже без шины CSI Intel в серии чипсетов 8500 сделала возможным для своих систем применение двух процессорных шин. Теперь основная проблема шинной архитектуры Intel, общий трафик по одной шине, в значительной степени сглажена. Что, кстати, вполне подтверждается появившимися в сети тестами.

Поэтому AMD либо предложит качественно новый уровень решений, либо успокоится и не сделает этого. Если не сделает – это будет очевидным просчетом. Ведь любые существенные нововведения у AMD возможны только с изменением форм-фактора процессоров. Раз уж мы все равно изменяем разъем в угоду новому стандарту памяти, почему бы попутно не заложить в него дополнительные возможности? Ведь следующее изменение может быть не скоро.
Тем более что Intel все равно не успокоится, пока не догонит (и не перегонит) AMD по возможностям своих систем. Учитывая финансовые и производственные возможности Intel, у AMD есть только один способ зарабатывать деньги: быть всегда впереди, хотя бы по архитектурным особенностям своих процессоров.
Осталось только уточнить, что увеличение количества шин в процессоре (и увеличение количества ядер) потребует увеличить количество портов во встроенном в процессор коммутаторе (crossbar). Впрочем, не думаю, чтобы это представляло какую-то особенно серьезную проблему.

Обратите внимание: до сих пор обсуждалось достаточно большое количество потенциально выгодных для повышения производительности технологий, вообще не связанных с ростом частоты процессоров.
Однако некоторый запас по частоте у Opteron-ов все же есть. Есть впечатление, что на выпуск хотя бы ограниченных партий процессоров, работающих на частоте 3GHz, нынешний технологический процесс AMD вполне способен. Особенно если вспомнить, что ранее я предусмотрительно сделал «для себя» запас по TDP на уровне 130Вт, и теперь не надо так жестко стараться уложиться в рамки 95Вт, оговоренных спецификацией для платформы Socket 940. Если подумать, то, пожалуй, можно даже отодвинуть перспективу для одиночных ядер примерно до 3.2GHz, по мере перехода на 65нм, и постепенного «оттачивания» технологического процесса (конечно же, не в ближайшем будущем).
Ну а теперь традиционная ложка дегтя в конце главы. :D Напомню, что старый разъем Socket 940 никуда волшебным образом не исчез. И его придется поддерживать, хотя бы пару лет. Таким образов, в данный момент AMD в некоторой степени оказалась заложником своей политики, обещая поддерживать Socket 940 не менее пяти лет. Правда, два из них уже прошло, но еще года три выпускать продукты для этого разъема придется.
Впрочем, мне их не жалко. :D Сами виноваты.

Немного об XDR


Сделаем очередное небольшое отступление. Надо сказать, есть еще более занятный вариант перехода на новый вид памяти. С технической стороны весьма привлекательно выглядит переход на такой экзотический тип памяти, как XDR.
Тут надо сделать очередное отступление (похоже, вся эта статья состоит именно из них) :D.
Некоторое время назад одна весьма немаленькая компьютерная корпорация, известная как Intel, вступила в коалицию с одной весьма маленькой компанией, известной как Rambus. Основана она была, кстати, двумя инженерами, ранее работающими в Intel – по-видимому, это немаловажный штришок к дальнейшим событиям.

Компания Rambus имела потенциально очень интересные наработки по части нового типа памяти, который, по мысли появившегося альянса, должен был прийти на смену тогдашнему основному типу памяти, SDRAM. Новый тип памяти носил вполне логичное название DR DRAM (Direct Rambus DRAM).
Отличительной чертой памяти была узкая высокоскоростная шина (ничего не напоминает?), которая соединяла контроллер памяти в чипсете со специальным контроллером Rambus внутри модуля. Благодаря весьма прогрессивной на тот момент технологии внутренней организации (в частности, контроллер Rambus работал внутри модуля с 32-мя банками памяти) и скоростной шине каждый модуль PC800 должен был демонстрировать чудеса производительности. Более того, память DR DRAM РС800 получила такое официальное название именно для того, чтобы, по контрасту с РС100, подчеркнуть ее феноменальную производительность.

При вдвое большей максимальной теоретической производительности, чем у РС100 SDRAM (1600МB/sec), DR DRAM, кроме всего прочего, должна была достигать заметно более высокой утилизации пропускной способности. То есть, сравнение этих двух типов памяти было отнюдь не в пользу РС100 SDRAM, DR DRAM имела все преимущества.
Так гласила теория. Похоже, кто-то из высшего менеджемента Intel поверил в феерические ожидания от подобного альянса. Или же бывшие сотрудники Intel, хорошо зная стиль мышления своих коллег, соответствующим образом представили преимущества своей памяти. Что ж, дело житейское: всяк бизнесмен хочет продать свой продукт как можно лучше, ничего необычного здесь нет.
И в результате наш некто, будучи весьма высокопоставленным сотрудником Intel, совершил роковую ошибку: подписал контракт с компанией Rambus, обязывающий Intel не применять никакую иную технологию памяти с пропускной способностью свыше 1GB/sec, кроме DR DRAM. Подчеркиваю, ошибка была не в том, что Intel подписала контракт о продвижении перспективной (или считавшейся таковой на тот момент) памяти – это как раз нормальная ситуация в бизнесе. Подписан был эксклюзивный контракт: корпорация Intel не имела права предлагать какое-либо другое скоростное решение, кроме DR DRAM.
Представили себе величину мезальянса? Слон и моська отдыхают перед разницей между двадцатимиллиардной корпорацией – лидером рынка, и недавно образованной компанией с уставным капиталом из нескольких миллионов, полученных от инвесторов. Перейдя к аристократической терминологии, это аналог следующей ситуации: царь всея Руси прогуливался по улице, милостиво кивая отдельным проходящим мимо дворянам. Встретил миловидную простолюдинку. Вздумалось ему узнать ее мнение на политику государства. И так она ему полюбилась, что взял он ее под белы рученьки, ввел в Думу Государственную, и поклялся слушать не кого-либо другого, а только ее.

Как Вы думаете, часто такие ситуации бывают в жизни? До недавнего время я тоже думал, что нечасто. Дескать, в бизнесе чудес не бывает. Ан нет, бывают! Ибо корпорация Intel подарила компании Rambus именно такие, исключительные права. Эх, знать бы, чем и как Rambus сумела убедить Intel. Может, и у меня так получится? :D

Впрочем, не будем забегать вперед. Время шло, содружество между компаниями развивалось. Корпорация Intel, действуя согласно договору, употребила все свое немалое влияние, а также все мыслимые и немыслимые усилия, чтобы именно DR DRAM стала основным направлением в промышленности. Многомиллионные транши производителям памяти, всяческие популистские акции, направленные на популяризацию DR DRAM, выпуск чипсета i820 с поддержкой только одного типа памяти, DR DRAM.
Казалось, никаких неприятностей быть не должно: поддержка индустрии была (все как один производители клятвенно пообещали выпускать ее столько, сколько понадобится, хоть и морщились от цены лицензий на DR DRAM). Интел выпустила чипсет, производители плат радостно его раскупили, Rambus не успевала считать деньги от продаж лицензий, радостно рапортуя об «еще одном счастливчике, влившемся в клуб DR DRAM».

Казалось бы, типичная американская мечта о «Золушке от Hi Tech» налицо: изучай, мотай на ус, и делай точно так же.
На практике же оказалось, что действительность «несколько отличается» от запланированного двумя союзниками ранее. Прежде всего, выяснилось, что у модулей DR DRAM слишком высокая латентность: даже инженеры Intel, на тот момент создававшие наиболее быстрые контроллеры памяти, не смогли достичь тех показателей латентности, которые были характерны для приличной SDRAM PC100 с CL=1 (Cas Latency). Показывая великолепные результаты в потоковых тестах, DR DRAM не демонстрировала ничего выдающегося в реальных приложениях.

А в ситуации примерно одинаковой производительности становятся гораздо важнее такие «второстепенные» факторы, как стоимость памяти. А она у DR DRAM была на момент появления попросту заоблачной, превышая таковую для PC100 SDRAM примерно в пять раз. Причем жадность производителей была, в общем-то, не при чем: на первых порах производителям действительно было сложно достичь заданных стандартом характеристик для РС800 DR DRAM. Это даже привело к тому, что позднее с подачи Intel комитет JEDEC ввел еще два менее скоростных стандарта, РС600, и РС700. Микросхемы, не прошедшие тестирование на частоте 800MHz, производители маркировали на меньшие частоты.
К тому же DR DRAM действительно технически заметно сложнее: чего стоят 32 независимых банка, например. Логика в микросхемах DR DRAM действительно занимает заметно большую площадь, чем в SDRAM. И, хотя основа основ, ячейка памяти, у этих двух видов примерно одинакова, выход годных к использованию микросхем оказался совсем разный.
Добавим к этому высокую цену на лицензию DR DRAM, повышенный нагрев микросхем (в частности, пришлось снабжать модули металлическими теплораспределителями), повышенные требования к временным характеристикам (частота работы намного выше), увеличенную примерно на 20% площадь микросхемы (по сравнению с микросхемой SDRAM той же емкости). И все это вкупе с новейшим и быстрым чипсетом дает примерно тот же эффект, что и архиудачный предыдущий чипсет BX со старой доброй РС100?
Да гори оно огнем, такое высокотехнологическое счастье!

Тем более что некоторые отступники-производители, совместно с окончательно обнаглевшей VIA, вдруг взяли и разогнали SDRAM до 133MHz, создав некий «почти стандарт». И, невзирая на активное сопротивление Intel, JEDEC все же утвердил его. Правда, далеко не сразу. Верная подписанному контракту, корпорация Intel сопротивлялась внедрению памяти РС133 изо всех сил.
Это оказалось сильным ударом для DR DRAM. Мало того, что разгон РС100 до РС133 давался производителям практически даром, так еще и покупатели покупали РС133 гораздо охотнее. И, хотя латентность РС133 примерно соответствовала хорошей РС100 с CL=1, пропускная способность РС133 была уже достаточно высока, и составляла 1066МB/sec. Что, разумеется, не преминули разрекламировать производители памяти и производители материнских плат. В конце концов, круглые числа нравятся покупателям – и покупатели в полной мере это демонстрировали, раскупая платы с надписью РС133 как горячие пирожки. К сожалению, частенько не на чипсетах Intel, поскольку официально Intel не имел права поддерживать память РС133.

Кстати, благодаря этому в тот момент ощутимый рывок совершила VIA. Ведь у ее чипсетов была поддержка и 133MHz шины процессоров, и памяти РС133. Кстати, это привело к скандалу: корпорация Intel была не слишком счастлива от того, что решения VIA имеют более широкие возможности и пользуются спросом. Поэтому Intel подала на в суд VIA за «неправильное использование лицензии на процессорную шину Pentium III». С точки зрения Intel, наличие у VIA лицензии на шину 100MHz вовсе не означает, что она имеет право встраивать в свои чипсеты шину 133MHz. Разумеется, VIA была с этим не согласна.
В тот раз история сошла VIA с рук: незадолго до этого VIA прикупила себе бывшего производителя графических чипов, легендарную S3, чьи графические чипы были одними из лучших до начала трехмерной эры в графике.
А у компании S3 были кросс – лицензионные соглашения с Intel. Вот так вот у VIA неожиданно оказались совершенно законные основания для своих чипсетов. Впрочем, вернемся к истории с Rambus.
Как уже говорилось, производители материнских плат решительно хотели покупать именно чипсет ВХ, и никакой другой. Поскольку ВХ официально не поддерживал ни 133MHz процессора, ни памяти РС133, производители материнских плат занимались ничем иным, как разгоном, заставляя его работать на частоте 133MHz. Такие системы пользовались в то время очень большой популярностью.
Действительно, мазохистов мало: если скорости систем одинаковы (а у РС133 систем она даже выше), зачем платить за DR DRAM гораздо больше?

На этот вопрос Rambus и Intel так и не сумели найти ответ. Хотя очень искали. В ход пошли даже такие «совковые» методы торговли, как «торговля в нагрузку»: производитель материнских плат, желающий купить популярный чипсет ВХ, должен был «в нагрузку» покупать определенное количество чипсетов 820. Понятно, что на подобные действия Intel пошла не от хорошей жизни, ведь популярностью пользовался почему-то чипсет ВХ, а не новое хорошее решение на чипсете 820.
А вот чипсет 820 (Camino), который должен был стать локомотивом индустрии, спросом, увы, не пользовался. Да и платы на его основе были совсем недешевыми, кстати: цена в районе 200 долларов тоже не располагала к покупке.

Положение становилось угрожающим. С одной стороны, Intel выпускала процессоры Pentium III, рассчитанные на шину 133MHz. С другой стороны, единственным чипсетом Intel на тот момент, официально поддерживающим такую шину, был 820. Который, повторю, спросом вовсе не пользовался. А покупали в то время чипсет ВХ, который разгоняли, и использовали с памятью РС133 (которую Intel поддерживать не имела права). Душераздирающее зрелище, как говаривал ослик ИА.
Это начало тревожить корпорацию Intel, посему срочно был изыскан способ задействовать выпущенные ранее в избытке чипсеты 820. При помощи дополнительной микросхемы, MTH (Memory Translation Hub), устанавливаемой на платы с чипсетом 820, Intel сделал возможным использование РС100 (естественно, РС133 он поддерживать все так же не имел права, а Rambus не спешила это право предоставить).
Производители материнских плат слегка вздохнули: хоть и не самый быстрый вариант (это еще мягко сказано; к задержкам, связанным с Rambus протоколом, добавилась собственная немаленькая задержка МТН, в результате набор получился весьма заторможенным), но хоть как-то можно использовать грандиозные залежи чипсета 820.

И тут случилось страшное: в самом разгаре продаж комплектов 820 + МТН оказалось, что иногда работа МТН приводит к перезагрузке систем. Это оказалось последним гвоздем в крышку гроба чипсета 820: если не слишком быструю работу еще можно было как-то пережить, то работу с ошибками пережить уже трудно.
В результате Intel понесла немалые потери: несколько миллионов плат (!), на которых были распаяны 820 + МТН, Intel за свои деньги заменила на вариант «плата на чипсете 820 + модуль памяти DR DRAM» (правда, слегка пожадничали и давали в комплекте модуль 128МВ РС600, который по скорости был не ахти). Уровень убытков вполне можно себе представить. К чести Intel, она хотя бы заменила платы, в которых использовался МТН.

А вот некоторые производители (ау, Asus!) сделали вид, что никаких ошибок и в помине нет. Так и написали: дескать, специалисты Asus никаких ошибок в работе наших плат не нашли. Очень искали, но нет их, и все тут. Видимо, Intel от большой дури (или же в борьбе со скукой) теряла деньги, заменяя платы своим покупателям. А большинство оставшихся производителей вообще сделало вид, что ничего не случилось, и никаких ошибок нет. Мол, какие такие ошибки? Ничего не знаем. Не было такого. В общем, увлекательнейшая была коррида.
Прибавим сюда еще тот факт, что Rambus, со своей стороны, сделала все, чтобы вызвать со стороны производственных партнеров отвращение к себе. В какой-то момент, сочтя, что чудесная память DR DRAM слишком медленно становится основным видом, Rambus решила всех «поторопить». Поскольку уменьшать размеры роялти, видимо, было не с руки (или просто до слез жалко денег), Rambus нашла «волшебную кнопку» совсем в другом месте.

В свое время Rambus вместе с Intel вошла в комитет JEDEC, который занимается тем, что вырабатывает стандарты используемой в индустрии оперативной памяти. Важно здесь то, что комитет JEDEC некоммерческий, и прямой выгоды от своей деятельности не извлекает. Это комитет стандартизации. Соответственно, у этого комитета есть устав, который в одном из своих пунктов требует, чтобы участники комитета сообщали обо всех стандартах и патентах, имеющих отношение к обсуждаемым стандартам.
В тот момент Rambus никаких патентов (кроме DR DRAM) не имела. Но, принимая участие в заседаниях комитета JEDEC, имела доступ к открытой совместной информации производителей памяти. В частности, к ним относится документация по SDRAM и DDR SDRAM, которую в тот момент AMD + VIA (и в заметной степени HYNIX) всячески лоббировали в качестве следующего стандарта оперативной памяти – к тому моменту стало ясно, что DR DRAM на роль общего стандарта не подходит. Слишком дорого, слишком медленно, слишком сложно в производстве.

Ну так вот, «предприимчивые ребята» из Rambus решили, что раз информация открытая, тем хуже для остальных. И, пока остальные погрязли в спорах относительно будущего памяти, Rambus подала в патентное бюро США патенты на …. память SDRAM и DDR SDRAM! Более того, были запатентованы некоторые ключевые особенности ячейки памяти. А поскольку ячейка памяти остается неизменной вот уже несколько десятков лет, по сути, получается, Rambus «запатентовала» сам принцип работы динамической памяти. Таким образом, вышло, что Rambus изобрела DRAM.
Будь это частные лица, такие действия можно было бы назвать «незаконной приватизацией», или «мошенничеством», если перестать соблюдать политкорректность.
Поскольку речь не о частных лицах, назовем это «большим бизнесом». Хотя отстроиться от слова «мошенничество» достаточно сложно.

Оторопевшим от такой беспардонной наглости производителям памяти Rambus заявила, что владеет патентами на ключевые технологии SDRAM и DDR SDRAM. И предлагает всем производителям, в настоящее время «незаконно использующим ее родные патенты в своих противозаконных изделиях», недорого их легализовать. Кстати, те, которые производят много DR DRAM, могут получить скидку: мол, комплектом лицензии отдадим со скидкой. Пользуйтесь на здоровье.
Разумеется, Rambus с треском вылетела из комитета JEDEC, только это уже ничему помочь не могло. В качестве показательного процесса «оскорбленная в лучших чувствах Rambus» обрушилась на HYNIX, негодуя по поводу «столь циничного нарушения ее патентов». История судебных баталий «несчастная Rambus против империалистических шакалов, укравших плоды изнурительных трудов ее разработчиков» достойна пера мастера детектива. Увы, у меня такого таланта нет, посему я даже не буду пытаться ее изложить.

Мы вернемся к Intel, и к ситуации вокруг РС133. Стало понятно, что от столь «корректного» союзника надо откупаться любой ценой. И цена оказалась немалой: переговоры длились несколько лет, и в конце Intel выплатила «огорченной» Rambus сумму порядка 200 миллионов долларов в качестве отступных за дезавуированный контракт.
Хватка у «американской Золушки» оказалась поистине бульдожьей.

Таким образом, история с DR DRAM окончилась фактически неудачей. Хотя первые системы на Pentium 4 все еще использовали DR DRAM, Intel не скрывала, что это временное решение, до подхода соответствующей платформы на DDR. Так и случилось. По иронии судьбы, как раз к окончанию своей эпопеи на рынке компьютеров DR DRAM приобрела сравнительно пристойные черты. Сохранив все свои лучшие наработки в виде высокой эффективности работы и большой полосы пропускания, она заметно уменьшила латентности после перехода на стандарт РС1066, к тому же появились 32-битные модули DR DRAM, дающие высокую полосу пропускания в случае установки одного модуля.
Так или иначе, но, продемонстрировав высокий технологический уровень, DR DRAM все же не прижилась.
Компания Rambus на некоторое время ушла в тень. Впрочем, тень была не слишком глубокой: время от времени Rambus подавала в суд на того или иного производителя. Впрочем, как ни странно, назвать Rambus сугубо юридической компанией рука все же не поворачивается: в перерыве между судебными заседаниями и громкими заявлениями Rambus объявила о технологии Yellowstone.

Суть ее заключается в передаче восьми битов за такт (!). Этот режим получил название ODR (Octal Data Rate). Для сравнения, DDR память передает два бита за такт (на контакт данных). Шина процессора Pentium 4 – четыре бита за такт на контакт. А здесь – сразу восемь. Технически все реализовано весьма красиво. При частоте несущей в 400MHz частота передачи данных составляет 3.2GHz. Кроме того, память XDR (такое название дала Rambus новой памяти) сохранила привлекательные черты технологии DR DRAM: множественные независимые банки, скрытый цикл восстановления ячеек, самосогласование канала передачи данных, и так далее.
Более того, в памяти XDR Rambus применила еще несколько замечательных технологических инноваций, благодаря чему появилась возможность не выравнивать тщательно длину проводников к разным участкам модуля. В частности, в случае XDR модуля разница в длине проводников между различными участками модуля может достигать 30 см (!), и эта разница будет учтена контроллером Rambus так, чтобы сигнал остался связным.

С технической точки зрения решение восхитительно. Кроме того, XDR может похвастаться минимальной латентностью цикла чтения (порядка 20нс), и заметно уменьшенными другими служебными задержками. Полный цикл для XDR почти вдвое меньше, чем для DDR! Поддерживается такие технологии, как конвейеризация запросов.
Кроме того, XDR великолепно масштабируется: компания Rambus демонстрировала образцы чипов, работающих на 6.4GHz, а в перспективе – работа на 8GHz! Более того, все эти великолепные показатели совмещаются с небольшим количеством контактов на микросхеме. Поэтому ничего удивительного в том, что XDR память стала применяться в ситуации, когда требуется максимальная полоса пропускания, низкая латентность, и одновременно с этим небольшое количество контактов.

Это вовсе не то, что вы подумали :D Это коммуникационное оборудование. Именно там весь этот набор характеристик весьма востребован. А позднее, присмотревшись к характеристикам памяти, к лицензиатам на технологию XDR присоединились Sony, Toshiba, NEC, IBM (впрочем, последней она нужна постольку, поскольку производимые IBM для Sony сотоварищи микропроцессоры Cell используют XDR). Кроме того, лицензировали XDR производители графических процессоров, ATI и Nvidia. Им высокая производительность XDR будет совсем не лишней. Не берусь сейчас утверждать точно, но вроде бы и у AMD есть лицензия на XDR (как в свое время была на RD DRAM).

В связи с воистину выдающимися характеристиками XDR у многих людей неоднократно рождались мысли вида «вот было бы здорово, если бы AMD использовала решение с XDR». А ведь действительно, технология XDR памяти для архитектуры К8 – именно то, что «доктор прописал». Низкая латентность (а мы помним, что ядро К8 чувствительно, прежде всего, к задержкам), высокая полоса пропускания, и даже малое количество контактов (ведь контроллер памяти интегрирован, стало быть, чем меньше контактов выходит из процессора, тем проще процессор производить). Кроме того, чем меньше контактов, тем проще и дешевле разводить материнские платы. Складывается впечатление, будто бы XDR специально проектировали под К8.
Сложно сказать, какой прирост производительности показали бы системы на XDR памяти, существуй они сегодня в реальности (впрочем, где-нибудь в недрах AMD они вполне могут существовать в реальности). Можно лишь очень приблизительно прикинуть, что снижение латентности чтения более чем в полтора раза вкупе с высокой пропускной способностью должно дать не менее чем 10%-ый прирост производительности.
Но эти показатели можно легко улучшить. Модуль XDR с частотой 3.2 GHz и пропускной способностью 3.2GB/sec имеет порядка 100 контактов. Соответственно, если вместо двух модулей DDR2, которые имеют 480 контактов, развести 4 канала (!) XDR, получим весьма неслабый прирост производительности при уменьшении количества контактов.

Во-первых, XDR гораздо эффективнее использует свою полосу пропускания, чем DDR. Таким образом, при формальном равенстве пропускных способностей (возьмем случай двух каналов наиболее быстрой DDR2-800 и 4-х каналов фактически младшей XDR 3.2GHz), имея и там и там по 12.8GB/sec, в случае с XDR реальная пропускная способность памяти будет выше. Ну а если взять более быструю из реально существующих микросхем XDR, то у нас будет 6.4GHz на модуль, и, соответственно, 25.6GB/sec (!). Весьма и весьма внушительная цифра. Особенно впечатляющая еще и потому, что дается без особого усложнения конструкции или разводки платы.
При этом продукты вроде этого, с которыми один модуль может выдавать до 6.4GB/sec, , являются уже коммерчески доступными!
Во-вторых, мало того, что латентность решения с XDR заметно меньше, дополнительное уменьшение задержек мы можем получить, используя 4-х канальный интерливинг. Это решение часто применяется в серверных решениях, когда необходимо эффективно использовать скорость памяти. Пригодится такое решение и в этом случае.

В результате все склеивается как можно лучше: повторюсь, такое впечатление, будто бы XDR и Athlon 64 специально созданы друг для друга!
Будет ли он использоваться на самом деле? А вот это достаточно сомнительно. В частности, традиционная ложка дегтя есть и в XDR. Вернее, даже две ложки.
Первая ложка связана с ценой XDR памяти. Она на сегодняшний момент примерно в четыре раза выше стоимости соответствующего по емкости чипа DDR. Это слишком дорого для массового рынка.
На этом месте я уже совсем было поставил крест на использовании XDR в системах на Athlon 64, как вдруг вспомнил про такое чудо природы, как Athlon FX. Ведь это как раз процессор для тех, кому важна производительность, а не стоимость. В подобных системах XDR память будет как раз неплохим подспорьем: будет дорого, но будет быстро. Пожалуй, ни с одним другим видом памяти Athlon FX не продемонстрирует таких показателей скорости, как с XDR!

Кстати, идея об использовании XDR именно в системах с Athlon FX кажется мне весьма плодотворной. И без того покупатели Athlon FX не слишком ограничены в деньгах, им лишних несколько сотен долларов особо критичными не будут.
Зато взамен они смогут получить наиболее быструю из всех возможных вариантов композицию.
Кроме того, XDR ведь будет использоваться в игровой приставке. Соответственно, с течением времени ее стоимость упадет. А дальше, как и в любом массовом производстве, цена обратно пропорциональна объему производства. Так что варианты развития есть.

Возможно, что для AMD это будет вынужденным ответом, в случае, если обещанный Intel в следующем году новый процессор Conroe окажется очень удачным. Тогда возникнет необходимость чем-нибудь убедительно ответить. Для такого ответа система Athlon 64 + XDR потенциально весьма эффективна, это мы уже выше выяснили.
Что ж, выглядит все это очень красиво. Перейдет ко второй ложке дегтя, которая, вероятнее всего, и похоронит эту идею. Выражаясь кратко, ну всем XDR память хороша. Вот если бы не Rambus ее изобрела…. В этом месте опускаются руки: на месте AMD и производителей памяти я бы не связывался с Rambus ни под каким соусом. По примеру Intel, может оказаться, что дружить с Rambus себе дороже. Вон, Intel почти на полмиллиарда «надружилась».

В случае AMD такая «дружба» может просто пустить по миру. Просто потому, что «запас плавучести» у AMD меньше, чем у Intel.
Посмотрим, рискнет ли AMD связываться с еще одной сугубо «имиджевой» платформой только ради того, чтобы (при необходимости) отобрать флажок «производитель самых быстрых процессоров». Ее (платформу) ведь потом еще и поддерживать придется. А создание контроллера под XDR, затем выпуск небольшой партии процессоров Athlon FX с переделанным контроллером, создание референс – дизайна материнской платы, тестирование систем, и все это ради продажи нескольких тысяч комплектов коммерчески успешной идеей назвать сложно. Разве что сделать это ради имиджа. Впрочем, Athlon FX вообще процессор скорее ради имиджа, чем ради прибыли.

Кроме того, имиджевой такая идея названа еще и потому, что в перспективы коммерческого успеха связанной с технологиями Rambus платформы я не верю. Потому что с трудом представляю себе производителя памяти, решившего перевести существенную часть своих производственных линий на XDR.
Слишком памятны еще у производителей памяти разборки с Rambus (а у некоторых они и вовсе еще не закончились), чтобы связываться с принадлежащей Rambus технологией. Одно дело делать в относительно небольших количествах XDR память для приставок типа Xbox 360, и совсем другое – делать эту память одним из основных источников дохода. Вдруг Rambus в очередной раз вожжа под хвост попадет, и спустя полгода ее мнение относительно размеров роялти изменится? Что тогда? Закрываться?

Слишком чревато ставить свои доходы в прямую зависимость от порядочности и аппетитов посторонней корпорации. Тем паче, что «порядочность» этой компании была хорошо заметна в истории с «патентованием» DRAM, когда Rambus, входя в комитет JEDEC, вопреки уставу комитета втихомолку подавала патенты на открытые стандарты SDRAM и DDR SDRAM. А спустя некоторое время стала давить на производителей, требуя от них отчислений за якобы принадлежащие Rambus патенты.
В тот раз производители памяти все же сумели отстоять свое право на производство ранее открытых стандартов памяти (причем многим из них было совсем не просто это сделать, судебные процессы следовали один за другим). Сильно сомневаюсь, чтобы среди них нашлись мазохисты, дабы вляпаться в очередной альянс с Rambus.
Слишком рискованно.

Повторюсь, речь о малой вероятности переориентирования на XDR существенной части производственных мощностей вендоров памяти, в ущерб выпуску DDR2 и DDR. Понятно, что некоторое (относительно небольшое) количество XDR, задействованной в таких устройствах, как Xbox 360, и Sony Cell, производители памяти с удовольствием («за недорого») произведут. Тем паче, что цена на чипы XDR примерно вчетверо выше, и выше соответствующая прибыль. Ради этого количества памяти соответствующие лицензии у Rambus закуплены. Но если они вдруг исчезнут, основной бизнес производителя памяти пострадает не сильно.
Связывать же с Rambus свой основной бизнес…. Как по мне, так это риск за гранью разумного.
Подытожим: формально AMD может представить систему на Athlon FX + XDR. Смысл имеет именно эта конфигурация, как не имеющая серьезных ограничений по стоимости, зато требующая максимальной производительности. Но формальная возможность вовсе не означает, что AMD ею действительно воспользуется. Разве что все другие варианты окажутся исчерпанными/невозможными.
Интересно ли узнать в этой связи, есть ли лицензия на XDR у Intel?! :D

Вообще-то, будет крайне занятно, если на этот раз Rambus поддержат все, кроме Intel. Эдакая очередная гримаса циничной истории, которая «мать всех наук». :D Вполне себе гламурное окончание печальной истории «как Intel за памятью ходила». :D Тем не менее, при определенных обстоятельствах это выглядит как достаточно вероятное событие.
Занятно: глава «немного об XDR» пока получилась самой длинной из всех глав. Вот тебе и «немного» :D
Видимо, пора сменить сорт чая.:D

И вновь о Socket F


Между прочим, до этого момента я был вполне благодушен к AMD. А зря. Ведь AMD у нас лидер? Лидер! Я сам так писал выше! Вот сейчас мы с нее и спросим, как с лидера.
По всей строгости, так сказать. Безо всяких скидок.
У AMD были в течение последнего года не только успехи и всяческие достижения. Но обо всем по порядку.
«Во первых строках письма» (с) хочется как следует приложить обо что-нибудь твердое свежее нововведение AMD, Socket F.
Оказывается, все это время AMD очень чутко реагировала на критику, которой подверглась Intel за свой Socket LGA775. И, видимо, так ей понравилась бурная реакция народа на высокотехнологическое решение «налепить кривых ножек на сокет», что и сама решила дать столь чудный повод поворчать.
Ура, свершилось. «Высочайшее достижение» человеческой цивилизации под названием LGA1207 ждет своих покупателей. «Маньяки – хирурги» напали и «обезножили» серверный разъем!
Браво. Подумаешь, многие пользователи были недовольны новым разъемом. Подумаешь, у некоторых плат были проблемы с перекосом разъемов, их не слишком высокой механической стойкостью, и невозможностью исправить согнутую/поломанную ножку. Зато у AMD все теперь будет как у «локомотива индустрии». Включая головную боль.
Видимо, это нынче модно: внедрять память DDR2 именно с разъемом типа LGA. Они, похоже, продаются прямо-таки комплектом. Так сказать, LGA – это наше все.
«Поздравляю». Кому как, а мне нынешняя «инициатива» AMD не по душе.
Впрочем, я таки могу их понять! И это даже не очень сложно. Как говорится, вполне просматривается мотив. В свое время AMD приводила весьма интересную раскладку по абсолютной себестоимости:

1M Transistors = 1mm^2
64KB Cache = 1mm^2
1mm^2 = 10-20 cents
Package pin = 0.5-2 cents
200 pin package = $1-$4
500 pin package = $5-$10
512KB Cache = $1-$2
Small CPU Core = 5mm^2, $0.5-1
Substantial CPU Core = 40mm^2, $4-$8

Сейчас подобной откровенности от AMD нам уже не дождаться, прошло то время, но нам хватит и этих данных. Обратили внимание на выделенную строчку? При тысяче двуустах ножках себестоимость корпусировки должна быть еще более высокой. Учитывая нелинейный рост, она легко может составить, скажем, в районе 24 - 40 долларов на процессор. Заметим, что стоимость корпусировки оказывается сравнимой с себестоимостью самого кристалла: в Интернете пробегали оценки технической себестоимости (только производство, без других расходов) одного процессора для AMD и Intel, и эта стоимость примерно равна 40 долларам.

А тут столько же может обойтись упаковка этого процессора в корпус. Обидно, однако. А если это умножить на планируемое количество процессоров? Вот то-то! Разумеется, от подобных затрат очень хочется избавиться.
Ну и что, что теперь станут дороже материнские платы? Зато, как там было в AMD-шных презентациях, «технологии, направленные на людей». Да, мы уже верим. А как же! Во что же еще верить, ведь ничего святого у людей не осталось! Мне только одно интересно: контакты с процессора Opteron под Socket F будут точно так же легко соскребаться ногтем, как и с процессора Pentium 4? Или же будут все же попрочнее приклеены?
Впрочем, это все еще цветочки. Сейчас пойдут ягодки. Предлагаю всем остановиться, и трезво припомнить, чего же именно достигла AMD на десктопном, на серверном, и на мобильном рынке.
На десктопном все относительно прилично, доля рынка AMD находится в районе 20% (различные источники приводят разные оценки, но порядок величины именно этот). Здесь все хорошо: идет спокойное, методичное, и планомерное увеличение своей доли рынка. В теории, оно могло бы быть и более быстрым, но здесь AMD подводит недостаток производственных мощностей.

На мобильном рынке все, в общем-то, грустно. Будем надеяться, что пока грустно. Объявленный AMD процессор Turion 64, в принципе, достаточно неплохой продукт, имеющий преимущества перед Centrino. Например, в части поддержки AMD64, которую конкурирующий продукт не поддерживает. Так что с технической стороны все неплохо.
Но ему сложно соревноваться с широко раскрученной торговой маркой Centrino, ведь недаром в ее рекламу Intel вложила 300 миллионов долларов. Разумеется, ситуация постепенно меняется к лучшему для AMD, и даже динамика положительна: прирост доли рынка составляет 72% за квартал.
Прямо как в анекдоте: вчера наторговали на копейку. Сегодня – уже на две! Товарного объема никакого, зато насколько быстро растет оборот!

Именно так и происходит в мобильном рынке. Скажем, если ранее у AMD было 2%, то стало 3.5%. Несомненно, динамика положительная, кто ж спорит. Только до приличной доли рынка еще лет пять расти придется. Либо придется предпринимать какие-то дополнительные усилия по исправлению ситуации.
Может быть, программы какие для покупателей и производителей объявить? Авось и подтянется кто. Может, деньжат заработать получится? В конце концов, ведь именно мобильный рынок сейчас быстрее всего растет. Или деньги AMD не интересуют?
Судя по поведению, вроде бы очень интересуют. По крайней мере, если наблюдать за постепенным ростом аппетитов AMD в деле выпуска процессоров Athlon FX. Если первые процессоры серии FX стоили безумных 900 долларов, то позднее AMD взяла планку 1 000 долларов (в частности, с процессором Athlon FX57). А сейчас, между прочим, готовится к очередному барьеру: процессор Athlon FX60 (а вовсе даже не FX59, как некоторые тут подумали) возьмет совсем нескромную планку стоимости в 1200 долларов. Конечно, двухъядерный Athlon FX60 с частотой 2.6GHz весьма приличный продукт, кто же спорит. Но все же 1200 долларов за один только процессор – откровенный перебор. Не исключено, правда, что цена выставлена такой специально, чтобы никто, не приведи Господь, не заказал больше одного процессора в одни руки. :D А то вдруг их не хватит всем пяти оверклокерам – маньякам, разгоняющим процессоры при помощи жидкого азота. :D

Кстати, что-то пока «hardcore - оверклокеры» :D жидкий гелий не освоили. Даже странно как-то…. Заодно и по стоимости охлаждающей системы к процессору приблизились бы. К тому же, если использовать изотоп He-3, можно практически до абсолютного нуля добраться. Сверхпроводящий процессор создать. :D Какой раритет будет! Запускаешь «любимый тест оверклокеров» Super Pi, и он себе крутится. Круг за кругом. Целую вечность. Пока гелий не закончится.
Впрочем, речь сейчас не об оверклокерах, а об AMD.
Мда, а ведь когда-то была вся такая себе скромная в аппетитах корпорация. Стоило исчезнуть конкуренции в данной области, как цена продукта «неожиданно» пошла вверх. А ведь AMD усиленно борется в суде против «плохого монополиста» Intel. В некоторых отношениях Intel, конечно, монополист, тут спорить не о чем. Но даже во времена махрового монополизма Intel и эпопеи с К5 стоимость топов от Intel с такой скоростью не росла, тут уж всецело «заслуга» AMD. Воздадим ей должное.
Так что отныне AMD «обиженной и угнетенной» более не выглядит, куда ни посмотри. Одно слово, «Капитализм!» (с)

Но вернемся к мобильному рынку. Ну так кто его будет проталкивать, уважаемые? Пушкин? Производители ноутбуков? Ну так им и с Intel-ом неплохо, их холят, любят и лелеют. Ноутбуки продаются хорошо, покупатели довольны. Кто должен стараться, производители, или AMD? Кому, в конце концов, это нужнее?
Все-таки AMD? Мне тоже так подумалось.
Впрочем, пора перейти к серверному рынку. Благо, мы так долго сегодня разговаривали о Socket F, и потенциальных возможностях Opteron-ов.
Они, эти потенциальные возможности, как всегда, крайне велики. Куда ни глянь, как ни посмотри – вполне ведь удачный продукт получился.Одно только непонятно.
За несколько лет существования удачного продукта Opteron, за полгода существования двухъядерных Opteron-ов (которым конкурента у Intel нет в канале продаж до сих пор!) суммарная доля рынка, которую получила AMD, составляет примерно 15%.
Много это, или мало?
Если сравнить с теми жалкими 1.5%, которые принадлежали продукту Athlon MP, то на порядок больше.
А вот если сравнить с 85% рынка у конкурента? Тогда явно мало получается.
Как же так? Что ж такое? Есть удачный продукт, которому нечего противопоставить, и всего 15% рынка за три года? Издевательство какое-то.

Кстати, сама AMD в качестве обоснования такой небольшой доли рынка приводит то самое соображение, которое представила в суд. Дескать, Intel ей мешает съесть свою долю рынка. И, что характерно, я в этом с AMD вполне согласен. Ну конечно же, мешает!
А что, менеджеры AMD всерьез рассчитывали, что менеджмент Intel будет три года пить валериану, рыдать друг у друга на плече, и смотреть, как AMD увеличивает долю рынка? Так сказать, пойдут чесать затылок всей корпорацией? Мне трудно поверить в такую массовую наивность. Стало быть, на самом деле такого никто и не ждал. Здесь, извините, бизнес, а не состязание в «поддавки».
Разумеется, в некоторой степени AMD права: методы противодействия Intel не всегда были политкорректными. И AMD поступила совершенно правильно, что подала на Intel в суд: это вполне законный способ отстаивать свои интересы.

Мне другое интересно: а что, это было какое-то совершенно неожиданное и непредсказуемое развитие событий? Мол, никто не ждал, что Intel будет настолько сильно сопротивляться? Так ей есть что терять!
Более того, я просто рукоплещу от того, как красиво это было проделано: учитывая, что в серверных задачах Opteron-ы частенько разбивали Xeon-ы просто наголову, Intel выбрала совершенно другую тактику.
Не имея возможности выкатить более быстрое решение, они выкатили насквозь пропыленный, но все еще действенный аргумент: надежность.
Например, обновленная платформа под ядро Nocona (на базе 7520-го чипсета) поддерживала такую технологию, как зеркалирование памяти. Ранее, кстати, технологии типа «RAID памяти» применялись разве что на серверах высшего уровня, и большинству покупателей систем на Xeon-ах это все вообще не нужно, если уж совсем честно.

Но зато как красиво это было проделано: вместо соперничества на почве производительности, где шансов у Intel было мало, соперничество аккуратно было перенесено на почву «наличие дополнительных возможностей».
Где, как ни крути, AMD проиграла. Пусть это несчастное «зеркалирование памяти» реально необходимо было всего 10% покупателей, но услышали про его существование все потенциальные покупатели.
Разумеется, это было нелегко: специалисты Intel не вылезали из командировок, и на языках у них были кровавые мозоли от постоянного повторения «технологий зеркалирования памяти», «новейшей шины PCI-E», и тому подобных «вкусностей».

Но результат был достигнут: несмотря на явный и очевидный проигрыш в производительности, Intel отделалась потерей всего 15% серверного рынка в крайне опасной для себя ситуации.
В ситуации, когда могла потерять как минимум треть. А в худшем случае и половину рынка.
Я уже не говорю о том, что фактически AMD откусила 15% на относительно дешевом рынке: рынке двухпроцессорных платформ. Рынок четырехпроцессорных (и выше) х86-платформ остался фактически полностью за Intel. Невзирая на то, что почти все три года на нем сражались чуть ли не испопаемые Xeon-ы MP, работающие на шине 400MHz. С них бы пыль в музеях сдувать, а их продавали.
А все потому, что на рынке серверов высокого уровня скорость – это еще не все. А иногда даже не главное. Главное – наличие определенных возможностей, характерных для продукции такого класса.
Этого AMD не учла, как ни крути. Всем ее продукты были хороши в плане скорости. И иногда они даже выигрывали тендеры. Но мейнстримом так и не стали. Потому что AMD к сражению на этом рынке подготовилась плохо.

С одной стороны, это понятно: до появления Opteron-ов AMD на этом рынке вообще не было. Да и сам рынок серверов высокого уровня на х86-архитектуре относительно молод.
С другой стороны, из тактического проигрыша из-за «мелочей» необходимо сделать главный вывод: новая платформа, которая Socket F, проигрывать по возможностям не имеет права. А потому, хочет AMD того, или нет, но сделать пресловутое «зеркалирование памяти» придется. Если, конечно, AMD хочет, чтобы ее решения котировались на дорогом и вкусном рынке серверов.
Иначе ее уделом так и останется небольшая доля серверов для малых предприятий и станций для HPC (High Performance Computing). Занимать места в TOP500, конечно, крайне престижное мероприятие, но не думаю, что это основная цель AMD. Само по себе это денег не приносит.
Основная цель, хочется надеяться, все же заработать денег. А если так – придется как следует попотеть для этого.

Процессоры Opteron создали вполне хороший имидж для AMD, теперь пришла пора этим воспользоваться. Поэтому повторюсь: отсутствие зеркалирования памяти на Socket F будет роковой ошибкой для AMD. У нее осталось не так уж много времени, чтобы попытаться попасть на рынок высокоуровневых систем.
Не более пары лет, в течение которых преимуществ по скорости у Opteron-ов будет все меньше и меньше.
Ну и напоследок пару штрихов, вызывающих настороженность.
Штрих первый: вот уже который раз я слушаю совершенно официальную версию, что AMD нигде не позиционирует Opteron-ы против Itanium-ов. Дескать, это нам не конкурент, мы конкурируем с Xeon-ами.
Дагагой ИА! (с) Бгатцы дагагие (с), вы бы уж сами определились, во что вы верите, и с чем вы воюете, ладно? Я ж мучаюсь, ночей не сплю! Надеваю старомодный ветхий зипун (с), выхожу на дорогу, и все жду, одолеем ли супостата? Силен ли наш батыр? Верна ли рука? Послушен ли конь? Не перебежало ли дорогу нашего батыра лихо какое с пустым ведром?

А то вроде и Itanium-ам Opteron-ы не конкуренты, и в то же самое время, куда на сайте AMD ни погляди, постоянное сравнение Opteron-ов почему-то происходит именно с Itanium-ами. Причем, как ни удивительно, обычно не самыми свежими. Как-то это странно выглядит. Просто вакханалия «бенчмаркетинга», право слово!
Может, системные администраторы корпоративного сайта AMD просто не знают, что AMD с Itanium-ами не конкурирует? Может, им никто не сказал? Тогда надо им сказать! Передайте им кто-нибудь, пожалуйста! А то нехорошо получается! Прямо как в «Обыкновенном чуде»: «Я три дня гналась за Вами, чтобы сказать, как Вы мне безразличны» (с).

Так что давайте определяться: либо AMD солидная компания, либо у нас очередная победа маркетинга над здравым смыслом. Для компании, которая рвется заявить о себе как о приличном поставщике, пользоваться приемами в стиле 13-летней кокетки явно несолидно.
Покупатели, знаете ли, вовсе не такие глупые, как это принято считать. Иногда они все же догадываются, что PR-rating – это не частота «некоего мифического Thunderbird-а, который мог бы соперничать с данным Athlon-ом XP, если бы существовал с такой частотой».
Доверчивость, знаете ли, имеет обыкновение заканчиваться. Причем, как обычно, крайне не вовремя. Не стоит считать покупателя заведомым идиотом, не к лицу это солидной корпорации.
Штрих второй: некоторое время официальные лица AMD озвучили дальнейшие планы по развитию своей продукции. Эти самые дальнейшие планы произвели на меня, если честно, несколько гнетущее впечатление.
Прежде всего потому, что никаких принципиально новых продуктов, фактически, нет. По крайней мере, они не были озвучены. В конце концов, производственным партнерам в лице крупных производителей компьютеров надо будет работать не только сегодня, но и завтра, и послезавтра. Поэтому определенные планы на будущее просто обязаны быть озвученными, чтобы партнеры как-то планировали дальнейшее взаимодействие. А что фактически прозвучало от AMD?

Будет некоторый косметический ремонт продукта: двухъядерники переведут на новый техпроцесс, добавят кэш третьего уровня, ускорят шину памяти, и Hyper Transport. В 2007 году AMD представит четырехъядерные процессоры.
Извините, и это, собственно, все? Дальше будем сидеть и смотреть, кто больше ядер на пластину поместит? Дальнейшее развитие одного отдельно взятого ядра заканчивается, больше в процессорах улучшать нечего? Будем просто наращивать количество ядер?
Выглядит откровенно удручающе. Ведь вполне понятно, что увеличение количества ядер на самом деле не интенсивный, а экстенсивный путь развития. С увеличением количества ядер прирост от их увеличения будет все меньше и меньше, тепловые требования – все жестче и жестче. И в какой-то момент нам опять придется возвращаться туда, откуда мы пришли: заниматься улучшением производительности отдельно взятого ядра. Тем более, что нынешний процессор К8, при всей своей привлекательности, еще далеко не идеальный продукт.

Конечно, на данный момент прирост от появления второго ядра заметно больше, чем от улучшения самого ядра. И на текущий момент проще просто увеличивать количество ядер. Но этот способ имеет ограниченную применимость, и относительно скоро она будет исчерпана.
Да и глупо не иметь за душой запасной вариант. Ведь совсем не исключено, что Intel сумеет уместить на процессор большее количество ядер (тем более, что ядро Dothan, к примеру, заметно меньше по площади ядра Venice).
Тогда можно было бы жестом фокусника достать обновленное ядро. Главное, чтобы подобная работа шла: ведь не зря же в свое время К9, который был высокочастотным проектом наподобие NetBurst, отменили. Должны же были разработчики чем-то заниматься все это время?

Если допустить, что работа над следующим ядром идет, просто результат еще не готов, тогда все становится на свои места: некоторое время, до подхода нового ядра, можно будет перебиться на увеличении количества ядер в процессоре, и развитии «умеренной» многоядерности (два – четыре ядра на процессор).
Ну а по мере готовности нового ядра его выведут на арену в качестве нового продукта.
Искренне надеюсь, что дело просто в неготовности следующего за К8 ядра, и в необходимости дополнительного времени на его создание. Тем более, что на недавней встрече с аналитиками это было в некоторой степени подтверждено самой AMD. На слайдах авторства AMD в 2007 – 2008 году фигурирует неизвестное «new core».
Впрочем, поживем – увидим. В любом случае, это тема для будущих статей. :D
UPDATE: Когда эта статья уже была «сдана в печать», AMD выложила целую серию презентаций с недавней встречи с аналитиками. Кое-что в этих презентациях показалось мне настолько занятным, что я решил не ждать следующей статьи, а высказаться сразу же.
Во-первых, AMD теперь тоже очень любит чудный критерий «производительность на ватт». Ниже я напишу о нем подробнее, а пока поздравляю корпорацию со вступлением в клуб «маразматиков от маркетинга». Так сказать, «правильной дорогой идете, товарищи!» (с) Ленин.
Ну-ну.

Во-вторых, AMD, похоже, стоит на распутье, и не знает, куда ей податься: к умным, или к красивым? (с). Потому что на слайдах, посвященных чипсетам (!), обещает поддержку (начинаем загибать пальцы): DDR3, DDR4, FB DIMM, FBD2 (видимо, следует полагать, что это FB DIMM 2). О как! Типа, мы не знаем, какая память будет следующей, поэтому наделали все варианты процессоров, и какой понадобится, такой и выкатим.
Прямо-таки типичное поведение лидера! :D Мол, куда все, туда и я! Абалдеть! (с)
Только одно непонятно: раньше вроде как контроллер памяти был в процессоре. А слайд посвящен чипсетам…

Может, они теперь и контроллер на всякий случай уберут? Вслед за Intel? :D Остальные поступки они ведь частенько перенимают, почему бы этот не перенять? Было бы занятно. Лично я смеялся бы.
Но самое интересное удалось обнаружить на одном из слайдов: среди поддерживаемых типов памяти была DR DRAM (!).
Абзац.
Приехали.
«Поздравляю».
Или это они так завуалировано называют XDR? Тем более, что говорят на этом слайде о минимальной стоимости на контакт, и хороших тепловых показателях....
В общем, посмотреть было занятно. Но вопросы не исчезли. А жаль.


Далее: Особое мнение – 2: никто не уйдет обиженным! Часть 2