При внимательном рассмотрении вы заметите, что физически ядро AMD Opteron очень похоже на старое ядро Athlon. Одна из инноваций Opteron заключается в добавлении встроенного контроллера памяти, который занимает пространство, отводимое в ядрах Palomino и Thoroughbred под кэш L2. Кстати, размер кэша L2 был увеличен в Opteron до 1 мегабайта (16 путей).


SledgeHammer имеет более 940 контактов, что ставит рекорд в мире x86.


Вид на Opteron сбоку - наконец-то процессор обзавёлся распределителем тепла (heat spreader)! Мы уже давно ждали появления подобной функции на Athlon, но так её и не получили - главным аргументом была цена.

Детальная информация о ядре Opteron: улучшенный Athlon, продолжение

В остальном, помимо новых функций типа встроенного контроллера памяти и увеличенного кэша L2 (1 Мбайт, 16 путей, ассоциативный), ядро во многом осталось прежним. Сходство наглядно заметно при сравнении фотографий ядер Opteron и Thoroughbred.

Как и раньше, ядро содержит девять функциональных блоков (3 ALU, 3 AGU, FADD, FMUL и FMISC - три целочисленных блока и три блока операций с плавающей запятой), а также три декодера x86, тщательно проработанные AMD. Практически не изменился кэш L1 для инструкций и данных (по 64 кбайт на каждый компонент), хотя сейчас в нём появилась логика ECC.


Сердце кристалла: ядро процессора без кэша L2 и контроллера памяти. Следующая иллюстрация объясняет ситуацию.



Сравнение ядер Opteron (слева) и старого Athlon на ядре Thoroughbred (справа). На первый взгляд они практически идентичны. Как можно заметить, AMD осуществила лишь небольшие изменения в архитектуре Opteron, конечно, если не считать контроллер памяти и кэш L2.

Детальная информация о ядре Opteron: улучшенный Athlon, продолжение

Наиболее интересна детальная информация о процессоре. Сердцем кристалла является перекрёстный коммутатор (XBAR), он управляет потоками данных между контроллером памяти, ядром процессора и тремя портами HyperTransport. По сравнению с Athlon 64, который предназначается для однопроцессорных конфигураций, Opteron оснащён логикой, позволяющей работать в многопроцессорных системах. Например, в серверах можно использовать до восьми процессоров Opteron совместно, без наличия северного моста.

Более того, процессор приобрёл блок команд SSE2, который удвоил количество регистров до шестнадцати, как у Intel P4. На уровне обработки команд произошли фундаментальные изменения: буферы TLB (Transition Look-aside Buffers) были переработаны под большую нагрузку (1000 входов максимум). Чем больше входов записано в TLB, тем реже придётся загружать таблицы перевода адресов из основной памяти при передаче физического адреса.


Основная структура Opteron не слишком сильно отличается от Athlon: не изменились три блока целочисленных операций и три блока работы с плавающей запятой, равно как и декодеры x86. Кэш приобрёл логику ECC. Истинные изменения начинают проявляться лишь при детальном рассмотрении процессора.

Ядро процессора Hammer Barton Thoroughbred "B"
Площадь подложки (диаметр 200 мм) 31416 мм² 31416 мм² 31416 мм²
Площадь кристалла 193 мм² 101 мм² 84 мм²
Техпроцесс 0,13 мкм 0,13 мкм 0,13 мкм
Потери годных кристаллов (приближ.) 18% 18% 18%
Выход годных кристаллов (теоретический) 148 единиц/подложку 255 единиц/подложку 306 единиц/подложку
Выход годных кристаллов (при учёте 60% доли выхода) 89 единиц/подложку 153 единиц/подложку 183 единиц/подложку
 

Copyright @ by Lehach, 2009