Настоящие инновации кроются в деталях. В сердце процессора находится перекрёстный коммутатор (crossbar switch, XBAR), который направляет потоки информации между контроллером памяти, ядром процессора и тремя портами HyperTransport. По сравнению с Athlon 64, который поддерживает только однопроцессорные конфигурации, Opteron также содержит логику управления для работы в многопроцессорном окружении. Поэтому в серверах до восьми процессоров Opteron могут работать вместе без северного моста. Кроме того, был добавлен блок совместимости с SSE2, где присутствует в два раза больше регистров (16), чем у Intel P4. Фундаментальные изменения были осуществлены в механизме обработки команд: буферы TLB были переработаны под большую нагрузку (максимум 1000 записей). В целом, чем больше размер TLB, тем менее часто будет осуществляться доступ к таблицам трансляции в основной памяти при передаче физического адреса.

Фундаментальная структура Hammer не слишком отличается от Athlon: три целочисленных блока и три блока работы с плавающей запятой остались неизменными, как и три декодера x86. Кэши теперь обладают схемой ECC. Важные изменения кроются в деталях.Ядро процессора Hammer Barton Thoroughbred "B" Площадь подложки (диаметр 200 мм) 31416 мм² 31416 мм² 31416 мм² Площадь кристалла 193 мм² 101 мм² 84 мм² Техпроцесс 0,13 мкм 0,13 мкм 0,13 мкм Потери 18 процентов 18 процентов 18 процентов Теоретический максимальный выход годных кристаллов 122 шт./подложку 255 шт./подложку 306 шт./подложку Число кристаллов при выходе 60% 73 шт./подложку 153 шт./подложку 183 шт./подложку Ядро процессора Thoroughbred "A" Palomino Thunderbird Площадь подложки (диаметр 200 мм) 31416 мм² 31416 мм² 31416 мм² Площадь кристалла 80 мм² 128 мм² 128 мм² Техпроцесс 0,13 нм 0,18 нм 0,18 нм Потери 18 процентов 18 процентов 18 процентов Теоретический максимальный выход годных кристаллов 322 шт./подложку 201 шт./подложку 201 шт./подложку Число кристаллов при выходе 60% 193 шт./подложку 120 шт./подложку 120 шт./подложку



В целом, это помогает экономить время. По сравнению с ядрами Thoroughbred и Barton, буферы TLB работают с меньшими задержками, что, в свою очередь, приводит к повышению производительности. Также был переработан и блок предсказания ветвлений, в результате чего счётчик событий (History Counter) может хранить до 16.00 записей (Athlon XP - 4.000). Чтобы позволить ядру работать на более высоких тактовых частотах, AMD удлинила конвейер Hammer до 12 ступеней - старый Athlon имел всего десять ступеней, в то время как текущая модель Intel P4 (и Xeon) использует 20 ступеней. В результате исполнительные устройства могут быстрее загружаться последовательными командами, что снижает пустые циклы ожидания.

Существенная особенность: расширенные 64-битные регистры.

HyperTransport: высокоскоростная шина без компромиссов

В отличие от всех процессоров Intel, которые связываются с северным мостом по обычной параллельной FSB, AMD Hammer использует интерфейс HyperTransport. Последовательный интерфейс с переменным потоком позволяет SledgeHammer получить скорость передачи данных до 3,2 Гбайт/с - в обоих направлениях одновременно. В результате суммарная пропускная способность составляет 6,4 Гбайт/с. Для сравнения, Pentium 4 с 533 МГц FSB позволяет достигать пропускной способности 3,97 Гбайт/с, но только в одном направлении. Последовательный интерфейс разработан с учётом максимально гибкой пропускной способности. AMD оснастила серверную версию ядра Hammer тремя портами HyperTransport.
 

Copyright @ by Lehach, 2009