Ядро процессора Thoroughbred "A" Palomino Thunderbird Площадь подложки (диаметр 200 мм) 31416 мм² 31416 мм² 31416 мм² Площадь кристалла 80 мм² 128 мм² 128 мм² Техпроцесс 0,13 мкм 0,18 мкм 0,18 мкм Потери годных кристаллов (приближ.) 18% 18% 18% Выход годных кристаллов (теоретический) 322 единиц/подложку 201 единиц/подложку 201 единиц/подложку Выход годных кристаллов (при учёте 60% доли выхода) 193 единиц/подложку 120 единиц/подложку 120 единиц/подложку



По сравнению с ядрами Thoroughbred и Barton, TLB работает с уменьшенными задержками, что, в свою очередь, повышает скорость. Предсказание ветвлений также подверглось доработке, и сейчас счётчик истории переходов может содержать до 16.000 вхождений (Athlon XP - 4000). Чтобы процессор мог работать на высоких тактовых частотах, AMD увеличила конвейер Hammer до 12 ступеней, по сравнению с 10 ступенями старого Athlon, в то время как процессор Intel P4 (и Xeon) использует конвейер с 20 ступенями. В результате исполнительные блоки смогут быстрее получать команды, что уменьшит циклы ожидания.

Важная новая особенность: расширенные 64-битные регистры.

HyperTransport: скоростная шина

Вместо распараллеливания FSB, процессоры связываются между собой по интерфейсу HyperThransport. Последовательный интерфейс с переменной скоростью потока позволяет SledgeHammer получать суммарную скорость передачи в 3,2 Гбайт/с - в обоих направлениях одновременно. В результате общая пропускная способность достигает 6,4 Гбайт/с на порт HyperTransport. Для сравнения, Pentium 4 с 533 МГц FSB обладает скоростью передачи по шине 3,97 Гбайт/с, но только в одном направлении.

Последовательный интерфейс был специально разработан для максимальной гибкости пропускной способности. AMD оснастила серверную версию Opteron тремя портами HyperThransport. Все данные процессора Opteron проходят через интерфейс HyperTransport и встроенный контроллер памяти. Чтобы соседний процессор получил прямой доступ к памяти, к примеру, Opteron использует коммутатор XBAR. Причём этот коммутатор в полной мере задействует 64-битные шины для адресов и команд.

Пять режимов работы

Пять режимов работы AMD Opteron.

В зависимости от установленных битов регистра LME, процессор работает в одном из режимов, указанных на иллюстрации. Такой подход позволяет гарантировать обратную совместимость, что является одним из самых больших преимуществ архитектуры AMD "AMD64" над Intel "IA64".

Важная особенность: 64-битные регистры Opteron

A significant new feature: the extended 64-bit register.

Opteron может работать с памятью объемом до 1 Тбайт (1024 Гбайт), то есть он использует 40-битную физическую адресацию и 48-битную виртуальную адресацию. Такая ширина может показаться несколько меньше, чем ожидалось от 64-битной архитектуры, однако процессор уже может работать с большим объёмом памяти, чем 32-битное адресное пространство Pentium 4, Xeon или Athlon XP. Архитектура AMD64 расширяет 32-битные регистры процессоров IA-32 до 64 битов. С приложениями, работающими в "наследственном (legacy)" или "совместимом (compatibility)" режимах, процессор продолжает использовать восемь обычных 32-битных регистров EAX, EBX, ECX, EDX, EBP, ESI, EDI и ESP (см. иллюстрацию выше).

Если процессор переходит в 64-битный режим, то архитектура x86-64 расширяет эти восемь регистров с помощью префикса R до 64 бит. Расширенные регистры называются от RAX до RSP. Кроме того, в 64-битном режиме Opteron может получать доступ к восьми регистрам общего назначения GPR (General Purpose Registers) от R8 до R15, которые тоже имеют ширину 64 бита. Для вычислений с плавающей запятой используются восемь 128-битных регистров SSE, а именно с XMM8 до XMM15. Однако они работают только в 64-битном режиме.
 

Copyright @ by Lehach, 2009