Первые заметные изменения касаются BTB и блока декодирования инструкций. Если BTB не обеспечит предсказание ветвления, то декодер инструкций осуществит статическое предсказание, которое должно привести к незначительному падению производительности в случае ошибки. Причём, это незначительное падение должно компенсироваться улучшенным процессом определения циклов. Динамическое предсказание также было обновлено, и умножение целых чисел сейчас осуществляется в выделенном блоке.

Ключевым элементом для обеспечения высокой производительности является предсказание ветвлений. Если процессор знает (или догадывается), какой путь в коде будет принят далее, то он сможет наиболее эффективно использовать ресурсы своего конвейера. При удлинении конвейера с 20 до 31 ступени предсказание ветвлений начинает играть ещё более важную роль. Удлинение конвейера позволило Intel уменьшить сложность каждого этапа, обеспечив, таким образом, возможность дальнейшего роста тактовой частоты. Но за это приходится платить: ошибочные предсказания ветвлений у Prescott обходятся процессору намного дороже.

Теперь становится вполне очевидным, почему Intel решила увеличить размер всех кэшей. В случае ошибочных предсказаний ветвлений обеспечение процессора необходимыми данными становится, как никогда, важным. Для заполнения конвейера процессор должен иметь под рукой все необходимые данные. Для этого кэш L1 теперь работает с восемью входами (8-way associative).

Число кристаллов на пластину и цены



Нажмите для увеличения картинки.

В отличие от 200-мм подложек, используемых AMD, Intel применяет 300-мм подложки размером с пиццу, которые обеспечивают большую площадь. Мы решили проанализировать количество процессоров, которые можно получить с каждой подложки, что позволяет нам сделать выводы о доступности, ценах и, в итоге, об успешности процессора.

Количество процессоров, которые можно получить с одной подложки, вас либо огорчит, либо порадует (всё зависит от вашей точки зрения). Теоретический предел составляет 588 процессоров для ядра Prescott (учитывая 300-мм подложку Intel) и 148 процессоров Opteron/Athlon 64 FX (учитывая 200-мм подложку AMD). Даже если выход годных кристаллов у Intel составляет всего 40%, компания получит в два раза большее число процессоров с подложки, чем у AMD при выходе в 60%. К тому же, не следует забывать, что число клиентов у Intel обычно намного больше, чем у AMD. Не говоря о числе заводов, конечно.

Реальные проценты выхода годных кристаллов всегда хранятся в секрете. В полупроводниковом производстве возможно достижение до 85%, и так иногда и происходит, но обычно на заводах массового производства полупроводников даже выход в 70% считается хорошим. Когда полупроводниковый завод начинает выпускать новый продукт, то процент выхода годных кристаллов обычно намного ниже, чем потом, после доводки и совершенствования процесса производства.

Поскольку Intel не стала бы рисковать, выпуская новый продукт, если бы не смогла обеспечить его наличие в должных количествах, предположим, что выход процессоров Prescott составляет не меньше 50%. К тому же, мы опираемся на тот факт, что в последних планах Intel по-прежнему присутствует выпуск 4-ГГц процессоров в этом году.

 

Copyright @ by Lehach, 2009