7.2.1. Характеристики процессора определяющие его производительность

7.2.2. Современные процессоры архитектуры x86 компаний Intel и AMD

7.2.3. Оценка производительности современных процессоров

В современных компьютерах центральные процессоры (ЦП) выполнены в виде компактного модуля (размерами около 5×5×0,3 см) вставляющегося в zif-сокет. Большая часть современных процессоров реализована в виде одного полупроводникового кристалла, содержащего миллионы, а с недавнего времени даже миллиарды транзисторов.

7.2.1. Характеристики процессора определяющие его производительность

Центральный процессор имеет следующие важнейшие характеристики, определяющие его производительность:

- частота ЦП;

- кеш;

- технический процесс;

- поддержка новых технологических решений;

- наличие встроенного контроллера памяти.

Рассмотрим данные характеристики более подробно.

Частота ЦП. Довольно большое время основной характеристикой указывающей на производительность ЦП была его частота. Но когда основные компании-производителя пошли разными путями в разработке новых поколений процессоров, то тактовая частота перестала быть мерилом производительности. Измеряется частота в герцах (мегагерцах, гигагерцах). Но надо учитывать, что «количество частоты» не соответствует количеству операций. Продуктивность ЦП в отношении на герц может варьироваться в широких пределах, в зависимости от архитектуры процессора. Если ранее архитектура была довольна схожа между процессорами конкурентов, и их можно было сопоставлять по частоте, то сейчас архитектуры компаний различаются гораздо сильней.

Кеш. Центральный процессор постоянно работает с памятью. Но скорость оперативной памяти не особо велика, чтобы процессор, при работе с ней, раскрывал полностью свой вычислительный потенциал. Поэтому, у процессоров существует своя собственная небольшая, но быстрая память. Ее именуют "Кеш". Обычно, такой памяти на процессоре от 256 Кб до 2 Мб. Кеш хранит в себе те данные, которые могут понадобиться процессору в ближайший момент. Поэтому, перед тем как выполнить операцию с данными, процессор ищет их сперва в кеше. Кеш разделяют на уровни: обычно, в процессорах используется двухуровневая система (т.н. Кеш L1 и L2). Кеш первого уровня отличается малым размером (но большой скоростью), а второго уровня – большим размером. Кеш третьего же уровня очень велик, но медленен и встречается только в отдельных моделях ЦП.

Кеш во многом обусловливает стоимость процессора, т.к занимает значительную (иногда и большую) часть кремниевой подложки ЦП. Чем больше кеш, тем быстрее работает процессор. Зачастую, разница производительности между процессором с кешем 128 Кб и ЦП с кешем в 1 Мб L2 несоизмерима мала, в сравнении с увеличившейся стоимостью процессора.

Технический процесс. Производители вынуждены уменьшать нормы производства процессоров еще и для того, чтобы снизить тепловыделение процессора. Обычно пользователю достаточно знать: чем меньше тех. процесс (и подаваемое на ЦП напряжение), тем меньше нагрев процессора. Все современные процессоры выпускаются по нормам 0,09 мкм, на подходе массовое распространение 0,065 мкм. Для производителей процессоров, внедрение новых технологий – не только снижение площадей чипов, но и важный фактор на пути увеличение производительности ЦП.

Поддержка технологий. Для оптимизаций выполнения определенных задач, производители ЦП внедряют в свои процессоры специальные наборы инструкций. Например, SSE (SSE2, SSE3), 3DNow!, Extended 3DNow! и т.п. Эти инструкции не вносят каких-то изменений в саму исполнительную часть ядра процессора, но позволяют описывать сложные последовательности команд, более короткими командами и упрощать работу процессору. В основном, такие дополнительные наборы инструкций созданы для увеличения производительности в программах, которые используют данные наборы инструкций.

Встроенный контроллер памяти. Долгое время, этот термин не был применим к ЦП. Однако, компания AMD в своем новом поколении процессоров К8 встроила контроллер памяти в процессор. ЦП все время работает с ОЗУ и скорость его работы с оперативной памятью – это важнейший параметр на пути обеспечения высокой производительности. Раннее существовала схема работы ЦП с ОЗУ: "Процессор – Чипсет – ОЗУ". Этот путь сократили и "перенесли" контроллер памяти из чипсета – в ЦП. Тем самым схема упростилась до "Процессор – ОЗУ". В ЦП Intel пока применяется традиционная схема, в которой участвует чипсет. Однако в процессорах Core i7 компания Intel использует встроенные контролеры памяти позволяющий работать с 3 каналами памяти DDR3.

7.2.2. Современные процессоры архитектуры x86 компаний Intel и AMD

В настоящее время в составе ПК можно встретить процессоры, приведенные на рис. 7.26 – 7.31.

Intel Pentium 4 – одноядерный x86-совместимый микропроцессор компании Intel, представленный 20 ноября 2000 года. Архитектура NetBurst (рабочее наименование – P68), лежащая в основе процессоров Pentium 4, разрабатывалась компанией Intel, в первую очередь, с целью достижения высоких тактовых частот процессоров. NetBurst не является развитием архитектуры P6, использовавшейся в процессорах Pentium III, а представляет собой принципиально новую по сравнению с предшественниками архитектуру. Характерными особенностями архитектуры NetBurst являются гиперконвейеризация и применение кэша последовательностей микроопераций вместо традиционного кэша инструкций.

Intel Pentium D построен по микроархитектуре NetBurst, как и все модели Pentium 4. Буква «D», в названии, расшифровывается как Dual – двойной, и указывает на наличие двух ядер.

Intel Core – это название, используемое для процессоров с кодовым именем Yonah, представленных 5 января 2006 года. Они производились с использованием техпроцесса 65 нм, основанных на архитектуре Banias/Dothan Pentium M, с добавленной технологией защиты LaGrande. Общая производительность была увеличена за счет добавления поддержки SSE3 расширений и усовершенствования поддержки расширений SSE и SSE2. Но при этом производительность немного снижается в связи с более медленным кэшем (а точнее, в связи с его высокой латентностью). Процессор Core Duo является лучшим в мире двуядерным процессором с архитектурой x86 с точки зрения энергопотребления (меньше 25 Вт).

Intel Core Duo имеет два ядра, 2 Мб кэш 2-го уровня, на оба ядра, и шину управления для контроля над кэшем 2-го уровня и системной шиной.

Intel Core Solo использует то же двойное ядро, что и Core Duo, но рабочим является только одно ядро.

Pentium 4 (Socket 423)

Рисунок 7.26 – Pentium 4 (Socket 423)

Рисунок 7.27 – Pentium 4 (Socket 478))

Рисунок 7.28 – AMD Athlon 64 X2

Рисунок 7.29 – Pentium D 820

Рисунок 7.30 – Intel Core 2 Duo E6600 «Conroe»

Рисунок 7.31 – AMD Phenom

Intel Core 2 – восьмое выпущенное корпорацией Intel поколение микропроцессоров архитектуры x86, основанное на совершенно новой процессорной архитектуре, которая называется Intel Core. В отличие от процессоров архитектуры NetBurst (Pentium 4 и Pentium D), в архитектуре Core 2 ставка делается не на повышение тактовой частоты, а на улучшение других параметров процессоров, таких как кэш, эффективность и количество ядер. Особенностями процессоров Intel Core 2 являются EM64T (поддержка архитектуры EM64T), технология поддержки виртуальных x86 машин Vanderpool (en), NX-бит и набор инструкций SSSE3. Кроме того, впервые реализованы следующие технологии: LaGrande Technology, усовершенствованная технология SpeedStep (EIST) и Active Management Technology (iAMT2).

Первые процессоры Core 2 официально представлены 27 июля 2006 года. Процессоры Intel Core, они делятся на модели Solo (одноядерные), Duo (двухъядерные), Quad (четырехъядерные) и Extreme (двух- или четырехъядерные с высочайшей скоростью и разблокированным множителем).

AMD Athlon 64 – первый 64-битный процессор для домашних пользователей и мобильного применения компании AMD, который был представлен 23 сентября 2003 года. Процессор построен на архитектуре AMD 64 и относится к восьмому поколению (K8) и доступен для Socket 939 и Socket AM2. Данные процессоры построенные на архитектуре AMD 64 и способны работать с 32-битным x86, 16-битным и 64-битным кодом.

Основным качеством процессоров Athlon 64 является интегрированный в ядро контроллер памяти, чего не было в предыдущих поколениях ЦПУ. Не только то, что данный контроллер работает на частоте ядра процессора, но также и то, что из связки процессор-память исчезло лишнее звено – северный мост, позволило существенно уменьшить задержки при обращении к ОЗУ.

AMD Athlon 64 X2 компании AMD является первым двухъядерным ЦПУ для настольных компьютеров. Этот процессор содержит два ядра Athlon 64, объединенных на одном кристалле с помощью набора дополнительной логики. Ядра имеют в своем распоряжении двухканальный контроллер памяти HyperTransport, базирующийся на Athlon 64 степпинга E, и в зависимости от модели содержит от 512 до 1024 Кб Кэша 2-го уровня на каждое ядро. Athlon 64 X2 поддерживают набор инструкций SSE3 (которые ранее поддерживались только процессорами компании Intel), что позволило запускать с максимальной производительностью код, оптимизированный для процессоров Intel.

AMD Phenom – многоядерный центральный процессор фирмы AMD предназначенный для использования в стационарных персональных компьютерах. В под данной маркой выходят трех- (AMD Phenom X3) и четырехъядерные (AMD Phenom X4) процессоры, базирующийся на архитектуре K10. Основным отличием процессоров поколения K10 от своих предшественников на базе K8 является объединение четырех ядер на одном кристалле, обновления протокола Hyper-Transport до версии 3.0 (один 16-битный канал имеет скорость 4000 Mб/с), общий для всех ядер кэш L3, а также перспективная поддержка контроллером памяти DDR3 (пропускная способность до 17.1 Гб/с). Сами ядра также были модернизированы по сравнению с ядрами K8.

Процессор существует в двух вариантах: Phenom для настольных систем, Opteron серий 83хх и 23хх для серверов а так же серии 13хх для сокета Socket AM2+. Все процессоры серии Phenom построены на Socket AM2+ обратно совместимом с Socket AM2. При использовании процессоров Phenom на материнских платах с поддержкой Socket AM2 он лишается поддержки шины Hyper-Transport 3.0, раздельного тактования контроллера памяти (северного моста), кэша L3 и ядер, а так же некоторых энергосберегающих функций.

Сравнительный анализ характеристик современных процессоров приведен в таблице 7.1.

Таблица 7.1 - Сравнительный анализ характеристик современных процессоров

CPU

Производ-ство

Частота ЦП

Частота FSB

Особенности, платформа

Наборы инструкций

Pentium 4

с 2000 по 2007 год

1,3 - 3,8 ГГц

400 - 1066 МГц

NetBurst,
180—65 нм,
Socket 478,
Socket 423,
Socket T (LGA 775)

IA-32, MMX, SSE, SSE2, SSE3, EM64T

Pentium D

с 2005 по 2007

2,66 - 3,6 ГГц

533 - 800 МГц

NetBurst,
90 -65 нм,
Socket T (LGA 775)

IA-32, MMX, SSE, SSE2, SSE3, EM64T

Intel Core

с 2006

667 T/s

Intel Core,
Socket T (LGA 775)

MMX, SSE, SSE2, SSE3, SSSE3, EM64T

Intel Core 2

с 2006

1 - 3,20 ГГц

533 - 1600 МГц

Intel Core
Socket T (LGA 775)

MMX, SSE, SSE2, SSE3, SSSE3, SSE4, x86-64

Athlon 64

К8+
Socket 754
Socket 939

MMX, Extended 3DNow!, SSE, SSE2, AMD64, Hyper-Transport

Athlon 64 X2

с 2006

2 - 3,2 ГГц

Hyper-Transport 1000 МГц

К8+
Socket AM2

MMX, Extended 3DNow!, SSE, SSE2, SSE3, AMD64, Cool'n'Quiet, NX-Bit, , Hyper-Transport

AMD Phenom

с 2008

1,8 - 2,6 ГГц

Hyper-Transport 2000 МГц

K10
Socket AM2+

MMX, Extended 3DNow!, SSE, SSE2, SSE3, AMD64, Cool'n'Quiet, NX-Bit, Hyper-Transport

7.2.3. Оценка производительности современных процессоров

Производительность процессоров существенно зависит от архитектуры, тактовой частоты, размера КЭШа и других параметров. Однако, производительность также определяется программным обеспечением которое выполняется на данном процессоре. Так, одни и те же процессоры могут показывать различное быстродействие в различных программах.

На рис. 7.32 – 7.35 приведены сравнительные оценки производительности двух ядерных процессоров Intel (Core 2 Duo E xxx) и двух ядерных (Athlon 64 X2), трех ядерных (Phenom X3) и четырех ядерных (Phenom X4) процессоров AMD в различных программах.

Рисунок 7.32 – Оценка общей производительности пакетом SYS Mark 2007

Рисунок 7.33 – Оценка производительности в игре Half-Life

Рисунок 7.34 – Оценка производительности при обработке видео

Рисунок 7.35 – Оценка производительности при моделировании в пакете 3D Max