Сервер - статьи

       

Реализации и примеры


Чем живет рынок восьмипроцессорных систем сегодня? Начнем, пожалуй, с систем на базе процессоров Intel как превалирующих на рынке. Есть несколько моделей процессора Itanium в вариантах MP (Multi-Processor) и DP (Dual Processor) с тактовыми частотами до 1,6 ГГц (существует также низковольтная линейка (LV). К первому типу (MP) относятся продукты, предназначенные как раз для применения в многопроцессорных системах - Itanium 2 1,6 ГГц с 9 Мбайт кэша L3 и FSB 533 МГц ($4226 в партиях по 1000 шт.), Itanium 2 1,6 ГГц с 6 Мбайт кэша L3 ($1980) и Itanium 2 1,5 ГГц с 4 Мбайт кэша L3 ($910). Ко второму (DP) - чипы для двухпроцессорных вычислений: Itanium 2 1,6 ГГц, 3 Мбайт кэша L3, FSB 533 МГц ($1172) и Itanium 2 1,6 ГГц, 3 Мбайт кэша L3, FSB 400 МГц ($851). Третья категория (LV) в настоящее время включает низковольтный Itanium 2 1,3 ГГц с 3 Мбайт кэша L3 ($530), потребляющий 63 Вт. Он ориентирован на использование в системах базового уровня и сверхплотных серверах.

См.

С точки зрения создания восьмипроцессорных систем наиболее интересен чипсет Intel E8870 (Intel 870). На самом деле он разработан для двух- и четырехпроцессорных серверных платформ высшего уровня и состоит из следующих основных компонентов: Intel E8870IO (SIOH), Intel E8870 (SNC), Intel E8870DH (DMH), Intel 82870P2 PCI/PCI-X (P64H2), Intel 82801DB (ICH4). Однако использование уже упомянутой микросхемы Intel E8870SP (E8870SP Scalability Port Switch, SPS) позволяет расширить возможности НМС Intel E8870 и создавать системы с восемью процессорами Itanium 2.

Основные характеристики Intel 8870: 400 МГц, 128-разрядная системная шина, что обеспечивает скорость передачи данных до 6,4 Гбайт/с, очень большой объем оперативной памяти: концентратор DMH предоставляет в сумме 32 разъема для установки памяти на каждый процессорный узел, в итоге максимальный объем составляет 128 Гбайт (с 4 DDR Memory Hubs).

Чипсет поддерживает два масштабируемых порта с высокой пропускной способностью. Четыре соединения интерфейса Hub Interface 2.0 имеют пропускную способность 1 Гбайт/с на каждое соединение, что позволяет применять до четырех 64-разрядных контроллеров PCI/PCI-X (P64H2) с интерфейсом HI 2.0.
Имеется механизм предзагрузки данных и встроенная кэш-память системы ввода/вывода. Высокопроизводительный мост PCI/PCI- X обеспечивает поддержку всех устройств ввода/вывода PCI/PCI-X I/O, начиная от устаревших PCI и заканчивая высокопроизводительными PCI-X на частоте 133 МГц (каждый контроллер P64H2 содержит два независимых 64-разрядных канала PCI-X с максимальной частотой 133 МГц). Кроме того комбинация таких характеристик, как модули hot-plug для процессора и памяти, обнаружение и коррекция ошибок, восстановление сбоев устройств памяти (MDFR), резервные пути ввода/вывода, делает платформу более надежной, уменьшает время простоев при ремонте и обеспечивает целостность передачи данных по всем соединениям и шинам. Читатель, наверное, обратил внимание на количество микросхем, образующих чипсет Intel 8870 - даже для четырехпроцессорной конфигурации оно равняется восьми (и это только в случае использования одного контроллера PCI-X). В случае же создания восьмипроцессорной системы это число возрастает минимум до 20 микросхем (!), поэтому создание решений на базе Itanium 2 - кране сложная и трудоемкая задача. Учитывая только лишь эти особенности реализации данной платформы, понимаешь, почему стоимость серверов на базе Itanium столь высока. А вот во время знакомства с реализациями восьмипроцессорных систем на базе архитектуры AMD Opteron 8xx, понимаешь, что они привлекательны не только, что называется, на листе. Особенно это становится заметно в сравнении с реализациями восьмипроцессорных систем на базе Itanium 2. Судите сами: полновесная восьмипроцессорная система (имеется поддержка PCI-X, PCI Express, 2?Gigabit Ethernet, SATA II) на базе системной платы Tyan Transport VX50 (впрочем, единственной в своем роде) использует всего две микросхемы. По сути, в ней применяется чипсет nForce4 Professional (аналог AMD-8000) и мост AMD-8131 для поддержки PCI-X. Наиболее современные одноядерные процессоры AMD Opteron 852 работают на тактовой частоте 2,6 ГГц и поддерживают набор инструкций SSE3.


Емкость кэш-памяти второго уровня составляет 1 Мбайт. Обмен данными между чипами и системной логикой осуществляется по шине HyperTransport, работающей на частоте 1 ГГц (800 МГц - для процессоров Opteron предыдущего поколения). Они производятся по 90-нм техпроцессу, максимальное энергопотребление составляет 93-95 Вт. Кроме того в них реализована фирменная технология снижения энергопотребления AMD PowerNow. Стоимость процессоров Opteron 852 составляет $1514 в партиях от 1000 штук.

Топология многопроцессорного решения AMD Ну и пожалуй, самая интересная информация: компания AMD помимо одноядерных процессоров предлагает серверные двухъядерные чипы, среди которых и Opteron линейки 8xx. Многоядерная новинка получила название Dual-Core AMD Opteron 800 и предназначена для применения в четырех- и восьмипроцессорных серверах. В настоящее время компания предлагает три версии двухъядерных Opteron стоимостью от $1514 до $2649 (в партиях по 1000 шт.) и с тактовой частотой от 1,8 до 2,2 ГГц. Стоит ли говорить, что с учетом гибкости архитектуры AMD, восьмипроцессорные системы превращаются в весьма интересно организованные 16-процессорные? Причем в сравнении с еще не объявленными двухъядерными Intel Xeon MP или Itanium MP (которые будут не более чем 16-процессорными, с разделением шины), Dual-Core Opteron вновь оказывается в более выгодном положении. У многопроцессорных систем Intel для всех установленных процессоров всегда использовалась общая процессорная шина, тогда как решения AMD обладают и общим контроллером памяти, и одним на два ядра контроллером процессорной шины. Взаимодействие каждого из ядер с разделяемыми ресурсами осуществляется посредством специального Crossbar-переключателя и очереди системных запросов. Кроме того, два ядра на одном кристалле в процессорах AMD используют полнодуплексный интерфейс HyperTransport, что актуальнее разделяемой шины Intel. На этом же уровне организовано и взаимодействие ядер между собой, благодаря чему вопросы когерентности (равноценности содержимого) кэшей решаются без дополнительной нагрузки на системную шину (и без того рационально загруженную) или шину памяти.

Содержание раздела