Реферат : Архитектура Cray-1 


Полнотекстовый поиск по базе:

Главная >> Реферат >> История техники


Архитектура Cray-1




Архитектура Cray-1

В 70-х годах бывший сотрудник и один из руководителей фирмы CDC Seymour Cray (Сеймур Крей) организовал собственную фирму, которая занялась проектированием сверхбыстродействующей ЭВМ, известной под названием Cray-1 с быстродействием, превосходящим 150 млн. операций в секунду с широким использованием новой интегральной технологии.

Память этой машины выполнена в виде 16 блоков, общей емкостью в 1 млн. 64 разрядных слов. Допускается одновременное обращение к этим блокам таким образом, что реальное время обращения становится равным 12,5 нсек, в то время как время обращения к одному блоку равно 50 нсек.

Основная память машины Cray-1 в отличие от других высокопроизводительных машин не имеет иерархическую структуру, она столь быстра что в такой иерархии отпала необходимость. Считается, что машина Cray-1 является наиболее быстродействующей из класса однопроцессорных систем.

О структурной организации этой машины целесообразно рассказать более подробно. Изложение будет основано на интересной статье Ричарда М. Расселла, одного из разработчиков этой машины, в которой приведены основные технические данные, архитектурные особенности и некоторые соображения, положенные в основу принятых структурных решений (Richard М. Russell. The CRAY-1 Computer System. Communication of the ACM. January 1978, Volume 21, Number 1).

Расселл относит машину Cray-1 к классу сверхвысокопроизводительных векторных процессоров. К этому классу относятся также машины Иллиак-IV, STAR-100, ASC.

В состав центрального процессора Cray-1 входят:

главная память, объемом до 1048576 слов, разделенная на 16 независимых по обращению блоков, емкостью 64К слов каждый;

регистровая память, состоящая из пяти групп быстрых регистров, предназначенных для хранения и преобразования адресов, для хранения и обработки векторных величин;

функциональные модули, в состав которых входят 12 параллельно работающих устройств, служащих для выполнения арифметических и логических операций над адресами, скалярными и векторными величинами;

устройство, выполняющее функции управления параллельной работой модулей, блоков и устройств центрального процессора;

24 канала ввода-вывода, организованные в 6 групп с максимальной пропускной способностью 500000 слов в секунду (2 млн. байт в сек.).

Двенадцать функциональных устройств машины Cray-1, играющие роль арифметико-логических преобразователей, не имеют непосредственной связи с главной памятью. Так же как и в машинах семейства CDC-6000, они имеют доступ только к быстрым операционным регистрам, из которых выбираются операнды и на которые засылаются результаты после выполнения соответствующих действий.

Три группы операционных регистров, непосредственно связанные с арифметико-логическими устройствами, называются основными. К ним относятся восемь так называемых А-регистров, состоящих из 24 разрядов каждый. А-регистры связаны с двумя функциональными модулями, выполняющими сложение (вычитание) и умножение целых чисел. Эти операции используются главным образом для преобразования адресов, их базирования и индексирования. Они также используются для организации счетчиков циклов. В ряде случаев А-регистры можно использовать для выполнения арифметических операций над целыми числами.

В следующую группу основных операционных регистров входят восемь 64-разрядных S-регистров, непосредственно связанных с функциональными устройствами выполнения арифметических действий со скалярными величинами, представленными с фиксированной и плавающей запятой. Эти S-регистры аналогичны по назначению Х-регистрам операндов в машине CDC-6600. Особый интерес представляют восемь 64-элементных векторных регистров, которые предназначены для хранения восьми операндов-векторов. Каждый такой операнд состоит из 64 компонент (элементов). В свою очередь каждая компонента представляет собой 64-разрядное слово, в котором хранится число с плавающей или фиксированной запятой. Компоненты вектора могут представлять собой также элементы некоторой таблицы. В системе команд машины предусмотрены специальные операции, в качестве операндов которых выступают многокомпонентные векторы. Не во всех задачах требуется обрабатывать векторы размерности 64. Специальный управляющий регистр центрального процессора задает требуемую размерность (число элементов). Этот регистр программно- управляем, что позволяет в процессе вычислений изменять размерность обрабатываемых векторов. Кроме того, в центральном процессоре предусмотрен регистр маски, с помощью которого можно блокировать выполнение арифметико- логических действий над некоторыми компонентами вектора, т. е. осуществлять выборочные покомпонентные действия. Регистр маски по своему назначению аналогичен регистру маски машины Иллиак-IV.

В вычислительных методах линейной алгебры часто встречается процедура, состоящая в том, что строку матрицы (все элементы строки матрицы) умножают на некоторую скалярную величину и затем вычитают из элементов другой строки, с тем чтобы получить, например, нулевой коэффициент при некотором неизвестном. На этой процедуре основан метод исключения Гаусса при решении систем линейных алгебраических уравнений. Выполнение такой процедуры можно запараллелить двумя несколько различными способами, приводящими, естественно, к одинаковому результату.

Поскольку в машине Cray-1 устройства, выполняющие операции умножения и вычитания, могут работать одновременно, то эту процедуру на ней можно запараллелить так. Умножить первую компоненту первого вектора на скалярную величину, после этого приступить к выполнению операции вычитания результата из первой компоненты второго вектора, а пока происходит это вычитание, параллельно выполнить операцию умножения скаляра на вторую компоненту первого вектора. Этот механизм, позволяющий совмещать различные арифметические действия, в статье Расселла назван цепочкой. В литературе этот принцип организации параллелизма иногда называют конвеерным. Сочетание конвейерного параллелизма с "покомпонентным", по мнению разработчиков машины Cray-1, составляет одну из важных особенностей и достоинств ее структурной организации.

В состав регистровой памяти центрального процессора входят две группы вспомогательных буферных регистров, сокращающих число обращений к главной памяти. В первую группу входят 64 так называемых В-регистра, которые служат для накопления операндов, поступающих из А-регистров или направляемых в А- регистры из главной памяти. Во вторую группу входят 64 буферных регистра операндов, связанных с S-регистрами. Они называются Т-регистрами и служат тем же целям в отношении главной памяти, что и В-регистры. Совместно В- и Т- регистры можно рассматривать как единый буфер для хранения часто используемых операндов и их адресов.

Поскольку к регистрам В и Т можно обращаться из программы, то их можно рассматривать как промежуточную, доступную для программы память, хранящую 24-разрядные операнды (В-регистры) и 64-разрядные операнды (Т- регистры). Пересылками между памятью к В- и Т-регистрами управляют программы пользователя. Это означает, что В- и Т-регистры можно рассматривать как программно управляемые буферы. В этом состоит отличие от механизма управления буферной памятью, принятого, например, в машинах IBM-370, который реализован аппаратным путем.

Кроме того, в состав центрального процессора машины Cray-1 входит регистровая буферная память значительного объема для промежуточного храпения команд программы, исполняемой в данный момент. Эта буферная память состоит из четырех секций, каждая по 16 слов. Последовательность команд программы предварительно поступает этот буфер. Если она содержит условный переход, то в буфере накапливаются также команды, относящиеся к последовательности, на которую возможен этот условный переход. Буфер команд является средством ускорения работы устройства управления, так как заметно минимизирует время ожидания команд из главной памяти.

Система команд машины Cray-1 прямо отражает регистровую структуру центрального процессора, своеобразие связи функциональных модулей с операционными регистрами и связи их с главной памятью. Команды машины Cray-1 двух форматов: короткие команды - 16 разрядов и длинные - 32 разряда.

Семь первых разрядов определяют код операции, затем следуют трехразрядные поля i, j, k, определяющие соответственно номер регистра результата и номера регистров исходных операндов.

В одном слове машины Cray-1 может размещаться до четырех команд короткого формата. Длинные команды могут начинаться в одном слове и продолжаться в следующем. Это позволяет плотно упаковывать команды в памяти машины и в какой-то степени ускоряет их выборку.

К главным управляющим регистрам машины относятся следующие: счетчик команд, способный адресовать каждую четвертую часть слова, регистр базы (ВА), который служит для образования абсолютного адреса при обращении к памяти и одновременно является верхней границей адресного пространства программы; регистр границы адресов (LA), содержащий нижнюю границу доступных для текущей программы адресов, регистры ВА и LA служат для защиты памяти, выделенной для программы, активной в мультипрограммном режиме. Тем самым в машине Cray-1 применен метод защиты по границам, используемый во многих машинах, в частности в машине Минск-32.

В составе центрального процессора имеется девятиразрядный регистр F, фиксирующий причину прерываний, а именно: прерывания по нормальному окончанию задачи, окончанию по ошибке, фиксирует прерывания по вводу- выводу, по появлению ошибок в операндах, по переполнениям, меткам времени и сигналам с пульта оператора машины. Специальный регистр режимов исполнения программ позволяет блокировать некоторые группы прерываний.

Система прерываний в машине Cray-1 построена по образу и подобию таковой, принятой для машин-предшественников семейства CDC, а именно, такая же, как у CDC-7600.

Схемами управления автоматически запоминаются все управляющие и основные операционные регистры прерванной программы при появлении прерывания в область главной памяти, адрес начала которой указан в специальном управляющем регистре. После этого управление автоматически передается программам операционной системы, которые анализируют причину прерывания и при необходимости запоминают в главной памяти содержимое всех групп промежуточных и буферных регистров (В, Т и V). В главной памяти для каждой задачи, идущей в мультипрограммном режиме, выделены массивы, в которых сохраняется вся информация, необходимая для продолжения прерванной программы.

Отметим, что защита памяти и система прерываний организованы так, что значительная доля работы по запоминанию информации для возврата, по организации процесса переключения с одной задачи на другую возлагается на операционную систему. Отсутствие достаточно развитых аппаратных средств динамического перераспределения памяти, упрощенный аппарат преобразования программных адресов в физические (аппаратное базирование) вполне допустимы в машинах, предназначенных для решения крупных научных задач. Этот режим "научных" вычислений характерен сравнительно редким появлением ситуации, требующих переключения с решения одной задачи на другую. Это в свою очередь позволяет по-иному реализовать защиту и прерывания, не заботясь о быстром аппаратном их выполнении.

Здесь хотелось бы еще раз подчеркнуть то влияние на структурную организацию ЭВМ, которое оказывает класс решаемых задач. Интересен способ представления чисел с плавающей запятой, принятый в машине Cray-1. На мантиссу со знаком выделено 49 разрядов. На двоичный порядок выделено 15 разрядов. Тем самым цена младшего разряда 2-48 (~ 10-17), а диапазон представимых чисел приблизительно оценивается величиной 102500. Может показаться на первый взгляд странным увеличение диапазона представимых чисел до таких огромных пределов. Однако для решения некоторых задач линейной алгебры такое расширение диапазона может оказаться необходимым.

Математическое обеспечение машины Cray-1, так же как и у ее предшественников машин фирмы CDC, "фортранно-ориентировано". Это означает, что в качестве основного входного языка выбран фортран, наиболее интенсивно используемый в научных расчетах. Для машины Cray-1 создан специальный оптимизирующий транслятор со стандартного фортрана, учитывающий специфику этой векторной машины. При некоторых условиях, наложенных на программу, данный транслятор обеспечивает конвеерный параллелизм и готовит объектные программы, эффективно использующие эти возможности машины. Ведутся работы над новой версией транслятора, который будет оптимизировать фортранные программы, составленные без каких-либо ограничений.

В состав математического обеспечения входит также макроассемблер CAL (Cray Assembler Language) и библиотека стандартных программ, составленная на этом языке и ориентированная на использование средств параллельных вычислений, присущих данной машине.

Операционная система COS (Cray Operating System) предназначена для режима пакетной обработки и дистанционной пакетной обработки заданий, полученных с удаленных терминалов. Операционная система рассчитана на мультипрограммную обработку одновременно до 63 активных задач. Для обеспечения работы в режиме дистанционного доступа в качестве машины-сателлита вычислительной системы Cray-1 используется минимашина "Eclipse". С этой машиной связаны внешние каналы центрального вычислителя с помощью специальных сопрягающих устройств. На минимашину возлагаются функции управления приемом-передачей информации, управления линиями связи, т. е. функции процессора передачи данных. Фирма Cray разрабатывает для этих целей собственный специализированный микрокомпьютер, который в скором будущем должен заменить минимашину другой фирмы. Машина Cray-1, как уже говорилось, на сегодняшний день считается наиболее быстродействующей в классе универсальных ЭВМ для научных расчетов. Ее производительность сильно зависит от характера решаемых задач. Экспериментальная проверка показала, что она колеблется от 20 до 160 млн. операций в секунду. При выполнении операций с плавающей запятой диапазон ее быстродействия оценивается в пределах от 20 до 60 млн. операций в секунду.

Список литературы

Для подготовки данной работы были использованы материалы с сайта http://parallel.ru/

Похожие работы:

  • Архитектура ЭВМ

    Реферат >> Информатика, программирование
    ... Так возникло новое понятие — архитектура ЭВМ. Под архитектурой ЭВМ принято понимать совокупность ... IBM 370, IBM ES/9000, Cray 3, Cray 4, VAX-100, Hitachi, Fujitsu ... говоря, векторно-конвейерные суперкомпьютеры, например, Cray-1 [6]. В этом случае мы имеем ...
  • Архитектура ЭВМ

    Реферат >> Информатика, программирование
    ... и т.д. Структура персонального компьютера Архитектура компьютера обычно определяется совокупностью ее ... вышел первый четырёхъядерный процессор Intel Core 2 Quad на ядре Kentsfield ... процессоров. Intel представила семейство Core i7, состоящее из трёх ...
  • Архитектура многокристального микропроцессора К10 и К10.5

    Курсовая работа >> Информатика, программирование
    ... появились однокристальные МП с микропрограммным управлением. Архитектура многокристального МП с микропрограммным управлением позволяет ... обработанных. Подобное отличие существует и между архитектурами NetBurst и Core, но реализация технологии у AMD ...
  • Архитектура ЭВМ

    Шпаргалка >> Информатика, программирование
    ... 45. MPP-архитектура 46. SMP-архитектура 47. PVP-архитектура 48. ... Подобную архитектуру называют кластерной, и по такому принципу построены CRAY SV1, ... потока. 46. SMP-архитектура Symmetrical Multiprocessing. Архитектура: несколько однородных процессоров ...
  • Архитектура Великобритании

    Учебное пособие >> Иностранный язык
    ... особенности, характерные для британских памятников архитектуры; развивать умения восприятия и обобщения ... furniture with great care, so that each chair, each vase, ... hundred years ago. The core of the house is ... of wood standing on stone core walls. At the north ...
  • Архитектура материнских плат

    Реферат >> Информатика, программирование
    ... ); Socket 775 - процессорыIntel Core 2 Quad/Core 2 Extreme/Core 2 Extreme/Pentium 4/Extreme; ... 279 мм) IBM,1983 архитектура IBM PC XT AT 12 ... –330 мм) IBM, 1984 архитектура IBM PC AT (Desktop/Tower) ... -330 мм) IBM, 1990 архитектура IBM PC XT (форм-фактор ...
  • Архитектура сотовых сетей связи и сети абонентского доступа

    Реферат >> Радиоэлектроника
    ... приведена на рис. 2. Рис. 2 Архитектура простейшей DECT-системы. Контроллер предназначен ... (в США они называются Digital Local Carrier - DLC), в дальнейшем предполагается увеличение ... абонентов, получила название Digital Loop Carrier (DLC), что можно перевести ...
  • Архитектура промышленной сети BitBus

    Дипломная работа >> Информатика, программирование
    ... архитектуры каждого элемента управляющей цепи. Одноуровневая архитектура. Такая архитектура ... CSMA схемы доступа (carrier-sense multiple access), ... 1.5. показывают возможные стадии развития системной архитектуры от иерархической к одноуровневой. Система, ...
  • Архитектура современного ПК

    Курсовая работа >> Информатика, программирование
    ... реализованных в компьютере, образует архитектуру компьютера. Центральной частью компьютера ... имеет четырехъядерный процессор Intel Core 2 Extreme QX6700 (частота ... исследовательских центрах компании. Гибкость архитектуры современных ПК позволяет организациям и ...
  • Архитектура видеопамяти

    Статья >> Информатика, программирование
    ... слоев (разрядных матриц) и "смешанная" архитектура. Архитектура "в глубину". При такой организации ... , подлежащих модификации. "Смешанная" архитектура. В этой архитектуре доступ к данным видеопамяти может ... GA-P35-DS4 Процессор Intel Core 2 Duo E8200 @ 3800 ...