|
В начало
Лекция. Транспьютер Т9000
Архитектурные и
структурные особенности На момент своего появления транспьютеры семейства Т-8
были самыми быстродействующими 32-разрядными микропроцессорами. Попытка фирмы Inmos сохранить лидерство перед американскими производителями
микропроцессоров воплотилась в разработку транспьютера Т9000. Его основные
технические характеристики: • производительность - 200 MIPS, 25 MFLOPS; • объем внутрикристальной
памяти - 16 Кбайт; • число коммуникационных каналов - 4; • скорость обмена по линку -
100 Мбит/с. Основными особенностями архитектуры данного
транспьютера являются аппаратная поддержка механизма виртуальных каналов и аппаратный группировщик команд,
повышающий загрузку параллельно функционирующих устройств процессора. Однако фирма Inmos не смогла
выдержать обещанные сроки поставки Т-9000, а также достичь объявленной
производительности. Поэтому, хотя образцы Т-9000, работающие
на пониженной, по сравнению с объявленной, тактовой частоте были выпущены,
коммерческого успеха они не имели. Виртуальные линки Механизм виртуальных линков
позволяет вести по одному физическому линку обмен
между произвольным числом пар процессов, протекающих в разных транспьютерах. Управляет обменом встроенный в Т-9000 процессор
виртуального канала (VCP). Сообщение,
передаваемое от процесса-отправителя к процессу-получателю, VCP делит на пакеты, каждый из которых содержит 32 байта
данных (последний пакет - от 1 до 32 байт), заголовок пакета и концевик (дам последнего пакета - признак конца сообщения,
для остальных - признак конца пакета). При получении пакета, VCP в принимающем транспьютере передает подтверждение в
виде пустого пакета содержащего только заголовок и признак конца пакета. VCP,
используя информацию, содержащуюся в заголовке пакета, осуществляет
маршрутизацию пакетов и сшивку сообщения. Таким образом, обмен данными для
процессов выглядит так же, как и в случае транспьютеров прежних поколений, что
способствует преемственности программного обеспечения. "Прозрачность" для процессов маршрутизации сообщений
в сети транспьютеров Т9000 полностью устраняет различие между обменом в рамках
одного транспьютера и обменом в транспьютерной сети. Этот свойство существенно
упрощает разработку программы для мультитранспьютерной
системы и повышает ее эффективность, поскольку не требуется дополнительных
расходов на организацию маршрутизации и коммутации. В целях увеличения числа физических связей
транспьютера Т9000 разработан программируемый коммутатор С
104, осуществляющий передачу сообщения с любого из 32 входов на любой из 32
выходов в соответствии с их заголовком. Для возможности использования в системе Т9000
совместно с транспьютерами предшествующих поколений разработана микросхема С 100, выполняющая согласование электрических характеристик
и преобразование формата передаваемых по линкам
данных. Группировщик команд В Т-9000 полностью сохранена система команд предыдущих
поколений транспьютеров. Увеличение производительности достигается за счет
одновременного исполнения группы, в которую входит до 8 команд. В Т-9000 реализован
аппаратный группировщик команд. Образование групп
команд преследует цель достижения высокой загрузки устройств
процессора. Процессор за один такт извлекает из памяти 4 команды.
В силу того, что некоторые команды требуют для исполнения более чем 1 такт, в
процессоре может быть накоплено количество команд, достаточное для формирования
5 групп по 8 команд каждая, что соответствует полной загрузке устройств процессора. Транспьютероподобные микропроцессоры серии "Квант"
Примером отечественной разработки транспьютероподобных
процессоров являются микропроцессоры серии "Квант". Это семейство
32-разрядных микропроцессоров с оригинальной архитектурой, сочетающей
RISC-подход с методикой длинного командного слова. Семейство характеризуется высокой
степенью внутреннего параллелизма процессов обработки, конвейерным выполнением
команд, Гарвардской архитектурой памяти, наличием последовательных
коммуникационных каналов -линков. Были выпущены две модификации микропроцессора: • "Квант-10" по технологии 2,5 мкм на трех полузаказных матричных кристаллах 1537 ХМ2,
спроектированных в НИИ "Квант" и изготовленных в НИИ точной
технологии, г. Зеленоград; • "Квант-20" по технологии 1,5 мкм на одном
кристалле типа U1700 фирмы ZMD (ФРГ, Дрезден), спроектированном в НИИ
"Квант" и изготовленном фирмой ZMD. Структура микропроцессора
показана на рис. 80. Микропроцессор работает с внешними раздельными
кэш-памятями команд и данных и может использовать сопроцессор. Память данных
микропроцессора содержит только данные, тогда как память команд может
содержать как команды, так и данные (такая архитектура памяти получила
название модифицированной Гарвардской). Устройство
управления Процессор выбирает из памяти команд 32-разрялные
команды и помещает их сначала в первый, а затем во второй регистры команд,
далее декодирует команды и формирует управляющие сигналы для всех функциональных
блоков процессора. Блок управления прерываниями обеспечивает приоритетную
схему обработки 10 типов внешних и внутренних прерываний. Блок ПДП прямого
доступа в память позволяет выполнять вычисления одновременно с обменом данными
по 4 коммуникационным каналам. Блок защиты данных предназначен для защиты
фрагментов памятей команд и данных, выделяемых под операционную систему. Рис. 80. Структура микропроцессора "Квант" В процессоре
реализована концепция разнесенной" (decoupled) архитектуры, в
соответствии с которой все вычисления адресов выполняются отдельным адресным
устройством, что предоставляет возможность одновременной обработки данных в
арифметическом устройстве и вычисления адресов в адресном устройстве. Адресное
устройство содержит в программном счетчике адрес следующей команды,
поддерживает в памяти стек адресов возврата из подпрограмм (обработчиков
прерываний), выполняет все вычисления адреса в 16-разрядном адресном сумматоре.
Файл адресных регистров (АР) содержит 8 16-разрядных АР для МП
"Квант-10" и 4 16-разрядных АР для МП "Квант-20". Арифметическое устройство Арифметический
блок способен выполнять 16 логических и 14 арифметических операции, в том
числе байтовые, пошаговое умножение 32-разрядного множимого на два разряда
множителя. Логический блок может выполнять логические операции параллельно с арифметическими. Все операции выполняются над 32- разрядными
операндами за один такт. Универсальный сдвигатель способен выполнять за один такт логический,
арифметический или циклический сдвиг 32-разрядного слова влево или вправо на 0
- 31 разряд, а также осуществлять циклические сдвиги внутри байтов, тетрад, пар. Схема маскирования арифметического устройства
позволяет маскировать результаты любой операции содержимым одного из регистров
общего назначения. Файл регистров общего назначения (РОН) используется для
хранения операндов, результатов, масок, адресов данных. В регистр флагов заносятся признаки по результатам выполнения
операций в арифметическом устройстве. Системное
устройство Системное
устройство обеспечивает связь с 4 аналогичными процессорами по независимым
каналам. Обмен осуществляется побитно блоками слов. В начале каждого блока
задается количество передаваемых слов и адрес в памяти, в который будет
записываться сообщение. В процессе передачи осуществляется контроль по четности
для каждого передаваемого байта данных. В случае ошибки при передаче
вырабатывается соответствующее прерывание. Регистр зашиты памяти позволяет запрещать запись в любой блок памяти
длиной 4 Кслов. Конвейер
процессора В процессоре
реализован трехстадийный конвейер выполнения команд.
На первой стадии осуществляется выборка команды из памяти команд, на второй
стадии производится формирование адреса данных для последующего обращения в
память и модификация регистров адреса, на третьей стадии выполняются ввод-вывод
данных из памяти по предварительно вычисленному адресу и операции арифметики.
Действия на каждом этапе выполняются за один такт, что позволяет при
обеспечении высокой степени загруженности конвейера выполнять команды в
среднем за один такт. Система команд Команды
процессора подразделяются на простые и комплексные.
Первые выполняют одно действие, тогда как вторые задают трехадресную
арифметическую операцию над данными в регистрах одновременно с операцией
обмена данными с памятью и (или) модификацией адресных регистров. При обращении к
памяти используются следующие виды адресации: базовая по
содержимому АР, базовая по содержимому РОНа,
автоинкрементная или автодекрементная адресация по любому АР, базово-индексная
адресация по двум АР. В МП "Квант-20" добавлена базово-индексная
адресация с 8-разрядным смещением, задаваемым в поле команды. Для упрощения
устройства управления и обеспечения большей гибкости в программах в
микропроцессоре реализована следующая схема выполнения условных и безусловных
переходов. В случае условного перехода специальная команда проверяет
соответствие флага признаков результата арифметической операции одному из 16
возможных условий перехода. Если имеет место соответствие, то следующая команда
не выполняется, а как бы подменяется пустой операцией (NOP). Причем проверка условия осуществляется на фоне
выполнения арифметических операций. Чтобы не нарушить
работу конвейера (избежать пропуска конвейерных циклов), безусловный
переход выполняется но принципу "отложенного
перехода". В конвейере сначала отрабатывается команда
следующая за командой перехода, а затем выполняется переход, Так же выполняется
и обращение к подпрограммам. Конвейеризация
внутренних процессов в осуществляется во времени выполнения операций в различных функциональных устройствах микропроцессора
позволяют выполнять до четырех команд за один такт. Производительность
микропроцессора. Гибкая система
команд микропроцессор способствует его эффективному применению
как на задачах счётного характера, так и на задачах логической и символьной
обработки. Коммуникационные возможности процессора позволяют строить на его
базе масштабируемые системы с МРР-архитектурой. Уникальная
архитектура процессора серии "Квант" позволила обеспечить лучшее
значение производительности по сравнению с транспьютерами фирмы Inmos. Производительность
микропроцессора "Квант-10" с тактовой частотой 4 МГц соответствует
производительности транспьютера Т-800 с частотой 20 МГц. Производительность
микропроцессоров "Квант-10" и "Квант-20" может быть оценена
как 12-15 Моп/с и 25-30 Моп/с. |
|