Россия, Москва, МЭИ, 2006 |
Современные вычислительные технологии и их аппаратные платформы
6.1. Особенности технологий, основанных на (сверх)массовом параллелизме
С момента зарождения и по настоящий день в развитии вычислительной техники решающую роль играют военные программы, которые консолидируют финансовые, интеллектуальные, материальные и технические ресурсы общества для решения задач выживания конкретного сообщества людей. В частности, с середины 80-х годов прошлого столетия DARPA [132] приступило к масштабным исследованиям в области беспилотных систем военного назначения в широком классе технотронных комплексов военного назначения, обеспечивающих нужды наземных, морских и воздушных вооружений и военной техники (ВВТ). (DARPA - Агентство по прорывным исследовательским проектам в области обороны - США.)
Под технотронными комплексами принято понимать автоматизированные технические средства, функционирование которых в принципе невозможно без использования вычислительной техники.
Основная направленность исследований по программам DARPA - это максимальная роботизация ВВТ "поля боя", тесно взаимодействующих с удаленными, наземными и аэрокосмическими человеко-машинными комплексами разведки и оперативного управления.
Основная цель - это максимальное снижение потерь живой силы по крайней мере в локальных военных конфликтах с технически отсталым противником.
Необходимое условие реализации - это создание интеллектуальных, высокопроизводительных, отказоустойчивых, защищенных от несанкционированного доступа, многоуровневых, неоднородных и распределенных ВС, построенных на принципах модульности и открытости их компонент, обеспечивающих как эволюционное развитие ВВТ, так и оперативное межвидовое взаимодействие непосредственно на "поле боя".
С учетом постоянной диспропорции между предоставляемой и требуемой производительностью, интеллектуальностью, отказоустойчивостью и т. д. (обычно 1/100) при создании таких ВС приходится использовать комплекс интенсивных факторов системотехнического уровня организации вычислений, которые поддерживаются достаточно специфическими технологиями проектирования и использования комплектующих сверх-или ультра-БИС и вычислительных устройств на их основе:
- Кремниевая компиляция [98, 99, 134] - используется для создания программируемых и заказных СБИС или УБИС.
- ПЛИС -технология [70, 135-137] - обеспечивает прямое отображение основных, интерфейсных и управляющих функций на (полу) заказные СБИС или УБИС ( ПЛИС - программируемые логические интегральные схемы).
- Бит-процессорная технология [138-141] - обеспечивает отображение функций пользователя в "терминах" микропрограммного уровня организации вычислений в (Б)ВС с массовым параллелизмом, повышенной живучести и вычислительной устойчивости.
- Технология систолических матриц [70, 142-149] - обеспечивает прямое отображение функций пользователя на матрицу алгоритмически ориентированных операционных устройств.
- ЦПОС -технология [70, 150-158] - обеспечивает отображение проблемно-ориентированных функций пользователя в "терминах" языка низкого уровня ( ЦПОС - цифровой процессор обработки сигналов).
- RISC -технология [159-168] - обеспечивает отображение проблемно-ориентированных функций пользователя в "терминах" языка высокого уровня многопроцессорных (Б)ВС ( RISC - редуцированная система инструкций на микропрограммном уровне управления).
- CISC -технология - обеспечивает отображение функций пользователя в "терминах" языка высокого уровня в ВС с расширенной гарвардской архитектурой, в которой имеются локальные и глобальные шины обмена данными, командами и адресами, многоуровневая память и т. п. ( CISC - расширенная система инструкций на микропрограммном уровне управления).
Перечисленные технологии можно разбить на две группы (рис. 6.1):
- (полу)прямого отображения реализуемых функций на кремниевые структуры, к которым относятся кремниевая компиляция и ПЛИС-технология;
- (микро)программная реализация функций, создаваемых блоков и устройств ВС, что не исключает использование первых двух при создании сверх- и/или ультра-БИС, поддерживающих соответствующий (микро)программный уровень управления в последних технологиях. ПЛИС -технология является развитием технологии программируемых
логических матриц (ПЛМ) и вентильных матриц, которые настраиваются на функции пользователя либо на одной из последних фаз изготовления кристалла (например, металлизация связей или вскрытие контактных окон между слоями металлизации), либо по технологии (П)ПЗУ (реализуемое пользователем электрическое и, в частности, "флэш-программирование"). Бит-процессорная технология практически единственная, где отечественная микроэлектроника и вычислительная техника имеет перед
зарубежными технологиями определенные приоритеты, так как ориентирована на МКМД-, а не на ОКМД-режим распараллеливания вычислений (МКМД - "множество команд - множество данных", ОКМД - "одна команда - множество данных").
Для бит-процессорной технологии характерны:
- высокая структурно-функциональная гибкость, реализуемая на микропрограммном уровне управления, доступном разработчику любого уровня иерархии ВС;
- массовый ( ) векторно-конвейерный параллелизм по ассоциативно взаимодействующим потокам команд и данных;
- простота процессорного элемента ( вентилей), обеспечивающая его проектную и диагностическую "прозрачность", что в сочетании с высоким уровнем топологической мультипликации (102-103 ячеек) позволяет достичь наиболее высоких уровней интеграции в сверх-, ультра-БИС и на целой пластине, не выдвигая завышенных требований к "интеллектуальным" и технологическим компонентам САПР.
Для систолических технологий характерно сочетание "алгоритмически ориентированного" задания функций, реализуемых отдельным элементарным вычислителем, сверхмассового ОКМД-параллелизма и (полу) заказной аппаратной реализации.
ЦПОС -технология первоначально была ориентирована на создание и использование программируемых однокристальных средств цифровой векторно-матричной обработки сигналов с модифицированной фон-неймановской архитектурой. Поэтому в первых ЦПОС был аппаратно реализован арифметический сопроцессор плавающей запятой, исполняющий в одном цикле базовую операцию векторно-матричной обработки в составе двух ассемблерных команд: "умножение + суммирование с накоплением", а внутренние шины команд и данных разделены, что соответствует гарвардской архитектуре.
По мере расширения конструктивно-технологических возможностей микроэлектроники в ЦПОС появились независимые адресные устройства и шины, а к концу 80-х годов на их основе стали строить многопроцессорные ВС со специализированными интерфейсами, что делает такие ВС эффективными только в определенных областях применения.
Основное системное ограничение, регламентирующее темп обработки данных (темп реального времени) в однокристальных ЦПОС, вытекает из теоремы Котельникова и фон-неймановской организации вычислений, которые в совокупности требуют, чтобы программа обработки завершилась за время формирования одного отсчета сигнала. В результате при относительно несложной программе обработки из 10^{3} реально исполненных одноцикловых инструкций темп обработки данных в ЦПОС, работающих
на тактовой частоте 0,3-1 ГГц, находится в пределах 100-300 кГц, что ограничивает спектр обрабатываемых сигналов ультразвуковым диапазоном.
В RISC -технологии основная ставка делается на снижение аппаратно-временных системных издержек в ВС с высоким уровнем (102-103) распараллеливания вычислений, что достигается эффективной компиляцией с языка высокого уровня на уровень сокращенной системы команд ассемблерного уровня с постоянным циклом исполнения. В результате освобождается площадь кристалла для расширенной системы внутренних регистров, значительно упрощается устройство и процесс асинхронного управления, а значит, и повышается скорость обработки. При этом возрастает частота обращений к памяти, но падает продолжительность цикла обращения к ней, которое в RISC -процессорах находится в соотношении 2:1 ко времени выполнения команд. Для сравнения, в CISC -процессорах такое соотношение составляет 5:1.
Чтобы сохранить соотношение 2:1 в многопроцессорных RISC -системах, их память должна быть распределенной, а чтобы повысить эффективность межпроцессорного обмена, чаще всего прибегают к сети, построенной по типу "ножка в ножку" с ближайшими соседями. Базовые положения этой технологии были апробированы в транспьютерных ВС, управление которыми обычно ведется методом волнового фронта, который представляет собой частный случай управления потоком данных.
Существенно, что бит-процессорная, ЦПОС - и RISC -технологии реализуются через инструментальные кросс-системы и, как правило, не имеют собственных операционных систем, а в ответственных случаях эксплуатации и боевого применения поддерживаются наиболее устойчивыми к внешним воздействующим факторам КНД- и сапфировыми технологиями изготовления элементной базы [136] (КНД - кремний на диэлектрике).
Современные CISC -технологии базируются на концепции языков высокого уровня, где аппаратные платформы строятся исходя из:
- повышения эффективности выполнения программ, написанных на языках высокого уровня;
- уменьшения нагрузок на компиляторы за счет перераспределения части их функций в сторону аппаратуры;
- увеличения надежности программного обеспечения. Поставленные цели в CISC -технологии достигаются благодаря сближению структуры языка высокого уровня со структурой операций, реализуемых на уровне машинных команд, и со структурой управляющей информации.
Из приведенных данных можно заключить:
- Современные технологии погружения задач пользователей в аппаратуру (Б)ВС исходят из их формализованной постановки, что требует опережающих, комплексных, фундаментальных исследований предметной области создания и использования ВВТ и средств управления ими, включая и вычислительную технику.
- В зависимости от соотношения между требуемой и предоставляемой пропускной способностью (Б)ВС в современных технологиях погружения задач пользователей на уровень аппаратуры задействован широкий спектр методов и приемов от прямого отображения структуры аппаратуры в структуру языка ( CISC -технология) до прямого отображения структуры задачи в вентильную структуру заказной сверх- или ультра-БИС (кремниевая компиляция).
- С позиций "быстрого" и "бездефектного" проектирования аппаратуры кремниевая компиляция [98, 99, 137, 153] является универсальным средством, используемым во всех технологиях, которые в этом смысле отличаются только уровнем детализации в стандартизованных спецификациях реализуемых аппаратных проектов (рис. 6.2):
- в CISC -, ЦПОС - и RISC -технологиях - с точностью до списка стандартных команд ассемблера (слов-команд);
- в ПЛИС - и бит-матричных технологиях - с точностью до однобитных и булевых операций.
- Одно из главных достоинств кремниевой компиляции состоит в том, что она служит базой для комплексной системы диагностики, перекрывающей весь жизненный цикл от разработки средств вычислительной техники до ее эксплуатации и боевого применения в составе технотронных комплексов ВВТ, так как встроенные средства диагностики являются неотъемлемыми атрибутом сверх- и ультра-БИС, причем создание средств диагностики должно вестись нисходящим проектированием от задач, решаемых пользователем, и ограничений их правильного решения со стороны условий эксплуатации и боевого применения ВВТ и до аппаратурных блоков обнаружения и парирования отказов, которые вступают в конкуренцию за площадь кристаллов с основными функциональными блоками.
- Современные кремниевые компиляторы специфицируют проект с точностью до маршрутной карты выращивания твердотельных или оптоэлектронных вентилей и обеспечивают выход на серийный выпуск сверх- или ультра-БИС в течение 3-6 месяцев. Несмотря на такую относительно высокую инерционность реализации проекта, кремневую компиляцию можно взять за основу перспективных технологий синтеза вычислительных супрамолекулярных соединений, в которых темп структурно-функциональной реконфигурации может быть приближен к темпу реального времени.
- В средней перспективе структурно-функциональную реконфигурацию вычислительных (био)кристаллов и супрамолекулярных соединений можно проводить на основе более мобильных ПЛИС - и битпроцессорных технологий, которые с точки зрения распределения функций между разработчиком и пользователем сверх- или ультра-БИС обеспечивают наиболее высокий уровень функциональной интеграции реализуемого проекта, уступающий только кремневой компиляции.
увеличить изображение
Рис. 6.2. Спецификация стандартных технических решений современных копьютерных проектов - С учетом того, что система рис. 6.1 на всех этапах формализации и погружения задач пользователя на аппаратный уровень их реализации поддерживается (мини)супер-ЭВМ и рабочими станциями, оснащенными интерактивными программными оболочками, кремниевая компиляция является логическим завершением сквозной индустриальной технологии проведения фундаментальных и прикладных исследований с минимальным циклом внедрения их результатов в производство сложных технотронных изделий военного назначения.
- Одним из решающих факторов минимизации цикла освоения в промышленности результатов фундаментальных и прикладных исследований служит интегрированная система диагностики технотронных изделий. Разработка таких диагностических систем является наиболее время- и трудоемким этапом приборных ОКР и должна вестись параллельно и одновременно с постановкой задач предметной области, но с учетом вариации всех системотехнических и физико-технических параметров, прямо или косвенно влияющих на работоспособность технотронных систем двойного назначения.