Добрый день!
Скажите, пожалуйста,планируется ли продолжение курсов по нанотехнологиям? Спасибо, Евгений
|
Термальный синтез микропрограмм алгоритмически ориентированных МКМД-бит-потоковых субпроцессоров
5.2. Термальный синтез DD-ассоциативных вычислительных конструкций алгоритмически ориентированного субпроцессора подстановки данных
Чтобы перейти от интерактивного к формализованному синтезу микропрограмм МКМД-бит-потоковых субпроцессоров, прежде всего необходимо формализовать синтез библиотечных слов- и поток-инструкций, а также процедур их компоновки на бит-матрице и редак-
тирования пространственно-временных FIFO -регистровых связей между операционными модулями, где локальный фазовый сдвиг даже на 1 такт приводит к потере работоспособности всего субпроцессорного тракта. Именно последнее обстоятельство делает сходными проблемы фазирования в МКМД-бит-потоковых технологиях с проблемами (де)когерентиза-ции в супрамолекулярных, наноэлектронных и квантовых вычислителях (см. раздел 7.3 [94]).
Как показал опыт, для успешной формализации процедур синтеза библиотечных слов-инструкций в МКМД-бит-потоковых технологиях требуется промежуточный (термальный) уровень декомпозиции функций, в "терминах" которого описывается рекуррентный алгоритм работы соответствующего операционного модуля, топологическая схема которого в основном определяется разрядностью и размерностью циклически преобразуемых операндов .
Методику термального синтеза микропрограмм слов- и поток-инструкций в полной мере иллюстрируют рекуррентные процедуры построения операционных модулей поток-инструкции перестановки данных ( TRANS ) по верхнему индексу , которые гарантированно удовлетворяют системообразующее для МКМД-бит-потоковых технологий неравенство (6.1) курса "Задачи и модели вычислительных наноструктур", если используются в большом количестве циклов . При этом возможны два случая, когда синтезированный поток-оператор покрывает все факториальное пространство подстановок :
- без изменения топологии микропрограммы, то есть только за счет вариаций порядка следования псевдослучайных адресов что характерно для классических DD-ассоциативных конструкций;
- с изменением топологии микропрограммы в зависимости от содержимого потока адресов и/или преобразуемого потока данных что характерно для PD-ассоциативных конструкций.
Здесь ; ; !, и в каждом -м цикле выполняемая подстановка может изменяться, сохраняя свои параметры ; . Сокращенная формальная запись -й подстанов-ки содержит только множество транспозиций: , где и .
Учитывая, что любая конечная группа изоморфна некоторой (под)груп-пе подстановок, такой субпроцессор можно считать теоретико-групповым [103], если поток-оператор TRANS дополнить системными средствами поиска по заданной группе изоморфной ей подгруппы подстановок.
В традиционной вычислительной технике для выполнения подстановок обычно используют ЗУПВ в одном из двух режимов:
- запись потока входных данных в ячейки памяти в порядке их поступления, то есть по индексу , где , и чтение ячеек памяти в порядке подстановки, то есть по индексу ;
- запись потока входных данных в ячейки памяти в порядке подстановки: и чтение ячеек памяти в хронологическом порядке по .
С системотехнических позиций оба режима эквивалентны, так как требуют одних и тех же объемов памяти - бит, и используют ЗУПВ с разделением времени между фазами записи и чтения. В результате цикл выполнения подстановки оказывается равным , что снижает в 2 раза регламентируемый теоремой Котельникова предельный темп поступления и обработки сигналов и изображений. Чтобы компенсировать такие временные издержки, используют парафазную схему включения двух блоков ЗУПВ, что позволяет совместить во времени фазу записи -й подстановки в одном блоке, с фазой чтения -й подстановки в другом блоке. В результате в 2 раза возрастает объем используемой ЗУПВ, но "средний" цикл выполнения одной подстановки становится равным S.
В операционном модуле МКМД-бит-потоковой инструкции используется не ЗУПВ, а -битных FIFO -регистров, причем каждая, в том числе и "тождественная транспозиция" -й подстановки выполняется линейной последовательностью из 3 слов-инструкций:
- дешифрации адреса - ,
- записи и хранения - ,
- чтения - .
Ограничим рассмотрение различных вариантов реализации МКМД-бит-потоковой инструкции и вторым режимом работы FIFO -регистровой памяти, считая, что индекс подстановки меняется с максимально возможной скоростью, то есть на каждом -м цикле использования поток-оператора, и поэтому .
В DD -ассоциативной векторно-конвейерной поток-инструкции снимается ограничение на и каждая из "транспозиций", входящих в -ю подстановку, выполняется линейной последовательностью слов-инструкций:
-
Дешифратор адреса -й "транспозиции" представляет собой строку матрицы (терм) из 7 бит-процессоров (рис. 5.3), на выходе каналов АЛУ которой реализуется преобразование:
( 5.1) где все аргументы и параметры целочисленные:
- - подстановочный адрес -й "транспозиции";
- - натуральный ряд чисел, задающих номера строк бит-матрицы или, что одно и то же, пространственные адреса кольцевых FIFO -регистров , которые заносятся со сдвигом влево и циклически воспроизводятся на выходах бит-инструкций первого столбца матрицы;
- - начальная задержка потоков псевдослучайных адресов и преобразуемых потоков данных , которая может появиться во входном интерфейсе субпроцессора при компоновке слов-инструкций на бит-матрице (в библиотечном модуле );
- - суммарная "технологическая" задержка на выходе -й слов-инструкции , где включает: 1 такт - на , 3 такта - на (монтажное "ИЛИ"), 1 такт - на и 2 такта - на , из которых только в задержка зависит от (в данном случае бит и тактов);
- - "технологическая" задержка на распространение и по каналам транзита соответственно до входа и выхо-да -й слов-инструкции , то есть -й строки бит-матрицы рис. 5.3;
- - функциональная задержка в каждой -й слов-инструкции , которая расходуется на размещение признака результата в старший ( -й) бит каждого -го цикла сравнения;
- - фазовый сдвиг и соответственно в бит-потоках данных и , где и ;
- - хронологический адрес синхронного поступления и на соответствующие входы ;
- - период активности поток-инструкции на циклах ее использования, так как по условиям правильной работы требуется, чтобы в потоке данных и псевдослучайных адресов только первые -битных слов были значащими, а остальные слов - "нулевыми".
Главная особенность слов-инструкции состоит в потоковой реализации схемы "ИЛИ" с входами (бит-процессоры 3-5 столбцов рис. 5.3), где результат циклического сравнения пространственного и потокового адресов (бит-процессоры 2-го столбца матрицы) размещаются в 8-м бите каждого -го цикла. В дальнейшем содержимое этого бита циклически выделяется в бит-процессорах 7-го столбца матрицы, где и формируется -битный результат дешифрации .
-
Блок записи и хранения содержимого состоит из термов в виде кольцевых FIFO -регистров (строка бит-матрицы рис. 5.4), на каждом входе которого (бит-процессоры 2-го столбца) реализуется преобразование:
( 5.2) где:
- - суммарная "технологическая" задержка до выхода -й слов-инструкции , входящей в (для бит тактов);
- , и - соответственно начальное и конечное значение хронологического индекса на -м цикле использования ;
- - фактический цикл записи всего потока в в -м цикле использования поток-инструкции .
Циклическое (по ) хранение в кольцевых FIFO -регистрах на -м цикле их использования (выходы бит-процессоров 4-го столбца рис. 5.4) имеет вид:
( 5.3) где:
- - определяется той частью кольцевого циклического FIFO -регистра, которая заключена между его входом и схемой "И", обеспечивающей обнуление его содержимого с циклом тактов и период хранения в , равный тактов (для бит тактам);
- - поток "обнуляющих" операндов, который поступает на вход RS и который имеет циклический по вид и для всех .
-
Блок чтения содержимого кольцевых FIFO -регистров (термов) на -м цикле их использования (входы бит-процессоров 1-го столбца рис. 5.5 или, что одно и то же, выходы бит-процессоров 5-го столбца рис. 5.4) реализует преобразование:
( 5.4) где:
- - суммарная "технологическая" задержка до выхода слов-инструкции (для бит тактов);
- - сдвиг разделенных во времени фаз записи и чтения, а ;
- - поток управляющих операндов, который формирует-ся бит-процессорами 2-го и 3-го столбцов рис. 5.5, распространяется по строкам бит-матрицы с задержкой и имеет циклический по вид и для всех ;
- - циклическая по константа, которая задает однократный цикл "записи-чтения", равный тактов, и которая имеет вид: 1-й бит - "единица" и остальные биты - "нули";
- - циклическая по константа, которая задает разрядность обрабатываемых операндов и которая имеет вид: 1-й бит - "единица", а остальные бит - "нули".
-
Встроенный в блок вывода данных через -битный FIFO -порт, на выходе которого (выход вертикального канала транзита бит-процессоров 1-го столбца рис. 5.5) реализуется преобразование:
( 5.5) где: - "технологическая" задержка на распространение от -го входа и до выхода схемы "ИЛИ" с входами FIFO -регистрового порта вывода.
Из приведенных данных видно, что в соотношениях (5.1)-(5.3) в качестве хронологического используется индекс , а в соотношениях (5.4)-(5.5) в этом качестве выступает индекс .