Россия, Москва, МЭИ, 2006 |
Нейрофизиологический и формально-логический базис нейроподобных вычислений
4.5. Многопороговые модели
Рассмотренные формальные модели нейронов и нейронных структур типа перцептрона в своей основе используют некоторые пороговые правила "принятия решений" на этапе формирования выходной реакции, для исследования которых был разработан аппарат пороговой логики [77]. В рамках этой теории классическую (много)пороговую модель формального нейрона, которая отражает основные электрофизиологические свойства реального нейрона [56], можно представить в импликативной форме:
( 4.4) |
Здесь - -мерный входной вектор с компонентами ; компоненты "весового" вектора принимают значения ; индекс представляет ранг значения свертки (и однозначно связанного с ним вектора ) на скалярной оси ; - значения реализуемой логической функции ; ; ; , а вектор порогов разбивает множество скалярных произведений входного и "весового" векторов на пороговых полуинтервалов ; ; ; ; - отношение следования; - оператор подстановки (присваивания).
В отличие от формального нейрона Мак-Каллока - Питтса функциональная полнота многопороговых элементов и их моделей достигается только параметрической адаптацией, то есть вариацией весового и/или порогового векторов.
Если в (4.4) ввести ограничения на весовые коэффициенты типа , то получим систему мажоритарных пороговых правил формального нейрона Мак-Каллока - Питтса, а если зафиксировать систему связей между пороговыми элементами по типу "каждый с каждым", получим перцептрон Розенблатта.
Задачи оптимального синтеза (много)пороговых моделей сформулированы В.И. Варшавским (предисловие к [77]):
- Нахождение условий реализуемости произвольной логической функции той или иной многопороговой моделью.
- Синтез многопороговой модели по заданной логической функции и некоторому критерию качества.
- Синтез сети из многопороговых моделей по заданной логической функции и некоторому критерию качества.
Характеристики структурной сложности,связывающие задачи 1-3 в единую схему оптимального синтеза многопороговых моделей, введены Л.А. Шоломовым [78]:
- сложность (много)пороговой модели:
( 4.5) где - некоторые одновременно не равные нулю "стоимостные" коэффициенты реализации "единицы" веса и одного порога соответственно;
- сложность логической функции :
( 4.6) где минимум берется по всем многопороговым моделям типа (4.4);
- сложность класса логических функций (функция Шеннона):
( 4.7) где максимум берется по всем -значным логическим функциям
В такой постановке, как и в любой задаче поисковой оптимизации, основная сложность связана с реализацией критерия (4.7), который требует полного перебора всех логических функций из некоторого класса, а основная трудность связана с неопределенностью выбора шага вариации -мерного весового вектора .
Решая методом случайного поиска задачи оптимального синтеза (много)пороговых моделей, А.Т. Бахарев и Л.А. Растригин [79] обнаружили, что с позиций поиска минимума размерности вектора порогов значение имеют только те вариации весового вектора , которые нарушают отношение порядка (по индексу ) между значениями свертки на скалярной оси Например, для и (рис. 4.23) вариации весового вектора в пределах пирамид с вершиной в начале координат и с основаниями и т. д. дают фиксированный порядок следования индексов , упорядоченных по возрастанию значений свертки : , , .
Вариации весового вектора , которые сохраняют отношение порядка (по индексу ) между значениями свертки , получили название индексных зон [79]. Они позволяют заменить непрерывные вариации конечным набором целочисленных значений , отвечающих одному и тому же порядку следования индексов , и разбить весь процесс оптимального синтеза формальных нейронов на два этапа:
- абстрактно-логический, который осуществляется на множестве подстановок индексов и где определяются условия минимально пороговой реализации (много)пороговой модели;
- "физический", который обеспечивает переход от , заданным на упорядоченном целочисленном множестве , к и с непрерывными значениями компонент.
Работу (много)пороговой модели ((М)ПМ) типа (4.4) проиллюстрируем на примере ее настройки на реализацию булевых функций (БФ) двух переменных : "И" - ; "ИЛИ" - ; "НЕРАВНОЗНАЧНОСТЬ" - , и в предположении , . В этом случае значения свертки двумерных булевых -векторов , , и расположатся на скалярной оси в лексикографическом (по индексу ) порядке:
( 4.8) |
Отсюда, для настройки (М)ПМ на реализацию:
- БФ "И" необходимо, чтобы одномерный вектор порогов удовлетворял условию , а правило подстановки значений функции над двумя пороговыми полуинтервалами имело вид: , ;
- БФ "ИЛИ" необходимо, чтобы при сохранившемся правиле подстановки одномерный вектор порогов принимал значение ;
- БФ "НЕРАВНОЗНАЧНОСТЬ" необходимо, чтобы вектор порогов был двумерным с компонентами и , а прави-ло подстановки значений над тремя пороговыми полуинтервалами имело вид ; ; .
Вариации значений компонент весового вектора, размерности и значений компонент вектора порогов обеспечивают реализацию произвольной ЛФ переменных, причем не каждая вариация весового вектора изменяет отношение порядка (по индексу ) между значениями свертки на скалярной оси . Так, при и лексикографический порядок сохранится: , а при и он нарушится:
( 4.9) |
то есть вместо порядка следования индексов вида в (4.8) получили порядок следования в (4.9).
Такой "перестановочный" эффект значений свертки на оси служит источником минимизации размерности вектора порогов или, что одно и то же, системы решающих правил в (М)ПМ. Например, для БФ при лексикографическом порядке требуется (М)ПМ с двумя порогами и , а при порядке следования (4.9) - с одним порогом и системой решающих правил , .
В [79, 80] проанализированы условия эквивалентного перехода от (М)ПМ с аналоговыми параметрами ( и ) к (М)ПМ с дискретными параметрами. Было показано, что перестройка входного преобразования (М)ПМ, связанная с вариациями весового вектора, приводит к различным -перестановкам упорядоченных компонент свертки на скалярной оси . В результате полная вариация весового вектора порождает множество перестановок значений компонент свертки и связанных с ними индексов , что и позволяет разбить все пространство на классы эквивалентности , такие, что вариации внутри класса не нарушают связанного с этим классом отношения порядка между значениями компонент свертки.
Структура пространства индексных зон (ИЗ) или, что одно и то же, вариации , сохраняющие отношение порядка , зависит от размерности входного вектора и значности его компонент, что иллюстрирует рис. 4.24 [79, 80], где показаны все восемь индексных зон для . Из рис. 4.24 видна центрально-осевая симметрия пространства индексных зон, что позволяет ограничить анализ их структуры только первым (гипер)октантом.
Если в трехмерном случае индексные зоны представляют собой пирамиды с вершинами в начале координат, то в двумерном случае это уже сектора, заключенные между наклонными линиями на целочисленной решетке, которая задается значениями компонент входного вектора .
Равномерность разбиения пространства на индексные зоны нарушается уже при (рис. 4.25), что приводит к разно "устойчивой" реализации ЛФ, зависящей от выбранного значения весового вектора.
Из сказанного следует, при фиксированном векторе порогов и правиле подстановки вариации весового вектора внутри индексной зоны изменяют значения , но не нарушают отношение порядка между ними, а значит, и задаваемое (4.4) правило реализации ЛФ. Например, в заштрихованной индексной зоне (рис. 4.2) отношение порядка имеет вид . Здесь для определенности указаны значения отвечающие . Тогда при реализуется ЛФ "И" , если правило подстановки имеет вид , . Переход в индексную зону с номером 2 сопровождается инверсией неравенства , которая приводит к новому порядку следования на скалярной оси . Однако он не нарушает правила подстановки, задаваемые функцией "И". Если (М)ПМ настроен на ЛФ то такая же вариация весового вектора (при неизменном правиле подстановки ; и ) приведет к реализации ЛФ .
Таким образом, с позиций устойчивой реализации заданной функции вида (4.4) необходимо как минимум сохранить отношение порядка (при фиксированном правиле разбиения и правиле подстановки ), а при перестройке (М)ПМ с одной функции на другую при той же системе решающих правил надо перейти в другую ИЗ, то есть изменить отношение порядка.