Опубликован: 03.04.2013 | Уровень: для всех | Доступ: платный
Лекция 5:

Нейрофизиологический и формально-логический базис нейроподобных вычислений

4.3. Формальная модель нейрона и сети Мак-Каллока - Питтса

Одна из первых успешных попыток построения формальной модели реальных нейронов была предпринята в 1943 году физиологом У.С. Мак-Каллоком и математиком У. Питтсом [64]. Главное ее достоинство - это простота, которая, с одной стороны, позволяет проводить анализ функциональных возможностей сложных нейронных структур, что важно для нейрофизиологов, а с другой стороны - оценивать функциональную устойчивость нейроподобных вычислительных структур при флуктуациях порогов, что важно для инженеров.

В дальнейшем под формальным нейроном стали понимать элемент вычислительной машины, который обладает следующими свойствами [65]:

  1. Элемент имеет \delta нервных входных волокон и одно выходное волокно (аксон).
  2. Каждый вход и единственный выход могут находиться только в двух состояниях: "возбужден" или "не возбужден".
  3. Нервные волокна от некоторого входа могут разветвляться, но не могут объединяться с волокнами другого входа.
  4. Волокна могут быть возбуждающими (+1) или тормозящими (-1) (рис. 4.7-а). Волокно может также запирать сигнал, идущий по другому волокну (рис. 4.7-б).
    Условное изображение формального нейрона и его соединительных волокон

    Рис. 4.7. Условное изображение формального нейрона и его соединительных волокон
  5. Через нейрон и по нервным волокнам сигналы распространяются только в одном направлении.
  6. В формальном нейроне имеется конечная задержка на распространение сигнала от входа к выходу.
  7. При правильной работе нейрон возбуждается, если алгебраическая сумма возбуждающих и тормозящих сигналов превосходит некоторый фиксированный порог ?.

Фактически У. Мак-Каллоку и У. Питтсу удалось корректно формализовать известные на тот момент времени механизмы синаптической передачи электрофизиологических возбуждений (см. раздел 4.1).

Для описания логических функций, реализуемых формальным нейроном, используют диаграммы Венна, в которых логические переменные представлены следующими областями (рис. 4.8):

Диаграмма Венна для 2 и 3 переменных

Рис. 4.8. Диаграмма Венна для 2 и 3 переменных

Для изображения логических функций с помощью диаграмм Венна достаточно поставить точку в соответствующем месте:


Вид реализуемой формальным нейроном логической функции зависит как от правил соединения волокон, так и от значения порога. Если формальный нейрон имеет \delta входов, то множество возможных комбинаций значений входных сигналов насчитывает 2^{\delta} значений, которым на диаграмме Венна соответствует своя область. Поэтому каждой комбинации значений входных сигналов можно поставить в соответствие суммарное значение возбуждения, которое можно представить числом и записать его в соответствующую область диаграммы Венна. В результате каждый формальный нейрон рис. 4.9 можно представить эквивалентным нейроном рис. 4.10.

Формальные нейроны и соответствующие им диаграммы Венна [65]

Рис. 4.9. Формальные нейроны и соответствующие им диаграммы Венна [65]
В каждой области диаграммы Венна указана величина возбуждения при соответствующей входной комбинации [65]

Рис. 4.10. В каждой области диаграммы Венна указана величина возбуждения при соответствующей входной комбинации [65]

Возможен и другой вариант представления формального нейрона, когда в поля диаграммы Венна вписаны числа, отвечающие порядку появления соответствующей точки при возрастании порога исходного нейрона (рис. 4.11).

В каждой области диаграммы Венна указано число, соответствующее порядку появления точек при возрастании порога [65]

Рис. 4.11. В каждой области диаграммы Венна указано число, соответствующее порядку появления точек при возрастании порога [65]

Сетью Мак-Каллока называется объединение четырех или более рядов формальных нейронов без обратных связей типа рис. 4.12.

Сеть Мак-Каллока \delta=2 [65]

Рис. 4.12. Сеть Мак-Каллока \delta=2 [65]

Из приведенных данных следует:

  • одна и та же логическая функция (в данном случае это \overline{b} ) может быть реализована как одиночным формальным нейроном, так и сетью, элементы которой настроены на более "сложные" логические функции, то есть между "сложностью" функции и "сложностью" реализующей ее структуры нет и не может быть взаимно однозначного соответствия (структурно-функциональный полиморфизм);
  • формальный нейрон является функционально полным в том смысле, что его можно настроить на реализацию любой логической функции, в данном случае двух переменных.

При этом следует иметь в виду, что полнота формального нейрона достигается за счет его структурно-параметрической перестройки, то есть вариацией порога как параметра и схемы соединения с другими нейронами сети как структурного фактора.

Чтобы по известной структуре сети определить реакцию выхода, необходимо руководствоваться следующими правилами:

  1. Выходное преобразование нейрона первого ряда всегда совпадает с его логической функцией.
  2. Выходное преобразование нейрона второго (и последующего) ряда определяется в следующей последовательности:
    1. На диаграмме Венна одного из нейронов второго ряда рассматривается область, отвечающая a*b. Если в этом месте имеется точка,следует рассмотреть выходные диаграммы Венна нейронов первого ряда и найти среди них все общие множества, в которых и в левой, и в правой диаграммах имеются точки. Затем в выходной диаграмме Венна рассматриваемого нейрона второго ряда надо поставить точку (точки) в области (областях), соответствующих каждому общему множеству. (В схеме рис. 4.12 левый нейрон имеет точку в области a*b и оба нейрона первого слоя имеют общую точку в области \overline{a} * b, что и соответствует его выходной реакции.)
    2. Если в области a*b точка отсутствует, то анализируется область a* \overline{b} для всех нейронов второго ряда (движение против часовой стрелки по диаграмме Венна). Если такая точка имеется (в нашем случае это правый нейрон), то в диаграммах Венна нейронов первого ряда необходимо найти все общие множества, в которых в левой диаграмме имеется точка, а в правой отсутствует. В нашем случае данному условию удовлетворяет область a*\overline{b} левого и правого нейрона первого ряда, что порождает точку в аналогичной области правого нейрона второго ряда.
    3. Аналогично определяется выходная реакция для остальных областей диаграммы Венна второго ряда с той разницей, что для области \overline{a}*\overline{b} нейроны первого ряда не должны иметь точек в одинаковых областях, а для области \overline{a}*b точка должна быть в правой выходной диаграмме и ее не должно быть в левой. В нашем случае области \overline{a}*\overline{b} и \overline{a} *b точек не имеют, и поэтому процедура определения выходных преобразований нейронов второго ряда завершена.

Выходная реакция единственного нейрона третьего ряда, а значит, и всей сети определяется двумя точками собственной диаграммы Венна:

  • a*\overline{b} , что требует наличия точки в левой диаграмме второго слоя и ее отсутствия в правой; такому условию отвечает область \overline{a *b нейронов второго слоя, и поэтому в выходную реакцию всей сети проставляется точка в эту же область;
  • \overline{a} *b, что требует наличия точки в правой диаграмме второго слоя и ее отсутствия в левой; такому условию отвечает область a*\overline{b} нейронов второго слоя, и поэтому в выходную реакцию всей сети проставляется точка в эту же область.

Сети из формальных нейронов позволили перевести из абстрактной в инженерную плоскость исследования по синтезу надежных элементов из ненадежных компонент Дж. фон Неймана [66]. В частности, сеть рис. 4.13 логически устойчива при колебаниях порогов в пределах 75 %. (Сеть считается логически устойчивой, если она сохраняет реализуемую логическую функцию при одновременной флуктуации порогов составляющих формальных нейронов [65].)

В рамках этих исследований удалось показать [65]:

  1. Всегда можно построить логически устойчивую сеть, вычисляющую любую заданную функцию при колебаниях порогов у нейронов сети в пределах (1-2^{-\delta})*10^2.
  2. Если у всех составляющих сеть нейронов диаграммы Венна содержат одинаковое количество точек, то для \delta \ge 3 сеть сохраняет логическую устойчивость при флуктуациях порогов в пределах (1-1/\delta)*10^^{2 }.
Логически устойчивая сеть Мак-Каллока \delta=2 [65]

Рис. 4.13. Логически устойчивая сеть Мак-Каллока \delta=2 [65]

С.О. Мкртчян предложил схему формального нейрона с разрешающими взаимодействиями входных волокон [67], которые он привел к входам формального нейрона, дополнив пороговый элемент блоком входных логических преобразований (рис. 4.14 [68]), эквивалентных "сетевым преобразованиям" формального нейрона Мак-Каллока - Питтса.

При этом С.О. Мкртчян отказался от традиционного сетевого подхода к построению нейро-ЭВМ и сосредоточил свои усилия на синтезе традиционных блоков и устройств вычислительной техники на основе аппаратно реализованных формальных нейронов. В итоге были синтезированы все блоки и устройства традиционных ЭВМ, включая и конечные автоматы, основу которых составляют RS -триггеры (рис. 4.15).

Формальные нейроны с равноправными запрещающими и разрешающими входами [68]

увеличить изображение
Рис. 4.14. Формальные нейроны с равноправными запрещающими и разрешающими входами [68]
Схемы RS-триггеров на пороговых и формальных нейронах [68]

Рис. 4.15. Схемы RS-триггеров на пороговых и формальных нейронах [68]

Тем не менее, нейрокомпьютерная и компьютерная техника продолжили развиваться параллельными курсами, что можно объяснить следующими причинами. Технологические успехи микроэлектроники выдвинули на первый план не минимизацию затрат активных (преобразующих) элементов (транзисторов), а средств коммутации, которые стали основными "пожирателями" площади кристаллов и главными источниками временных и энергетических издержек обмена информацией СБИС с "внешней средой". Более того, нейроподобная элементная база в принципе не могла выиграть у традиционных булевых вентилей даже по удельным аппаратным затратам, измеряемым количеством вентилей на одну реализуемую логическую функцию в составе многофункционального или универсального (функционально полного) логического модуля, на что, собственно, и делал ставку С.О. Мкртчян [68]. В частности, на универсальный логический модуль, реализующий 16 логических функций двух переменных, требуется всего 9 вентилей "И - НЕ " и два инвертора. В результате удельные затраты булевых вентилей на 1 логическую функцию составляют ~10 вентилей / 16 функций, то есть 0,625 вентиля на функцию. Для реализации в микроэлектронном операционном базисе порогового элемента на два входа требуются одноразрядный сумматор, блок сравнения и регистры хранения порога и весовых коэффициентов, где только на одноразрядный сумматор расходуется порядка 9 вентилей типа "И", "ИЛИ" и 4 инвертора. Поэтому нейроподобная элементная база способна выиграть у традиционных булевых вентилей только в том случае, если используемый физико-технический процесс будет адекватен системе преобразований формального нейрона "суммирование - сравнение - подстановка".

Этим можно объяснить возрождение интереса к нейросетевым вычислительным устройствам, которое произошло в середине 80-х годов прошлого столетия благодаря Дж. Хопфилду и Д. Танку [69], предложившим эффективную процедуру обучения сетей Мак-Каллока - Питтса. Именно эффективное обучение нейросетей пока является главным преимуществом нейрокомпьютерных технологий перед традиционными компьютерными технологиями, где главные временные издержки сосредоточены в процедурах формализации и программирования, с помощью которых задачи пользователя преобразуются в булево представление, исполняемое элементной базой ЭВМ.

Дж. Хопфилд и Д. Танк предложили проводить обучение нейро-ЭВМ на принципах аналоговой вычислительной техники, когда поиск решения дискретной задачи осуществляется в непрерывном пространстве, в котором как раз и выполняются нейронные вычисления. При этом обучение формулируется как поиск глобального оптимума некоторой функции, для достижения которого требуется как минимум умение выбираться из локального экстремума, для чего в аналоговые цепи обычно встраивают некоторые параметры "прибыли", которые эквивалентны параметру "температуры" в машине Больцмана.

Для этих целей подходит модель нейроподобной сети, в которой состояние i -го формального нейрона описывается выходом V_{i}G{V^{0}i , V^{1}i } (излагается по [70]). Входные возбуждения формального нейрона формируются двумя источниками: внешним сигналом I_{i} и состояниями осталь-ных нейронов. Дж. Хопфилд ввел энергетическую функцию произвольного состояния симметрично связанной сети:

E = - \sum{T_{ij}*V_{i}*V_{j}} -\sum{I_{i}*V_i}, ( 4.2)

где первая сумма берется по i < j, вторая сумма просто по i, а T_{ij} представляет силу синаптического взаимодействия нейрона j с нейроном i (в биологической интерпретации).

Из (4.2) следует, что в энергетическую функцию нейросети вклад вносят только возбужденные нейроны, у которых V_i = 1, что соответствует состоянию " on " i -го нейрона, а невозбужденные нейроны, у которых V_i = 0 (состояние "off") никакого влияния на энергию всей сети не оказывают ни за счет первого, ни за счет второго слагаемого. Поэтому разность значений энергии i -го нейрона между его возбужденным и невозбужденным состояниями можно определить соотношением:

E_{i(on)} -  E_{i(off)}= 
\Delta{E_i} = -\sum{T_{ij}*V_{j}} - \sum{I_{i}} ( 4.3)

Если \Delta E_{i} отрицательна, то для минимизации энергии требуется усиление взаимодействий этого нейрона с остальными и/или внешней средой. В противном случае требуется ослабление такого взаимодействия.

В такой интерпретации локальные и глобальные минимумы можно рассматривать в качестве хранимых образцов, а нейросеть - как структурно организованную ассоциативную память, устойчиво воспроизводящую совокупность минимумов, свойственных только данной нейросети ("хранящую" значения p_{1}, p_{2}, p_{3}, p_{4} - рис. 4.16).

Сеть Хопфилда в качестве структурно организованной ассоциативной памяти [70]

Рис. 4.16. Сеть Хопфилда в качестве структурно организованной ассоциативной памяти [70]

С другой стороны, используя модель отжига для выхода сети из локального минимума, можно для каждого i -го элемента памяти вычислить (4.3). Доказано, что двоичный механизм поиска глобального минимума регулируется вероятностной функцией P_{i} = 1/(1+e^{\Delta{E_i}/T}), где переменная T аналогична температуре в модельном отжиге и по существу является масштабирующим множителем, управляющим интенсивностью "шума", который поддерживает флуктуационный характер изменения энергии в сети. При возрастании T P_{i}\to 0,5, и поэтому система ведет себя хаотично безотносительно к ограничениям в самой сети. При T = 0 и \Delta E_{i} = 0 система становится детерминированной ( P_{i} = 1 ) и скатывается в ближайший локальный минимум. Когда сеть Хопфилда - Танка достигает температурного равновесия, относительная вероятность ее нахождения в состоянии a по сравнению с вероятностью состояния b в данный момент времени T подчиняется распределению Больцмана: P_{a}/P_{b} = e^{-(Ea} ^{-Eb)/ T}.

Отсюда, состояние температурного равновесия не гарантирует достижения некоторого устойчивого состояния в сети, причем сами состояния продолжают варьировать даже при установившемся распределении вероятностей.

Наилучшая стратегия достижения температурного равновесия (признак конца обучения нейросети) при любой заданной температуре T состоит в том, чтобы стартовать с высокой температуры, сделав легко преодолимыми энергетические барьеры системы, и постепенно понижать T, повышая статус состояний с низкой энергией. В итоге при плавном

изменении температуры T можно с большой вероятностью попасть в глобальный минимум или остановиться в достаточной близости от него. Таким образом, на основе приведенных данных можно заключить:

  1. Несмотря на свою простоту, сети Мак-Каллока - Питтса достаточно удобны как для моделирования "случайных" процессов, протекающих в реальной нервной системе, так и для эффективного определения структуры "дочерней" нейросети и ее параметров (порогов), что является итого обучения.
  2. В сетях Хопфилда - Танка структурно-параметрические методы хранения информации используются на уровне не субнейрональных, а межнейрональных взаимодействий, когда хранимые нейросетью данные воспроизводятся при переходе в одно из устойчивых состояний после ее возбуждения.
  3. Главным препятствием на пути эффективного использования ней-роподобных компьютерных технологий является неадекватность физико-технических процессов (суб)микронной микроэлектроники, ориентированных на переключательный характер булевого операционного базиса и неадекватных системам пороговых преобразований, лежащих в основе формальных нейронов.
Максим Брагута
Максим Брагута
Россия, Москва, МЭИ, 2006
Nozimjon Fayziev
Nozimjon Fayziev
Таджикистан, Душанбе