Россия, Москва |
Самоорганизация (самообучение) нейронных сетей
Классификация без учителя
Задан набор объектов, каждому объекту поставлен в соответствие вектор значений признаков (строка таблицы). Требуется разбить эти объекты на классы эквивалентности. Для каждого нового объекта нужно:
- Найти класс, к которому он принадлежит.
- Использовать новую информацию, полученную об этом объекте, для исправления (коррекции) правил классификации.
Отнесение объекта к классу проводится путем его сравнения с типичными элементами разных классов и выбора из них ближайшего.
Простейшая мера близости объектов - квадрат евклидова расстояния между векторами значений их признаков (чем меньше расстояние, тем ближе объекты). Соответствующее определение признаков типичного объекта - среднее арифметическое значение признаков по выборке, представляющей класс. Другая мера близости, возникающая при обработке сигналов, изображений и т.п. - квадрат коэффициента корреляции (чем он больше, тем ближе объекты). Возможны и иные варианты.
Если число классов заранее определено, то задачу
классификации без
учителя можно поставить следующим образом.
Метод динамических ядер в классификации без учителя
Пусть задана выборка предобработанных векторов данных -
пространство векторов данных. Каждому классу будет соответствовать
некоторое ядро
- пространство ядер.
Для любых и
определим меру
близости
, а для каждого набора
из
ядер
и любого разбиения
на
классов
определим критерий качества
![]() |
( 1) |
Требуется найти набор и разбиение
, минимизирующие
Шаг
алгоритма разбиваем на
этапа:
1) Для фиксированного набора ядер ищем
минимизирующее
разбиение
; оно дается следующим решающим правилом:
, если
при
(когда для
минимум
достигается
при
нескольких значениях
, выбор между ними может быть сделан
произвольно).
2) Для каждого , полученного на первом
этапе, отыскивается
, минимизирующее критерий качества

Начальные значения ,
выбираются произвольно либо по
какому-нибудь эвристическому правилу. Если ядру
ставится в
соответствие элемент сети, вычисляющей по входному сигналу
функцию
, то решающее правило для классификации дается
интерпретатором
"проигравший забирает все": элемент
принадлежит
классу
, если выходной
сигнал
-го элемента
меньше всех остальных.
Мера близости
выбирается такой, чтобы легко можно было найти ядро
, минимизирущее
для данного