СРАВНИТЕЛЬНЫЙ АНАЛИЗ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ СИМВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
О. И. Нечаева
(Новосибирск)
Страницы: 57-70 Подраздел: АНАЛИЗ СИГНАЛОВ И ИЗОБРАЖЕНИЙ
Аннотация
Рассматриваются алгоритмы кластеризации символьных последовательностей с использованием расстояния Левенштейна, основанные на методе k-средних и нейронной сети Кохонена. Приводятся описание и сравнительная характеристика по времени и точности двух эвристических алгоритмов нахождения ядра в кластерах: алгоритма выбора ядра из кластера и алгоритма подсчета символов. Оценивается возможность применения метода k-средних с переходом к частотным словарям для кластеризации различных типов символьных последовательностей. Сравниваются по времени и качеству алгоритмы кластеризации векторов в евклидовом пространстве методом k-средних и с помощью нейронной сети Кохонена.
|