Зведений каталог бібліотек Харкова

 

Чанышев, О. Г.
    Метод автоматической кластеризации текстов на основе анализа пересечений кластеров доминант [Текст] / О.Г. Чанышев // . — С. 2-7.


- Анотація:

Основная цель работы — определение пар текстов с максимальной тематической близостью из заданного множества. Каждый текст представлен доминантами с непустыми вербальными кластерами (частичными лексико-семантическими полями). В качестве меры близости пары текстов принята сумма "степеней смысловых подобий доминант". "Степень смыслового подобия доминанты" есть сумма отношений размера пересечения ее вербальных кластеров в различных текстах к размерам кластеров. Приведены результаты экспериментов по кластеризации с использованием различных методов "взвешивания" слов. Ключевые слова: кластеризация текстов, бинарные классифицирующие таксоны, доминанты, кластеры слов, лексико-семантическое поле, степень смыслового подобия

- Є складовою частиною документа:

- Теми документа

  • УДК // Обчислювальна математика. Числовий аналіз



Наявність
Установа Кількість Документ на сайті установи
Науково-технічна бібліотека Національного аерокосмічного університету ім. М.Є. Жуковського   Перейти на сайт