-
Ключові слова:
мето... ; інформаційні технології, ІТ, информационные технологии, ИТ, information technologies ; модифікація, модификация ; IT-technologies, IT-технології, IT-технологии
-
Анотація:
Проводится сравнительный анализ методов классификации текстовых документов. Рассматривается метод ближайшего соседа как один из наиболее точных методов для разбиения массива документальной информации на классы, обсуждаются его преимущества и недостатки. Предложен ряд новых модификаций метода ближайшего соседа, компенсирующих его основные недостатки, даны рекомендации по выбору настраиваемых параметров методов. Кроме того, в работе большое внимание уделяется проблеме обучения классификаторов на выборках фиксированного размера и анализу их точностных свойств.
-
Зміст:
Приложение к журналу " Информационные технологии"
-
Є складовою частиною документа:
|