Опис документа

багатотемні класифікації, многотемные классификации ; метод ідентифікації, метод идентификации ; природна мова, естественный язык ; текстові документи, текстовые документы

В дисертації запропоновано метод автоматичної ідентифікації мови з використянням статистик N-грам, проведено порівняльний аналіз різних способів класифікації текстових документів з метою вибору оптимальних за точністю і повнотою, запропонована класифікація природомовних текстових документів з використанням розробленого методу. Розвинуто метод автоматичного створення багатотемної класифікації текстових документів в реальному часі, створено програмний модуль для ідентифікації мови та класифікації багатотемних текстових документів. Таким чином, за допомогою цих методів,підвищена точність і швидкість класифікації, розроблені відповідні програмні засоби для використання в системах автоматичної обробки текстів в багатомовних інформаційних системах.