-
Ключові слова:
програмування, программирование, programming ; процесор текстовий, процессор текстовый ; програмування системне, программирование системное ; система інформаційно-пошукова, система информационно-поисковая ; пошук документу, поиск документа ; пошук інформації, поиск информации ; інформація текстова, информация текстовая ; мова інормаційно-пошукова, язык информационно-поисковый
-
Анотація:
Описано підхід до пошуку дублікатів документів (або їх частин), наведених різними мовами. В основу підходу покладено використання частотних морфологічних словників, а також словників перекладів. Пошук дублікатів проводиться за допомогою виділених опорних слів, які витягаються за допомогою емпірико-статистичних правил, використання частотних словників та їх перекладів. Даний підхід реалізовано в системі континент-моніторингу InfoStream. Також у результаті виконання процедури пошуку діблікатів було створено двомовний паралельний корпус документів.
-
Є складовою частиною документів:
-
Теми документа
-
ББК науковий // Программирование для вычислительных систем и сетей
|