-
Ключові слова:
технологія інформаційна, технология информационная, IT, ИТ ; документ електронний, документ электронный ; хешування, хэширование ; Техніка, с.г., медицина
-
Анотація:
Дисертація присвячена проблемі плагіату наукових та інших робіт, яка завдяки росту комп'ютерної грамотності населення та проникненню Інтернету у всі сфери життя набуває все більшого масштабу. В рамках дисертаційного дослідження розроблені моделі та методи, які дозволяють визначити нечіткі збіги в тексті, зображеннях та таблицях документу, навіть при значних структурних змінах контенту. Запропоновано концептуальну модель технології визначення нечітких збігів, модель індексу документу та модель нечіткого збігу. Для підготовки тексту запропоновано використовувати засоби виправлення помилок в словах, відкидання стоп-слів і стоп-фраз, методи канонізації, десинонімізації та методи заміни антонімів. Розроблено метод створення індексу документу з використанням локально-чутливого хешування, та метод фільтрації помилкових збігів. Для графічних зображень запропоновано методи фрагментації та визначення базового кута повороту зображення. Для таблиць запропоновано методи визначення шапки таблиці та індексації по стовпцях і рядках.
-
Теми документа
-
ББК науковий // Елементарна теорія чисел
|