Зведений каталог бібліотек Харкова

 

ІНФАндрєєв, А. В.
    Розроблення бази даних тримовного словника та парсинг вхідних даних [Текст] : дипломна робота, пояснювальна записка / кер. роботи доц. Вечірська І.Д. ; ХНУРЕ, Кафедра Інформатики. — Харків, 2015. — 63 с.


- Анотація:

Роботу присвячено розробці технологій обробки природномовної інформації для побудови бази даних тримовного словника та парсингу вхідних даних. Вхідними даними являються зображення відсканованого словника та задана структура згідно з алфавітно-гніздовим принципом побудови словника. Для побудови бази даних використовувалася система управління базами даних MySQL, для розпізнавання тексту відсканованого словника використовувалась технологія оптичного розпізнавання тексту. Проведено дослідження структури словника, виділено правила побудови словникових статтей, а також проведено парсинг словника. Програму реалізовано у середовищі розробки Microsoft Visual Studio 2013, мови програмування C #, СУБД MS SQL, бібліотеки Emgu. ТЕРМІНОЛОГІЧНИЙ СЛОВНИК, БАЗА ДАНИХ , ПАРСИНГ ДАНИХ, СЛОВАРНА СТАТТЯ, КОМП'ЮТЕРНА ЛЕКСИКОГРАФІЯ . Работа посвящена разработке технологий обработки естественной информации для построения базы данных трехъязычного словаря и парсинга входных данных. Входными данными являются изображение отсканированного словаря и заданная структура согласно алфавитно-гнездовому принципу построения словаря. Для построения базы данных использовалась система управления базами данных MySQL, для распознавания текста отсканированного словаря использовалась технология оптического распознавания текста. Проведено исследование структуры словаря, выделено правила построения словарных статей, а также проведено парсинг словаря. Программа реализована в среде разработки Microsoft Visual Studio 2013, языка программирования C #, СУБД MS SQL, библиотеки Emgu. ТЕРМИНОЛОГИЧЕСКИЙ СЛОВАРЬ, БАЗА ДАННЫХ, ПАРСИНГ ДАННЫХ, СЛОВАРНЫЕ СТАТТЬИ, КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ The work is dedicated to the development of processing technologies natural information database trilingual dictionary and parsing data. The input data image is scanned dictionary. To build the database used database management system MySQL, scanned text recognition dictionary used OCR technology. A study of the structure of vocabulary, rules of construction marked a dictionary entry, and also the parsing dictionary. The program is implemented in development environment Microsoft Visual Studio 2013 programming language C #, database MS SQL, library Emgu. GLOSSARY, DATA BASE, PARSING DATA, COMPUTER LEXICOGRAPHY, SQL

- Теми документа

  • Дипломні роботи студентів ХНУРЕ // Дипломні роботи кафедри Інформатики (ІНФ)



Наявність
Установа Кількість Документ на сайті установи
Наукова бібліотека Харківського національного університету радіоелектроніки 1 Перейти на сайт