Зведений каталог бібліотек Харкова

 

Крижановский, А. А.
    К вопросу об индексировании вики-текстов [Текст] / Учреждение Российской академии наук Санкт-Петербургский ин-т информатики и автоматизации РАН // Известия РАН.Теория и системы управления  : научный журнал / РАН. Известия АН. — C. 121-129.


- Анотація:

Новый тип документов в вики-разметке завоевывает Интернет. Это выражается не только в увеличении количества интернет-страниц в этой разметке, но также и в популярности вики-проектов (в частности, Википедии), поэтому все более актуальной становится задача поиска в вики-текстах. Предложен и реализован способ индексации текстов Википедии на трех языках: русском, английском и немецком. Рассмотрена архитектура системы индексирования, включающая программные модули GATE и систему лемматизации Lemmatizer. Описаны правила преобразования вики-текстов в тексты на естественном языке. Построены индексные базы русской Википедии и Simple English Wikipedia. Проверено выполнение закона Ципфа для текстов русской Википедии и Simple English Wikipedia.

- Є складовою частиною документа:

- Теми документа

  • УДК // Обробка слів. Обробка текстів



Наявність
Установа Кількість Документ на сайті установи
Науково-технічна бібліотека Національного аерокосмічного університету ім. М.Є. Жуковського   Перейти на сайт