Рассматривается подход, позволяющий эффективно индексировать базы данных, представляющие собой наборы документов. Предложен алгоритм построения индекса и приведена оценка его сложности. Описанный подход позволяет применять оптимальные индексы для широкого класса задач, в частности, для случаев поиска информации в реляционных базах данных, в полуструктурированных базах OEM-документов, а также для поиска в наборах XML-документов. Ключевые слова: полуструктурированные базы данных; алгоритмы индексирования данных, вероятностная оценка эффективности поиска.