Предложен алгоритм выявления новых событий, позволяющий улучшить качество отбора новостей из сети Интернет путем повышения оперативности, точности и полноты выбора новой информации из массива документов. Алгоритм реализует функцию выделения ключевых слов и словосочетаний, встречающихся в публикациях, и сравнения содержания текстов по ним. Ключевые слова: текст, обработка текста, мера Солтона, семантическое сходство, семантическое расстояние, мера близости, алгоритм фильтрации текстов, новая информация.