Дана стаття присвячена рішенню питання розробки алгоритму автоматизованого визначення емоційного забарвлення природномовних текстів. При цьому використано комбінований підхід з використанням класи-фікатора текстових даних і аналізу синтаксичних зв'язків між словами в тексті. Це дозволяє враховувати не тільки емоційне забарвлення (тональність) окремих слів, але і тональність груп синтаксично пов'язаних слів. Такі групи складаються зі слів, що мають емоційне забарвлення і безпосередньо беруть участь у формуванні тональності тексту, та слів, що підсилюють або послаблюють тональність інших слів в межах групи. Такий підхід передбачає ранжирування текстових даних за категоріями емоцій, а також розширюваність за рахунок можливості додавання нових категорій емоційного забарвлення текстових даних. На основі даного подходу ррозроблено алгоритм автоматизованого визначення эмоційного забарвлення природномовних текстових даних.
Данная статья посвящена решению вопроса разработки алгоритма автоматизированного определения эмоциональной окраски текстов на естественном языке. Для решения поставленной задачи предложено использовать комбинированный подход с использованием классификатора текстовых данных и анализа синтаксических связей между словами в тексте. Это позволяет учесть не только эмоциональную окраску (тональность) отдельных слов, но и тональность групп синтаксически связанных слов. Такие группы состоят из слов, имеющих эмоциональную окраску и непосредственно принимающих участие в формировании тональности текста, и слов, усиливающих или ослабляющих тональность других слов в пределах группы. Такой подход предусматривает ранжирование текстовых данных по категориям эмоций, а также расширяемость за счет возможности добавления новых категорий эмоциональной окраски текстовых данных. На основе данного подхода разработан алгоритм автоматизированного определения эмоциональной окраски текстов на естественном языке.
This article is devoted to solving the problem of the automated computation of emotional coloring of natural language text. In this case a combined approach is used. This approach provides the categorization of text data and the analysis of syntactic relations between words in this text. It enables to consider the emotional color (tonality) of individual words, but the key groups of syntactically related words. These groups are composed of emotionally colored words and words that amplify or weaken the emotional coloring of other words within the group. This approach provides the ranking of text data into categories of emotions and enables to add new categories of emotions. An algorithm of the automated computation of emotional coloring of natural language text based on this approach is developed.