конструкційна граматика, конструкционная грамматика ; українське мовознавство, украинское языкознание ; фразеологізми, фразеологизмы
Статтю присвячено статистичному аналізу фразеологізованих речень української мови. Обґрунтовано доцільність застосування статистичного критерію mutual information для встановлення коефіцієнта невипадковості певної послідовності слів у тексті.
Наведено результати обчислення mutual information для моделей фразеологізованих речень за даними Українського національного лінгвістичного корпусу. Доведено, що всі проаналізовані моделі речень мають високий ступінь невипадковості компонентів, що входять до складу незмінної частини речення. Для обстежуваних одиниць запропоновано обчислення модифікованого показника МІ - МІ3 (МІ - mutual information).
Зіставлено отримані дані з відповідними показниками МІ та МІ3 для лексичних фразеологізмів та нефразеологізованихречень. Виділено чинники, які впливають на коректність здійснених підрахунків.
Статья посвящена статистическому анализу фразеологизированных предложений украинского языка. Обоснована целесообразность применения статистического критерия mutual information для установления коэффициента неслучайности определенной последовательности слов в тексте.
Приведены результаты вычисления mutual information для моделей фразеологизированных предложений по данным Украинского национального лингвистического корпуса. Доказано, что все проанализированные модели предложений обладают высокой степенью неслучайности компонентов, которые входят в состав неизменяемой части предложения. Для исследуемых единиц предложено вычисление модифицированного показателя МІ - МІ3.
Полученные данные сопоставлены с соответствующими показателями МІ и МІ3 для лексических фразеологизмов и нефразеологизированных предложений. Выделены факторы, влияющие на корректность проведенных расчетов.
The article is devoted to the statistical analysis of the sentences with phraseological structures of the Ukrainian language. Expediency of application of cal criterion of mutual information was substantiated for determining the nonrandom measure of a certain sequence of words in the text.
There were provided the results of mutual information computation for the models of sentences with phraseological structures according to the data of Ukrainian National Linguistic Corpus. There was proved that all the analyzed sentences models have a high degree of components non-randomness that make up invariable part of the sentence. There were suggested the computation of the modified measure of МІ - МІ3 for the researched units.
Obtained data was compared with the corresponding measures of MI and МІ3 for lexical phraseologisms and non-idiomatic sentences. There were singled out the factors that affect the correctness of calculations performed.