Методы статистического анализа литературных текстов

  • Автор: Юрий Орлов, Константин Осминин
  • Жанр: Наука
  • Серия: Синергетика: от прошлого к будущему
  • Год: 2012
  • Издательство: Либроком

В настоящей книге излагается новый подход к решению некоторых задач математической лингвистики, основанный на использовании кинетических уравнений, описывающих эволюцию выборочных функций распределения текста по буквам. Этот подход сочетает в себе методы традиционной математической статистики и статистической механики, модифицированные для применения их к нестационарным временным рядам, каковыми являются последовательности букв в тексте.
Центральной задачей, решаемой в данной работе, является идентификация автора и жанра "условно неизвестного" литературного текста в библиотеке известных текстов. Построен высокоточный метод идентификации, использующий функционал близости текстов как распределений пар букв в определенной норме.
Анализируются также статистические свойства распространенных европейских языков. Для них установлено полуэмпирическое распределение алфавитных символов по частоте встречаемости, которое оказалось зависящим от двух параметров - количества букв в алфавите данного языка и их соответствия звуковому ряду. Рассмотрены конкретные примеры статистического решения некоторых спорных вопросов об авторстве того или иного текста.

Юрий Орлов, Константин Осминин - Методы статистического анализа литературных текстов скачать fb2 бесплатно

К сожалению книгу удалена по просьбе правообладателя.

Учебное пособие обобщает опыт создания отечественных и зарубежных систем, реализующих автоматическое понимание текстов. Эти сложные "интеллектуальные" системы выделяются из множества систем, которых просто используется автоматическая обработка текста, поскольку автора интересует именно качественный…

Пособие посвящено новому направлению в прикладной лингвистике, в котором разрабатываются методы, позволяющие анализировать содержание текста, определяя, что говорится и что подразумевается, а также представлять его в явной (эксплицитной) форме. Разбираются примеры анализа феноменов языка и речи,…

Пособие обобщает и систематизирует материал по теории текста, содержит описание различных подходов к определению текста и его признаков, освещение текстовых категорий, основных средств межфразовой связи, а также типологии текстов. Основные понятия теории текста рассмотрены с позиций коммуникативной…

Пособие отражает опыт проведения лингвистического (и шире - филологического) анализа текста и опирается на достижения современного гуманитарного знания и интегральную концепцию языка. Первая часть посвящена определению места текста и его лексической структуры в кругу смежных явлений, а вторая -…

В книге доктора филологических наук В.Е.Чернявской рассматриваются ключевые лингвистические категории - стиль, текст, дискурс - в связи с проблемами филологической интерпретации научного текста. Анализируются особенности формулирования гуманитарных научных текстов, их смысловая и композиционная…

В монографии рассмотрены три метода минимизации ньютоновского типа для расчета установившихся режимов электроэнергетических систем (ЭЭС). Показано, что применение методов наиболее эффективно при использовании в качестве уравнений установившихся режимов ЭЭС уравнений баланса мощностей в узлах ЭЭС в…

Излагается новое направление теории матриц, основанное на использовании специально вводимого понятия иннора. Развиваемая группа методов позволяет по-новому подойти к решению многих задач, связанных с исследованием распределения корней многочленов, и, как следствие, к решению многих важнейших задач…

В монографии излагается класс итерационных методов решения операторных уравнений, содержащих принцип сжимающих отображений и, как частный случай, метод Ньютона. Исследуются алгоритмические особенности применения разработанных методов для решения задач статистической динамики и оптимального…

В монографии систематически изложен новый метод решения задач обратной динамики, основанный на использовании математической модели рассматриваемой динамической системы и робастных методов стабилизации неопределенных систем по выходу. Наиболее полно эта теория излагается для линейных конечномерных…

В настоящей книге рассмотрены вопросы структурной идентификации динамических систем на основе анализа наблюдаемых информационных портретов в условиях неопределенности. Предложены методы оценки состояния равновесия динамической системы. Описаны процедуры нахождения собственных чисел динамической…

В настоящей книге изложены идеи и методы статистической теории открытых систем. Автор рассматривает следующие основные проблемы: критерии относительной степени упорядоченности ложных движений; связь динамического и статистического описания, роль динамической неустойчивости движения в статистической…

В настоящей монографии исследуются процессы структурной организации и самоорганизации текста исходя из основных принципов теории симметрии и синергетики. Установлено разнообразие способов достижения гармонии формы, проанализирована система градационных моделей структуры текста. Функциональное…