Оценка деловых текстов XVIII и XIX веков некоторыми лингвистическими программами



Скачать 32,07 Kb.
страница2/7
Дата04.03.2023
Размер32,07 Kb.
#205301
ТипНаучная работа
1   2   3   4   5   6   7
Связанные:
Оценка деловых текстов XVIII и XIX веков некоторыми лингвистическими программами

Объект исследования: онлайн-сервисы текстового анализа Advego, Text.ru, Орфограммка и Главред и словосочетания, относящиеся к состоянию русского языка XVIII-XIX вв.
Предмет исследования: возможность выявления «устаревших» словосочетаний с помощью онлайн-сервисов текстового анализа.
Материал:

  • фрагменты из романа И. А. Гончарова «Фрегат “Паллада”»,

  • фрагмент делового письма Г. Р. Державина, помещенного в 6 томе «Сочинений Державина с объяснительными примечаниями Я. Грота» под №774.

Цели:

  • проанализировать возможности используемых сейчас онлайн-сервисов анализа текста,

  • выявить сходства и различия между этими программами,

  • проанализировать, выявляют ли программы анализа текстов Advego, Text.ru, Орфограммка и Главред словосочетания:

а) которые не соответствуют современным грамматическим правилам,
б) в которых не соблюдена лексическая сочетаемость.
Задачи:

  • оценить фрагменты названных произведений с использованием онлайн-сервисов анализа текстов Advego, Text.ru, Орфограммка и Главред;

  • проверить, какие ошибки они выявляют.

Методы: эксперимент.
Рабочая гипотеза: те словосочетания, связь внутри которых построена по правилам, актуальным для XIX в., но не для XXI в., будут оценены всеми программами как ошибочные.
Глава 1. Обзор онлайн-сервисов текстового анализа
В данной работе мы рассмотрим онлайн-сервисы текстового анализа Advego, Text.ru, Орфограммка и Главред. Такой выбор был сделан вследствие их возможности выявлять грамматические, орфографические, пунктуационные и логические ошибки.
Программа Advego прежде всего ориентирована на SEO-анализ текстов. С его помощью в данной системе можно определить:

  1. Частотность каждого встретившегося слова в процентах. Это позволяет оценить, по каким запросам выдача данного отрезка наиболее вероятна.

  2. Объем текста: количество символов с пробелами и без пробелов.

  3. Общее количество слов:

  4. Количество стоп-слов – тех слов, наличие которых в запросе игнорируется поисковыми системами. То есть, при ответе на запрос веб-документы (в т. ч. и анализируемый текст) будут отобраны независимо от наличия в них этих слов.

  5. Количество уникальных слов:

  6. Количество значимых слов:


  7. Скачать 32,07 Kb.

    Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7




База данных защищена авторским правом ©psihdocs.ru 2023
обратиться к администрации

    Главная страница