Контрольная работа по дисциплине «Теоретические основы информатики»



страница3/7
Дата14.12.2022
Размер1,13 Mb.
#196848
ТипКонтрольная работа
1   2   3   4   5   6   7
Связанные:
Парфенова Олеся Андреевна з19ПО(ба)Ин ТОИ вар5

Задание 1.





  1. Создайте таблицу «Частотность букв русского языка», используя MS Excel.

Создадим в MS Excel таблицу «Частотность букв русского языка». Данные для таблицы возьмем из сети Интернет (https://dpva.ru/Guide/GuideUnitsAlphabets/Alphabets/FrequencyRuLetters/)

Рисунок 1 – таблица «Частотность букв русского алфавита»
2. Cоставьте таблицу, аналогичную таблице «Частотность букв русского языка» (задание 1), определив вероятность каждого символа в тексте (по вариантам) как отношение количества одинаковых символов каждого значения ко всему числу символов в тексте. По формуле Шеннона подсчитайте количество информации, приходящейся на один символ.
Текст: С любопытством стал я рассматривать сборище. Пугачев на первом месте сидел, облокотясь на стол и подпирая черную бороду своим широким кулаком. Черты лица 17 его, правильные и довольно приятные, не изъявляли ничего свирепого. Все обходились между собою как товарищи и не оказывали никакого особенного предпочтения своему предводителю.
Для выполнения второго задания будем использовать MS Word и MS Excel. При проведении информационных измерений текст можно считать как набор (множество) букв русского алфавита. Каждый элемент этого множества (каждую букву) можно привести в соответствие с числами натурального ряда в результате чего получим конечное множество, над элементами которого можно производить измерения. Если общее число букв данного текста обозначить через N2, а через Ni – количество конкретной i-ой буквы, то можно рассчитать

как частоту появления конкретной буквы в рассматриваемом тексте. Для это применим формулу Шеннона. В данном случае энтропию информации обозначим через I2 и ее будем рассчитывать по следующей формуле:

В программу Microsoft Word скопируем наш текст. В программе MS Excel создадим таблицу, в которой расположим буквы русского алфавита по порядку.

Рисунок 2 – таблицы «Частотность букв русского алфавита»
Переходим в окно MS Word. В начале подсчитаем количество буква «а» в тексте и перенесем данные в таблицу. Для этого нужно на панели инструментов меню Главное выбрать команду Заменить. В окне диалога Заменить после слова Найти пишем а и щелкаем по кнопке заменить все. (рисунок 3) Программа сообщает нам, как показано на рисунок 4, сколько произведено замен. Это число 16 и есть количество букв а в тексте.

Рисунок 3 – команда Заменить

Рисунок 4 – результат замены буквы а
Заносим полученные данные в таблицу MS Excel. Тоже самое проделываем со всеми остальными буквами.


Рисунок 5 – результат заполнения
С помощью функции СУММ подсчитаем количество букв в нашем тексте. Для этого в ячейку I36 введем функцию СУММ. Получили 278 букв. Таким образом получили, что N2=278. Далее вычислим частоту Pi для каждой буквы по формуле

В ячейку J3 вводим =I3/I$36, а затем c помощью функции автозаполнения скопируем до конца таблицы.
,
Рисунок 6 – таблица «Частотность букв русского алфавита в тексте»
Теперь вычислим количество информации, приходящейся на один символ I2 по формуле
Для этого в ячейку K3 вводим =ЕСЛИ(J3=0;0;-J3*LOG(J3;2)), а затем копируем формулу с помощью функции автозаполнения до конца таблицы. Данные этих вычислений оказываются в столбце K. Затем в ячейку K36 вводим формулу автосуммы по столбцу К и получаем число I2.

Рисунок 7 – вычисление количества информации, приходящейся на один символ
В итоге мы получили, количество информации, приходящейся на один символ нашего текста, т.е. I2=4,3709.


  1. Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7




База данных защищена авторским правом ©psihdocs.ru 2023
обратиться к администрации

    Главная страница