Issn 411-1473 Современные информационные технологии и ит-образование Научный журнал Том (№11) Москва



Скачать 27,21 Mb.
Pdf просмотр
страница262/553
Дата06.10.2019
Размер27,21 Mb.
#79117
1   ...   258   259   260   261   262   263   264   265   ...   553
АННОТАЦИЯ
Целью статьи является разработка научно-методических основ и концепции
построения децентрализованной системы образовательных ресурсов на базе системы
хранилищ электронных образовательных ресурсов для создания единого
информационного пространства, обеспечивающего доступ и распространение
ресурсов от поставщика к потребителю
.
Современный учебный процесс сложно представить без использования компьютерных учебников, задачников, тренажеров, лабораторных практикумов, справочников, энциклопедий,
тестирующих и контролирующих систем и других компьютерных средств обучения. В настоящее время для самого широкого круга пользователей создано огромное количество качественных информационно-образовательных ресурсов. Свободный доступ к ресурсам даёт возможность образовательному сообществу продуктивно использовать наиболее актуальные и современные методические, научные и учебные материалы.
На сегодня Единая коллекция ЦОР (http://school-collection.edu.ru/) стала одним из самых популярных федеральных образовательных ресурсов для общеобразовательных учреждений РФ.
Согласно статистическим данным Ramblers Top100, LiveInterne к сайту Коллекции обращаются до
40 тыс. уникальных пользователей в день, а в рейтинге образовательных ресурсов Рунета она еженедельно занимает 9-11 места.
В настоящее время Коллекция насчитывает более 111 тыс. различных учебных материалов. Так в Коллекции представлены наборы цифровых образовательных ресурсов к большому количеству учебников, рекомендованных Минобрнауки к использованию в школах
России, инновационные учебно-методические разработки, разнообразные тематические и предметные коллекции, а также другие учебные, культурно-просветительские и познавательные материалы.
Разработка децентрализованной системы хранения образовательных ресурсов на базе системы хранилищ электронных образовательных ресурсов Единой коллекции ЦОР позволит создать единое информационное пространство для обеспечения доступа и распространения ресурсов.
Децентрализованная система и её узлы в частности оперируют четырьмя видами данных:

потоковые и транзитные данные;

данные сохраненные в виде распределенного кеша;

файловые данные;

данные генерируемые самой системой в процессе функционирования.
Потоковые данные — это данные, которые непрерывно получаются пользователем от источника потокового вещания. К таким данным относятся, например, аудио и видео трансляции
204

или сообщения службы живого текстового общения. Транзитные данные — данные требующие срочной передачи и предназначенные для других узлов. Если при передаче транзитных данных фиксируется факт частого появления данных определенного размера и имеющих определенную хеш-сумму, то эти данные также направляются и сохраняются в виде распределенного кеша.
Данные, сохраненные в виде распределенного хеша, представляют собой блоки данных,
каждому из которых поставлены в соответствие следующие параметры: размер, хеш и набор статистических параметров (такие как время доступа, относительная частота обращения и число обращений).
Контентная единица представляет собой набор файлов, которые воспринимаются модулями, подключенными к транспортному ядру узла как неделимая единица. В свою очередь транспортное ядро узла при хранении и передаче этих данных разбивает их на более мелкие блоки в зависимости от специального алгоритма.
Принципиальная схема структуры контентной единицы представлена в соответствии с рисунком 1.
Блоки бывают разного размера и каждый файл находящийся в рамках контентной единицы разбивается на блоки по-своему. Алгоритм разбиения файлов на блоки анализирует всю информацию контентной единицы и часть информации из распределенного кеша данных и выбирает размеры блоков так, чтобы максимально понизить избыточность данных, как внутри самой контентной единицы, так и во всей распределенной системе вцелом.
Рисунок 1 — Принципиальная схема контентной единицы
От каждого выделенного блока рассчитывается хеш-сумма по одному из известных алгоритмов (MD4, MD5, SHA1). Таким образом, каждый файл контентной единицы начинает представлять из себя набор групп состоящих из блока данных, размера этого блока и вычисленной хеш-суммы. Контентная единица в свою очередь начинает представлять из себя набор групп,
состоящих из блока данных, размера этого блока и хеш-суммы, но без повторений между группами совокупности размера блока и хеш-суммы. Также частью контентной единицы становится карта блоков, позволяющая воссоздать изначальный набор файлов из группы неповторяющихся блоков данных.
Карта блоков представляет собой дерево файлов, в котором каждое файловое имя поставлено в соответствие со строкой хешей (или хеш-строкой). Каждая хеш-строка представляет собой набор конкатенированных групп, состоящих из размера блока и его хеш-суммы, благодаря тому, что размер блока в бинарном виде и хеш-сумма представляют собой строки постоянной дины. Карта блоков сама по себе представляет строку, все данные в которой записаны с помощью заранее оговоренного языка байт-разметки, такого как, например, bencode.
Описательную функцию при передаче данных между узлами децентрализованной системы выполняют специальные блоки данных, называемые метаданными.
Метаданные описывают контентную единицу, как с пользовательской точки зрения, так и с точки зрения системы.
Метаданные могут содержать в себе следующие виды информации:
205



системная информация;

идентификационная информация;

описательная информация.
Системная информация представляет собой карту блоков, которые представлены в виде строки.
Идентификационная информация представляет собой общий хеш контентной единицы.
Общий хеш контентной единицы содержит в себе размер контентной единицы и хеш, который рассчитывается из карты блоков.
Описательная информация представляет собой свободно кастомизируемую информацию,
что означает, что ее состав легко варьируется. Такая информация может содержать в себе:

название;

текстовое или гипертекстовое описание;

сопутствующие гипертексту файлы;

изображения;

ключевые слова;

информация об источнике (распространителе).
Передаче контентных единиц, как и при передаче любых других данных система при должна избегать передачу избыточных объемов информации.
В качестве примера рассмотрим простой случай. Допустим, контентная единица представляет из себя набор N-го числа похожих файлов, которые имеют в составе общий набор байт и отличный от других составляющий

Скачать 27,21 Mb.

Поделитесь с Вашими друзьями:
1   ...   258   259   260   261   262   263   264   265   ...   553




База данных защищена авторским правом ©psihdocs.ru 2022
обратиться к администрации

    Главная страница