Лекции по дисциплине «Анализ данных» Направление подготовки 38. 03. 05 «Бизнес-информатика»



страница5/17
Дата02.06.2016
Размер0.75 Mb.
ТипЛекции
1   2   3   4   5   6   7   8   9   ...   17

23 Мультимедийные технологии


 

Технология мультимедиа (лат. multi – «много», media – «среда») – способ представления информации в компьютере с возможностью одновременного использования текста, графики, звука, видео и анимационных эффектов.



Мультимедийные технологии — это совокупность современных средств аудио- теле-, визуальных и виртуальных коммуникаций, используемых в процессе организации, планирования и управления различных видов деятельности.



Средства мультимедиа позволяют создавать базы, банки данных и знаний в сфере культуры, науки и производства. Такие продукты всё более завоёвывают рынок пользователей. Мультимедиа технологии широко используются в рекламной деятельности, при организации управления маркетингом средств и методов продвижения товаров и услуг, в обучении и досуговой деятельности.



К компьютерным средствам мультимедиа относят: специальное ПО, а также: CD и DVD драйверы и компакт-диски к ним; аудиокарты, аудио колонки, наушники и микрофоны; видеокарты; аудио- и видео периферийные устройства (цифровые кинокамеры и фотоаппараты и др.).



Технология мультимедиа позволяет вводить, сохранять, перерабатывать и воспроизводить текстовую, аудиовизуальную, графическую, трёхмерную и иную информацию. Свойство интегрировать эти виды данных, компактно и длительно хранить их на электронных носителях, не разрушающихся со временем и не ухудшающих свои характеристики при копировании, позволяет утверждать, что они могут отражать богатейшие национальные богатства России в мультимедийных БД, которые вместе с системами гипертекста, гипермедиа и WWW обеспечат пользователям почти моментальный доступ к любому их фрагменту.



Организации и подразделения, обладающие информационными ресурсами и средствами мультимедиа, использующими мультимедийные технологии порой называют медиатеками. В России медиатеки находят широкое распространение в библиотеках и учебных заведениях. В этом случае считается, что медиатека – хранилище информационных медиаресурсов.



Технические средства мультимедиа, как и любые компьютерные информационные системы, позволяют выполнять все виды информационных процессов.


23 Управление проектами в Microsoft Project


 

Управление проектами (проектный менеджмент — project management)- это планирование, координация и контроль работ по проекту для достижения его целей в рамках установленного бюджета и сроков, с надлежащим качеством.



       К достаточно распространенным и поддерживаемым на российском рынке программным продуктам относятся «большие» мультипроектные профессиональные системы — PrimaVera Planner , Open Plan Professional и более «скромные» — Microsoft Project , Sure Track Manager. 

       Наиболее популярна на сегодняшний день в мире программа управления проектами MS Project.





Microsoft Project стал фактически стандартом среди средств автоматизации индивидуальной работы менеджеров проектов. Свою популярность он заслужил благодаря удачному сочетанию простоты использования, дружеского интерфейса и наиболее необходимых инструментов управления проектами.



Microsoft Project рассчитан, в первую очередь, на пользователей, которые не являются профессионалами в управлении проектами. Таким образом, его можно отнести к «непрофессиональным системам» управления проектами. с другой стороны, с помощью Microsoft Project можно управлять проектами со значительным количеством работ и ресурсов.



Microsoft Project входит в семейство Microsoft Office, что подтверждается следующими его свойствами:



построение интерфейса и справочной системы на единственных с Microsoft Office принципах;



возможность сохранения данных проектов в базе данных Access;



двусторонний обмен данными с Outlook;



Среди преимуществ Microsoft Project также можно назвать усовершенствованные средства групповой работы, что позволяют одному менеджеру одновременно управлять несколькими проектами с большим числом участников. По мнению Gartner Group, Microsoft Project – лучший выбор для организаций, где используется матричная схема управления, то есть проектные команды допускают взаимодействие сотрудников из разных департаментов.



К недостаткам системы можно отнести ограниченные средства управления бюджетом и отсутствие средств для управления рисками проекта.



Для расширения функциональности системы разработанные дополнительные модули, доступные для бесплатной загрузки через Internet. Кроме того, существует web-сервис Microsoft ProjectCentral.com, предназначенный для организации совместной работы над проектами для групп, распределенных территориально. ProjectCentral.com предоставляет членам рабочей группы и всем заинтересованным лицам веб-страницы для работы с информацией проекта.



 

 

43 Статистические пакеты


 

Потребность в средствах статистического анализа данных очень велика, что и послужило причиной для развития рынка статистических программ.



Наилучший выбор статистического пакета для анализа данных зависит от характера решаемых задач, объема обрабатываемых данных, квалификации пользователей, имеющегося оборудования.    



Число статистических пакетов, получивших распространение в России, достаточно велико (несколько десятков). Из зарубежных пакетов этоSTATGRAPHICS, SYSTAT, STATISTICA, SPSS, SAS, CSS. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, САНИ, КЛАСС-МАСТЕР, СТАТЭксперт и др.



Для пользователей, имеющих дело со сверхбольшими объемами данных или узкоспециальными методами анализа, пока нет альтернативы использованию профессиональных западных пакетов. Среди интерактивных пакетов такого рода наибольшими возможностями обладает пакетSAS.



Если Вам необходимо обработать данные умеренных объемов (несколько сотен или тысяч наблюдений) стандартными статистическими методами, подойдет универсальный или специальный статистический пакет, надо только убедиться, что он содержит нужные методы обработки.



Пакеты STADIA и STATISTICA являются универсальными пакетами, содержащими большинство стандартных статистических методов. Пакеты SPSS и SyStat перенесены на персональные компьютеры с больших ЭВМ предыдущих поколений, поэтому, наряду с представительным набором тщательно реализованных вычислительных методов, они сохраняют и некоторые архаические элементы. Однако имеющиеся в них возможности командного языка (впрочем, очень непростые в изучении и использовании) могут быть весьма полезны для сложных задач обработки данных. Пакеты STADIA и STATISTICA  исходно разработаны для ПЭВМ, а поэтому проще в обращении. Эти пакеты, пожалуй, содержат наибольшее количество методов статистического анализа.



STATISTICA — это универсальная интегрированная система, предназначенная для статистического анализа, визуализации данных и разработки пользовательских приложений. Программа содержит широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе. Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента.



Универсальный российский статистический пакет STADIA — за 15 лет существования и развития стал аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русскоязычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами. Отличается простотой использования применительно к отечественной аудитории.



Следует обратить внимание на удивительную компактность пакета STADIA: он требует в несколько раз меньше места на диске, чем его конкуренты, и при этом не уступает, а часто и превосходит их по своим функциональным возможностям.

Простая линейная регрессия

В предыдущих заметках предметом анализа часто становилась отдельная числовая переменная, например, доходность взаимных фондов, время загрузки Web-страницы или объем потребления безалкогольных напитков. В настоящей и следующих заметках мы рассмотрим методы предсказания значений числовой переменной в зависимости от значений одной или нескольких других числовых переменных.1

Материал будет проиллюстрирован сквозным примером. Прогнозирование объема продаж в магазине одежды. Сеть магазинов уцененной одежды Sunflowers на протяжении 25 лет постоянно расширялась. Однако в настоящее время у компании нет систематического подхода к выбору новых торговых точек. Место, в котором компания собирается открыть новый магазин, определяется на основе субъективных соображений. Критериями выбора являются выгодные условия аренды или представления менеджера об идеальном местоположении магазина. Представьте, что вы — руководитель отдела специальных проектов и планирования. Вам поручили разработать стратегический план открытия новых магазинов. Этот план должен содержать прогноз годового объема продаж во вновь открываемых магазинах. Вы полагаете, что торговая площадь непосредственно связана с объемом выручки, и хотите учесть этот факт в процессе принятия решения. Как разработать статистическую модель, позволяющую прогнозировать годовой объем продаж на основе размера нового магазина?

Как правило, для предсказания значений переменной используется регрессионный анализ. Его цель — разработать статистическую модель, позволяющую предсказывать значения зависимой переменной, или отклика, по значениям, по крайней мере одной, независимой, или объясняющей, переменной. В настоящей заметке мы рассмотрим простую линейную регрессию — статистический метод, позволяющий предсказывать значения зависимой переменной Y по значениям независимой переменной X. В последующих заметках будет описана модель множественной регрессии, предназначенная для предсказания значений независимой переменной Y по значениям нескольких зависимых переменных (Х1, Х2, …, Xk).2



Виды регрессионных моделей

В заметке Представление числовых данных в виде таблиц и диаграмм для иллюстрации зависимости между переменными X и Y использовалась диаграмма разброса. На ней значения переменной X откладывались по горизонтальной оси, а значения переменной Y — по вертикальной. Зависимость между двумя переменными может быть разной: от самой простой до крайне сложной. Пример простейшей (линейной) зависимости показан на рис. 1.



Рис. 1. Положительная линейная зависимость

Простая линейная регрессия:

(1) Yi = β0 + β1Xi + εi

где β0 — сдвиг (длина отрезка, отсекаемого на координатной оси прямой Y), β1 — наклон прямой Y, εi — случайная ошибка переменной Y в i-м наблюдении.

В этой модели наклон β1 представляет собой количество единиц измерения переменной Y, приходящихся на одну единицу измерения переменной X. Эта величина характеризует среднюю величину изменения переменной Y (положительного или отрицательного) на заданном отрезке оси X. Сдвиг β0 представляет собой среднее значение переменной Y, когда переменная X равна 0. Последний компонент модели εi является случайной ошибкой переменной Y в i-м наблюдении. Выбор подходящей математической модели зависит от распределения значений переменных X и Y на диаграмме разброса. Различные виды зависимости переменных показаны на рис. 2.

Рис. 2. Диаграммы разброса, иллюстрирующие разные виды зависимостей

На панели А значения переменной Y почти линейно возрастают с увеличением переменной X. Этот рисунок аналогичен рис. 1, иллюстрирующему положительную зависимость между размером магазина (в квадратных футах) и годовым объемом продаж. Панель Б является примером отрицательной линейной зависимости. Если переменная X возрастает, переменная Y в целом убывает. Примером этой зависимости является связь между стоимостью конкретного товара и объемом продаж. На панели В показан набор данных, в котором переменные X и Y практически не зависят друг от друга. Каждому значению переменной X соответствуют как большие, так и малые значения переменной Y. Данные, приведенные на панели Г, демонстрируют криволинейную зависимость между переменными X и Y. Значения переменной Y возрастают при увеличении переменной X, однако скорость роста после определенных значений переменной X падает. Примером положительной криволинейной зависимости является связь между возрастом и стоимостью обслуживания автомобилей. По мере старения машины стоимость ее обслуживания сначала резко возрастает, однако после определенного уровня стабилизируется. Панель Д демонстрирует параболическую U-образную форму зависимости между переменными X и Y. По мере увеличения значений переменной X значения переменной Y сначала убывают, а затем возрастают. Примером такой зависимости является связь между количеством ошибок, совершенных за час работы, и количеством отработанных часов. Сначала работник осваивается и делает много ошибок, потом привыкает, и количество ошибок уменьшается, однако после определенного момента он начинает чувствовать усталость, и число ошибок увеличивается. На панели Е показана экспоненциальная зависимость между переменными X и Y. В этом случае переменная Y сначала очень быстро убывает при возрастании переменной X, однако скорость этого убывания постепенно падает. Например, стоимость автомобиля при перепродаже экспоненциально зависит от его возраста. Если перепродавать автомобиль в течение первого года, его цена резко падает, однако впоследствии ее падение постепенно замедляется.

Мы кратко рассмотрели основные модели, которые позволяют формализовать зависимости между двумя переменными. Несмотря на то что диаграмма разброса чрезвычайно полезна при выборе математической модели зависимости, существуют более сложные и точные статистические процедуры, позволяющие описать отношения между переменными. В дальнейшем мы будем рассматривать лишь линейную зависимость.



Вывод уравнения простой линейной регрессии

Вернемся к сценарию, изложенному в начале главы. Наша цель — предсказать объем годовых продаж для всех новых магазинов, зная их размеры. Для оценки зависимости между размером магазина (в квадратных футах) и объемом его годовых продаж создадим выборки из 14 магазинов (рис. 3).



Рис. 3. Площади и годовые объемы продаж 14 магазинов сети Sunflowers: (а) исходные данные; (б) диаграмма разброса

Анализ рис. 3 показывает, что между площадью магазина X и годовым объемом продаж Y существует положительная зависимость. Если площадь магазина увеличивается, объем продаж возрастает почти линейно. Таким образом, наиболее подходящей для исследования является линейная модель. Остается лишь определить, какая из линейных моделей точнее остальных описывает зависимость между анализируемыми переменными.


Каталог: files
files -> Методические рекомендации «Организация исследовательской деятельности учащихся»
files -> Актуальность исследования
files -> Рабочая программа дисциплины
files -> Программа курса предназначена для учащихся 9-11 класса и рассчитана на 128 часов. Периодичность занятий 1 раз в неделю по 4 учебных часа
files -> Предоставление максимально широкого поля возможностей учащимся, ориентированным на высокий уровень образования и воспитания, с учетом их индивидуальных потребностей
files -> Методические рекомендации по организации исследовательской и проектной деятельности младших школьников
files -> Программы
files -> Выпускных квалификационных работ


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   17


База данных защищена авторским правом ©psihdocs.ru 2017
обратиться к администрации

    Главная страница