Лекции по дисциплине «Анализ данных» Направление подготовки 38. 03. 05 «Бизнес-информатика»



страница1/17
Дата02.06.2016
Размер0.75 Mb.
ТипЛекции
  1   2   3   4   5   6   7   8   9   ...   17
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Чеченский государственный университет»


Лекции по дисциплине

«Анализ данных»

Направление подготовки



38.03.05 «Бизнес-информатика»

Профиль подготовки

Электронный бизнес

Квалификация



Бакалавр

Форма обучения

Очная

Грозный-2015


Рецензент: _____ С.Р.Шамилев ________________
Составитель; ___ А.Р. Юнусов _________________
Лекции дисциплины «Анализ данных» /сост. А.Р. Юнусов – Грозный: ФГБОУ ВПО ЧГУ, 2014г.

Лекции предназначены для преподавания дисциплины базовой части цикла математических и естественнонаучных дисциплин студентам очной формы обучения по направлению подготовки 38.03.05 «Бизнес-информатика» в 3 семестре.



Лекции составлены с учетом Федерального государственного образовательного стандарта высшего профессионального образования по направлению подготовки «Бизнес-информатика», утвержденного приказом Министерства образования и науки Российской Федерации от 14 января 2010 г. N 27
Составитель ____________________ А.Р.Юнусов

(подпись)

«____»____________________2014







ã А.Р. Юнусов, 2014




ã ФГБОУ ЧГУ, 2014


Содержание


1 Аффинитивный анализ (affinity analysis) 4

2 Кластерный анализ 5

Типология задач кластеризации 6

Типы входных данных 6

Цели кластеризации 6

Методы кластеризации 6

Идея и алгоритм обучения 9

Самоорганизующиеся карты и главные многообразия[править | править вики-текст] 10

3 Классификация и регрессия 10

Data Mining — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей.


10

3 Понятие информация, данных, знания


14

13 Технология и методы обработки экономической информации


16

23 Мультимедийные технологии


18

23 Управление проектами в Microsoft Project


19

43 Статистические пакеты


20

Множественная линейная регрессия 25

Пример: множественный регрессионный анализ 25

Коэффициенты регрессии 25

Значимость эффектов предиктора 26

Построчный график выбросов 27

Логистическая регрессия 27

Математическая основа логистической регрессии 28

Особенности логит регрессии  29

4 Классификация и регрессия. Машинное обучение 30

Data Mining — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей.
30

3 Понятие информация, данных, знания


34

13 Технология и методы обработки экономической информации


36

23 Мультимедийные технологии


39

23 Управление проектами в Microsoft Project


39

43 Статистические пакеты


41

Выводы 49

5 Анализ и прогнозирование временных рядов 84

6 Ансамбли моделей 114

Ансамбли моделей: что? как? для чего? 114

Бустинг 115

Бэггинг 116

Резюме 116

Литература 117



1 Аффинитивный анализ (affinity analysis)



http://3.bp.blogspot.com/-pyozmme4we4/uypytjubffi/aaaaaaaahe8/kjbboswts9e/s1600/img110+%25281%2529.gif
Аффинитивный анализ (affinity analysis) — один из распространенных методов  Его название происходит от английского слова affinity, которое в переводе означает «близость», «сходство». Цель данного метода — исследование взаимной связи между событиями, которые
происходят совместно. Разновидностью аффинитивного анализа является анализ рыночной корзины (market basket analysis), цель которого — обнаружить ассоциации между различными событиями, то есть найти правила для количественного описания взаимной связи между двумя
или более событиями. Такие правила называются ассоциативными правилами (association rules). Примерами приложения ассоциативных правил могут быть следующие задачи:
§ выявление наборов товаров, которые в супермаркетах часто покупаются вместе или никогда не покупаются вместе;
§ определение доли клиентов, положительно относящихся к нововведениям в их обслуживании;
§ определение профиля посетителей веб-ресурса;
§ определение доли случаев, в которых новое лекарство показывает опасный побочный эффект.

Базовым понятием в теории ассоциативных правил является транзакция — некоторое множество событий, происходящих совместно. Типичная транзакция —приобретение клиентом товара в супермаркете. В подавляющем большинстве случаев клиент покупает не один товар, а


набор товаров, который называется рыночной корзиной. При этом возникает вопрос: является ли покупка одного товара в корзине следствием или причиной покупки другого товара, то есть связаны ли данные события? Эту связь и устанавливают ассоциативные правила.

Например, может быть обнаружено ассоциативное правило, утверждающее, что клиент, купивший молоко, с вероятностью 75 % купит и хлеб. Следующее важное понятие — предметный набор. Это непустое множество предметов, появившихся в одной транзакции. Анализ рыночной корзины — это анализ наборов данных для определения комбинаций


товаров, связанных между собой. Иными словами, производится поиск товаров, присутствие которых в транзакции влияет на вероятность наличия других товаров или комбинаций товаров. Современные кассовые аппараты в супермаркетах позволяют собирать информацию о покупках, которая может храниться в базе данных. Затем накопленные данные могут
использоваться для построения систем поиска ассоциативных правил.

Каталог: files
files -> Методические рекомендации «Организация исследовательской деятельности учащихся»
files -> Актуальность исследования
files -> Рабочая программа дисциплины
files -> Программа курса предназначена для учащихся 9-11 класса и рассчитана на 128 часов. Периодичность занятий 1 раз в неделю по 4 учебных часа
files -> Предоставление максимально широкого поля возможностей учащимся, ориентированным на высокий уровень образования и воспитания, с учетом их индивидуальных потребностей
files -> Методические рекомендации по организации исследовательской и проектной деятельности младших школьников
files -> Программы
files -> Выпускных квалификационных работ


Поделитесь с Вашими друзьями:
  1   2   3   4   5   6   7   8   9   ...   17


База данных защищена авторским правом ©psihdocs.ru 2017
обратиться к администрации

    Главная страница