Семантического анализа данных: опрос онтологии подходов



Скачать 56,76 Kb.
Дата04.03.2021
Размер56,76 Kb.
#101527

Семантического анализа данных: опрос онтологии подходов

Абстрактно—семантического анализа данных относится к интеллектуальному анализу данных-задачи, которые систематически включать знания в данной области, особенно формальные семантики. В прошлом, многие исследования подтвердили выгоды использования знаний в предметной области интеллектуального анализа данных. В то же время, распространение технических знаний обогатил семейство знаний в предметной области, особенно формальная семантика и семантический веб-онтологий. Онтология-это явная Спецификация концептуализации и формальный способ определения семантики знаний и данных. Формальная структура онтологии делает его природным способом кодирования знаний о предметной области для использования интеллектуального анализа данных. В данной работе исследование, мы введем общие понятия семантического анализа данных. Мы исследуем, почему онтология имеет потенциал, чтобы помочь семантического анализа данных и как формальная семантика в онтологии могут быть включены в процесс интеллектуального анализа данных. Мы предоставляем подробную обсуждение достижений и современных онтологии на основе подходов и внедрение подходов, основанных на других формах представления знаний.

I. введение

Интеллектуального анализа данных, также известный как извлечение знаний из баз данных (КДД), это процесс нетривиальное извлечение неявной, прежде неизвестной и потенциально полезной информации из данных [30]. В последние несколько десятилетий, достижения в области методов интеллектуального анализа данных приводят к много замечательных революций в области анализа данных и большие данные. Интеллектуальный анализ данных также сочетает в себе методы, заимствованные из статистики, искусственного интеллекта, машинного обучения, системы баз данных, и многие другие дисциплины для анализа больших наборов данных. Семантического анализа данных относится к задач интеллектуального анализа данных, которые систематически включать знания в данной области, особенно формальной семантики, в процесс. Эффективность это-главное знание в процессе анализа данных были подтверждены в последние исследования. Файяд [21] утверждал, что знания предметной области могут играть важную роль во всех стадиях интеллектуального анализа данных, включая преобразование данных, сокращения характеристика, алгоритм выбора, пост-обработка, интерпретация модели и так далее. Рассел и Норвиг [64] считает, что интеллектуальный агент (например, по интеллектуальному анализу данных-системы) должен иметь возможность получить знания и должны научиться более эффективно знания с знаниями.

Предыдущий семантический анализ данных исследования свидетельствует о положительном влиянии знаний на анализ данных. Например, предварительная обработка может извлечь выгоду из знаний о предметной области, которые могут помочь отфильтровать избыточные или противоречивые данные [41], [59]. При поиске и генерации узора, знание домена может работать как набор предварительных знаний ограничений, чтобы помочь уменьшить пространство поиска и наставит на путь поиска [8], [9]. Более того, выявленные закономерности могут быть удалены из [49], [48] или сделать более наглядными путем кодирования их в официальной структуре технических знаний [76].

Для использования знаний в предметной области в процессе интеллектуального анализа данных, первый шаг должен учитывать представления и построения знаний на моделях, что компьютер может в дальнейшем процесс доступа и. Распространения технических знаний (ке) заметно обогатили семейный знаний о предметной области с помощью методов, создания и использования знаний о предметной области на формальном уровне [64]. Онтология является одним из успешных знаний технических достижений, что является явная Спецификация концептуализации [26], [67]. Как правило, онтология разрабатывается с целью определения конкретного домена (например, генетика). Такой онтологии, как онтология предметной области, формально определяет понятий и отношений в этой области. Закодированный формальная семантика в онтологии используется в основном для эффективного обмена и использования знаний и данных. Яркими примерами онтологии включают ген онтологии (идти [73]), Единая медицинская Языковая система (UMLS [45]), и более чем 300 онтологии в Национальный центр Биомедицинской онтологии (NCBO [2]).

Исследования в области семантического Веба [10] привел к вполне зрелым стандартов для моделирования и систематизации знаний в предметной области. Сегодня, семантическая сеть онтологии стать одним из ключевых технологий для интеллектуальной обработки знаний, обеспечивающих основу для обмена концептуальных моделей о домене. Веб-Язык онтологии (сова) [1], которая стала стандартом де-факто для определения семантической сети онтологии, широко используется для этой цели. Семантические веб-технологии, которые формально представлять знания предметной области, в том числе структурированного сбора предварительной информации, правила вывода, знания, обогащенного данных и т. д., таким образом, можно разработать основу для систематического учета знаний предметной области в интеллектуальных интеллектуального анализа данных среды.

В данной работе исследование, мы изучаем достижения и семантического анализа данных. Мы специально сосредоточиться на онтологии подход. Онтология-обоснованных подходов к семантической попытки сведении к использованию формального процесса интеллектуального анализа данных. Обычно это достигается с помощью формальных определений понятий и отношений.

В онтологии в качестве вспомогательной информации или условия ограничения, чтобы направлять процесс интеллектуального анализа данных. Например, в классификации, онтология может указать последовательность взаимосвязей задач классификации. Исключить противоречивое пространство поиска, задача классификации может привести к большей точности [8]. Более того, структура онтологий может служить хорошим представлением для результата интеллектуального анализа данных. Например, в информации, извлечения и интеллектуального анализа текста, извлеченного информация может быть представлена через себя онтологию, используя онтологию языка определения (например, сова) [77]. В этой статье, мы ориентируемся на три перспективы онтологического подходов в исследовании семантического анализа данных:

– Роль онтологий: почему знания предметной области, с формальной семантики, таких, как онтологии, необходимы на всех этапах процесса интеллектуального анализа данных. Добыча с онтологии как онтологии представлены и обработаны, чтобы помочь процесса интеллектуального анализа данных.

– Оценка эффективности: как онтологии может повысить производительность систем интеллектуального анализа данных в приложениях.

2. РОЛЬ ОНТОЛОГИЙ В СЕМАНТИЧЕСКИХ ДАННЫХ

Перспективы и механизм использования онтологий в семантических данных варьируется в зависимости от различных систем и приложений. На вопрос, почему онтология является полезным в оказании помощи процесса интеллектуального анализа данных не имеет единому выводу. Просмотрев предыдущие онтологии на основе подходов, мы подводим итоги трех целей, онтологии были введены для семантического анализа данных:

Для преодоления семантического разрыва между данными, приложения, алгоритмы интеллектуального анализа данных и интеллектуального анализа данных результатов.

Чтобы предоставить алгоритмы интеллектуального анализа данных с помощью априорных знаний, который либо направляет процесс добычи или снижает/ограничивает пространство поиска.

Обеспечивают формальный способ представления горного потока данных, от предобработки данных с результатами добычи.

А. Преодоление семантического разрыва

На вопрос, почему знания домен полезно в процессе анализа данных уже давно обсуждалась в предыдущих семантического анализа данных исследования. Исследователи утверждают, что существует разрыв в знаниях между данными, алгоритм интеллектуального анализа данных и интеллектуального анализа результатов на всех этапах интеллектуального анализа данных, включая обработку, выполнение алгоритма, и результат поколения [18].

Предварительная обработка данных обычно содержит очистка данных, нормализации, преобразование, выделение признаков и отбора. В большинстве случаев, существуют семантические лакуны в этапы предварительной обработки данных. Без учета формальной семантики, специальные и эмпирические методы используются для определения качества данных. Например, дефицит и правила ближайшего соседа обычно принимают, чтобы определить выбросы и отсутствующие значения. В нормализации и шаг трансформация, семантика данных необходима для понимания отношений данных. Например, важно определить корреляции между объектами и атрибутами данных при выполнении нормализации данных. Сильно коррелированные признаки могут быть уменьшены в один общий атрибут. На практике, семантические лакуны, как правило, заполняется вручную специалистами домен. Однако, онтологии было показано, чтобы быть полезным во многих предобработки данных задач [41], [59], [72].

Существует семантический разрыв между алгоритм интеллектуального анализа данных, а также. Алгоритмы интеллектуального анализа данных, как правило, предназначены для сбора данных с разных доменов и сценариев. Однако, данные из определенного домена, как правило, несут домен конкретной семантики. Общие алгоритмы интеллектуального анализа данных имеют возможности выявлять и использовать семантику в различных областях и приложениях. Онтологии являются полезными для задания доменов семантика и может сократить семантический разрыв путем аннотирования данных с богатой семантикой. Семантическая разметка заключается в назначении основных элементов информационных связей формального семантического описания [20], [42]. Такие элементы должны составлять семантику их источник. Семантическая разметка имеет решающее значение в реализации семантического анализа данных путем приведения формальной семантики данных. Аннотированный данных очень удобны для последующих этапов семантического анализа данных, поскольку данные преобразуются в формальной и структурированной форме, что связывает онтологические условия и отношения.

Многие научные исследования, посвященные преодолению семантического разрыва результаты данных и пользователей. Marinica и соавт. [49], [50], используемые онтологии на должность обрезки и фильтрации правления ассоциации результаты добычи. Мансинг и соавт. [48] использовали топологии, чтобы помочь субъективный анализ для правила ассоциации после подрезки задач. Результаты анализа данных могут быть представлены онтологий в семантическом богатый Формат, которые помогают совместного использования и повторного использования. Например, извлечение информации (т. е.) - это задача автоматического извлечения структурированной информации из текста. Результаты данные анализ текста-это набор структурированной информации и знаний относительно домена. Для представления структурированных и машиночитаемой информации, характер представления информации с онтологией. На основе онтологии извлечение информации (Оби) [77] и широко используется такое представление. С Оби добытая информация не только четко структурированы, но и представлены предикаты в онтологии, которые легки для совместного и многократного использования.

Б. Предоставление предварительных знаний и ограничений

Определение и повторное использование знаний-одна из важнейших проблем для семантического анализа данных. В качестве формальной спецификации понятий и отношений онтологии является природным способом кодирования формальная семантика предварительных знаний. Закодированный предварительных знаний имеет потенциал, чтобы влиять на все стадии процесса интеллектуального анализа данных, начиная от первичной обработки в результате фильтрации и представительства. Например, Liu и соавт. [46] разработали представительства РСО гиперграфа для сбора информации от онтологии и данных. Онтологии включены в графическое представление данных в качестве априорного знания к искажению структуры графа, а также представляющие расстояния между терминами и понятиями в графе. Подход преобразования гиперграфа в двудольный граф для представления как данных, так и онтологии в силовых структура. Случайные блуждания с перезапуском над двудольный граф осуществляется в создания семантических объединений. Всякий раз, когда случайная прогулка проходит на основе онтологий края, области знаний, закодированных в онтологии мосты скрытых семантических отношений под данные с богатой семантикой.

Как совокупность понятий и предикатов, онтология обладает способностью выполнять логические рассуждения и тем самым сделать вывод о согласованности этих предикатов. В семантическом интеллектуального анализа данных, умение делать вывод последовательности, как правило, служат в качестве ограничений. Набор ограничений, использующих онтологии обладают способностью обнаруживать противоречивые данные и результаты в стадии обработки, на этапе выполнения алгоритма фильтрации результатов и генерация. Например, Балканскими и соавт. [8] включены онтологии как последовательность ограничений на множество задач, связанных с классификацией. Онтология задает ограничения между несколькими задачами классификации. Карлсон и соавт. [16] представили наблюдали алгоритм извлечения информации, что пары обучение много информации экс-тракторов. Использование онтологии в качестве ограничений на набор экстракторов, он дает более точные результаты. Клава Marinica и соавт. [49], [50] представлены постобработки правило ассоциации горнодобывающих результатов с использованием онтологии для проверки согласованности. Недопустимые или противоречивые правила ассоциации обрезаются и отфильтрованы с помощью онтологии и механизм вывода.

С. формально представляющие интеллектуального анализа данных результаты хорошо спроектированный систем интеллектуального анализа данных, представить результаты и выявленные закономерности в формализованном и структурированном формате, так что результаты интеллектуального анализа данных способны быть интерпретированы как области знаний и для дальнейшего обогащения и совершенствования текущих баз знаний. Онтология является одним из способов представления результатов анализа данных в формализованном и структурированном виде. В качестве формального определения понятий и отношений онтологии может кодировать богатую семантику для разных доменов. Интеллектуального анализа данных результаты из разных доменов и задачи соответствуют, естественно, с представлением онтологии, например, извлечение информации и интеллектуальный анализ ассоциативных правил. В частности, в онтологии на основе извлечения информации (Оби) [55], [77], добытая информация-это набор аннотированных терминов из документа с отношений, определенных в онтологии. Поэтому это прямо вперед, чтобы представлять полученную информацию с онтологией.

Wimalasuriya и ДОУ [77] утверждает, что онтология является действительной формой для представления результатов Оби в семантической богатый Формат. Кодирование результаты Оби в формальной структуре онтологии может упростить процесс интеллектуального анализа данных других задач интеллектуального анализа данных, которые нужно использовать в нынешний результат. Вывод двигателей, которая была разработана в области технических знаний, может выполнять проверку согласованности, которые проверяют результаты интеллектуального анализа данных и противоречивые результаты. Системы Оби можно извлечь информацию с высших вспомнить и точность по сравнению с традиционными системами, т. е. Онтология в Оби обеспечивает функцию как концептуальная основа и проверка согласованности. Он также организует извлеченную информацию в формализованном и структурированном виде, используя явное представление онтологии. Аналогичным образом онтологии на основе шаблона ассоциации шахтным способом [46] может представлять скрытых семантических объединений.

Раздел III. ДОБЫЧА С ОНТОЛОГИЯМИ

С формально закодированное семантика, онтология имеет потенциал для оказания помощи в различных задач интеллектуального анализа данных. В данном разделе мы приведем семантические алгоритмы интеллектуального анализа данных в нескольких важных задач, в том числе ассоциативных правил, классификации, кластеризации, рекомендации, извлечения информации и прогнозирования ссылке.

А. Онтологии на основе ассоциативных правил

Ассоциативных правил является одной из основных задач интеллектуального анализа данных и используется в различных приложениях. В начале работы, Сватэк и Раух [71] разработанный инструмент горной ассоциации, которые могут принести пользу от онтологии В все четыре этапа процесса интеллектуального анализа: Общие сведения, конструкция задач, интерпретация результата, и результат за распространение семантического Веба. Bellandi и соавт. [9] представили онтологии на основе правил ассоциации метод добычи, который запрашивает онтологии для фильтрации экземпляров, используемых в ассоциации горнодобывающих процесса правило. Онтология в данной работе предусматривает ограничения для запросов в горнодобывающей процесс ассоциации. Поиск пространства горной ассоциации сдерживается запрос вернулся из онтологии, что некоторые пункты из правил ассоциации выходного основе или использоваться для описания интересные предметы по уровню абстракции. Ограничения пользователей включают в себя как обрезка ограничений, которые используются для фильтрации набора номера-интересные предметы, абстракции и ограничения, которые допускают обобщение элемента в концепции онтологии.

Marinica и соавт. [49], [50] представлены постобработки правило ассоциации результаты интеллектуального анализа с использованием онтологии для проверки согласованности. Недопустимые или противоречивые правила ассоциации обрезаются и отфильтрованы с помощью онтологии и механизм вывода. Недавно Лю с соавт. [46] предлагается использовать онтологии и гиперграфа для обнаружения скрытых ассоциативных правил в данных. Они построили связь между онтологией и данные, используя модель двудольных гиперграфа. Случайное блуждание метрики основе были предложены для измерения латентного семантического расстояния между понятиями и терминами. Наборы терминов с более короткими семантического расстояния ранжируются выше, топовые наборы терминов формируются как сильные ассоциации.

Раздел III. ДОБЫЧА С ОНТОЛОГИЯМИ

С формально закодированное семантика, онтология имеет потенциал для оказания помощи в различных задач интеллектуального анализа данных. В данном разделе мы приведем семантические алгоритмы интеллектуального анализа данных в нескольких важных задач, в том числе ассоциативных правил, классификации, кластеризации, рекомендации, извлечения информации и прогнозирования ссылке.

А. онтологии на основе ассоциативных правил

Ассоциативных правил является одной из основных задач интеллектуального анализа данных и используется в различных приложениях. В начале работы, Сватэк и Раух [71] разработанный инструмент горной ассоциации, которые могут принести пользу от онтологии В все четыре этапа процесса интеллектуального анализа: Общие сведения, конструкция задач, интерпретация результата, и результат за распространение семантического Веба. Bellandi и соавт. [9] представили онтологии на основе правил ассоциации метод добычи, который запрашивает онтологии для фильтрации экземпляров, используемых в ассоциации горнодобывающих процесса правило. Онтология в данной работе предусматривает ограничения для запросов в горнодобывающей процесс ассоциации. Поиск пространства горной ассоциации сдерживается запрос вернулся из онтологии, что некоторые пункты из правил ассоциации выходного основе или использоваться для описания интересные предметы по уровню абстракции. Ограничения пользователей включают в себя как обрезка ограничений, которые используются для фильтрации набора номера-интересные предметы, абстракции и ограничения, которые допускают обобщение элемента в концепции онтологии.

Marinica и соавт. [49], [50] представлены постобработки правило ассоциации результаты интеллектуального анализа с использованием онтологии для проверки согласованности. Недопустимые или противоречивые правила ассоциации обрезаются и отфильтрованы с помощью онтологии и механизм вывода. Недавно Лю с соавт. [46] предлагается использовать онтологии и гиперграфа для обнаружения скрытых ассоциативных правил в данных. Они построили связь между онтологией и данные, используя двудольный Б. онтологии на основе классификации.

Классификация является одним из самых распространенных задач интеллектуального анализа данных, что найти модель (или функции) для описания и определения классов данных или понятий [30]. В семантическом интеллектуального анализа данных, одним из типичных случаев использования онтологии является аннотирование этикетки классификации с набором отношений, определенных в онтологии. Исследования Балканскими и соавт. [8] указывает на то, что онтологии аннотированная классификация этикетки, семантика, закодированных в задаче классификации имеет возможность не только влиять на меченых данных в задаче классификации, а также обрабатывать большое количество немаркированных данных. Они вобрали в онтологию в качестве ограничений согласованности в нескольких связанных задач классификации. Эти задачи классифицируют нескольким категориям одновременно. Онтология задает ограничения между несколькими задачами классификации. Немеченая коэффициент ошибок определяется как вероятность классификатор присваивает метку немаркированных данных, что нарушает онтология. Эту задачу классификации производит гипотеза классификации классификаторы, которые производят не менее немеченого процент ошибок и, таким образом, большинство непротиворечивости классификации.

Allahyari и соавт. [7] представили онтологии на основе метода автоматической классификации текстовых документов в динамично определенный набор тем. Субъекты и отношения между сущностями определяются из текста документа. Семантический граф связанных сущностей строятся из набора отношений. Алгоритм Hits [43] используется для идентификации основных сущностей в семантическом графе для дальнейшей идентификации динамических темах. Классификация документов на основе вычисления подобия семантического графа документа для определения онтологического контекста (темы) модели гиперграфа. Случайное блуждание метрики основе были предложены для измерения латентного семантического расстояния между понятиями и терминами. Наборы терминов с более короткими семантического расстояния ранжируются выше. Топовые наборы терминов формируются как сильные ассоциации.

С. Онтологии на основе Кластеризации

Кластеризации [34] - это задача интеллектуального анализа данных, группировка множества объектов в одном кластере, которые похожи друг на друга. Раннее творчество онтологии на основе кластеризации включает в себя использование онтологии в тексте задачи кластеризации для обработки данных [31], обогащая понятие вектора онтологических понятий [32], а также содействие измерить расстояние с онтологией семантики [36].

Песни и соавт. [65] воспользовался тезауруса и корпус на основе онтологии для кластеризации текстов с обогащенным концептуальным сходством. Они предложили генетический алгоритм для кластеризации текстов с трансформированным латентно-семантического индексирования с использованием онтологии для захвата связанные семантического подобия. Цзин и соавт. [35] используется онтология повторно вес векторы на основе знаний векторного пространства для кластеризации текстов. Fodeh [23] утверждает, что онтология может быть использована для уменьшения числа признаков, необходимых в документе задач кластеризации. С помощью онтологии, основного подмножества семантических особенностей для каждого текстового корпуса определяется. Используя этот базовый семантические особенности кластеризации, число объектов может быть снижена на 90% или больше, пока еще производят кластеры, которые отражают главные темы в текстовом корпусе.

Ovaska и соавт. [58] в исполнении Гена задач кластеризации от экспериментов микрочипов с помощью генной онтологии (перейти). График структуры (ГС) и информационного Контента (СК) меры используются для оценки сходства между генами. ГС-методы, основанные на использовании иерархической структуры пойти, чтобы вычислить генной схожести. ИК-методы, основанные на дополнительно рассмотреть информацию, контент перейти в эталонный набор генов. Чжан и соавт. [82] предложен медицинский документ кластеризации с онтологии на основе срочных мер сходства. Онтология используется для индексации терминов в наборе медицинский документ. Вес термина рассчитывается заново на основе онтологий понятие меры сходства. Сферически K-среднее используется для задач кластеризации.

Д. Онтологии на основе извлечения информации

Извлечение информации (т. е.) относится к задаче извлечения определенной информации из текста естественного языка путем автоматической их обработки. Т. е. тесно связано с интеллектуальным анализом текста. Онтологии на основе извлечения информации (Оби) в подполе извлечение информации, которая использует формальные онтологии для управления процессом экстракции [40], [77]. Из-за этого руководство в процессе добычи, систем Оби есть в основном реализованы в виде контролируемого подхода [76]. Хотя очень немногие, считаются на основе онтологий [78], [79], они полагаются на примерах известных соотношений [4], [63]. .

Ранняя работа Оби включает извлечение знаний из Web-документов [5] и данных неструктурированных документов [19]. Онтология может обеспечить проверку согласованности для извлечения информации в системе, т. е.. Кара [39] представил онтологии информационной системы на основе извлечения и который использует онтологии для проверки согласованности. Выход из регулярной системы т. е. превращается в онтологический случаях через онтологию населения. Вывод и проверить последовательность выполняемых на этих онтологических инстанций. Карлсон и соавт. [17] предложили Semi-наблюдали алгоритм извлечения информации с нескольких размеченных данных и большое количество немаркированных данных. Предложенный алгоритм несколько пар онтологии информацию экстракторов на основе онтологии указать ограничения и исключения для различных категорий и отношений. Алгоритм итеративно и инкрементально обогатить этикетка классификации, используя самые уверенные выходы из этих экстракторов.

Недавно Фернандес и соавт. [22] представлен способ использования баз знаний предметной области для поддержки возможности семантического поиска в больших хранилищах документов. Nebhi [56] предложил систему Оби для устранения двусмысленности сообщения в Twitter. Соединяя понятия от freebase и правил извлечения, основанные на зависимости деревья, подход Nebhi определяет смысл (и контексте) юридических лиц, указанных в сообщениях. Nebhi [57] улучшена точность процесс устранения неоднозначности путем замены модели на основе подхода с задачей классификации с помощью опорных векторов. Как способ содействия принятию Оби, Wimalasuriya и ДОУ [76] предложил онтологии на основе компонентов для извлечения информации (OBCIE) архитектуры. OBCIE направлена на поощрение повторного использования путем моделирования компонентов системы, т. е. как модульная, как это возможно. Гутьеррес и соавт. [27] продлил OBCIE архитектуры путем внедрения гибридных конфигураций (например, в различных реализациях и различных функций).

Е. Онтологии на основе системы рекомендаций

Рекомендательных систем или систем рекомендации [3], [12] представляют собой системы, которые предназначают для прогнозирования предпочтений или оценок, которые пользователь даст на объект. Рекомендательные системы стали чрезвычайно популярными в последние годы и применяются в различных приложениях, в том числе фильмы, музыка, новости, книги, научные статьи, поисковым запросам, и социальные теги [44], [75]. В хорошей системе и рекомендации, разнородной информации из различных источников, как правило, требуется. Онтологии могут интегрировать использование разнородной информации и руководства, предпочтения и рекомендации.

В начале работы на основе онтологий рекомендательная система использует онтологии для профилирования пользователей [53], персонализированный поиск [60] и Интернете [52], [51]. Недавно Pudota и соавт. [61] предложил систему рекомендаций, которые создают и рекомендуют теги автоматически для веб-ресурсов. Веб-документы аннотируются и соответствует условиям в онтология первый.

Затем на основе онтологий рассуждения проводятся для получения новых знаний из аннотированного условия. Этот вывод сделан путем нахождения общих узлов предка для них и, возможно, все узлы в пути между соответствием узлов с потологического понятия. И Чой Кан [38] предложил онтологии на основе рекомендательной системы, в которой онтология используется для кодирования долгосрочные и краткосрочные предпочтений. Предпочтения пользователей онтология состоит из понятий общей онтологии вместе с документами, которые пользователь посетил. Рекомендация основывается на сходстве между онтологическими понятиями и терминами.

IJntema [33] разработали систему рекомендаций, Афина, обеспечить на основе онтологий и рекомендации, новости системы питания. Продлить framekwork Эрме [24], система, используемая для построения информационной службы персонализации, с помощью онтологии, чтобы определить семантические отношения между терминами и понятиями. Он использует онтологии для понятия магазина и их отношения к новости. Cantador и соавт. [14] предложена еще одна новость система рекомендаций, что делает использование онтологий для обеспечения онлайн новости рекомендательные сервисы. Онтологии используются для создания концептуальной базы для содержания новости и предпочтений пользователя. Онтологии могут автоматически комментировать новости с семантической концепции, которые появляются в обоих текстов и онтологии.

Ф. Онтологии на основе прогнозирования ссылке

Прогнозирование ссылку для социальных сетей становится очень активные исследования в области интеллектуального анализа данных благодаря успеху онлайн социальных сетях, таких как Twitter, Facebook и Google+. Aljandal и соавт. [6] представлены основы прогнозирования ссылке с онтологии-обогащенный числовые характеристики графов. Авторы утверждали, что в предыдущие социальных исследований сети плоское представление интересов таксономии общества совершенствование прогнозирования ссылке. Онтология агрегированная мера расстояния предлагается кодировать интерес таксономии в онтологии в меру расстояния, чтобы более точно описать общие интересы пользователей.

ТОР и соавт. [74] представлен метод прогнозирования ссылку на онтологии аннотированных данных. Данные первого аннотируются контролируемый словарь терминов из онтологии. Аннотация связей между данными и предикат в онтологии составить график аннотации. График уплотнения и плотной способ подграфа было предложено фильтровать график и найти перспективные. Функция оценки на основе нескольких эвристик был предложен для ранжирования прогнозы, основанные на этих отфильтрованы Amakrishnan [62] предложил метод обнаружения информационных подграфов связи, которые касаются двух объектов в графе. Они предложили эвристику для взвешивания, которые косвенно зависят от семантики сущностей и типы свойств в онтологии и на характеристики экземпляра данных. Дисплей -граф алгоритма генерации было предложено извлечь небольшую подграфа связи с графиком входного сигнала. Mabroukeh и Ezeife [47] предложил использовать онтологии для семантического интеллектуального анализа веб-использования и предсказания следующего страницу. Семантическая информация в онтологии используется в последовательных алгоритмов интеллектуального анализа данных рисунка позволяет сократить пространство поиска и частично облегчить алгоритм подсчета поддержки.

ИЖ. ОЦЕНКА ПРОИЗВОДИТЕЛЬНОСТИ И ПРИЛОЖЕНИЙ

В качестве формальной спецификации понятий и отношений домен, онтология может помочь в процессе интеллектуального анализа данных в различных аспектах. Разумно ожидать прирост производительности в онтологии подходов по сравнению с подходами данных без использования онтологий или других форм знаний предметной области. Многие семантического интеллектуального исследования данных свидетельствуют такие улучшения. С хорошо разработанными алгоритмами, предыдущие исследования или доклады, повышение производительности и достижение задач интеллектуального анализа данных, которые не могут быть достигнуты без использования онтологий. В этом разделе мы дадим краткую сводку повышения производительности в онтологии подходов и их применения.

А. прирост производительности в точности, напомним, и последовательность данных результатов добычи

Многие предыдущие онтологии усилия показали увеличение производительности в результатах интеллектуального анализа данных. Онтологические подходы, как сообщается, имеют более высокую точность и вспомнить, чем традиционные подходы в решении различных задач, таких как кластеризация текстов [32], [33], [35], [65], [82], информация добыча [17], [27], [56], [57], ссылка предсказание [6], [15], [74], и рекомендации системы [33], [52], [60], [61].

Научные исследования в систему рекомендаций предполагает, что на основе онтологий рекомендательные системы имеют более высокую точность прогнозирования по сравнению с традиционными методами рекомендации [13], [83]. С обогащенной семантикой и сокращение пространства поиска, скорость выполнения набирать сообщили в гене задач кластеризации от экспериментов микрочипов с онтологии на основе кластеризации [58]. В горнодобывающей использование интернета и следующая задача прогнозирования странице, семантика-знать последовательность алгоритмов интеллектуального анализа было доказано, чтобы выполнить 4 раза быстрее, чем обычные и не семантика-знать алгоритмы [47].

Онтология-обоснованных подходов повышения согласованности результатов интеллектуального анализа данных. Marinica и соавт. [49], [50] представлены постобработки правило ассоциации результаты интеллектуального анализа с использованием онтологии для проверки согласованности. Семантически противоречивые правила ассоциации укорачивают и отфильтрованы с помощью онтологии и логики рассуждений.

Б. Богатую семантику данных результаты

Онтология также может помочь в обогащении результаты анализа данных с формальной семантики. Богатая семантика результаты интеллектуального анализа данных ожидается от онтологии подходов по сравнению с подходами, без использования онтологий. Например, Оби способен извлечь информацию с аналогичной или близкой семантикой, которые не сразу появляются в источнике данных [39].

Не зная семантики атрибутов или наборов, ассоциативных правил, как правило, создает слишком много правил или даже противоречивые правила. Онтологии на основе правил ассоциации минирование мостов семантический разрыв знаний в предметной области и ассоциации правило алгоритма интеллектуального анализа данных. Это приводит к повышению сбора и представления ассоциативных правил по обрезке результаты или уменьшения пространства поиска. Топ рейтинг правила также привести к высокой мерой поддержки домен адресность [9].

С помощью онтологии, многоуровневых ассоциативных правил будет открывать понятие на основе правил ассоциации, а не экземпляр правил [29], [66], [80]. С супермаркетом операции, такие как сыр и молоко, хлеб и торт, и т. д., традиционные правила ассоциации методы добычи, чтобы создавать правила с тех пунктов, в то время как многоуровневые правило ассоциации могут создавать концептуальные правила уровня, такие как молочные продукты ! хлебобулочные изделия. Хорошо контролируемого детализации семантики повышает потенциал более интересные правила ассоциации.

С. выполнение задач интеллектуального анализа данных, что является недостижимым при использовании традиционных методов интеллектуального анализа данных

Определенных задач интеллектуального анализа данных, которые не могут быть достигнуты традиционными методами интеллектуального анализа данных может быть достигнуто путем онтологического подходов. Например, традиционная задача классификации, как правило, требует, по крайней мере, разумным количеством меченых данных в качестве предварительного знания. Использование онтологии как спецификации предварительного знания, задача классификации без достаточного количества меченых данных доказано, чтобы иметь сопоставимую Производительность по сравнению с традиционными методами классификации [8]. Использование онтологий в качестве концептуальных ограничений согласованности модели с немаркированной данные могут быть настроены на один, которые имеют оптимальную консистенцию с предварительного знания (т. е. онтологии). Задача классификации без пометки или аннотированных данных также сообщается, что в онтологии на основе текста задачи классификации [7].

В. Другие методы семантического анализа данных

Хотя онтология является одним из самых распространенных способов для формального представления знаний домена, другие представления знаний о предметной области используются в семантических данных. Ранние исследования семантического анализа данных использовали понятие иерархии как очень важный представления знаний о предметной области. Предыдущая иерархия понятие алгоритмов, основанных главным образом на использовании способности генерализации, что он может обрабатывать сырые данные на более высоком концептуальном уровне. Хан и соавт. [28] применение концепции иерархии в руководстве таких общих процесса атрибутов в количественном горной ассоциации. Позже, Хан и Фу [29] предложена многоуровневая ассоциации правило добыча с применением концепции иерархии для управления степенью детализации знаний, обнаруженных из данных на различных концептуальных уровнях. Камбер и соавт. [37] предложена иерархия концепции решений на основе методов дереве, в котором индукция деревьев решений может быть достигнута на разных уровнях концептуальной абстракции.

Позже, некоторые исследования использовали баз знаний для семантической задач интеллектуального анализа данных, включая Википедию и кокса [11], которые не совсем формальных онтологий. Габрилович и Маркович [25] вычислить семантическую соотнесенность с помощью Википедии на основе семантического анализа, в котором существенные улучшения в вычислительной слова и текст обзоры подтверждена. Милн и Виттена [54] развернуто Википедия как внешних знаний для документа задач кластеризации. Значительное улучшение производительности было достигнуто, используя понятия и категории информации в Википедии, чтобы аннотировать документы с обогащенной информационной семантики. Ю. и соавт. [81] исследовал способ создавать персонализированные рамки сущности и рекомендации для пользователей поисковых систем посредством использования знаний извлеченные из кокса. Набор данных пользователей, собранных из коммерческих поисковых систем вместе с графической сущности, извлеченные из кокса используются для создания семантического усовершенствованными функциями и строить модели, рекомендации.

Совсем недавно, новое представление, Мета-пути, был разработан для семантических задач интеллектуального анализа данных. Мета-путь-это путь, который определяет состав отношения между совокупностью условий на пути [69]. Например, в библиографическом нетто-работы, типичный Мета-путь может быть Автор ! бумаги ! место. Она обычно определяется на основе графа сети схема терминов интеллектуального анализа данных и понятий. Сравнивая с онтологию, каждый Мета-путь может относиться к нескольким понятиям, а каждый предикат в онтологии совы, как правило, связана с двумя понятиями. Тип Мета-путь определяется типом сущностей в Мета-пути, типа предикат в онтологии определяется смежных понятий. Последние исследования по Мета-пути успешно показали свою способность исследовать эффективный семантический алгоритм интеллектуального анализа данных с многих точек зрения. В начале работы Мета-путь фокусируется на использовании семантической обогатили представление подобия в гетерогенной информационной сети на различных приложениях [68], [70]. Sun и соавт. [68] представили PathSim, Мета-путь основан метод поиска сходства семантического сходства между объектами вычисляются в соответствии со структурой Мета-пути и матричное представление данных экземпляра отношения. Sun и соавт. [70] также предложил PathSelClus, Мета-пути на основе алгоритма кластеризации, в котором семантического сходства оцениваются на основе вероятностной модели на Мета-пути основы.

Заключение

Достижений в области инженерных знаний и интеллектуального анализа данных, продвижения семантического анализа данных, который приносит богатую семантику, чтобы все этапы процесса интеллектуального анализа данных. Многие исследования подтвердили преимущество включения знаний в интеллектуальный анализ данных. Формальная семантика, закодированных в онтологии-это хорошо структурированный, который легко для машины для чтения и обработки, таким образом, сделать его природы способ использования онтологий в семантических данных. Используя онтологии, семантические интеллектуального анализа данных имеет преимущества для преодоления семантического разрыва между данными, приложения, алгоритмы интеллектуального анализа данных и интеллектуального анализа данных результатов, дают алгоритм интеллектуального анализа данных с априорными знания, которые либо направляет процесс добычи или уменьшает пространство поиска, и обеспечивают формальный способ представления данных потока, от предобработки данных для интеллектуального анализа результатов.

В последнее десятилетие для обработки и управления большими данными подняли бурное обсуждение в горнодобывающей сообществу. С развитием технических знаний, особенно в семантических веб-технологий, добычи большое количество, семантика богатых и разнородных данных становится важной темой исследования в сообществе. Как многие исследователи отмечали, работает вместе семантического анализа данных все еще находится в ранней стадии. Онтологий на основе семантического анализа данных представляется одним из наиболее перспективных подходов. Основная задача заключается в разработке более автоматические семантические алгоритмы интеллектуального анализа данных и системы за счет использования в полную силу в формальной онтологии, которая четко определен язык представления, формальная семантика, логика и рассуждения инструменты для формирования и проверки согласованности.

Список Литературы:



  1. OWL Web Ontology Language. http://www.w3.org/TR/owl-ref/.



  1. The National Center for Biomedical Ontology. http://www.bioontology.org/.



  1. G. Adomavicius and A. Tuzhilin. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. Knowledge and Data Engineering, IEEE Transactions on, 17(6):734–749, 2005.



  1. E. Agichtein and L. Gravano. Snowball: Extracting relations from large plain-text collections. In Proceedings of the 5th ACM International Conference on Digital Libraries, pages 85–94, 2000.

  2. H. Alani, S. Kim, D. E. Millard, M. J. Weal, W. Hall, P. H. Lewis, and N. R. Shadbolt. Automatic ontology-based knowledge extraction from web documents. Intelligent Systems, IEEE, 18(1):14–21, 2003.



  1. W. Aljandal, V. Bahirwani, D. Caragea, and W. H. Hsu. Ontology-aware classification and association rule mining for interest and link prediction in social networks. In AAAI Spring Symposium: Social Semantic Web: Where Web 2.0 Meets Web 3.0, pages 3–8, 2009.



  1. M. Allahyari, K. J. Kochut, and M. Janik. Ontology-based text classification into dynamically defined topics. In Semantic Computing (ICSC), 2014 IEEE International Conference on, pages 273–278, 2014.



  1. N. Balcan, A. Blum, and Y. Mansour. Exploiting ontology structures and unlabeled data for learning. In Proceedings of the 30th International Conference on Machine Learning, pages 1112–1120, 2013.



  1. A. Bellandi, B. Furletti, V. Grossi, and A. Romei. Ontology-driven association rule extraction: A case study. Contexts and Ontologies Representation and Reasoning, page 10, 2007.

  2. T. Berners-Lee, J. Hendler, and O. Lassila. The semantic web. Scientific American, 284(5):28–37, 2001.



  1. K. Bollacker, C. Evans, P. Paritosh, T. Sturge, and J. Taylor. Freebase: a collaboratively created graph database for structuring human knowledge. In Proceedings of the 2008 ACM SIGMOD international conference on Management of data, pages 1247–1250, 2008.



  1. R. Burke. Hybrid recommender systems: Survey and experiments. User modeling and user-adapted interaction, 12(4):331–370, 2002.

  2. I. Cantador, A. Bellog´ın, and P. Castells. A multilayer ontology-based hybrid recommendation model. AI Communications, 21(2):203–210, 2008.

  3. I. Cantador, A. Bellog´ın, and P. Castells. Ontology-based personalised and context-aware recommendations of news items. In Proceedings of the 2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology-Volume 01, pages 562–565, 2008.



  1. D. Caragea, V. Bahirwani, W. Aljandal, and W. H. Hsu. Ontology-based link prediction in the livejournal social network. In SARA, volume 9, pages 1–1, 2009.

  2. A. Carlson, J. Betteridge, E. R. Hruschka Jr, and T. M. Mitchell. Coupling semi-supervised learning of categories and relations. In

Proceedings of the NAACL HLT 2009 Workshop on Semi-Supervised Learning for Natural Language Processing, pages 1–9, 2009.

  1. A. Carlson, J. Betteridge, R. C. Wang, E. R. Hruschka Jr, and T. M. Mitchell. Coupled semi-supervised learning for information extraction. In Proceedings of the third ACM international conference on Web Search and Data Mining, pages 101–110, 2010.



  1. P. Domingos. Toward knowledge-rich data mining. Data Mining and Knowledge Discovery, 15(1):21–28, 2007.



  1. D. W. Embley, D. M. Campbell, R. D. Smith, and S. W. Liddle. Ontology-based extraction and structuring of information from data-rich unstructured documents. In Proceedings of the seventh international conference on Information and knowledge management, pages 52–59. ACM, 1998.



  1. M. Erdmann, A. Maedche, H.-P. Schnurr, and S. Staab. From manual to semi-automatic semantic annotation: About ontology-based text annota-tion tools. In Proceedings of the COLING-2000 Workshop on Semantic Annotation and Intelligent Content, pages 79–85, 2000.



  1. U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth. From data mining to knowledge discovery in databases. AI magazine, 17(3):37, 1996.

[22] M. Fernandez,´ I. Cantador, V. Lopez,´ D. Vallet, P. Castells, and E. Motta. Semantically enhanced information retrieval: an ontology-based approach. Web Semantics: Science, Services and Agents on the World Wide Web, 9(4):434–452, 2011.

  1. S. Fodeh, B. Punch, and P.-N. Tan. On ontology-driven document clustering using core semantic features. Knowledge and information systems, 28(2):395–421, 2011.

  2. F. Frasincar, J. Borsje, and L. Levering. A semantic web-based approach for building personalized news services. International Journal of E-Business Research (IJEBR), 5(3):35–53, 2009.

  3. E. Gabrilovich and S. Markovitch. Computing semantic relatedness using wikipedia-based explicit semantic analysis. In IJCAI, volume 7, pages 1606–1611, 2007.

  4. T. R. Gruber. Toward principles for the design of ontologies used for knowledge sharing? International journal of human-computer studies, 43(5):907–928, 1995.

  5. F. Gutierrez, D. Dou, A. Martini, S. Fickas, and H. Zong. Hybrid ontology-based information extraction for automated text grading. In

Machine Learning and Applications (ICMLA), 2013 12th International Conference on, volume 1, pages 359–364. IEEE, 2013.

  1. J. Han, Y. Cai, and N. Cercone. Data-driven discovery of quantitative rules in relational databases. Knowledge and Data Engineering, IEEE Transactions on, 5(1):29–40, 1993.

  2. J. Han and Y. Fu. Discovery of multiple-level association rules from large databases. In VLDB, volume 95, pages 420–431, 1995.

  3. J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, 2005.

  4. A. Hotho, A. Maedche, and S. Staab. Ontology-based text document clustering. KI, 16(4):48–54, 2002.



  1. A. Hotho, S. Staab, and G. Stumme. Ontologies improve text document clustering. In Proceedings of the third IEEE International Conference on Data Mining, pages 541–544, 2003.

  2. W. IJntema, F. Goossen, F. Frasincar, and F. Hogenboom. Ontology-based news recommendation. In Proceedings of the 2010 EDBT/ICDT Workshops, page 16. ACM, 2010.

  3. A. K. Jain. Data clustering: 50 years beyond k-means. Pattern Recognition Letters, 31(8):651–666, 2010.



  1. L. Jing, M. K. Ng, and J. Z. Huang. Knowledge-based vector space model for text clustering. Knowledge and information systems, 25(1):35– 55, 2010.

  2. L. Jing, L. Zhou, M. K. Ng, and J. Z. Huang. Ontology-based distance measure for text clustering. In Proc. of SIAM SDM workshop on text mining, Bethesda, Maryland, USA, 2006.

  3. M. Kamber, L. Winstone, W. Gong, S. Cheng, and J. Han. Generalization

and decision tree induction: Efficient classification in data mining.

In Research Issues in Data Engineering, 1997. Proceedings. Seventh International Workshop on, pages 111–120. IEEE, 1997.



  1. J. Kang and J. Choi. An ontology-based recommendation system using long-term and short-term preferences. In Information Science and Applications (ICISA), 2011 International Conference on, pages 1–8.

IEEE, 2011.

¨

[39] S. Kara, O. Alan, O. Sabuncu, S. Akpınar, N. K. Cicekli, and F. N. Alpaslan. An ontology-based retrieval system using semantic indexing. Information Systems, 37(4):294–305, 2012.



[40] V. Karkaletsis, P. Fragkou, G. Petasis, and E. Iosif. Ontology based information extraction from text. In G. Paliouras, C. Spyropoulos, and G. Tsatsaronis, editors, Knowledge-Driven Multimedia Information Extraction and Ontology Evolution, volume 6050 of Lecture Notes in Computer Science, pages 89–109. Springer Berlin Heidelberg, 2011.

[41] N. Khasawneh and C.-C. Chan. Active user-based and ontology-based web log data preprocessing for web usage mining. In Proceedings of the 2006 IEEE/WIC/ACM International Conference on Web Intelligence, pages 325–328, 2006.



  1. A. Kiryakov, B. Popov, I. Terziev, D. Manov, and D. Ognyanoff. Semantic annotation, indexing, and retrieval. Web Semantics: Science, Services and Agents on the World Wide Web, 2(1):49–79, 2004.



  1. J. M. Kleinberg, R. Kumar, P. Raghavan, S. Rajagopalan, and A. S. Tomkins. The web as a graph: Measurements, models, and methods. In

Computing and combinatorics, pages 1–17. Springer, 1999.

  1. Y. Koren. The bellkor solution to the netflix grand prize. Netflix prize documentation, 81, 2009.



  1. D. Lindberg, B. Humphries, and A. McCray. The Unified Medical Language System. Methods of Information in Medicine, 32(4):281–291, 1993.



  1. H. Liu, D. Dou, R. Jin, P. LePendu, and N. Shah. Mining biomedical ontologies and data using rdf hypergraphs. In Machine Learning and Applications (ICMLA), 2013 12th International Conference on, volume 1, pages 141–146. IEEE, 2013.

  2. N. R. Mabroukeh and C. I. Ezeife. Using domain ontology for semantic web usage mining and next page prediction. In Proceedings of the 18th ACM conference on Information and knowledge management, pages 1677–1680. ACM, 2009.



  1. G. Mansingh, K.-M. Osei-Bryson, and H. Reichgelt. Using ontologies to facilitate post-processing of association rules by domain experts. Information Sciences, 181(3):419–434, 2011.



  1. C. Marinica and F. Guillet. Knowledge-based interactive postmining of association rules using ontologies. Knowledge and Data Engineering, IEEE Transactions on, 22(6):784–797, 2010.



  1. C. Marinica, F. Guillet, and H. Briand. Post-processing of discovered association rules using ontologies. In Data Mining Workshops, 2008. ICDMW’08. IEEE International Conference on, pages 126–133, 2008.

  2. S. E. Middleton, H. Alani, and D. C. De Roure. Exploiting synergy be-tween ontologies and recommender systems. arXiv preprint cs/0204012, 2002.



  1. S. E. Middleton, D. C. De Roure, and N. R. Shadbolt. Capturing knowledge of user preferences: ontologies in recommender systems. In

Proceedings of the 1st international conference on Knowledge capture, pages 100–107. ACM, 2001.

  1. S. E. Middleton, N. R. Shadbolt, and D. C. De Roure. Ontological user profiling in recommender systems. ACM Transactions on Information Systems (TOIS), 22(1):54–88, 2004.



  1. D. Milne and I. H. Witten. An effective, low-cost measure of semantic relatedness obtained from wikipedia links. In Proceeding of AAAI Workshop on Wikipedia and Artificial Intelligence: an Evolving Synergy, pages 25–30, 2008.



  1. H.-M. Muller,¨ E. E. Kenny, and P. W. Sternberg. Textpresso: an ontology-based information retrieval and extraction system for biological literature. PLoS biology, 2(11):e309, 2004.



  1. K. Nebhi. Ontology-based information extraction from twitter. In

Workshop on Information Extraction and Entity Analytics on Social Media Data - COLING 2012, pages 17–22, 2012.

  1. K. Nebhi. Named entity disambiguation using freebase and syntactic parsing. In LD4IE@ISWC, 2013.



  1. K. Ovaska, M. Laakso, and S. Hautaniemi. Fast gene ontology based clustering for microarray experiments. BioData mining, 1(1):11, 2008.



  1. D. Perez-Rey, A. Anguita, and J. Crespo. Ontodataclean: Ontology-based integration and preprocessing of distributed data. In Biological and Medical Data Analysis, pages 262–272. Springer, 2006.

  2. A. Pretschner and S. Gauch. Ontology based personalized search. In

Proceedings of the 11th IEEE International Conference on Tools with Artificial Intelligence, pages 391–398, 1999.

  1. N. Pudota, A. Dattolo, A. Baruzzo, F. Ferrara, and C. Tasso. Automatic keyphrase extraction and ontology mining for content-based tag recom-mendation. International Journal of Intelligent Systems, 25(12):1158– 1186, 2010.



  1. C. Ramakrishnan, W. H. Milnor, M. Perry, and A. P. Sheth. Discovering informative connection subgraphs in multi-relational graphs. ACM SIGKDD Explorations Newsletter, 7(2):56–63, 2005.

  2. S. Riedel, L. Yao, and A. McCallum. Modeling relations and their mentions without labeled text. In Proceedings of the 2010 European conference on Machine learning and knowledge discovery in databases: Part III, ECML PKDD’10, pages 148–163, Berlin, Heidelberg, 2010. Springer-Verlag.



  1. S. J. Russell and P. Norvig. Artificial Intelligence: A Modern Approach. Pearson Education, 2 edition, 2003.

  1. W. Song, C. H. Li, and S. C. Park. Genetic algorithm for text clustering using ontology and evaluating the validity of various semantic similarity measures. Expert Systems with Applications, 36(5):9095–9104, 2009.



  1. R. Srikant and R. Agrawal. Mining generalized association rules. In VLDB, volume 95, pages 407–419, 1995.



  1. R. Studer, V. R. Benjamins, and D. Fensel. Knowledge engineering: principles and methods. Data & knowledge engineering, 25(1):161– 197, 1998.



  1. Y. Sun, J. Han, X. Yan, P. S. Yu, and T. Wu. Pathsim: Meta path-based top-k similarity search in heterogeneous information networks. In VLDB’11, pages 992–1003, 2011.



  1. Y. Sun, B. Norick, J. Han, X. Yan, P. S. Yu, and X. Yu. Integrating meta-path selection with user-guided object clustering in heterogeneous information networks. In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining, pages 1348–1356, 2012.



  1. Y. Sun, B. Norick, J. Han, X. Yan, P. S. Yu, and X. Yu. Pathselclus: Integrating meta-path selection with user-guided object clustering in heterogeneous information networks. ACM Transactions on Knowledge Discovery from Data (TKDD), 7(3):11, 2013.



  1. V. Svatek,´ J. Rauch, and M. Ralbovsky`. Ontology-enhanced association mining. In Semantics, Web and Mining, pages 163–179. Springer, 2006.

  2. D. Tanasa and B. Trousse. Advanced data preprocessing for intersites web usage mining. Intelligent Systems, IEEE, 19(2):59–65, 2004.

  3. The gene ontology consortium. Creating the gene ontology resource: design and implementation. Genome Res., 11(8):1425–1433, August 2001.



  1. A. Thor, P. Anderson, L. Raschid, S. Navlakha, B. Saha, S. Khuller, and X.-N. Zhang. Link prediction for annotation graphs using graph summarization. In The Semantic Web–ISWC 2011, pages 714–729. Springer, 2011.



  1. A. Toscher,¨ M. Jahrer, and R. M. Bell. The bigchaos solution to the netflix grand prize. Netflix prize documentation, 2009.



  1. D. C. Wimalasuriya and D. Dou. Components for information extraction: Ontology-based information extractors and generic platforms. In Pro-ceedings of the 19th ACM Conference on Information and Knowledge Management (CIKM), pages 9–18, 2010.



  1. D. C. Wimalasuriya and D. Dou. Ontology-based information extraction: An introduction and a survey of current approaches. Journal of Information Science, 36(3):306–323, 2010.



  1. F. Wu and D. S. Weld. Autonomously semantifying wikipedia. In Pro-ceedings of the 16th ACM Conference on Information and Knowledge Management, CIKM ’07, pages 41–50, 2007.



  1. F. Wu and D. S. Weld. Automatically refining the wikipedia infobox ontology. In Proceedings of the 17th international conference on World Wide Web, WWW ’08, pages 635–644. ACM, 2008.



  1. G. Yang, K. Shimada, S. Mabu, K. Hirasawa, and J. Hu. A genetic network programming based method to mine generalized association rules with ontology. In SICE, 2007 Annual Conference, pages 2715– 2722. IEEE, 2007.



  1. X. Yu, H. Ma, B.-J. P. Hsu, and J. Han. On building entity recommender systems using user click log and freebase knowledge. In Proceedings of the 7th ACM international conference on Web search and data mining, pages 263–272, 2014.



  1. X. Zhang, L. Jing, X. Hu, M. Ng, J. Xia, and X. Zhou. Medical document clustering using ontology-based term similarity measures. International Journal of Data Warehousing and Mining (IJDWM), 4(1):62–73, 2008.

  2. L. Zhuhadar, O. Nasraoui, R. Wyatt, and E. Romero. Multi-model ontology-based hybrid recommender system in e-learning domain. In

Proceedings of the 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology-Volume 03, pages 91–95, 2009.
Скачать 56,76 Kb.

Поделитесь с Вашими друзьями:




База данных защищена авторским правом ©psihdocs.ru 2023
обратиться к администрации

    Главная страница