Анализ информативных признаков в базе kdd


Заменить точку на запятую Заменить точку на запятую



страница4/5
Дата13.12.2022
Размер3,96 Mb.
#196599
ТипАнализ
1   2   3   4   5
Связанные:
Анализ информативных признаков в базе KDD

Заменить точку на запятую

Заменить точку на запятую

Нормализация данных


Нормирование выполняется для отображения диапазона расчетных значений исходных показателей, имеющих различные единицы измерений и/или диапазоны изменения.
1. Наиболее простым способом нормирования будет линейное преобразование
Линейная нормировка оптимальна, когда значения переменной
плотно заполняют определенный интервал. Если в данных имеются
относительно редкие выбросы, намного превышающие типичный разброс, именно эти выбросы определят масштаб нормировки.
Это приведет к тому, что основная масса значений нормированной переменной
сосредоточится вблизи нуля.

Нормализация данных


2. Способ нормировки ориентируется не на экстремальные значения, а на типичные, т.е. статистические характеристики данных, такие как среднее и дисперсия
В этом случае основная масса данных будет изменятся в пределах [-1;1]. Однако, теперь нормированные величины не принадлежат гарантированно единичному интервалу, более того, максимальный разброс значений заранее не известен.

Нормализация данных


3. Способ относительного приращения
4. Нелинейное преобразование

Нормализация данных

Нормализация данных

Анализ неинформативных параметров

Анализ неинформативных параметров

Анализ неинформативных параметров

Анализ неинформативных параметров

Анализ неинформативных параметров


связь 3 и 22 параметров, где парный коэффициент корреляции равен 0,949798, т.е. больше чем 0,7. Необходимо исключить из дальнейшего анализа переменную №3, так как эта переменная имеет меньшую корреляцию с показателем Y

Анализ неинформативных параметров

Анализ неинформативных параметров


связь 6 и 10 параметров, где парный коэффициент корреляции равен 0,96471, т.е. больше чем 0,7. Необходимо исключить из дальнейшего анализа переменную №6, так как эта переменная имеет меньшую корреляцию с показателем Y


Поделитесь с Вашими друзьями:
1   2   3   4   5




База данных защищена авторским правом ©psihdocs.ru 2023
обратиться к администрации

    Главная страница