Технология интеллектуального анализа данных “Automatic Data Mining based on Cluster Structures”
Технология базируется на оригинальном методе интеллектуального анализа данных (Data mining).
Лицо для контактов
В.Г. Родченко
Краткое описание научно-технической продукции
Технология базируется на оригинальном методе интеллектуального анализа данных (Data mining).
Метод основан на новом подходе к проблеме анализа данных и предусматривает обнаружение в данных ранее неизвестных, практически полезных и доступных интерпретации в рамках предметной области закономерностей.
В отличие от методов машинного обучения предусматривается, во-первых, обработка данных обучающей выборки в автоматическом, а не автоматизированном режиме, и, во-вторых, выявляемые закономерности могут быть проинтерпретированы в терминах предметной области.
Ожидаемый результат применения.
1) Отказаться от идеи фокусировки процесса обучения на построении алгоритма классификации (т.е. от идеи построения разделяющих классы поверхностей, которая характерна для большинства традиционно используемых алгоритмов).
2) Сосредоточится на идее обнаружения в данных скрытых интерпретируемых закономерностей путем исследования свойств классов и на выявлении пространств решений, в которых классы не пересекаются (т.е. на идее, заложенной в гипотезе компактности).
Заключение
1) Представлен альтернативный подход к Data Mining, который основан на анализе свойств сочетаний признаков априорного словаря.
2) Алгоритм обучения позволяет автоматически провести интеллектуальный анализ данных обучающей выборки и выявить наиболее информативные признаки с точки зрения разделения классов.
3) Продемонстрированы результаты применения алгоритма для обработки реального датасета Mushroom from the UCI Machine Learning Repository.