Oracle Data Mining
Опция Oracle Data Mining (ODM) предназначена для анализа данных методами, относящимися к технологии извлечения знаний или "data mining".
Основная задача этой технологии состоит в выявлении в больших наборах данных скрытых закономерностей, зависимостей и взаимосвязей, полезных при принятии решений на различных уровнях управления. Такие закономерности представляются в виде моделей различного типа, позволяющих проводить классификацию ситуаций или объектов, прогнозировать их поведение, выявлять группы сходных объектов и т.п. Существенно, что модели строятся автоматически на основе анализа имеющихся данных об объектах, наблюдениях и ситуациях с помощью специальных алгоритмов.
Методы извлечения знаний применяются в различных областях для решения таких практических задач, как привлечение новых, выявление наиболее перспективных и удержание клиентов, повышение эффективности маркетинговой деятельности по продвижению продуктов и услуг, выявлению причин сбоев оборудования и так далее.
Основу опции составляют процедуры, реализующие различные алгоритмы построения моделей классификации, регрессии, кластеризации. Версия Data Mining 10G поддерживает широкий спектр таких алгоритмов (перечислены в таблице)
| Алгоритмы, реализованные в Oracle Data Mining
| |
Классификационные модели
|
Naive Bayes, Adaptive Bayes Network
| |
Классификации и регрессионные модели
|
Support Vector Machine
| |
Поиск существенных атрибутов
|
Minimal Descriptor Length
| |
Кластеризация
|
Enhanced K-means, O-cluster
| |
Поиск ассоциаций
|
Apriory Algorithm
| |
Выделение признаков
|
Non-Negative Matrix Factorization
|
Важная особенность алгоритмов состоит в том, что все они работают непосредственно с реляционными базами данными и не требуют выгрузки и сохранения данных в специальных форматах. Кроме собственно алгоритмов, в опцию ODM входят средства подготовки данных, оценки результатов, применения моделей к новым наборам данных. Использовать все эти возможности можно как на программном уровне с помощью Java API или PL/SQL API, так и с помощью графической среды ODM Client, ориентированной на работу аналитиков, решающих задачи прогнозирования, выявления тенденций, сегментации и др.
|