Video: Proceso KDD 2024
Parte de Data Mining For Dummies Cheat Sheet
The Proceso estándar entre industrias para minería de datos ( CRISP-DM ) es el marco de proceso de minería de datos dominante. Es un estándar abierto; cualquiera puede usarlo. La siguiente lista describe las diversas fases del proceso.
-
Comprensión empresarial: Obtenga una comprensión clara del problema que tiene que resolver, cómo afecta a su organización y sus objetivos para abordarlo. Las tareas en esta fase incluyen:
-
Identificar los objetivos de su negocio
-
Evaluar su situación
-
Definir sus objetivos de minería de datos
-
Producir su plan de proyecto
-
-
Comprensión de datos: Revise los datos que tiene, documentarlo, identificar problemas de gestión de datos y calidad de datos. Las tareas para esta fase incluyen:
-
Recopilación de datos
-
Describiendo
-
Explorando
-
Verificando calidad
-
-
Preparación de datos: Obtenga sus datos listos para usar para el modelado. Las tareas para esta fase incluyen:
-
Selección de datos
-
Limpieza de datos
-
Construcción
-
Integración
-
Formateo
-
-
Modelado: Use técnicas matemáticas para identificar patrones dentro de sus datos. Las tareas para esta fase incluyen:
-
Seleccionar técnicas
-
Diseñar pruebas
-
Crear modelos
-
Evaluar modelos
-
-
Evaluación: Revise los patrones que ha descubierto y evalúe su potencial para el uso comercial. Las tareas para esta fase incluyen:
-
Evaluación de resultados
-
Revisión del proceso
-
Determinación de los próximos pasos
-
-
Despliegue: Ponga sus descubrimientos a trabajar en el día a día. Las tareas para esta fase incluyen:
-
Planificación de la implementación (sus métodos para integrar descubrimientos de minería de datos en uso)
-
Informes de resultados finales
-
Revisión de los resultados finales
-