CRISP-DM

QUÉ ES..?

Metodología creada para dar forma a los proyectos de Data Mining.

Es una metodología estándar que ha sido desarrollada para la construcción de proyectos.

Propone un ciclo de vida, cuya primer fase es comprensión del negocio.

Como metodología, incluye descripciones de las fases normales de un proyecto, las tareas necesarias en cada fase y una explicación de las relaciones entre las tareas.

El modelo de CRISP-DM es flexible y se pueden personalizar fácilmente.

Esta comprendida de 6 fases.

FASES

1) Comprensión del Negocio.

Establecer los objetivos del negocio.

Establecer los requisitos del proyecto.

Establecer los objetivos de la minería de datos.

Generar el plan del proyecto.

2) Comprensión de los Datos.

Recopilar información inicial.

Descripción de los datos.

Exploración de los datos.

Verificación la calidad de los datos.

3) Preparación de los datos.

Selección de los datos.

Limpieza de los datos.

Construcción de los datos.

Integración de los datos.

Formateo de los datos.

4) Modelado.

Seleccionar la técnica del modelado.

Diseño del plan de prueba.

Construcción del modelo.

Evaluar el modelo.

5) Evaluación.

Evaluar los resultados.

Revisar el proceso

Establecer las siguientes acciones
.

6) Implementación.

Una vez obtenido los resultados que son útiles para nuestro problema, hay que identificar las acciones que se deben tomar, pensar en cómo proceder para llevarlas a cabo e implementar

VENTAJAS Y DESVENTAJAS

VENTAJAS

Mayor competitividad.

Satisfacción del cliente.

Confianza de los clientes y proveedores.

Disminución y cumplimiento de los plazos.

Disminución de costos.

Reducción de tiempo.

DESVENTAJAS

Puede aparecer algún inconveniente a la hora de utilizar esta METODOLOGÍA.

Dependiendo del tipo de datos que se quieran recopilar, nos puede llevar mucho trabajo.

A veces la inversión inicial para obtener la METODOLOGÍA necesarias para la recopilación de datos puede tener un coste elevado.

APLICACIÓN Y BENEFICIOS

Para aplicar en una empresa se debe:

Analizar y considerar como un eje principal.

Analizar todos los tipos de datos por completos.

Agrupar lainformación de los datos y su comportamiento.

Evaluar conjuntamente los datos considerando las tareas especificas.

Considerar la implementación estructural, junto al tiempo que se utilizó.

Obtener datos fiables que ofrece información de calidad.

Mantener una organización adecuada de toda la información.

Cross Industry Standard Process for Data Mining

PROCESO ESTÁNDAR TRANSVERSAL DE LA INDUSTRIA PARA LA MINERÍA DE DATOS