Procesos
Indentificacion del problema
Objetivos Comerciales
Objetivos de Mineria de Datos
Limpieza y Preprocesamiento
de Datos
Deteccion de valores faltantes
Deteccion de Valores Atipicos
Analisis Exploratorio
de Datos
Visuaizacion de Datos
Relacion entre Variables
Analisis sobre la
Naturaleza y Estrucutra de
los Datos
Ingenieria de
Caracteristicas
Seleccion de Carateristicas
Transformacion de caracteristicas
Creacion de Nuevas Caracteristicas
Reduccion de la Dimensionaidad
Adquision de datos
Fuentes de Datos
Data Propia
Data Compartida
Data Externa o
de Terceros
Modelado y
Seleccion de
Algoritmos
Seleccion de los Algoritmos
Candidatos
Evaluacion del Algoritmo
Comparacion de Modelos
Evaluacion y Validacion
de Modelos
Creacion del Conjunto de
Entrenamiento, Validacion
y Prueba
Seleccion de Metricas
de Evaluacion
Entrenamiento del Modelo
Implementacion
Preparacion del
Entorno de Implementacion
Empaquetado del Modelo
Integracion con la
Infraestructura
Manteminiento
Mantenimiento y
Monitoreo
Difultades y Retos
Calida de Datos
Falta de Datos Etiquetados
Dimensionalidad Alta
Interpretabilidad de Modelos
Tiempos y Recursos Limitados
Problemas de Escabilidad
Complejidad de los Modelos
Impactos
Mejora la toma de decisiones
Automatiza tareas repetitivas
Disminucion de costos
Mejora la calidad en
los productos
Sesgos y Discriminacion
Privacidad y Seguridad
Desplazamiento Laboral
Dependencia Tecnologica
Proyectos en Ciencia de Datos
Tipos de Problemas
Aprendizaje Supervisado
Variables Etiquetadas
Conocemos la Variable Objetivo
Podemos Establecer una
Relacion Causal
Aprendizaje No Supervisado
Datos no etiquetados
No Conocemos la Variable
Objetivo
No Establecemos una
Relacion Causal Apriori