Se Caracteriza por:
Se Caracteriza Por
Negativos
Positivos
Se Compone de:
Se Compone de
Se Compone de:
Se Compone de:
Puede ser
Puede ser
Puede Ser
Desde
Se Compone de:
Se Compone de:
Se compone de:
Se Convierten en

Procesos

Indentificacion del problema

Objetivos Comerciales

Objetivos de Mineria de Datos

Limpieza y Preprocesamiento
de Datos

Deteccion de valores faltantes

Deteccion de Valores Atipicos

Analisis Exploratorio
de Datos

Visuaizacion de Datos

Relacion entre Variables

Analisis sobre la
Naturaleza y Estrucutra de
los Datos

Ingenieria de
Caracteristicas

Seleccion de Carateristicas

Transformacion de caracteristicas

Creacion de Nuevas Caracteristicas

Reduccion de la Dimensionaidad

Adquision de datos

Fuentes de Datos

Data Propia

Data Compartida

Data Externa o
de Terceros

Modelado y
Seleccion de
Algoritmos

Seleccion de los Algoritmos
Candidatos

Evaluacion del Algoritmo

Comparacion de Modelos

Evaluacion y Validacion
de Modelos

Creacion del Conjunto de
Entrenamiento, Validacion
y Prueba

Seleccion de Metricas
de Evaluacion

Entrenamiento del Modelo

Implementacion

Preparacion del
Entorno de Implementacion

Empaquetado del Modelo

Integracion con la
Infraestructura

Manteminiento

Mantenimiento y
Monitoreo

Difultades y Retos

Calida de Datos

Falta de Datos Etiquetados

Dimensionalidad Alta

Interpretabilidad de Modelos

Tiempos y Recursos Limitados

Problemas de Escabilidad

Complejidad de los Modelos

Impactos

Mejora la toma de decisiones

Automatiza tareas repetitivas

Disminucion de costos

Mejora la calidad en
los productos

Sesgos y Discriminacion

Privacidad y Seguridad

Desplazamiento Laboral

Dependencia Tecnologica

Proyectos en Ciencia de Datos

Tipos de Problemas

Aprendizaje Supervisado

Variables Etiquetadas

Conocemos la Variable Objetivo

Podemos Establecer una
Relacion Causal

Aprendizaje No Supervisado

Datos no etiquetados

No Conocemos la Variable
Objetivo

No Establecemos una
Relacion Causal Apriori