Se implementan mediante
Generan
Generan

Proyectos de Ciencia de Datos

Existen diversas

Áreas de aplicación

Salud

Sector productivo

Academia

Sector Gubernamental

Algunas categorías

De predicción

De agrupación

De estimación

De respuesta binaria

Algunos tipos

Regresión lineal

Regresión logística

Árbol de decisiones

Clustering de densidades

Clustering de afinidades

Redes neuronales

Random Forest

Marcos metodológicos

CRISP-DM

Entendimiento del negocio

Entendimiento de los datos

Preparación de los datos

Modelado

Evaluación

Implementación/Despliegue

Presentan retos

Éticos

Privacidad de los usuarios

Acceso público de datos

Sesgos socio-culturales

Operacionales

Consecución de datos

Gobernanza de datos

Acceso a los datos

Fiabilidad de los datos

Capacidad de computación

Conocimiento técnico

Conocimiento de negocio específico

Económicos

Costos operacionales altos

Costos de procesamiento

Costo personal técnico

Impactos Positivos

Económicos

Uso eficiente de recursos

Reducción de costos

Decisiones más eficientes

Menor consumo
y desperdicio

Técnicos

Mejoramiento de
los mdelos

Aprendizaje
interdisciplinario

Intercambio de trabajo
intersectorial

Innovación en el sector

Bienestar humano

Atención en salud

Mejoramiento de
Servicios públicos

Mejoramiento condiciones
laborales

Impulso del espíritu
innovador

Ambiental

Aprovechamiento recursos
naturales

Entendimiento fenómenos
naturales

Impactos negativos

Económicos

Pérdida de empleo

Reemplazo de
trabajos operativos

Técnicos

Desigualdad en desarrollo
entre los sectores

Bienestar humano

Vulneración de
la privacidad

Usos poco éticos de
la tecnología

Ambiental

Empleo excesivo
de energía

Aumento de producción
sin medir consecuencias

Por: Juan Camilo López Velásquez
Asignatura: Retos en Ciencia de Datos