Proyectos en Ciencia de Datos

Estructura

Comprensión del Negocio

Identificación del problema

Planeación

Objetivos

Recursos

Presupuesto

Personal

Datos

Herramientas

Infraestructura

Actividades

Tiempos

Restricciones

Anticipación de retos

Alcance

Preselección de técnicas

Comprensión de los datos

Fuentes de informaciónn

Descripción de los datos

Exploración de los datos

Preparación de los datos

Integración de fuentes

Selección datos relevantes

Limpieza

Atípicos

Faltantes

Corregir errores

Transformación

Normalización

Nuevas variables

Estandarización

Modelado

Selección de los modelos

Clasificación

Regresión

Segmentación

Pruebas de hipótesis

Ajuste del modelo e iteracción

Evaluación

Revisión general del proyecto

Evaluar resultados de los modelos

Selección mejor(es) modelo(s)

Determinar si es apto para implementar

Implementación

Documentar

Despliegue

Aplicación a nuevos datos

Pruebas

Ciclo de mejora

Monitoreo continuo

Ajuste y refinamiento

Comunicación de resultados

Retos

Datos

Acceso y recopilación de datos

Calidad de los datos

Cantidad de datos

Datos irrelevantes

Pocos datos

Datos faltantes

Datos atípicos

Datos sesgados

Nivel incorrecto
de detalle

Confidencialidad
de los datos

Datos privados

Datos sensibles

Etica en el manejo de datos

Modelado

Selección de modelos

Gran o poco
volumen de información

Aprender
información erronea

Sesgo en las respuestas

Alucinación del modelo

Aprender información inutil

Sobreajuste

Subajuste

Acompañamiento de expertos

Gestión del proyecto

Cambios sobre la marcha

Asignación de recursos

Comunicación entre las diferentes partes

Cumplimiento de plazos

Impactos

Positivos

Economico

Optimización de recursos

Tiempo

Personal

Infraestructura

Aumento de utilidades

Eficiencia operativa

Impulsar los ingresos

Detección y prevención de fraude

Cientifico

Generación de nuevo conocimiento

Trabajo interdisciplinario

Validación o refuerzo de teorias o estudios

Social

Mejora calidad de vida

Mejor atención en salud

Mejor calidad de educación

Ofertas personalizadas

Acceso a recursos

Creación de empleo

Predicción de problematicas
sociales

Ambiental

Monitoreo y conservación
de recursos naturales

Predicción de desastres naturales

Monitoreo de recursos naturales
Aire y Agua

Negativos

Económico

Costos iniciales elevados

Costos operativos continuos

Mano de obra calificada

Posibilidad de no retorno a la inversión

Persuación para la compra

Cientifico

Crecimiento no controlado
de conocimiento

Falta de documentación

Falta de revisión de los estudios

Falta de reproucibilidad

Saturación del entorno cientifico

Social

Desplazamiento laboral

Manipulación del comportamiento

Dependencia de la tecnología

Sesgo algorítmico

Privacidad de la información

Ambiental

Calentamiento global

Residuos electrónicos

Generación de calor

Consumo de energía

Santiago Alexis Patiño Munera