Proyectos en Ciencia de Datos
Estructura
Comprensión del Negocio
Identificación del problema
Planeación
Objetivos
Recursos
Presupuesto
Personal
Datos
Herramientas
Infraestructura
Actividades
Tiempos
Restricciones
Anticipación de retos
Alcance
Preselección de técnicas
Comprensión de los datos
Fuentes de informaciónn
Descripción de los datos
Exploración de los datos
Preparación de los datos
Integración de fuentes
Selección datos relevantes
Limpieza
Atípicos
Faltantes
Corregir errores
Transformación
Normalización
Nuevas variables
Estandarización
Modelado
Selección de los modelos
Clasificación
Regresión
Segmentación
Pruebas de hipótesis
Ajuste del modelo e iteracción
Evaluación
Revisión general del proyecto
Evaluar resultados de los modelos
Selección mejor(es) modelo(s)
Determinar si es apto para implementar
Implementación
Documentar
Despliegue
Aplicación a nuevos datos
Pruebas
Ciclo de mejora
Monitoreo continuo
Ajuste y refinamiento
Comunicación de resultados
Retos
Datos
Acceso y recopilación de datos
Calidad de los datos
Cantidad de datos
Datos irrelevantes
Pocos datos
Datos faltantes
Datos atípicos
Datos sesgados
Nivel incorrecto
de detalle
Confidencialidad
de los datos
Datos privados
Datos sensibles
Etica en el manejo de datos
Modelado
Selección de modelos
Gran o poco
volumen de información
Aprender
información erronea
Sesgo en las respuestas
Alucinación del modelo
Aprender información inutil
Sobreajuste
Subajuste
Acompañamiento de expertos
Gestión del proyecto
Cambios sobre la marcha
Asignación de recursos
Comunicación entre las diferentes partes
Cumplimiento de plazos
Impactos
Positivos
Economico
Optimización de recursos
Tiempo
Personal
Infraestructura
Aumento de utilidades
Eficiencia operativa
Impulsar los ingresos
Detección y prevención de fraude
Cientifico
Generación de nuevo conocimiento
Trabajo interdisciplinario
Validación o refuerzo de teorias o estudios
Social
Mejora calidad de vida
Mejor atención en salud
Mejor calidad de educación
Ofertas personalizadas
Acceso a recursos
Creación de empleo
Predicción de problematicas
sociales
Ambiental
Monitoreo y conservación
de recursos naturales
Predicción de desastres naturales
Monitoreo de recursos naturales
Aire y Agua
Negativos
Económico
Costos iniciales elevados
Costos operativos continuos
Mano de obra calificada
Posibilidad de no retorno a la inversión
Persuación para la compra
Cientifico
Crecimiento no controlado
de conocimiento
Falta de documentación
Falta de revisión de los estudios
Falta de reproucibilidad
Saturación del entorno cientifico
Social
Desplazamiento laboral
Manipulación del comportamiento
Dependencia de la tecnología
Sesgo algorítmico
Privacidad de la información
Ambiental
Calentamiento global
Residuos electrónicos
Generación de calor
Consumo de energía