Proyectos en ciencia de datos: Aspectos en común
Aspectos Estructurales
Definición del problema
es crucial para
Establecer claramente el problema que se va a abordar
Implica
Comprender las necesidades del negocio o la investigación
Definir cómo el análisis de datos puede ayudar a resolver el problema
Conformar el Equipo de trabajo
Recolección de datos
incluye
Identificación de fuentes de datos
Recopilación de datos
puede implicar
Adquisición de datos de bases de datos
APIs
Archivos locales
Almacenamiento y gestión de datos
los datos deben
Almacenarse de manera segura y Organizada
Puede incluir la creación de
Bases de datos
Data lakes
Sistemas de almacenamiento en la nube
Exploración y tratamiento de datos
los datos deben
Explorarse; para comprender su estructura y calidad
Limpiarse; adecuadamente para el análisis
Transformarse; adecuadamente para el análisis
Prepararse; adecuadamente para el análisis
Modelado de Datos
se construyen
Modelos estadísticos o de aprendizaje automático
incluye técnicas como
Regresión
Clasificación
Clustering
Evaluación de Resultados
determinan
Eficacia
Precisión
Aspectos Procedimentales
Metodología de Trabajo estructurada
como
CRISP-DM
Data Mining
Gestión de Proyectos
Se debe establecer un plan de proyecto
que incluya
Presupuesto
Tiempos y plazos
Recursos
Responsabilidades
Comunicación y Colaboración
Es importante mantener
comunicación con
Equipo de trabajo
Patrocinadores del proyecto
Usuarios finales
Documentación
se debe documentar
Proceso de recopilación y limpieza de datos
Modelos construidos
Resultados obtenidos
Decisiones tomadas
Ética y Cumplimiento Normativo
es importante tener en cuenta
Consideraciones éticas
Consideraciones Normativas
Dificultades y retos
Calidad de los datos
suelen ser
Incompletos
Incorrectos
Inconsistentes
Escalabilidad
con el aumento en el volumen los datos
surgen desafíos como
Escalabilidad de las herramientas
Capacidad de procesamiento de grandes cantidades de datos
Selección adecuada de variables
pueden ser
Relevantes
Irrelevantes
La correcta interpretación de los datos
Ética y Privacidad
es importante grantizar
La privacidad y la seguridad de los datos
Cumplir con las regulaciones y normativas aplicables
Acceso a los datos
se hace complicado
Obtener permisos para el uso de datos gubernamentales
Personal experto
es crucial
Vincular al equipo personal experto en el área de aplicación del proyecto
Resultados
algunos resultados son
Sector Productivo
Aumento de la productividad
Scoring Crediticio
Optimización de procesos
Modelos predictivos para toma de decisiones
Sector gubernamental
Modelos de Machine Learning
Desarrollo de aplicaciones
Incremento en la eficiencia operacional
Sector académico
Modelos de machine learnig
Aplicaciones Web
Sector Salud
Modelos analíticos
Modelos predictivos
Impactos
los impactos se derivan en
Sector Productivo
Incremento en la competitividad
generando beneficios en
Incrementa la oferta
Disminuyen los costos al consumidor
Alta calidad en los productos
generando
Clientes satisfechos
Confiablilidad
Aumento en los ingresos
beneficiando
Las condiciones de los empleados y sus familias
Índices de desempleo
Sector gubernamental
Aumento en el recaudo de impuestos
genera
Mayor ingreso para inversion
Mejoras a las politicas publicas
beneficiando
Población vulnerable
Mujeres cabeza de familia
Victimas del conflicto
Pequeños y medianos empresarios
Niñez
Agilización de la asignación de recursos
para
Desarrollo de proyectos agrícolas
Disminuir actos de corrupción
Sector académico
Innovación de métodos de enseñanza
Fortalecimiento de grupos de investigación.
Identificación y prevención de la deserción escolar
Nuevos métodos y estrategias basados en tecnología
Sector Salud
Innovación
Prevención y diagnóstico
Personalización de tratamientos
Gestión de pacientes
Atención Sanitaria