Proyectos en ciencia de datos: Aspectos en común

Aspectos Estructurales

Definición del problema

es crucial para

Establecer claramente el problema que se va a abordar

Implica

Comprender las necesidades del negocio o la investigación

Definir cómo el análisis de datos puede ayudar a resolver el problema

Conformar el Equipo de trabajo

Recolección de datos

incluye

Identificación de fuentes de datos

Recopilación de datos

puede implicar

Adquisición de datos de bases de datos

APIs

Archivos locales

Almacenamiento y gestión de datos

los datos deben

Almacenarse de manera segura y Organizada

Puede incluir la creación de

Bases de datos

Data lakes

Sistemas de almacenamiento en la nube

Exploración y tratamiento de datos

los datos deben

Explorarse; para comprender su estructura y calidad

Limpiarse; adecuadamente para el análisis

Transformarse; adecuadamente para el análisis

Prepararse; adecuadamente para el análisis

Modelado de Datos

se construyen

Modelos estadísticos o de aprendizaje automático

incluye técnicas como

Regresión

Clasificación

Clustering

Evaluación de Resultados

determinan

Eficacia

Precisión

Aspectos Procedimentales

Metodología de Trabajo estructurada

como

CRISP-DM

Data Mining

Gestión de Proyectos

Se debe establecer un plan de proyecto
que incluya

Presupuesto

Tiempos y plazos

Recursos

Responsabilidades

Comunicación y Colaboración

Es importante mantener
comunicación con

Equipo de trabajo

Patrocinadores del proyecto

Usuarios finales

Documentación

se debe documentar

Proceso de recopilación y limpieza de datos

Modelos construidos

Resultados obtenidos

Decisiones tomadas

Ética y Cumplimiento Normativo

es importante tener en cuenta

Consideraciones éticas

Consideraciones Normativas

Dificultades y retos

Calidad de los datos

suelen ser

Incompletos

Incorrectos

Inconsistentes

Escalabilidad

con el aumento en el volumen los datos
surgen desafíos como

Escalabilidad de las herramientas

Capacidad de procesamiento de grandes cantidades de datos

Selección adecuada de variables

pueden ser

Relevantes

Irrelevantes

La correcta interpretación de los datos

Ética y Privacidad

es importante grantizar

La privacidad y la seguridad de los datos

Cumplir con las regulaciones y normativas aplicables

Acceso a los datos

se hace complicado

Obtener permisos para el uso de datos gubernamentales

Personal experto

es crucial

Vincular al equipo personal experto en el área de aplicación del proyecto

Resultados

algunos resultados son

Sector Productivo

Aumento de la productividad

Scoring Crediticio

Optimización de procesos

Modelos predictivos para toma de decisiones

Sector gubernamental

Modelos de Machine Learning

Desarrollo de aplicaciones

Incremento en la eficiencia operacional

Sector académico

Modelos de machine learnig

Aplicaciones Web

Sector Salud

Modelos analíticos

Modelos predictivos

Impactos

los impactos se derivan en

Sector Productivo

Incremento en la competitividad

generando beneficios en

Incrementa la oferta

Disminuyen los costos al consumidor

Alta calidad en los productos

generando

Clientes satisfechos

Confiablilidad

Aumento en los ingresos

beneficiando

Las condiciones de los empleados y sus familias

Índices de desempleo

Sector gubernamental

Aumento en el recaudo de impuestos

genera

Mayor ingreso para inversion

Mejoras a las politicas publicas

beneficiando

Población vulnerable

Mujeres cabeza de familia

Victimas del conflicto

Pequeños y medianos empresarios

Niñez

Agilización de la asignación de recursos

para

Desarrollo de proyectos agrícolas

Disminuir actos de corrupción

Sector académico

Innovación de métodos de enseñanza

Fortalecimiento de grupos de investigación.

Identificación y prevención de la deserción escolar

Nuevos métodos y estrategias basados en tecnología

Sector Salud

Innovación

Prevención y diagnóstico

Personalización de tratamientos

Gestión de pacientes

Atención Sanitaria