作者:Andres Casallas 2 年以前
173
PROYECTO DE CIENCIAS DE DATOS GENÉRICO
Confidencialidad y protección de datos
Rendimiento y eficiencia
PROYECTO DE CIENCIAS DE DATOS GENÉRICO
Impactos
Optimización del presupuesto
La analítica genera valor en el nivel estratégico de las entidades
Disminución en el nivel de riesgo
Reducción de costos operativos
Aumento en la utilidad
Optimización en los tiempos de respuesta
Dificultades y retos
Capacidad de cómputo limitada
Omisión de juicio de expertos
Datos sin normalizar y errados
Gobierno de datos no definido
Consecución de fuentes de datos volumétricas
Aspectos procedimentales
Actividades
Mantenimiento al modelo (correcciones y optimizaciones)
Dashboard, informes y predicciones
Despliegue en producción
Identificar limitaciones y desafíos
Discretizar variables categóricas
Definición de métricas e indicadores
Evaluar los modelos
Juicio de expertos
Estadísiticamente
Segmentar datos: de desarrollo 70%, de validación 30%
Identificar el Software
Conclusiones y recomendaciones
Desarrollar los modelos
Predictivos
Descriptivos
Iterar con variedad de datos
Simular los modelos
Seleccionar hiperparámetros
Cleaning de datos
Construir la base de datos
Identificar las técnicas y herramientas
Identificar las variables dependientes e independientes
Identificar fuentes de información
Conciliación
Como se integran
Ubicación
Definición del objetivo general y específicos
Contexto de la empresa, visión, misión, políticas, normatividad
Aspectos estructurales
Etapas
Implementación
Presentación de resultados
Análisis exploratorio
Recopilación de datos
Identificación del problema