av Jennifer Espinoza Peña 2 år siden
254
Mer som dette
proceso ETL
Carga de Dimensión FECHA: en este paso, en vez de recibir el valor de la variable "Fecha_Desde", se tomará la fecha del último registro cargado en la dimensión FECHA.
Carga de Dimensión PRODUCTO: a la serie de tareas que realiza este paso, se le antecederá un nuevo paso que borrará los datos de la dimensión PRODUCTO
Carga de Dimensión CLIENTE: a la serie de tareas que realiza este paso, se le antecederá un nuevo paso que borrará los datos de la dimensión CLIENTE.
Establecer variables Fecha_Desde y Fecha_Hasta
Inicio: iniciará la ejecución de los pasos todos los días a las doce de la noche.
políticas de Actualización
Los datos de la tabla de hechos que corresponden al último mes (30 días) a partir de la fecha actual, serán reemplazados cada vez.
Los datos de la tabla de dimensión “FECHA” se cargarán de manera incremental teniendo en cuenta la fecha de la última actualización.
Los datos de las tablas de dimensiones “PRODUCTO” y “CLIENTE” serán cargados totalmente cada vez.
La información se refrescará todos los días a las doce de la noche.
Cuando se haya cargado en su totalidad el DW, se deben establecer sus políticas y estrategias de actualización o refresco de datos
siguientes acciones
Especificar de forma general y detallada las acciones que deberá realizar cada software.
Especificar las tareas de limpieza de datos, calidad de datos, procesos ETL, etc., que deberán realizarse para actualizar los datos del DW.
Carga de Tabla de Hechos VENTAS
Carga de Dimensión PRODUCTO
CARGA DIMENSIONAL CLIENTE
Carga Inicial.
Primero se cargarán los datos de las dimensiones y luego los de las tablas de hechos
se trabaja con un esquema constelación, hay que tener presente que varias tablas de dimensiones serán compartidas con diferentes tablas de hechos
evitar que el DW sea cargado con valores faltantes o anómalos
La realización de estas tareas pueden contener una lógica realmente compleja en algunos casos
debemos llevar adelante una serie de tareas básicas, tales como limpieza de datos, calidad de datos, procesos ETL, etc.
Para los tres tipos de esquemas, se realizarán las uniones correspondientes entre sus tablas de dimensiones y sus tablas de hechos.
ESQUEMAS
esquemas constelación
caso 3
caso 2
obtendre
caso 1
obtendra
Cada tabla de hechos debe poseer un nombre que la identifique, contener sus hechos correspondientes y su clave debe estar formada por la combinación de las claves de las tablas de dimensiones relacionadas.
Las tablas de hechos se deben confeccionar teniendo en cuenta el análisis de las preguntas realizadas por los usuarios
esquemas en estrella y copo de nieve,
Se crearán tantos campos de hechos como indicadores se hayan definido en el modelo conceptual y se les asignará los mismos nombres que estos.
Se le deberá asignar un nombre a la tabla de hechos que represente la información analizada, área de investigación, negocio enfocado, etc.
Se definirá su clave primaria, que se compone de la combinación de las claves primarias de cada tabla de dimensión relacionada.
Perspectiva “Tiempo”
tabla de dimensión ”FECHA”
Perspectiva “Productos”
tabla de dimensión ”PRODUCTO”
Perspectiva “Clientes”
tabla de dimensión ”CLIENTE”
ESQUEMA DE COPO DE NIEVE
Jerarquía de ”GEOGRAFIA”.
Entonces, al normalizar esta tabla se obtendrá:
cuando existan jerarquías dentro de una tabla de dimensión, esta tabla deberá ser normalizada
GRAFICAMENTE
3 TIPOS DE ESQUEMAS
Se redefinirán los nombres de los campos si es que no son lo suficientemente intuitivos.
Se añadirá un campo que represente su clave principal.
Se elegirá un nombre que identifique la tabla de dimensión.
El esquema que se utilizará será en estrella, debido a sus características, ventajas y diferencias con los otros esquemas.
Se debe seleccionar cuál será el tipo de esquema que se utilizará para contener la estructura del depósito de datos, que se adapte mejor a los requerimientos y necesidades de l@s usuari@s. Es muy importante definir objetivamente si se empleará un esquema en estrella, constelación o copo de nieve, ya que esta decisión afectará considerablemente la elaboración del modelo lógico.
Modelo Conceptual ampliado.
concepto
En este paso, y con el fin de graficar los resultados obtenidos en los pasos anteriores, se ampliará el modelo conceptual, colocando bajo cada perspectiva los campos seleccionados y bajo cada indicador su respectiva fórmula de cálculo
Subtopic
se debe presentar a los usuarios los datos de análisis disponibles para cada perspectiva
Una vez que se han establecido las relaciones con los OLTP, se deben seleccionar los campos que contendrá cada perspectiva, ya que será a través de estos por los que se examinarán y filtrarán los indicadores.
caso practico
correspondencia
diagrama relacional
objetivos:
identificar las correspondencias entre el modelo conceptual y las fuentes de datos.
es el de examinar los OLTP disponibles que contengan la información requerida, como así también sus características
TIPOS DE HECHOS E INDICADORES
Función de sumarización que se utilizará para su agregación
EJEMPLOS:
SUM, AVG, COUNT, etc
Hecho/s que lo componen, con su respectiva fórmula de cálculo
EJEMPLOS:
Hecho1 + Hecho2
CASO PRACTICO
REPRESENTACION GRAFICA
descripción de alto nivel de la estructura de la base de datos, en la cual la información es representada a través de objetos, relaciones y atributos.
CASO PRACTICO
CONCEPTOS
se debe tener en cuenta que los indicadores, para que sean realmente efectivos son, en general, valores numéricos y representan lo que se desea analizar concretamente
EJMEPLO: Saldos, promedios, cantidades, sumatorias, fórmulas, etc.
CASO DE PRACTICO
Preguntas de negocio obtenidas fueron las siguientes:
Se desea conocer cuál fue el monto total de ventas de productos a cada cliente en un periodo determinado
Se desea conocer cuántas unidades de cada producto fueron vendidas a sus clientes en un periodo determinado
EJEMPLOS
entrevistas, cuestionarios, observaciones, etc.
OBJETIVOS PRINCIPALES
La idea central es, que se formulen preguntas complejas sobre el negocio, que incluyan variables de análisis que se consideren relevantes, ya que son estas las que permitirán estudiar la información desde diferentes perspectivas.
Obtener e identificar las necesidades de información clave de alto nivel