BIG DATA
Nos referimos a un conjunto de datos o combinaciones de conjunto de datos cuyo tamaño, complejidad, y velocidad de crecimiento, dificultan su procesamiento y capacidad de análisis mediante tecnologías y herramientas convencionales.
Caracteristicas
VELOCIDAD
Se refiere al ritmo al que se generan los datos.DIFERENCIA CON ANÁLISIS DE DATOS REGULARBig Data procesa datos en tiempo real o casi real.
Ejemplo
Mensajes de Twitter
Diariamente se generan millones de mensajes de Twitter en tiempo real.
VOLUMEN
Se refiere al tamaño de los conjuntos de datos (terabytes, petabytes).DIFERENCIA CON ANÁLISIS DE DATOS REGULARBig Data se refiere a conjuntos de datos mucho más grandes.
Ejemplo
Transacciones con tarjeta de crédito en Europa
Millones de transacciones con tarjeta de crédito se realizan cada día en Europa, generando petabytes de datos.
VERACIDAD
Se refiere a la calidad de los datos: valiosos y significativos.
Ejemplo
Datos de un experimento científico
Se obtienen de fuentes confiables y se recopilan de manera precisa y sin sesgos, lo que garantiza su exactitud y confiabilidad para su análisis y uso en la toma de decisiones.
VARIEDAD
Se refiere a las formas, tipos y fuentes en las que se registran los datos.DIFERENCIA CON ANÁLISIS DE DATOS REGULARBig Data incluye una mayor diversidad de tipos de datos
Tipos de Datos
ESTRUCTURADOS
Son datos organizados en tablas con filas y columnas, donde cada columna representa un atributo específico y cada fila corresponde a una instancia o registro.CARACTERISTICASSe almacenan en bases de datos relacionalesSon fáciles de consultar y analizar
Ejemplo
Las bases de datos
La información se organiza en tablas con filas y columnas, lo que facilita la consulta y el análisis de los datos de manera eficiente.
NO ESTRUCTURADOS
Son datos que no se ajustan a un formato tabular y no se pueden organizar fácilmente en filas y columnas. CARACTERISTICASSon más difíciles de analizar
Ejemplo
Imagenes
No siguen un formato predefinido como las bases de datos, sino que contienen información visual que puede ser más compleja de analizar y organizar.
SEMIESTRUCTURADOS
Son un tipo de datos que tienen algunas características consistentes y definidas.CARACTERISTICASSon una mezcla entre datos estructurados y no estructurados.
Ejemplo
Archivos de texto sin formato
Aunque estos archivos no tienen una estructura definida como una base de datos, pueden contener información organizada de manera informal, como párrafos, listas o tablas, que pueden interpretarse de forma semiestructurada según su contenido y contexto.
VALOR
Hace referencia a la información útil y el conocimiento a partir de los datos.DIFERENCIA CON ANÁLISIS DE DATOS REGULAREl objetivo es extraer información útil y conocimiento de los datos.
Ejemplo
Patrones de compra
Permiten a las empresas comprender mejor el comportamiento de sus clientes, identificar tendencias de mercado, mejorar la personalización de productos y servicios, y tomar decisiones más informadas para aumentar sus ingresos y eficiencia.
VIABILIDAD
Se refiere a la capacidad para gestionar, procesar y analizar los datos de forma eficiente.DIFERENCIA CON ANÁLISIS DE DATOS REGULARSe requieren herramientas y tecnologías especializadas.
Ejemplo
Retorno de la inversión
VIZUALIZACIÓN
Se refiere a la representación gráfica de los datos para facilitar su comprensión.
Ejemplo
Mapas de calor
Permiten identificar patrones, tendencias y anomalías en grandes conjuntos de datos, lo que ayuda a los usuarios a tomar decisiones más informadas y a comprender mejor la información presentada.