BIG DATA

BIG DATA
r

Nos referimos a un conjunto de datos o combinaciones de conjunto de datos cuyo tamaño, complejidad, y velocidad de crecimiento, dificultan su procesamiento y capacidad de análisis mediante tecnologías y herramientas convencionales. 

Caracteristicas

VELOCIDAD

VELOCIDAD
r

Se refiere al ritmo al que se generan los datos.DIFERENCIA CON ANÁLISIS DE DATOS REGULARBig Data procesa datos en tiempo real o casi real.

Ejemplo

Mensajes de Twitter

r

Diariamente se generan millones de mensajes de Twitter en tiempo real.

VOLUMEN

VOLUMEN
r

Se refiere al tamaño de los conjuntos de datos (terabytes, petabytes).DIFERENCIA CON ANÁLISIS DE DATOS REGULARBig Data se refiere a conjuntos de datos mucho más grandes.

Ejemplo

Transacciones con tarjeta de crédito en Europa

r

Millones de transacciones con tarjeta de crédito se realizan cada día en Europa, generando petabytes de datos.

VERACIDAD

VERACIDAD
r

Se refiere a la calidad de los datos: valiosos y significativos.

Ejemplo

Datos de un experimento científico

r

Se obtienen de fuentes confiables y se recopilan de manera precisa y sin sesgos, lo que garantiza su exactitud y confiabilidad para su análisis y uso en la toma de decisiones.

VARIEDAD

VARIEDAD
r

Se refiere a las formas, tipos y fuentes en las que se registran los datos.DIFERENCIA CON ANÁLISIS DE DATOS REGULARBig Data incluye una mayor diversidad de tipos de datos

Tipos de Datos

ESTRUCTURADOS

r

Son datos organizados en tablas con filas y columnas, donde cada columna representa un atributo específico y cada fila corresponde a una instancia o registro.CARACTERISTICASSe almacenan en bases de datos relacionalesSon fáciles de consultar y analizar

Ejemplo

Las bases de datos

r

La información se organiza en tablas con filas y columnas, lo que facilita la consulta y el análisis de los datos de manera eficiente.

NO ESTRUCTURADOS

r

Son datos que no se ajustan a un formato tabular y no se pueden organizar fácilmente en filas y columnas. CARACTERISTICASSon más difíciles de analizar 

Ejemplo

Imagenes

r

No siguen un formato predefinido como las bases de datos, sino que contienen información visual que puede ser más compleja de analizar y organizar.

SEMIESTRUCTURADOS

r

Son un tipo de datos que tienen algunas características consistentes y definidas.CARACTERISTICASSon una mezcla entre datos estructurados y no estructurados.

Ejemplo

Archivos de texto sin formato

r

Aunque estos archivos no tienen una estructura definida como una base de datos, pueden contener información organizada de manera informal, como párrafos, listas o tablas, que pueden interpretarse de forma semiestructurada según su contenido y contexto.

VALOR

VALOR
r

Hace referencia a la información útil y el conocimiento a partir de los datos.DIFERENCIA CON ANÁLISIS DE DATOS REGULAREl objetivo es extraer información útil y conocimiento de los datos.

Ejemplo

Patrones de compra

r

Permiten a las empresas comprender mejor el comportamiento de sus clientes, identificar tendencias de mercado, mejorar la personalización de productos y servicios, y tomar decisiones más informadas para aumentar sus ingresos y eficiencia.

VIABILIDAD

VIABILIDAD
r

Se refiere a la capacidad para gestionar, procesar y analizar los datos de forma eficiente.DIFERENCIA CON ANÁLISIS DE DATOS REGULARSe requieren herramientas y tecnologías especializadas.

Ejemplo

Retorno de la inversión

VIZUALIZACIÓN

VIZUALIZACIÓN
r

Se refiere a la representación gráfica de los datos para facilitar su comprensión.

Ejemplo

Mapas de calor

r

Permiten identificar patrones, tendencias y anomalías en grandes conjuntos de datos, lo que ayuda a los usuarios a tomar decisiones más informadas y a comprender mejor la información presentada.