Es un término que describe grandes volúmenes de datos, tanto estructurados como no estructurados.En otras palabras se refiere a conjuntos de datos cuyo tamaño, complejidad y velocidad de crecimiento dificultan su captura, gestión y análisis mediante herramientas convencionales.
Se refiere al tamaño de los conjuntos de datos que deben analizarse y procesarse.Requiere de tecnologías de procesamiento y almacenamiento distintas a las tradicionales.
Ejemplo.
TARJETA DE CREDITO.
Las transacciones con tarjeta de crédito en un día dentro de Asia.
Se refiere a la velocidad con la que se generan los datos. Se generan a un ritmo tal que requieren técnicas de procesamiento distintas (distribuidas).
Ejemplo.
FACEBOOK.
Los mensajes y publicaciones que se generan en Facebook.
Se refiere a las diferentes fuentes y tipos de datos tales como:Estructurados.No estructurados.Semiestructurados.Requieren de capacidades de procesamiento y algoritmos especializados.
Ejemplo
ARCHIVOS
Archivos de audio y video que se generan en varios lugares de Barranquilla.
Se refiere a la calidad de los datos que se analizan.Los datos de alta veracidad tienen muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales.
Ejemplo
DATOS
Datos de un experimento o ensayo médico.