LAS 7 V

volumen

r

Tamaño de los conjuntos de datos (terabytes, petabytes).

visualizacion

r

Cómo presentar los datos de forma efectiva.

valor

r

información valiosa escondida en los datos.

velocidad

r

Rapidez con la que se generan los datos (mensajes de Twitter, Facebook).

viabilidad

r

capacidad de usar la gran cantidad de datos a manejar de forma eficaz

veracidad

r

calidad de los datos (datos valiosos vs ruido)

variedad

r

tipos de datos (estructurados, semiestructurados y no estructurados)

ASPECTOS

ventajas

r

Maneja conjuntos de datos mucho más grandes.Procesa datos en tiempo real o casi en tiempo real. Abarca una mayor variedad de tipos de datos.Requiere mayor atención a la calidad de los datos.Tiene el potencial de generar información más valiosa.Requiere herramientas de visualización especializadas.

EJEMPLOS

Transacciones con tarjeta de crédito.

Transacciones con tarjeta de crédito.

Archivos de audio y video de CCTV.

Archivos de audio y video de CCTV.

Mensajes de Twitter.

Mensajes de Twitter.

Publicaciones de Facebook.

Publicaciones de Facebook.

Datos de experimentos médicos.

Datos de experimentos médicos.

HERRAMIENTAS

Hadoop.
Spark.
Kafka.
Hive.
Pig.