BIG DATA

BIG DATA

HERRAMIENTAS

HADOOP

r

Es un marco de trabajo que proporciona un alojamiento y un tratamiento de datos grande para grupos de computadoras. Ejemplo: Una compañía de comercio electrónico usa Hadoop para examinar las formas en los que los clientes compran, para así poder aconsejarla de manera particular.

NOsQL

r

Sistemas de gestión de bases de datos diseñados para manejar grandes cantidades de datos no estructurados o semiestructurados.Ejemplo: Una plataforma de redes sociales utiliza una base de datos NoSQL para almacenar y recuperar información de perfiles de usuarios, que incluye datos diversos.

SPARK

r

Motor de funcionamiento de datos en memoria que apoya el análisis rápido y eficaz de un gran numero de datos.Ejemplo: Una empresa que realiza análisis financieros utiliza Spark para realizar cálculos complejos en tiempo real sobre la información financiera de transacciones.

TIPOS DE DATOS

ESTRUCTURADOS

r

La información está registrada en tablas que tienen una estructura preestablecida y vínculos aparentes entre las partes. La información se encuentra clasificada por categorías, esto hace más fácil la preservación y acceso a la misma.

NO ESTRUCTURADO

r

La información es a veces llamada de manera errónea como basura. Es posible que incluyan narración, imágenes, videos y distintos tipos de información que no se acomodan a una estructura preestablecida.

SEMI-ESTRUCTURADOS

r

Incluyen componentes de sustento, pero no logran totalmente una estructura firme. Regularmente, poseen ciertas insignias o identificadores que posibilitan un cierto grado de ordenación.

CARACTERISTICAS