BIG DATA
HERRAMIENTAS
HADOOP
Es un marco de trabajo que proporciona un alojamiento y un tratamiento de datos grande para grupos de computadoras. Ejemplo: Una compañía de comercio electrónico usa Hadoop para examinar las formas en los que los clientes compran, para así poder aconsejarla de manera particular.
NOsQL
Sistemas de gestión de bases de datos diseñados para manejar grandes cantidades de datos no estructurados o semiestructurados.Ejemplo: Una plataforma de redes sociales utiliza una base de datos NoSQL para almacenar y recuperar información de perfiles de usuarios, que incluye datos diversos.
SPARK
Motor de funcionamiento de datos en memoria que apoya el análisis rápido y eficaz de un gran numero de datos.Ejemplo: Una empresa que realiza análisis financieros utiliza Spark para realizar cálculos complejos en tiempo real sobre la información financiera de transacciones.
TIPOS DE DATOS
ESTRUCTURADOS
La información está registrada en tablas que tienen una estructura preestablecida y vínculos aparentes entre las partes. La información se encuentra clasificada por categorías, esto hace más fácil la preservación y acceso a la misma.
NO ESTRUCTURADO
La información es a veces llamada de manera errónea como basura. Es posible que incluyan narración, imágenes, videos y distintos tipos de información que no se acomodan a una estructura preestablecida.
SEMI-ESTRUCTURADOS
Incluyen componentes de sustento, pero no logran totalmente una estructura firme. Regularmente, poseen ciertas insignias o identificadores que posibilitan un cierto grado de ordenación.