BIG DATA

¿QUE ES?

r

El big data consiste en desarrollar mecanismos capaces de procesar y gestionar datos masivos que provienen de diversas fuentes y se emplea para encontrar patrones repetitivos, modelos predictivos o estadísticas más precisas dentro de esos millones de datos. En definitiva, el objetivo es procesar esos datos para convertirlos en información capaz de ser interpretada por el ser humano y que le ayude a tomar decisiones.

Historia de big data

r

Aunque el concepto de ‘‘big data‘‘ en sí mismo es relativamente nuevo, los orígenes de los conjuntos de big data se remontan a las décadas de 1960 y 1970, cuando el mundo de los datos recién comenzaba con los primeros centros de datos y el desarrollo de bases de datos relacionales.Alrededor de 2005, la gente comenzó a darse cuenta de la cantidad de datos que los usuarios generaban a través de Facebook, YouTube y otros servicios en línea.En el mismo año, se desarrollará Hadoop, un marco de código abierto creado específicamente para almacenar y analizar grandes conjuntos de datos.

Las "tres V" de big data

Volumen

r

La cantidad de datos importa. Con big data, tendrá que procesar grandes volúmenes de datos no estructurados de baja densidad. Puede tratarse de datos de valor desconocido, como feeds de datos de Twitter, flujos de clics de una página web o aplicación para móviles, o equipo con sensores. Para algunas organizaciones, esto puede suponer decenas de terabytes de datos. Para otras, incluso cientos de petabytes.

Velocidad

r

La velocidad es el ritmo al que se reciben los datos y (posiblemente) al que se aplica alguna acción. La mayor velocidad de los datos normalmente se transmite directamente a la memoria, en vez de escribirse en un disco. Algunos productos inteligentes habilitados para Internet funcionan en tiempo real o prácticamente en tiempo real y requieren una evaluación y actuación en tiempo real.

Variedad

r

La variedad hace referencia a los diversos tipos de datos disponibles. Los datos convencionales eran estructurados y podían organizarse claramente en una base de datos. Con el aguje de la big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, audio o video, requieren un preprocesamiento adicional para poder obtener significado y habilitar los metadatos.

¿De dónde proviene el big data?

r

Cada paso que damos o cada movimiento que realizamos, genera información que puede ser tratada por el big data. Las fuentes de generación y suministros de datos cada día son mayores y más variadas.

Acciones cotidianas de las personas

r

Envío de whatsapp, actualización de redes sociales, geolocalización de nuestros teléfonos móviles, visitas a sitios webs, anuncios…

Transacciones entre individuos y organizaciones

r

 Movimientos bancarios, facturación, llamadas, cruce de emails…

Máquinas

r

Existen multitud de instrumentos que emiten datos constantemente como sensores de temperatura, luz, sonido, GPS, pulseras que emiten datos sobre el sueño de cada individuo, pasos caminados, pulsaciones, instrumentos de medidas físicas y químicas…

Biométricas

r

Lectores de huellas digitales, escáner de retina, de ADN… y otros elementos que forman parte de la seguridad y defensa.

¿Cómo funciona big data?

r

El big data le aporta nuevas perspectivas que abren paso a nuevas oportunidades y modelos de negocio. Iniciarse en ello requiere de tres acciones clave.

Integración

r

Big data concentra datos de numerosas fuentes y aplicaciones distintas. Los mecanismos de integración de datos convencionales, como “extraer, transformar y cargar” (extract, transform, load, ETL), generalmente no están a la altura en dicha tarea. Analizar conjuntos de big data de uno o más terabytes, o incluso petabytes, de tamaño requiere de nuevas estrategias y tecnologías.Durante la integración, es necesario incorporar los datos, procesarlos y asegurarse de que estén formateados y disponibles de tal forma que los analistas empresariales puedan empezar a utilizarlos.

Gestión

r

Big data requiere almacenamiento. Su solución de almacenamiento puede residir en la nube, on premises o en ambos. Puede almacenar sus datos de cualquier forma que desee e incorporar los requisitos de procesamiento de su preferencia y los motores de procesamiento necesarios a dichos conjuntos de datos on-demand. Muchas personas eligen su solución de almacenamiento en función de dónde residan sus datos en cada momento. La nube está aumentando progresivamente su popularidad porque es compatible con sus requisitos tecnológicos actuales y porque le permite incorporar recursos a medida que los necesita.

Análisis

r

La inversión en big data se rentabiliza en cuanto se analizan y utilizan los datos. Adquiera una nueva claridad con un análisis visual de sus diversos conjuntos de datos. Continúe explorando los datos para realizar nuevos descubrimientos. Comparta sus hallazgos con otras personas. Construya modelos de datos con aprendizaje automático e inteligencia artificial. Ponga sus datos a trabajar.

Desafíos del big data

r

Vivimos en la era de la información donde la sociedad cada día es más digital y el valor del big data cada día es mayor. Sus múltiples aplicaciones y fuentes de obtención de datos están creciendo a ritmos exponenciales.Uno de los principales retos de la sociedad es crear un marco normativo a cerca de este nuevo concepto, donde los individuos sean conscientes de hacia dónde van los datos que nosotros mismos generamos, dónde queremos que lleguen, cómo y con qué fines.Una de las profesiones del futuro sin duda, es el experto en big data y business intelligence. Es un campo novedoso donde queda mucho por descubrir, por analizar y se necesitan expertos en la materia.

¿Cuáles son las utilidades del big data?

Detectar la actividad delictiva

r

Gracias al big data que generamos, se pueden identificar actos criminales, contenido delictivo, cruce de mensajes, identificación de perfiles psicológicos de una determinada región etc En EEUU ya han probado este sistema y están consiguiendo datos y conclusiones que hasta ahora desconocían por los métodos tradicionales.

Política

r

Mediante el cruce de datos en redes sociales, con la ubicación y perfiles sociales de quienes publican contenido, se pueden llegar a identificar qué es lo que preocupa a los ciudadanos, cuáles son sus intereses, problemas… y utilizar esa información para elaborar una campaña política a medida y ganarse el voto de los ciudadanos.

Banca y seguros

r

Las entidades financieras y aseguradoras ya emplean la monitorización y cruce de datos de clientes, con operaciones realizadas, comportamientos etc que les permite predecir movimientos de clientes, segmentarlos según su comportamiento y nivel de riesgo. Estos segmentos permitirán ofrecer productos más adecuados a cada cliente según sus necesidades y reduciendo el reducir riesgos de impago que puedan incurrir.

Salud

r

Monitorización de las constantes vitales para mejorar la calidad vida. A través de pulseras que analizan datos sobre nuestro estilo de vida, podemos ser capaces de evitar el sedentarismo, detectar anomalías en las pulsaciones, en el sueño…. Y ayudar a los investigadores médicos a realizar predicciones con datos sobre la salud de las personas.

¿Qué se hace con los datos extraídos?

r

Con todos los datos generados a través de softwares, APP, webs y otras herramientas, se almacenan en la nube. Cada empresa o especialista en big data, elabora algoritmos capaces de procesar la información y cruzar los datos que interesan en cada momento. A través de estos mecanismos, se identifican patrones de comportamiento para posteriormente, generar modelos predictivos basados en datos históricos y casi inmediatos.

BIBLIOGRAFIAS