Para nadie es sorpresa que el creciente volumen de los datos nos está llevando a una realidad cada vez más digitalizada. Tal vez no estemos inmersos en el código fuente de los sistemas, como se plantea en Matrix, pero lo cierto es que los datos nos rodean. Todos los dispositivos de cómputo, desde los servidores hasta los equipos portátiles en la empresa, generan información que se almacena en forma de bits. Pero fuera de las empresas, millones de dispositivos en todo el mundo generan cientos de miles de datos transaccionales día con día: electrodomésticos, wearables, automóviles conectados, televisores inteligentes, consolas de videojuego, smartphones… todo produce datos.
En este contexto, el valor ya no reside en quién tiene la información, pues ésta se encuentra al alcance de todos; el valor radica en qué se hace con dicha información. ¿Cómo pueden las empresas explotar la gran cantidad de datos existentes, tanto al interior de su empresa como en el mercado?
El reto para las empresas es extraer la información que necesitan de entre todo el océano de datos. Y una vez que extraen esa información, deben consolidar los datos, analizarlos y tomar decisiones con base en los resultados. Esto es posible a través de herramientas de software que procesa rápidamente los datos; frecuentemente se utilizan soluciones de minería o analítica de datos, pero también hay soluciones específicas para la gestión y el procesamiento de grandes volúmenes de datos, o Big Data.
BIG DATA SE ESCRIBE CON V
Big data es un término que describe cualquier cantidad voluminosa de datos estructurados, semiestructurados y no estructurados, que tienen el potencial de ser extraídos para obtener información. A este respecto, Gartner, consultora de tecnologías de información, define que los datos no estructurados son aquellos que no pertenecen a un modelo no definido o específico. Incluso estima que el 80 por ciento de los datos son no estructurados, como el cuerpo de un correo. En pocas palabras, los datos no estructurados son aquellos que no caben en una base de datos. Por su parte, los datos estructurados son aquellos que pueden ser ingresados en una base, como: fecha, hora, nombres, cuentas de correo, números, etc. En pocas palabras, hay un sinfín de fuentes de datos que producen información nueva cada minuto.
¿Qué pueden hacer las empresas para tomar ventaja de tanta información? ¿Y cómo pueden extraer únicamente los datos que necesitan de entre el océano de datos?
José Luis Zurita, CEO de AK Consulting México, explica que la adopción de soluciones de big data permite a las compañías utilizar los datos para su beneficio. Para lograrlo, primero hay que considerar las tres Vs de big data: el Volumen extremo de datos, la gran Variedad de tipos de datos y la Velocidad a la que se deben procesar dichos datos.
Volumen de datos. La organización debe poder extraer un conjunto de datos de entrenamiento que pueda analizarse rápidamente utilizando los diferentes algoritmos candidatos, pero también uno que refleje adecuadamente el conjunto completo de datos. Su organización debe contar con suficientes datos para representar correctamente las incidencias reales, a la vez que considera todos los escenarios posibles para los resultados que está buscando.
Variedad de datos. Conforme los datos no estructurados se vuelven esenciales para los procesos de negocio, se convierten en fuentes necesarias para los modelos predictivos. Esto significa que una empresa debe tener un conjunto de procesos sólidos para escanear, analizar y contextualizar datos no estructurados y transformarlos en conjuntos de datos que alimenten los algoritmos de analítica.
Velocidad de los datos. Cada vez más rápido se reciben grandes cantidades de datos y a menudo no se puede predecir cuándo podrían cambiar, lo que forzaría una necesidad casi continua de creación y preparación de perfiles de datos. La necesidad de grandes velocidades de datos requiere una potente infraestructura de cómputo, capaz de procesar rápidamente grandes volúmenes y variedades de datos sin sobrecargar los servidores. Esto puede requerir cientos o miles de servidores para distribuir el trabajo y operar de manera colaborativa. Pero la computación en la nube ofrece alternativas para el almacenamiento y análisis de datos, de forma que las empresas puedan implementar proyectos de big data sin impactar su propia infraestructura.
En resumen, al planear una estrategia de big data que le permita obtener información útil para la toma de decisiones que definirán las estrategias de su negocio, Zurita aconseja contemplar los siguientes pasos: consolidación de datos, segmentación, elaboración de reportes, comparación de resultados contra información histórica, toma de decisiones. A partir de ahí, el ciclo vuelve a empezar. “Una vez realizados los ajustes necesarios en la segmentación de datos para obtener nuevos reportes, se reinicia el proceso. Lo importante es que las empresas utilicen los resultados para trabajar en mejorar su estrategia de negocios de cara a los clientes. Así es como Big Data permite generar una experiencia de valor”, concluye Zurita.