La cifra es apabullante: cada día creamos unos 2,5 quintillones de bytes. Números que seguirán creciendo al amparo de un concepto como es el Big Data pero aún desconocido para muchos. Saber realmente cuáles son las características que definen este término es el paso más acertado para entender lo que depara a esta tecnología que engloba a ese conjunto de datos cuyo volumen supera la capacidad de las herramientas de uso común.

Precisamente si hay algo que logra el Big Data es facultar a las compañías a anticiparse confiando, en la información que tienen a su alcance, donde los datos son ya la base que genera realmente el conocimiento en las empresas.

Convertir la información en conocimiento debe ser el propósito de cualquier estrategia de Big Data Clic para tuitear

Hablamos de las dimensiones del Big Data o las llamadas Vs del Big Data que definen cuáles son las características que delimitan a aquellos datos que pueden ser considerados macrodatos de otros. Ya que no todo es Big Data, recuerden…

Veamos uno a uno:

Volumen

El incremento de los datos fruto de las nuevas tecnologías y la facilidad de generar datos digitales es una realidad palpable. El volumen significa gran tamaño. Así en el año 2020 se esperan que en el mundo se almacenen 35 Zettabytes. Los datos crecen, habiendo pasado ya por la era del Petabyte y posteriormente Exabyte, hasta llegar a hoy. En Twitter, por ejemplo, sólo en un día se generan 9 Terabytes de datos. Así, el volumen delimita el concepto de datos masivos no pudiéndose almacenar nunca en un simple ordenador, requiriendo tecnología específica para ello. Por lo tanto apunten: no se considera Big Data datos de clientes, proveedores, personal…

Velocidad

Cuando se toman decisiones en momentos críticos el tiempo es fundamental. Con el Big Data ocurre lo mismo, el procesamiento de los datos debe hacerse en el menor tiempo posible e incluso en el tiempo real. El Big Data requiere velocidad para acceder a los datos pero también en relación a la visualización de los mismos, con el objeto de facilitar el análisis y extraer conclusiones. Así nos encontramos que Internet es sin duda una de las fuentes de datos de mayor velocidad. Recuerden que las previsiones de Gartner en 2020 más de 25 mil millones de dispositivos estarán conectados a Internet ofreciendo datos en tiempo real.

Variedad

Si algo caracteriza al Big Data es las distintas tipologías y estructuras de los datos procediendo de fuentes muy diversas. El éxito de una organización dependerá en gran medida de resaltar el conocimiento que le propician los distintos tipos de datos de los que dispone. La clasificación más tradicional divide los datos en: estructurados, no estructurados y semi estructurados. Los primeros se almacenan en bases de datos relacionales donde su longitud, denominación y formato han sido predefinidos. Ejemplos: ERP, CRM… Los no estructurados, apuntan a no tener estructura alguna predefinida y lo encontramos en imágenes, vídeos, archivos logs, audios…

Los semiestructurados señalan a documentos con lenguaje HTML, XML o SGML es decir: “no tienen estructura fija pero contienen etiquetas y otros marcadores que ayudan a su comprensión”.

Veracidad

El Big Data hay que controlar necesariamente la integridad de los datos, ya que de esto dependerá del acierto de las decisiones. Una de la dimensiones más importantes también del Big Data señala a la fiabilidad de la información recogida eliminando cualquiera inexactitud o incertidumbre en la recopilación de los mismos, vinculándose este punto con el tratamiento de los datos o limpieza de los mismos. Esto supone un gran reto a medida de que los datos crecen.

Valor

Convertir la información en conocimiento debe ser el propósito de cualquier estrategia de Big Data y esto se consigue a través de la analítica que nos ayuda en la toma de decisiones. Se trata en definitiva de utilizar los datos de manera rentable y a la vez eficiente. Tener datos es fácil, lo complicado y el factor verdaderamente diferencial es el uso que se da de estos para comprender, por ejemplo, el comportamiento de los clientes o alcanzar niveles óptimos en competitividad.

En definitiva, la definición más común de Big Data engloba estas dimensiones y algunas más que han añadido otros autores expertos como la variabilidad, visualización y verificación. Siendo la definición más extendida de Big Data: “aquel conjunto de tecnologías y procesos que están permitiendo capturar y almacenar cantidades inteligentes de datos de diversos orígenes y tipologías”.

Pero lo complicado del Big Data es subir el siguiente nivel: usar y analizar los datos para ser más inteligentes. En Prometeus Global Solutions consideramos a esta tecnología como una fuente de valor incalculable para todas las empresas, independientemente de su tamaño, aportando soluciones que ayuden a las compañías a anticiparse a la realidad de sus clientes y ser más competitivas.