"Todos los días generamos 2,5 trillones debytes en datos; el 90% de los datos del mundo acumulados a día de hoy se hancreado en los últimos dos años." Son algunas de las constataciones que nosproporciona SINTEF, la mayororganización de investigación independiente de los países escandinavos.
"Cada hora se pueden procesar una mediade 60 millones de transacciones procedentes de cerca de 2.000 millones detarjetas en 220 países, a través de más de 40 millones de comercios" y,sin embargo, "el 90% de todos los datosque generan dispositivos como smartphones, tabletas, vehículos yelectrodomésticos conectados nunca se analiza? la mayor parte de ellos empiezana perder valor en cuestión de milisegundos?" afirman investigadores de IBM.
Como ya se sabe, a esto ahora lo llamamos "Bigdata", que no es sino ese inmenso volumen de información personal que, enformato digital, vamos dejando en los cada vez más numerosos dispositivos denuestra interconectada vida. Para situarnos un poco mejor en la realidaddel Big Data hay que recordar, por ejemplo que, por muy digitales que sean,tales bits necesitan un espacio físico donde guardarse: son los Data Center,uno de cuyos mayores problemas, por cierto, es algo tan prosaico como larefrigeración de sus potentes servidores, lo que está acelerando proyectos deinstalaciones submarinas. Facebook, Google? poseen grandes centros de datos por razones obvias; sin embargo alguienvislumbró que ahí había negocio y hoy es Digital Realty la compañía que tiene las mayoresinstalaciones puesto que se dedica a la adquisición, venta y alquiler de lasmismas. Cuando el contenido es tan importante, el continente puede ser muyrentable.
El Big Data es hoy uno de esos fenómenos alos que la sociedad periódicamente debe "enfrentarse", en el mejor delos sentidos (o no), y que son fruto de su propia evolución y conocimientos.Quizá un equivalente histórico sea la aparición de la imprenta o la de losvehículos a motor. La escritura y la rueda ya existían pero fueron la capacidadde multiplicar la reproducción escrita y la de acelerar el movimiento de larueda lo que introdujo un cambio sustancial en su uso y su influencia. Lainformación personal organizada y acumulada, de manera similar, también existíaantes del Big Data. Acerquémonos a la sacristía de cualquier Iglesia ycomprobaremos cómo allí se conservan registrados datos personales por décadas eincluso siglos. No digamos en un Registro Civil o Notarial. Es la historia,nuestra historia, lo que ni más ni menos, se va conformando con talesanotaciones. Un Museo es también un "Little Data" temático, allídonde se guardan los restos de nuestro pasado que ayudan a entender nuestropresente.
Todavía es pronto, seguramente, para evaluarlas consecuencias del Big Data y su creciente uso por parte de empresas,instituciones y personas. Van detectándose poco a poco implicaciones éticas,legales, económicas, o que afectan a nuestra propia convivencia y lasrelaciones que tenemos con nuestro entorno, pero falta perspectiva y tambiénquizá la constatación suficiente de sus consecuencias a nivel personal para queincluyamos hoy a este fenómeno entre nuestras preocupaciones. A lo sumosomos capaces de asumir que la difusión de nuestros datos y el uso de losmismos por terceros, aun cuando sea con fines comerciales (es decir, para ganardinero a nuestra costa), forma parte del precio que hemos de pagar por el uso ydisfrute de las nuevas tecnologías y sistemas de comunicación, así como por elacceso libre a contenidos ilimitados.
Como de forma acertada afirma Chris Meyer, en el recorrido de los datos a lasabiduría existen dos peldaños intermedios que son la información y elconocimiento. Pues bien, el Big Data viene a ser un atajo que facilitaprecisamente la conversión de la pura información, como cúmulo de datossimplemente reunidos y medianamente organizados, en conocimiento, o seaen el "dominio" útil de talinformación una vez analizada y estructurada para un fin determinado.
Al menos, esa es la teoría. En realidad elmundo del Big Data aplicado exige algunos requisitos so pena de aceptar el caoscomo magnitud atractiva y útil.
Pongámonos en el caso de una empresa, quizápequeña o mediana, que quiere aproximarse al mundo del Big Data y empezar avislumbrar su uso. En primer lugar es imprescindible, como condición sine quanon, la accesibilidad a los datos.
Una de las realidades que los expertosvislumbran en un futuro próximo es el incremento drástico del comercio dedatos. De acuerdo con Statista, el valor de mercado del Big Data en 2015 fue de 11 mil 957 millones de euros,y se estima que en 2016 sea de 15 mil 732 millones de euros. En otras palabras,nuestros datos tienen un reflejo económico más que considerable. El "Iagree" que de manera refleja clicamos en redes, webs de e-commerce,buscadores etc. es su puerta de entradaa nuestra información y ésta pasa a ser un producto tan apetecible comovalioso.
Pero nuestra Pyme, aunque podría acceder aeste comercio, quizá prefiera empezar por algo más a su alcance, por ejemplo,su propia base de datos de clientes, o la información contenida en su serviciopost-venta, o en los reports comerciales. Eso son datos que cumplen con elprimer requisito de accesibilidad.
El segundo paso es el análisis (recordemos que hay que pasar de la información al conocimiento). Eso, entreotras cosas, consiste en lo que los expertos llaman "eliminar elruido", porque la condición de "dato" no es en si misma unagarantía de utilidad. En el ejemplo, nuestra empresa debería contrastar susficheros para eliminar nombres erróneos, personas fallecidas, teléfonosfallidos etc. Se trata de aplicar unos filtros de puro sentido común que, enbuena medida, pueden automatizarse.
Y el tercer paso es contextualizar lainformación que poseemos . En sectores como la Banca y respecto al uso quelos clientes hacen de sus tarjetas de crédito, es básico conocer no solo elvolumen global de compras, o la cantidad de intercambios realizados sino lascircuntancias en que se realizan aplicando parámetros sociodemográficos,geográficos, temporales, etc.
Pues bien, si a partir de dos requisitosprevios como son su volumen y su variedad, ya poseemos los datos, los hemosfiltrado y situado en un contexto preciso, nos topamos con la necesidad deprocesarlos. Cuando hablamos de Big Data con su significado real, o sea de unagran cantidad de información, se aplica la llamada "computacióndistribuida" que no es sino el reparto de tal masa de datos entredistintos procesadores para luego agrupar el conocimiento extraído.
Empresas como Google aplican su propio modelo de procesamiento, llamado Map Reduce, a cuyo resultado accedemos los usuarios al consultar Google Trends o Page Rank, por ejemplo. En código libre está HADOOP y la Universidad de Berkeley, por su parte, desarrolló Spark, entre otros.
En pocas palabras: convertir datos en valor mediante la combinación, como hemos visto, de procesos digitales y análisis racionales, y todo ello para alcanzar el conocimiento útil para una mejor toma de decisiones empresariales. El Big Data, por tanto, no es nada si no es "para". Solo es valioso en razón de una finalidad que vaya más allá de su simple contemplación. De lo contrario estaríamos en la posición del avaro que se conforma con observar sus tesoros mientras vive en la miseria.
El futuro nos depara sorpresas, seguro. Y muchas de ellas vendrán de la mano del Big Data. Algunas ya comienzan a intuirse, en relación con la salud, la seguridad, el mercado e incluso los deportes. Otras ni las imaginamos. Los seres humanos inmersos en la civilización actual somos especialmente fecundos en dos cosas que generamos y difundimos con una incontinencia imparable: desechos y datos. El reto, ya en marcha, es controlarlos para minimizar sus efectos negativos, y "domesticarlos" para hacerlos valiosos en una forma vida que habrá de apoyarse en una fructífera gestión de la realidad antes que en la ficción.