Big data es un concepto que está de moda. Esta popularidad conlleva su referencia frecuentemente desde los últimos años y un gran número de empresas asegura utilizarlo en su actividad. Sin embargo, no todo lo que se menciona sobre big data es cierto. Se afirma que el 65% de los proyectos de big data que se empiezan en España fracasan. Esta situación se debe a que las organizaciones no están preparadas, a la existencia de un gran desconocimiento, además de a una escasa formación.
Una de las aproximaciones más completas de big data es la facilitada por Gartner (2012): «Son activos de información caracterizados por su alto volumen, velocidad y variedad, que demandan soluciones innovadoras y eficientes de procesado para la mejora del conocimiento y toma de decisiones en las organizaciones».
Big data no es solo un conjunto de nuevas tecnologías, sino que es una combinación de negocio y analítica para obtener valor de los datos (convertirlos en información y conocimiento) que, por sus características, situación, volumen, variedad o velocidad antes no se aprovechaban.
Las aplicaciones del big data son infinitas, actualmente es impensable hacer marketing sin utilizar big data. Podemos destacar su reciente aplicación en CRM, Business Intelligence y Business Analytics.
La gran generación de volúmenes de datos que se producen a diario, sumado a la velocidad con la que lo hacen, y la extensa variedad de procedencia, hacen que el procesamiento y análisis se convierta en un proceso de selección complejo. Por esta razón, se añaden al proceso dos nuevas uves, veracidad y valor, imprescindibles a la hora tomar decisiones y maximizar la rentabilidad.
Tipos de datos
Siguiendo la clasificación de datos de Joyanes (2013), se distinguen tres categorías de datos según su procedencia:
Permite extraer información relevante en base a diferentes análisis de datos a partir de técnicas estadísticas, inteligencia artificial o nuevas tecnologías, con el objetivo de comprender el negocio y solucionar problemas de negocio para ayudar en la toma de decisiones estratégicas
Es la más simple, ya que utiliza técnicas sencillas como medias, desviaciones típicas, gráficos, etc. En una fase preliminar de procesamiento de datos, permite entender la situación en la que se encuentran las empresas, identificando tendencias, patrones y excepciones.
Business intelligence es un tipo de analítica de datos descriptivo. «Es la habilidad de aprender las relaciones de hechos presentados de forma que guíen las acciones hacia una meta deseada» (Schmarzo, 2014).
De manera general, la información que se extrae de business intelligence se organiza siguiendo dos modelos (González, 2017):
Pretende predecir resultados basándose en tendencias, patrones y anomalías dentro del histórico de datos.
Este tipo de analítica está ligada al data mining y al data science. El data mining o minería de datos es el proceso automatizado para el descubrimiento de información relevante en cantidades de datos masivas. Por su parte, el data science es la extracción de conocimiento a partir de datos.
Trata de determinar las acciones que deben llevarse a cabo ante una situación concreta basándose en modelos predictivos.
Es una combinación entre la analítica predictiva y los algoritmos de optimización. No solo se predice lo que puede suceder, sino también las causas, y se añaden recomendaciones respecto a las acciones que se aprovecharán de esas mismas predicciones. Algunas de las metodologías más utilizadas dentro de estas categorías son: muestreo, calidad de los datos, preparación de los datos, modelización y evaluación.
La redacción de este artículo se ha basado en el trabajo de investigación desarrollado por Miriam Arroyo junto a Raquel Arganza, "Big data: Aplicaciones de la gestión del dato en las distintas etapas del funnel de conversión", ganador de un accésit en el Premio Estudios Financieros 2018 en la categoría "Marketing y Publicidad", un premio que aporta más de 85.000€ a los autores de trabajos de investigación en diferentes categorías, dicho premio se celebra cada año y actualmente tiene abierto el plazo de presentación de trabajos hasta el 3 de mayo 2019.