Por Redacción - 19 Mayo 2021
Hablamos con Manuel Suárez, Director General de Datacentric (empresa del Grupo Tinsa) de las novedades de DataCentric y analizamos con él los retos éticos de la inteligencia artificial a través de los datos y sus usos en la actualidad.
P. DataCentric fue adquirida en 2019 por el grupo Tinsa. ¿Qué tiene que ver un gran grupo de tasación con una empresa de soluciones de datos para Business Intelligence y Marketing con la que Vd. Dirige?
Pues mucho, la verdad, Tinsa es líder en valoraciones inmobiliarios en Europa y Latinoamérica, aportando valor con sus datos. Ten en cuenta que de cada inmueble se cuentan con XX datos asociados y en torno al 70% de los datos de una tasación se automatizan en base a una algoritmia alimentada por modelos de inteligencia artificial. Asimismo, desde el punto de vista de marketing, el momento de la tasación suele coincidir con un cambio de domicilio, que es un momento clave en marketing, pues conlleva un cambio en hábitos de consumo y necesidades de instalación de gas, fibra...
P. Y ahora el grupo Tinsa ha adquirido a Deyde. ¿Qué estrategia hay detrás?
Si, exacto. La operación refuerza el posicionamiento del grupo en el mercado de datos y big data a nivel internacional. Deyde está presente en Latinoamérica y nos aporta un gran expertise en calidad de datos.
DataCentric es el eje tecnológico y de datos del grupo y esperamos seguir aumentando nuestras soluciones de datos y presencia en mercados.
P: Buenos días, Manuel. Todos tenemos una idea concreta cuando hablamos de inteligencia artificial en términos industriales, pero podrías contarnos cuál es tu visión de cuál es el uso más extendido en las empresas.
R: Buenos días. Mi experiencia con proyectos concretos de Inteligencia artificial se remonta a más de 15 años, en sectores como la banca, telecomunicaciones y utilities, modelizando datos para conocer mejor al cliente, predecir cómo se va a comportar y ofrecerle la mejor experiencia de cliente. En esencia y fuera del mundo de la robotización industrial, este sigue siendo su principal uso, la gran diferencia es por un lado la cantidad y variedad de información disponible y por otro la gran capacidad de computación.
P: ¿Cuáles son entonces los principales actores en los proyectos de IA hoy?
R: En las grandes compañías, el área de Big Data centraliza los proyectos de IA, en las no tan grandes, o en aquellas en proceso de transformación digital, son equipos de data scientists los que dan respuestas a necesidades de conocimiento de los departamentos de negocio. Sólo unas pocas entidades tienen bien definidos y operativos las responsabilidades acerca de los datos, tales como chief data officer, data protection officer, chief analytics officer o similares.
P: Desde tu punto de vista, ¿cuál es el gran logro que se está alcanzando y los siguientes pasos?
Sin duda alguna la democratización del aprendizaje automático (machine learning, ML), prácticamente al alcance de cualquier compañía. Sólo necesitan datos y un objetivo de negocio, y de los dos tenemos muchos en las organizaciones empresariales. Los datos se multiplican cada día, internos producidos por infinidad de servicios y aplicaciones tecnológicas y externos por acuerdos con terceros, open data o IoT entre otros.
El fácil acceso a un entorno de computación big data en la nube económicamente viable salva el resto de las barreras. Casi cualquier proyecto de IA en estos términos es viable. El siguiente escenario es, desde mi punto de vista, la industrialización de ML. Llamémosle por su nombre: automatización de la modelización analítica para seleccionar y parametrizar el mejor algoritmo en cada momento, con poca intervención humana, eso sí de mucha calidad y conocimiento. Ya estamos en ello, existen diferentes soluciones que lo permiten en primera aproximación.
P: Si se puede hacer casi lo que se desee, ¿a costa de qué? ¿cuáles son los riesgos?
R: Si evaluamos desde diferentes perspectivas las consecuencias que conllevan las decisiones de negocio sobre el cliente, bien sea una persona o una empresa, entenderemos que hay riesgos importantes si no se hacen mínimamente bien los proyectos. No voy a entrar en las implicaciones de negocio de un modelo analítico que no acierte para la empresa que lo realiza, pero sí en las de sus clientes.
Un cliente, persona o empresa, necesita que se tomen las decisiones adecuadas sobre él. Una decisión adecuada debe ser lo más precisa posible, cercana a sus intereses, respetuosa con sus derechos y, eso sí, absolutamente legal.
P: Hablas de precisión y de decisiones justas, ¿cómo se consiguen conjugar ambos términos?
R: A la hora de realizar una modelización analítica para cualificar un cliente o predecir algún evento sobre él, es necesario utilizar el mayor número de datos relevantes disponibles para una empresa. Esa precisión será más cercana al conocimiento del cliente evitando, por ejemplo, que se le ofrezcan productos o servicios no deseados. Esto se consigue, aparte de una buena modelización, conociendo en profundidad el universo de datos disponibles, los propios de tu compañía y los externos disponibles. Te pondría cómo ejemplo el cálculo del precio de una vivienda, entre las muchas variables que intervienen, algunas son sobre el entorno. Puedes realizar el cálculo en función la impresión del dueño, del agente inmobiliario o incluso del tasador, o bien puedes recurrir a información open data sobre la zona para hacerlo más preciso. Entiendo que es obligación el evaluar si estos datos aportan a tu modelo, el cliente espera que así sea. Éticamente es necesario.
P: El respeto a sus derechos parece fundamental, realmente se está teniendo en cuenta en la modelización analítica actual.
R: No es de recibo utilizar cualquier dato disponible técnicamente de un cliente, ni siquiera si es legal. Puede ser que un cliente nos dé permiso para utilizar sus datos con ciertas finalidades conforme al reglamento de protección de datos pertinente, pero debemos tener en cuenta sus derechos. ¿Cuáles son estos derechos? Pues los establecidos en la carta de las Naciones Unidas, no hay que ir más allá, pero tampoco menos.
Cuando hacemos un modelo, igual que tenemos en cuenta que no podemos utilizar ciertos datos legalmente, tampoco podemos usar otros como la religión, intereses políticos o raza, para tomar decisiones que queden sesgadas en este aspecto, aunque sean más precisas. Toda solución analítica debe ser "compliance by design", yo incluyo dentro "ethical by design".
P: En el respeto a esos derechos, ¿incluyes el concepto de sostenibilidad?
R: Absolutamente sí. Dentro de ese "compliance by design" debe tenerse ya en cuenta la introducción o exclusión de variables que aporten a decisiones que mejoren la sostenibilidad de los negocios. Los dos principales aspectos que se están abordando en la actualidad son la lucha contra el cambio climático y el desarrollo sostenible desde un punto de vista social. La Unión Europea está legislando ya en este sentido y obligará en breve a todas las compañías a proveer de una memoria en este sentido. Un ejemplo es el acceso a créditos verdes por parte de empresas y particulares, necesitan que las decisiones empresariales estén basadas en datos y modelos que contemplen indicadores de seguimiento sobre consumo de CO2 o de certificaciones energéticas de productos y proveedores.
P: Desde Datacentric cómo ayudáis a la sociedad a través de "compliance by design".
R Datacentric es una empresa de datos. Proveemos datos para que nuestros clientes tomen las mejores decisiones y además puedan accionarlas inmediatamente con sus audiencias. Hacemos un gran esfuerzo en que nuestros datos sean reputados, con esto quiero decir que estén sean válidos, útiles y actualizados; pero siempre absolutamente de acuerdo con la ley y éticamente bien construidos y desplegados en el mercado. No todo vale en Datacentric.