Contar con buenos modelos predictivos ya no es suficiente
Durante los últimos años he sido testigo (y partícipe) de la transformación digital de muchas empresas en cuanto al uso de datos se refiere. Sin embargo, no todas se encuentran en el mismo nivel de madurez. Siempre suelo clasificar a las empresas en 4 grupos:
- No usan datos: cada vez quedan menos empresas de este tipo, y su tamaño suele ser pequeño. Toman decisiones basadas en la experiencia (intuición) de sus directivos.
- Usan datos para entender el presente: una gran mayoría de empresas ya se encuentran en este grupo, y son capaces de conocer en qué punto se encuentran analizando datos históricos. Podemos incluir aquí a todas aquellas que cuentan con herramientas de BI y que han realizado proyectos de analítica tradicional.
- Usan datos para predecir el futuro: cada vez son más las empresas que están intentando incorporarse a este grupo. Todas aquellas empresas que han desarrollado (con éxito) modelos predictivos se pueden englobar aquí.
- Usan datos para cambiar el futuro: muy pocas empresas han logrado avanzar hasta la que hoy en día se considera la última frontera en cuanto al uso de los datos se refiere. Y no es para menos, puesto que no es sencillo: hacen falta tanto buenos datos como buenos modelos para llegar hasta aquí.
Hace aproximadamente un año tuve la oportunidad de comenzar a trabajar con algunos de nuestros clientes (aquellos más aventajados en su estrategia de transformación digital) en su transición a esta última cuarta fase. En este artículo quiero compartir mi experiencia como Lead Data Scientist en este tipo de proyectos, y sobre todo, explicar en qué se diferencian de otros proyectos de Inteligencia Artificial más tradicionales.
Partiendo de un ejemplo real, si en lugar de simplemente predecir la fuga de clientes (churn) queremos evitarla, no nos basta con únicamente entrenar un modelo excelente que prediga qué clientes se van a fugar con mayor probabilidad, sino que hemos de ser capaces de establecer relaciones causa-efecto entre las posibles palancas de actuación y nuestra predicción. ¿Qué podemos hacer para evitar esa fuga? ¿De entre todas las opciones que tengo, cuál es la más óptima?
La revolución de la inferencia causalExiste una rama de la ciencia de datos, con una serie de algoritmos específicos (todavía poco conocidos), llamada Inferencia Causal, y que se especializa en la obtención de relaciones causa-efecto a partir de los datos. Los fundamentos de la inferencia causal son bastante antiguos, y se han utilizado sobre todo en el sector farmacéutico para evaluar la efectividad de nuevos medicamentos.
Hoy en día, la inferencia causal ha sufrido una pequeña revolución gracias al surgimiento de nuevos algoritmos (desarrollados principalmente por empresas como Google, Uber o Microsoft) que permiten identificar aquellas palancas de actuación más óptimas a un nivel de detalle nunca visto hasta ahora, y que están revolucionando varias industrias. Sin ir más lejos, la inferencia causal está detrás del premio Nobel de economía de 2021.
Los nuevos avances en inferencia causal solventan estos problemas gracias a la integración de modelos de Machine Learning, permitiendo:
- El aprendizaje usando grandes históricos de datos observables, evitando en gran medida la creación de grupos de control y tratamiento (cosa que en ocasiones puede no ser posible o ético).
- Obtener relaciones causa-efecto con una alta resolución, permitiendo por ejemplo la realización de campañas de marketing personalizadas a nivel de cliente, o tratamientos personalizados a nivel de paciente.
El desarrollo de modelos de inferencia causal requiere por un lado de conocimiento experto más allá de la herramienta o librería concreta que se vaya a utilizar (hay que tener muy claros los principios), y en muchas ocasiones de datos con los que las empresas no suelen contar. En un proyecto real de fuga de clientes (churn), desarrollado en WhiteBox, se enriquecieron los datos del cliente con datos externos sobre los precios de la competencia y las nuevas ofertas, siendo este un factor fundamental en la fuga.
Conclusión
Los proyectos de inferencia causal son cada día más demandados por nuestros clientes en WhiteBox, ya que permiten pasar de únicamente realizar predicciones a tener una serie de palancas que permiten pasar a la acción.
Este enfoque causal a la Inteligencia Artificial (premiado en 2021 con el premio Nóbel de economía) está permitiendo a las empresas dar un paso más en su transformación digital haciéndolas dueñas (y no simplemente espectadoras) de su futuro.