Al combinar datos a nivel de dispositivo con la potencia del machine learning, Kantar Media consigue aprovechar al máximo los paneles para entender quién está viendo contenidos a nivel censal. Así libera todo el potencial de la medición basada en personas
Ver todas las noticias y recursos
Resolución en alta definición: cómo usar machine learning para medir audiencias con mayor precision

Cuando RTL se asoció con Kantar Media para un Proof of Concept, no era precisamente por falta de datos. Con ocho canales de televisión, un servicio de streaming muy consolidado y una fuerte huella digital, RTL captaba señales de unos cinco millones de dispositivos únicos a través de sus webs y plataformas de catch-up.
El problema era la resolución. RTL, como muchas otras organizaciones con grandes volúmenes de datos propios, podía ver qué se estaba viendo, pero no por quién. Los datos estaban ligados a dispositivos y no a individuos, registrando actividad sin aportar una visión clara de la persona detrás de la pantalla.
Este es un vacío común en la medición de audiencias actual. La creciente fragmentación de los hábitos de visionado entre plataformas dificulta cada vez más obtener insights fiables a nivel individual. Muchos datasets son pasivos, recogidos automáticamente por aplicaciones o decodificadores. Aunque útiles para entender patrones, rara vez cuentan toda la historia.
La metodología de Kantar Media está diseñada para cerrar esa brecha. En lugar de usar dispositivos u hogares como sustitutos de personas, integra datos de comportamiento con insights de paneles de audiencia verificados. Es un enfoque basado en principios de medición consolidados, reforzado con modelos de machine learning que aumentan la escala y la precisión.
En el centro de este enfoque está el panel: grupos de individuos reales cuyas características demográficas y hábitos de consumo se verifican cuidadosamente y se actualizan de manera regular. Funcionan como punto de referencia, una base sobre la que interpretar señales de datos más amplias. Aunque limitados en alcance, los paneles aportan un nivel de fiabilidad que los datos de comportamiento en bruto no pueden ofrecer.
Para extender esa fiabilidad a datasets mayores, Kantar Media cruza registros de visionado a nivel de dispositivo con los datos de panel. Esto permite identificar patrones en el consumo de contenidos, franjas horarias de uso y otros marcadores de comportamiento. Posteriormente se aplican algoritmos que infieren atributos demográficos y de estilo de vida para cada dispositivo. Estos modelos utilizan técnicas basadas en árboles de decisión como XGBoost, LightGBM o random forest, generando perfiles probabilísticos de cada espectador.
El proceso resulta especialmente útil cuando los datos son incompletos o anónimos. Por ejemplo, si una tableta se utiliza habitualmente para ver contenidos de cocina a última hora de la tarde, y en el panel se observa un comportamiento similar en un perfil demográfico concreto, el sistema asigna a ese dispositivo un perfil probable. Estos perfiles pueden incluir rango de edad, género, composición del hogar o intereses como salud, videojuegos o alimentación. Así ocurrió con RTL: al combinar sus propios datos de dispositivo con el panel de Kantar Media, pudo enriquecer su conocimiento de los usuarios, pasando de identificadores anónimos a atributos como edad, género o estructura familiar. Esto le permitió obtener una visión más detallada de la audiencia, mejorando la segmentación y la toma de decisiones sobre contenidos.
Un cambio en la forma de entender a las audiencias
Las metodologías de machine learning también se aplican en Kantar Media con una función correctiva. Cuando los broadcasters o las marcas ya disponen de datos demográficos declarados -por ejemplo, a través de formularios de registro de usuario-, estos pueden contener errores. Kantar Media aplica lo que denomina “matrices de precisión” para corregir los errores más comunes, recalibrando los datos con ayuda de los benchmarks de panel.
Por supuesto, estas técnicas nunca sustituirán a los paneles, dado su papel único, ni se plantea que la modelización probabilística reemplace a los datos verificados. El valor está en la combinación de ambos: mantener el rigor de la medición representativa mientras se amplía su alcance gracias a la ciencia de datos escalable. El resultado es un dataset más completo y, sobre todo, más accionable.
Para los marketers, esto supone un cambio en cómo se pueden comprender y alcanzar las audiencias. En lugar de depender de categorías generales o proxies de dispositivos, las campañas pueden basarse en perfiles mucho más precisos. Esto facilita una mejor medición de cobertura y frecuencia, y permite un targeting más coherente entre plataformas. Para los broadcasters, no solo aumenta el potencial comercial, sino que también puede ayudarles a perfeccionar sus estrategias de contenido.
A medida que el entorno mediático sigue evolucionando, este tipo de insights a nivel individual probablemente se vuelvan cada vez más centrales para la forma en que operan broadcasters, anunciantes y plataformas, desplazando el foco de la mera recogida de datos a la interpretación significativa.
Al centrarse en la persona y no en el dispositivo, y al anclar la modelización del comportamiento en estándares de medición consolidados, los enfoques de Kantar Media ofrecen una vía clara para afrontar ese reto. En ellos se refleja un cambio más amplio en la industria: datos no solo técnicamente sofisticados, sino también verdaderamente accionables y adecuados para su propósito.
Emiliano Cancellieri es Data Science Manager en Kantar Media.