¿Es el fraude en los paneles el nuevo fraude publicitario? El impactante problema que afecta a los estudios de mercado se resuelve con la IA.

La calidad de los datos es fundamental para los directores de marketing que necesitan obtener información relevante, y el 89 % de los compradores coincide en que es su prioridad número uno. En este artículo, analizamos la situación actual en materia de fraude y explicamos cómo Kantar puede resolverlo mediante la inteligencia artificial y otras soluciones avanzadas.

La calidad de los datos es fundamental para los directores de marketing que necesitan obtener información relevante, y el 89 % de los compradores coincide en que es su prioridad número uno (fuente: Greenbook, Informe de prácticas de GRIT Insights de 2023).

Un reciente compromiso de calidad del sector está cobrando impulso a medida que más compradores, vendedores y proveedores comprenden que es necesario resolver este problema.

Como afirma Jane Frost, directora ejecutiva de la Market Research Society:«Las actividades fraudulentas son cada vez más sofisticadas, especialmente en la investigación online. Suponen un riesgo significativo para el futuro de nuestro sector».

La calidad de los datos debería ser un factor básico en el que los compradores de insights puedan confiar, pero el fraude rampante persiste desde hace años. Y es un tema del que, curiosamente, apenas se habla en el sector. El fraude en los paneles se perfila como el fraude publicitario o las granjas de clics de esta década, y se está industrializando rápidamente.

Y lo que es peor, a medida que aumentan las tasas de fraude, también lo hacen las variaciones en los datos resultantes.

En este artículo, revelamos cuál es la situación actual del fraude y cómo Kantar puede resolverlo mediante la IA y otras soluciones avanzadas.

A nivel mundial, existen tres grandes retos del sector que afectan a los paneles:

1. La lucha por la atención del público: ¿cómo competimos por el valioso tiempo de los participantes en los paneles?
2. El aumento de los requisitos de cumplimiento en materia de privacidad de datos: el RGPD es diferente de la CPPA, por ejemplo.
3. El aumento de los niveles de fraude online. Las «tasas de reconciliación» —el porcentaje de muestras rechazadas por ser de baja calidad— han aumentado en torno a un 300 % en los últimos tres años, y los clientes rechazan hasta un 40 % de los datos tras el trabajo de campo.

Los propietarios de paneles deben abordar cada uno de estos tres factores de forma inteligente y estratégica.

1. Lucha por captar la atención

Esto empieza por cómo tratamos a los participantes: no como una mercancía, sino como un recurso valioso. Buscamos constantemente formas de perfeccionar la forma en que formulamos nuestras preguntas, la duración de la entrevista y cómo aumentar la gamificación. Conocemos a nuestros participantes como personas, respondiendo a sus preguntas y tratándolos bien. Emparejamos a cada participante de forma individual mediante nuestro algoritmo exclusivo de emparejamiento de encuestas, de modo que las personas adecuadas respondan a las encuestas adecuadas, al ritmo adecuado. Esto ayuda a reducir los abandonos y las exclusiones, lo que se traduce en un 175 % más de encuestas completadas que la media del sector. Al combinar el trato que damos a los encuestados, a quienes valoramos como personas, con una tecnología de panel avanzada, conseguimos que nuestros panelistas estén contentos y comprometidos. Valoran nuestra aplicación con un 4,2 en Trustpilot y dejan comentarios positivos como: «¡El ambiente es positivo y he aprendido mucho de las encuestas online, mientras que mi cuenta bancaria también sigue sonriendo!».

2. El endurecimiento de los requisitos de cumplimiento en materia de protección de datos

Kantar desempeña un papel destacado en los debates y grupos de trabajo del sector (por ejemplo, ESOMAR). Además, contamos con un equipo interno de especialistas que supervisa constantemente la normativa sobre privacidad y consentimiento, y se asegura de que dispongamos de las soluciones técnicas adecuadas para la recopilación, el almacenamiento y la eliminación de datos.

En China, por ejemplo, contamos con una plataforma específica de gestión de muestras que cumple con la PIPL para la recopilación de datos aprobada por la CAC, y que ofrece una serie de optimizaciones específicas para el mercado. Está totalmente integrada en el ciberespacio chino y ofrece acceso programático a nuestro panel móvil de WeChat, de propiedad exclusiva: acceso a 1,5 millones de personas de difícil acceso. También contamos con múltiples capas de prevención del fraude y controles de calidad que garantizan que cada cuenta de WeChat esté vinculada a una cuenta bancaria real y única. Las identificaciones con hash y los enlaces a las encuestas se cifran con MD5 y Wave Secret, para mitigar las respuestas fantasma y las respuestas fraudulentas de los hackers.

3. Aumento de los casos de fraude en línea

Más de dos tercios de las alertas de calidad de datos (el 69 %) se atribuyen a distintos tipos de fraude. De estas, el 41 % proviene de hackers internacionales, el 13 % de bots conocidos, el 7 % de «ghost completes» (en los que un encuestado parece haber completado una encuesta, pero no se recopilan datos debido a que ha configurado enlaces redirigidos) y el 8 % de duplicados (en los que un encuestado completa varias encuestas, normalmente si ha creado muchas cuentas fraudulentas fingiendo pertenecer a distintos grupos demográficos).

Para garantizar la máxima calidad de los datos, hemos segmentado el fraude en tres tipos:

• Panelistas desmotivados: realizan varias tareas a la vez y responden a las encuestas de forma mecánica, por lo que la precisión es cuestionable. El impacto en la integridad de los datos es de moderado a bajo. Estos panelistas necesitan orientación y supervisión de su comportamiento. Puede ser necesario excluirlos de determinados estudios.

• Panelistas deshonestos: mienten sobre su identidad y completan más encuestas para ganar recompensas más rápido. El impacto en la integridad de los datos es de moderado a alto.

• Panelistas fraudulentos: actúan por su cuenta o en grupo para piratear encuestas y ganar recompensas a gran escala —las nuevas granjas de clics, por así decirlo—. Se trata de un fraude grave, a gran escala y con un alto impacto en la integridad de los datos.

¿Qué medidas está tomando Kantar para combatir cada uno de estos tipos de fraude? ¿Y cómo estamos utilizando las herramientas de IA y GenIA líderes en el mercado para combatirlos?

• Promovemos un buen diseño de las encuestas: La calidad de una encuesta depende de su diseño, su extensión y la experiencia del usuario. Incluso los participantes más comprometidos pueden perder el interés si no se tienen en cuenta estos factores.

• Evitamos los errores por falta de atención: Algunos panelistas dan respuestas incoherentes debido a malentendidos, y otros no son quienes dicen ser; pero no todos los problemas detectados se deben a un engaño deliberado. Algunos son errores inocentes, y no todas las acciones señaladas perjudican la integridad de los datos. Queremos incluir a todos los participantes genuinos. Por eso, ofrecemos formación a los panelistas y la oportunidad de mejorar su comportamiento, si es necesario.

• Definimos la calidad: es subjetiva, por lo que utilizamos métricas objetivas. Es fundamental reconocer los distintos niveles de baja calidad y los diferentes factores que contribuyen a ella. La división Profiles de Kantar amplía sus más de 20 años de profunda experiencia en paneles con tecnología e IA para hacerlo en tiempo real a través de Qubed AI, su herramienta antifraude patentada. Qubed AI funciona en tiempo real, está impulsada por 5 redes neuronales profundas (en otras palabras, aprendizaje automático avanzado), se entrena a diario a partir de más de 60 millones de eventos y procesa más de 300 características en cada sesión de encuesta para puntuar automáticamente y emitir un veredicto y una acción sugerida sobre si un participante es fraudulento o no, en milisegundos —algo que un ser humano (y otras tecnologías antifraude) simplemente no podrían hacer—.

• Utilizamos GenAI con la validación de respuestas abiertas de Qubed: empleamos nuestra solución patentada de evaluación de respuestas abiertas basada en ChatGPT, que puntúa las respuestas abiertas de los panelistas en múltiples dimensiones. Los factores que detectamos incluyen la relevancia con respecto a la pregunta formulada, la originalidad, la exhaustividad, el lenguaje, las respuestas plagiadas, el uso de datos de identificación personal (PII), la jerga, el uso de abreviaturas, así como el lenguaje soez, el racismo, el galimatías y las respuestas generadas por ChatGPT. Para obtener más información sobre cómo la validación de respuestas abiertas Qubed de Kantar combate el fraude, consulte este artículo anterior que publicamos titulado «Transformando los paneles: ¿Cómo utiliza Kantar los modelos de lenguaje grande (LLM) para mejorar las respuestas de los paneles?».

• Introducción de Qubed Facial Verification: El último avance de Kantar en la lucha contra el fraude en las encuestas ha sido la integración de Realeyes Verify en nuestra IA Qubed. Verify es una tecnología de verificación facial ligera entrenada con un conjunto de datos único de 17 millones de sesiones de encuesta con consentimiento, captadas mediante webcam. Podemos identificar rápidamente cuándo personas malintencionadas intentan unirse a nuestros paneles Premium.

Los directores de marketing y los responsables de insights deben comprender cómo sus socios de paneles están priorizando la calidad de los datos, y tener la seguridad de que estos les proporcionan datos oportunos y precisos, libres de respuestas fraudulentas.

A medida que todo el sector apuesta por la calidad a través del Compromiso de Calidad y otros medios, Kantar se encuentra en una posición idónea para continuar su papel de liderazgo en la eliminación del fraude y devolver una mayor confianza al sector de los datos de consumo, mediante el uso inteligente de la IA.

‍