Las encuestas continúan siendo una pieza probatoria relevante en litigios vinculados con percepciones del consumidor, efectos competitivos o respuestas conductuales. Se usan, por ejemplo, para analizar confusión en disputas marcarias, disposición a pagar o sustitución de demanda en asuntos antitrust, y reacciones de consumidores frente a cambios en productos o condiciones de mercado. El problema operativo aparece desde el inicio del caso: decidir si vale la pena invertir en una encuesta real y cómo estructurarla cuando los hechos aún están evolucionando y el riesgo procesal sigue siendo incierto. Esa dificultad se agrava porque los estudios piloto, aunque ayudan a reducir incertidumbre, también pueden ser costosos, consumir tiempo y resultar poco concluyentes, sobre todo cuando existen varias hipótesis en competencia. Bajo ese contexto, los modelos de lenguaje empiezan a incorporarse como apoyo exploratorio en etapas tempranas del análisis.
La propuesta se apoya en la capacidad de los modelos de lenguaje para aprender patrones estadísticos de grandes volúmenes de texto y reproducir formas de respuesta asociadas con preferencias, razonamientos o descripciones humanas. A partir de ello, podrían utilizarse para revisar cuestionarios y sugerir formulaciones menos ambiguas y sesgadas. También podrían generar respuestas sintéticas de individuos definidos por rasgos demográficos o conductuales, tomando como referencia patrones observados en datos similares. En una versión más ambiciosa, se plantea que, con entrevistas detalladas de personas específicas, podrían construirse “doppelgangers” virtuales que aproximen sus preferencias, actitudes y estilos de razonamiento. La utilidad práctica no estaría en reemplazar el trabajo empírico con personas, sino en ayudar a decidir con más información si conviene realizar una encuesta humana y bajo qué diseño.
La viabilidad inicial de este enfoque se relaciona con investigaciones recientes. Se menciona una investigación de 2024, con participación de Google DeepMind, en la que modelos de lenguaje fueron entrenados con entrevistas en profundidad a más de 1.000 personas reales para evaluar qué tan bien podían replicar sus respuestas y comportamientos en varias medidas. Los resultados apuntan a que, bajo ciertas condiciones, las respuestas sintéticas pueden capturar patrones complejos de actitudes y comportamiento útiles para análisis exploratorio y contraste de hipótesis. También se citan otros trabajos que encuentran que los modelos pueden simular respuestas a escala y a bajo costo. A partir de ello, se sugieren aplicaciones concretas: explorar si una población objetivo pequeña o dispersa podría mostrar variación relevante, revisar claridad y neutralidad de preguntas, detectar sensibilidad del resultado a la estructura del cuestionario y ofrecer, en el futuro, paneles sintéticos de consumidores anónimos como opción previa a una encuesta tradicional. Otra ventaja operativa es la posibilidad de consultar estos paneles repetidamente y sin fatiga del respondente, lo que facilitaría ensayar enfoques alternativos a medida que evoluciona el litigio.
El uso responsable de estas herramientas todavía enfrenta límites metodológicos importantes. Los modelos aprenden de los datos con los que fueron entrenados y, por tanto, podrían preservar, distorsionar o amplificar errores de medición presentes en encuestas humanas. El texto pone especial atención en el sesgo de deseabilidad social, es decir, la tendencia de las personas a sobredeclarar rasgos socialmente valorados. Todavía no existe certeza sobre cómo ese tipo de sesgo se transmite a los datos sintéticos ni sobre cómo ciertas decisiones de diseño influyen en el resultado final. Por eso, los autores están desarrollando una investigación experimental para evaluar si ese sesgo se propaga en conjuntos sintéticos y si diseños de encuesta orientados a reducirlo mejoran la validez de la salida generada. Las encuestas sintéticas no deberían entenderse como sustituto de las encuestas tradicionales, sino como parte de una caja de herramientas analíticas tempranas para explorar supuestos, probar sensibilidad y evitar desvíos costosos antes de lanzar una encuesta humana independiente y no sesgada.
Para leer más ingrese a: