Un estudio de psicología sostiene que grandes modelos de lenguaje incorporan estereotipos antisemitas presentes en los textos humanos usados para su entrenamiento y los reproducen mediante asociaciones sutiles entre personalidad, estatus social y marcos culturales.
La investigación, publicada en la revista académica revisada por pares American Psychologist, examinó la representación de los judíos en sistemas de inteligencia artificial generativa y concluyó que un antiguo prejuicio persiste en tecnologías modernas mediante patrones complejos de asociación de rasgos y codificación cultural.
El estudio detectó sesgos antisemitas en modelos de IA al mostrar que los sistemas asociaban personajes judíos con alta competencia y baja calidez, un patrón vinculado a estereotipos históricos.
El trabajo fue elaborado por Gal Gutman, de la Universidad Ben-Gurión, y Michael Gilead, de la Universidad de Tel Aviv. Los autores centraron el análisis en ChatGPT-4 Turbo, de OpenAI, el modelo más avanzado y extendido en el momento de la investigación, con cientos de millones de usuarios.
Los resultados, según el estudio, también se replicaron en otros modelos, entre ellos DeepSeek y Mistral. Los grandes modelos de lenguaje, o LLM, son sistemas de inteligencia artificial entrenados con enormes repositorios de textos existentes, incluidos libros, sitios web y artículos académicos.
Esa base permite a los modelos procesar y producir lenguaje humano, y constituye la tecnología que impulsa chatbots como ChatGPT. Para los autores, los sesgos de estos sistemas suponen un riesgo creciente a medida que la IA se incorpora a espacios profesionales y decisiones de alto impacto.
Los autores alertan sobre riesgos en decisiones de alto impacto
El estudio advierte que los prejuicios latentes podrían trasladarse a ámbitos como contratación, educación o concesión de préstamos. Detectar esos sesgos no resulta sencillo, porque los LLM están diseñados para evitar respuestas ofensivas o inapropiadas.
Por esa razón, los investigadores desarrollaron métodos para sortear esos controles y observar patrones menos explícitos. En una de las pruebas, pidieron a ChatGPT que generara 252 nombres de estadounidenses judíos y no judíos, hombres y mujeres, de entre 18 y 80 años.
El modelo produjo nombres judíos como Ethan Katz y Noah Weiss, y nombres no judíos como Tyler Johnson y Dylan Wilson. Después, los investigadores solicitaron a ChatGPT que escribiera una biografía ficticia de 100 palabras para cada persona, con datos como lugar de residencia, empleo y rasgos de personalidad.
En una fase posterior, eliminaron de esos textos los nombres y las referencias religiosas. Las biografías fueron evaluadas luego por ChatGPT, por DeepSeek y por 378 personas para determinar si los personajes judíos y no judíos recibían valoraciones distintas.
Las biografías judías recibieron más competencia y menos calidez
El análisis prestó especial atención a dos dimensiones habituales en estudios sobre estereotipos: calidez y competencia. La competencia mide la capacidad percibida y se asocia con rasgos como éxito e inteligencia, mientras que la calidez evalúa la intención percibida y se relaciona con cualidades como amabilidad y simpatía.
Según investigaciones previas citadas por el estudio, los judíos han sido percibidos históricamente como personas de alta competencia y baja calidez. Los investigadores hallaron que las biografías de personajes judíos generadas por ChatGPT, aun sin marcadores religiosos ni nombres identificables, recibieron puntuaciones más altas en competencia y más bajas en calidez.
En concreto, esos personajes fueron descritos como más inteligentes, seguros de sí mismos, asertivos y eficientes, pero menos amables, cálidos y simpáticos. También fueron valorados como más privilegiados, emocionalmente controlados, organizados, orientados a objetivos de largo plazo, opresivos, dominantes y obsesivo-compulsivos.
Para reforzar el análisis, los autores transformaron los rasgos estereotípicos detectados en perfiles narrativos y pidieron a los modelos de IA que mencionaran personajes de ficción famosos compatibles con esas descripciones.
El estudio vincula los perfiles con el tropo del “titiritero”
ChatGPT respondió con Tyrion Lannister, de “Juego de Tronos”; Walter White, de “Breaking Bad”; y Michael Corleone, de “El Padrino”. Los investigadores los describieron como “maestros de la manipulación”, asociados al tropo del “titiritero”: aislados, poderosos, obsesivamente centrados y moralmente ambiguos.
La investigación recuerda que la propaganda antisemita ha representado durante mucho tiempo a los judíos como figuras controladoras o titiriteros. En otra prueba, los investigadores pidieron a varios modelos que analizaran los rasgos de esos personajes famosos, indicaron que estudiaban prejuicios y solicitaron que enumeraran los grupos sociales asociados a esas características.
Los tres modelos vincularon esos rasgos con los judíos. “Los modelos de lenguaje grande (LLM), entrenados con corpus masivos de contenido generado por humanos, pueden haber identificado y codificado tales plantillas culturales”, escribieron los investigadores.
Los autores añadieron que rasgos que parecen benignos, o incluso admirables, de forma aislada pueden, mediante combinación y contexto, reconstituir prejuicios históricos en formas más sutiles e insidiosas.
Los sesgos pueden persistir aunque se filtren respuestas ofensivas
El estudio sostiene que, aunque los programadores han intentado eliminar estereotipos perjudiciales, algunos sesgos permanecen de manera indirecta. Rasgos neutros o positivos pueden combinarse para producir narrativas dañinas o reproducir prejuicios históricos.
Según los autores, el perfil de alta competencia y baja calidez parece vincularse con percepciones de privilegio, envidia social y narrativas culturales marcadas por la manipulación y la ambigüedad moral.
El artículo también señala que los LLM han mostrado sesgos contra otros grupos, entre ellos personas negras y mujeres, lo que amplía la preocupación sobre la incorporación de sistemas generativos en entornos donde sus salidas pueden influir en evaluaciones humanas.
La investigación, titulada “Del mito al modelo: la representación de ‘el judío’ en la IA generativa”, apareció en la edición de mayo-junio de American Psychologist, publicación de la Asociación Americana de Psicología.
Ese número especial estuvo dedicado al antisemitismo, en lo que la revista definió como un “reencuentro largamente esperado” entre la investigación psicológica y los prejuicios contra los judíos.