Saltar al contenido principalSaltar al pie de página

Dos científicas de la Universidade da Coruña investigan el rigor y el sesgo de género en la IA

Teresa Piñeiro y Laura Castro se integraron en un equipo que medía la fiabilidad de ChatGPT o Grok al elaborar los perfiles de 20 personalidades. El futbolista Iago Aspas, la escritora Ledicia Costas y el músico Carlos Núñez fueron algunos de ellos

De izquierda a derecha, las investigadoras Laura Castro y Teresa Piñeiro, del Grupo de Investigación Cidadanía Dixital de laa Universidade da Coruña.

De izquierda a derecha, las investigadoras Laura Castro y Teresa Piñeiro, del Grupo de Investigación Cidadanía Dixital de laa Universidade da Coruña. / LCO

A Coruña

Las investigadoras Teresa Piñeiro y Laura Castro del Grupo Cidadanía Dixital (DIGI) de la Universidade de A Coruña participaron en un proyecto sobre la capacidad de la IA en la verificación de noticias con perspectiva de género. Analizaron los perfiles creados por ChatGPT o Grok, entre otros programas, sobre 20 personajes públicos, como el futbolista Iago Aspas y la portavoz nacional del BNG, Ana Potón.

El plan, realizado en conjunto con investigadores de la Universidade de Vigo, buscaba responder a la pregunta sobre si es posible garantizar el rigor de la inteligencia artifical generativa en la lucha contra la desinformación. El proyecto Avaliación da IA xerativa na verificación de feitos sobre personalidades de Pontevedra con perspectiva de xénero fue desarrollado al amparo de la Cátedra de Feminismo 4.0 Depo-UVigo.

Partiendo de un prompt único (una orden única), el equipo investigador analizó las respuestas a la solicitud de informaciones sobre diez mujeres y diez hombres de la política, la comunicación o el deporte. La lista incluía a la portavoz del BNG, Ana Pontón, a la escritora Ledicia Costas, al músico Carlos Núñez o al futbolista Iago Aspas.

ChatGPT, el más fiable

El análisis investigó los sesgos de género empleados por las plataformas ChatGPT, Mistral, DeepSeek y Groken en la búsqueda y elaboración de perfiles. Se compararon el volumen, la calidad y el tipo de información, así como las fuentes empleadas en el proceso. La consulta fue igual en cada uno de los 20 casos.

Segun informa la Universidade, el resultado obtenido después de trabajar los datos muestra que ChatGPT es la herramienta más fiable para este tipo de tareas. Para los investigadores, Mistral y Grok son "aceptables, pero con déficit de fuentes". El peor resultado lo marca DeepSeek, que trabaja "sin valor para la verificación" y con "alta tasa de alucinaciones".

El equipo detectó que ChatGPT “cumple de forma consistente con la citación de fuentes verificables”, mientras que las otras incluyen referencias inventadas, especialmente DeepSeek.

Tracking Pixel Contents