OpenAI, compañía creadora de ChatGPT, ha publicado un estudio que aborda uno de los problemas más polémicos de la inteligencia artificial: las alucinaciones, es decir, cuando un modelo genera información falsa con total seguridad.
Según la investigación, este fenómeno no es solo un defecto del entrenamiento, sino un resultado matemáticamente inevitable en los sistemas actuales de lenguaje. Incluso con datos perfectos, persistirán los errores debido al método de predicción palabra por palabra que emplean las IA.
El análisis advierte que las evaluaciones vigentes empeoran la situación. La mayoría de los principales bancos de pruebas de la industria penalizan con igual severidad una respuesta incierta que una errónea. Esto incentiva a los modelos a ‘adivinar’ en lugar de reconocer su falta de certeza, generando lo que los investigadores describen como una epidemia de respuestas falsas pero convincentes.
Una incómoda solución
La propuesta de OpenAI consiste en asignar una calificación negativa para respuestas incorrectas y otorgar crédito parcial por dejar preguntas en blanco. De este modo, los modelos comenzarían a tomar en cuenta su propio nivel de confianza antes de responder, lo que reduciría el número de alucinaciones.
Sin embargo, expertos afirman que esta medida tendría un alto costo para la experiencia del usuario. Según Wei Xing, profesor asistente de la Universidad de Sheffield (Reino Unido), si un sistema como ChatGPT respondiera ‘no lo sé’ en un 30 % de las consultas, probablemente alejaría a millones de usuarios acostumbrados a recibir respuestas seguras y rápidas.
A este desafío se suma un obstáculo económico. Los modelos conscientes de su incertidumbre requieren muchos más recursos computacionales, lo que encarece drásticamente su operación en aplicaciones masivas. En sectores críticos como la medicina, las finanzas o la logística —donde el costo de una alucinación supera al de un cálculo adicional— este enfoque sí podría implementarse. Para el consumo general, en cambio, la industria sigue premiando la rapidez y la seguridad aparente por encima de la precisión.
Si te ha gustado, ¡compártelo con tus amigos!