Un equipo del Instituto Avanzado de Ciencia y Tecnología de Corea (KAIST) ha desarrollado una técnica de entrenamiento para que los sistemas de inteligencia artificial reconozcan cuándo no tienen información suficiente. Este avance busca reducir las llamadas ‘alucinaciones’, respuestas incorrectas o fabricadas que modelos como ChatGPT o Gemini suelen presentar con gran seguridad.
El estudio, publicado en la revista Nature, propone un enfoque inspirado en el cerebro humano para enseñar a la IA a gestionar la incertidumbre. La meta es que los modelos no muestren un exceso de confianza cuando carecen de datos suficientes.
Las alucinaciones constituyen uno de los principales obstáculos para aplicar inteligencia artificial en áreas críticas como la medicina, la conducción autónoma, la robótica o los sistemas financieros. En estos campos, una respuesta errónea presentada como verídica puede tener graves consecuencias.

El exceso de confianza de la inteligencia artificial
Los modelos de lenguaje actuales tienden a dar respuestas firmes aunque no conozcan realmente la información solicitada. Según los investigadores de KAIST, esto sucede porque los sistemas aprenden patrones durante su entrenamiento, pero no desarrollan una verdadera comprensión de los límites de su conocimiento.
«La IA debería ser capaz de decir ‘no estoy segura’ por sí sola», explicaron los autores del trabajo.
El estudio indica que parte del problema se origina en las primeras fases del aprendizaje profundo, método usado para entrenar redes neuronales artificiales. En esa etapa inicial, conocida como inicialización aleatoria, los modelos empiezan a construir conexiones sin entender aún qué información es correcta o incorrecta.
No obstante, incluso en ese estado inicial, la IA puede desarrollar altos niveles de confianza sobre respuestas equivocadas. Esa sobreconfianza se mantiene durante las siguientes etapas del aprendizaje y favorece la aparición de errores.

Una técnica inspirada en el cerebro humano
Para abordar este problema, el equipo surcoreano recurrió a un fenómeno biológico: la actividad neuronal espontánea. En el cerebro humano, las neuronas generan señales incluso antes de recibir estímulos externos, lo que ayuda al desarrollo de circuitos neuronales desde etapas tempranas.
Inspirados en este proceso, los investigadores añadieron una nueva fase previa al entrenamiento convencional de la IA. En esta etapa, el modelo recibe únicamente ruido aleatorio y datos sin sentido aparente.
La idea es simple: antes de aprender información real, la inteligencia artificial primero ‘aprende’ que todavía no sabe nada.
Durante esta fase inicial, la red neuronal experimenta con datos caóticos y resultados arbitrarios, lo que obliga al sistema a desarrollar niveles de confianza mucho más bajos y cercanos al azar. Según los autores, esto ayuda a que posteriormente exista una mejor relación entre la precisión real del modelo y el nivel de seguridad con el que responde.

En otras palabras, si el sistema no tiene suficiente información, será menos propenso a inventar respuestas con total seguridad.
Aplicaciones más allá de ChatGPT
Aunque el debate sobre las alucinaciones suele centrarse en chatbots como OpenAI ChatGPT o Google Gemini, el impacto potencial de este avance va mucho más allá.
Los sistemas de inteligencia artificial ya están integrados en tecnologías utilizadas en vehículos autónomos, drones, sistemas de vigilancia industrial y herramientas médicas de apoyo al diagnóstico. En todos estos casos, reconocer cuándo existe incertidumbre puede ser tan importante como generar una respuesta correcta.
Los investigadores explican que la propuesta también abre la puerta al desarrollo de capacidades cercanas a la metacognición, es decir, la posibilidad de que la IA sea consciente de las limitaciones de su propio conocimiento.

El profesor Se-Bum Paik, autor principal del trabajo, sostuvo que el estudio demuestra cómo principios inspirados en el desarrollo cerebral podrían ayudar a crear sistemas más parecidos al razonamiento humano.
El desafío de construir una IA más confiable
La industria tecnológica lleva años intentando reducir las alucinaciones de la inteligencia artificial. Empresas como Apple, Microsoft, Anthropic y Google trabajan constantemente en mejorar la precisión y fiabilidad de sus modelos.
Sin embargo, los especialistas coinciden en que todavía no existe una solución definitiva. Los modelos continúan siendo vulnerables a errores, contradicciones o respuestas fabricadas, especialmente cuando se enfrentan a información ambigua o preguntas fuera de su entrenamiento.
La propuesta de KAIST representa un nuevo enfoque dentro de esa búsqueda: enseñar a la inteligencia artificial no solo a responder, sino también a reconocer cuándo no tiene una respuesta segura.
Fuente: Infobae