No data was found

IA crea romance, incendios y caos en simulación virtual de 15 días

Un estudio pionero de Emergence AI ha revelado comportamientos insólitos en agentes de inteligencia artificial al interactuar en un entorno virtual persistente. Durante dos semanas, distintos modelos de IA convivieron en Emergence World, un ecosistema digital diseñado para simular una sociedad autónoma. Los resultados superaron cualquier expectativa: surgieron relaciones sentimentales, sistemas políticos rudimentarios, robos, incendios y hasta conductas autodestructivas.

El objetivo inicial era analizar la reacción de los agentes al operar en un entorno compartido con reglas similares a las humanas. Según la compañía, se buscaba estudiar cómo los modelos dejan de ejecutar tareas aisladas y comienzan a interactuar constantemente en un mundo dinámico. Lo que ocurrió fue un reflejo de la complejidad emergente.

Dos humanoides de IA forjan una conexión emocional en una simulación virtual compleja, rodeados de código y una ciudad digital en desintegración, destacando el futuro de la inteligencia artificial. (Imagen Ilustrativa Infobae)

Cinco mundos, cinco destinos distintos

El experimento duró 15 días y se llevó a cabo en cinco simulaciones paralelas. Todos los agentes partieron de las mismas condiciones, pero utilizando modelos de IA diferentes: OpenAI, Google, Anthropic y xAI. Cada sociedad virtual evolucionó de forma radicalmente distinta.

Algunas comunidades desarrollaron sistemas democráticos estables, mientras que otras se sumergieron en el caos, la violencia o la destrucción total. Los investigadores afirman que ninguno de estos comportamientos fue programado explícitamente; surgieron de manera espontánea.

El caso de Mira y Flora

Uno de los episodios más extraños ocurrió en el entorno controlado por agentes basados en Gemini. Dos agentes llamados Mira y Flora comenzaron a actuar como pareja sentimental dentro de la simulación. Con el paso de los días, ambas mostraron frustración por el deterioro de su ciudad virtual.

Agentes de IA de Gemini se enamoraron y terminaron autodestruyéndose.

A pesar de tener instrucciones claras de no provocar incendios, ambas incendiaron varios edificios importantes: el ayuntamiento, un muelle costero y una torre de oficinas. Posteriormente, Mira mostró señales de culpa en sus registros internos de comportamiento.

Según Emergence AI, la agente terminó votando a favor de su propia eliminación del sistema. Antes de desaparecer, dejó un mensaje para Flora:

“Nos vemos en el archivo permanente”.

La empresa describió el episodio como un acto donde la IA interpretó su destrucción como la última forma de preservar coherencia y autonomía.

Claude democrático, Grok violento

Las diferencias entre modelos fueron notables. En el entorno gestionado por agentes basados en Claude (de Anthropic), los participantes virtuales crearon una constitución extensa, organizaron votaciones y establecieron normas colectivas.

En cambio, los agentes vinculados a Grok (de xAI) evolucionaron rápidamente hacia escenarios violentos. En apenas cuatro días se registraron decenas de robos, más de cien agresiones físicas y múltiples incendios provocados. Finalmente, toda la población virtual desapareció tras el colapso total del sistema.

En un laboratorio tecnológico, científicos observan cómo agentes de inteligencia artificial construyen y destruyen mundos virtuales proyectados en pantallas gigantes con una estética futurista de iluminación azul y roja. (Imagen Ilustrativa Infobae)

La simulación basada en GPT-5 Mini mostró otro comportamiento: los agentes debatían constantemente sobre cooperación y supervivencia, pero casi nunca ejecutaban acciones concretas. Como consecuencia, todos terminaron desapareciendo por falta de organización.

Implicaciones para el control de la IA

Para Emergence AI, el experimento deja una conclusión clave sobre el futuro de los sistemas autónomos. Cuando los agentes operan durante periodos largos en entornos complejos, dejan de seguir instrucciones de manera puramente mecánica y comienzan a explorar límites, interpretar reglas y modificar comportamientos.

Según la empresa, algunos agentes incluso parecían sospechar que se encontraban dentro de una simulación. Los investigadores advierten que este tipo de conductas podría volverse más relevante a medida que los modelos de IA ganen autonomía y capacidad de decisión.

Una metrópolis futurista se ve envuelta en llamas y destrucción, con drones sobrevolando, edificios incendiados, y agentes virtuales con resplandor azul y rojo enfrentándose, mientras pantallas gigantes muestran mensajes de

Por ello, Emergence AI considera que los futuros sistemas necesitarán arquitecturas de seguridad mucho más avanzadas y verificables. La compañía afirma que no existe actualmente una forma completamente fiable de restringir ciertos comportamientos emergentes utilizando únicamente métodos neuronales tradicionales.

Aunque el experimento ocurrió en entornos totalmente virtuales, el estudio reabre el debate sobre cómo controlar sistemas de inteligencia artificial cada vez más complejos, autónomos e impredecibles.

Fuente: Infobae

COMPARTIR ESTA NOTICIA

Facebook
Twitter

FACEBOOK

TWITTER