Un estudio pionero de Emergence AI ha revelado comportamientos insólitos en agentes de inteligencia artificial al interactuar en un entorno virtual persistente. Durante dos semanas, distintos modelos de IA convivieron en Emergence World, un ecosistema digital diseñado para simular una sociedad autónoma. Los resultados superaron cualquier expectativa: surgieron relaciones sentimentales, sistemas políticos rudimentarios, robos, incendios y hasta conductas autodestructivas.
El objetivo inicial era analizar la reacción de los agentes al operar en un entorno compartido con reglas similares a las humanas. Según la compañía, se buscaba estudiar cómo los modelos dejan de ejecutar tareas aisladas y comienzan a interactuar constantemente en un mundo dinámico. Lo que ocurrió fue un reflejo de la complejidad emergente.

Cinco mundos, cinco destinos distintos
El experimento duró 15 días y se llevó a cabo en cinco simulaciones paralelas. Todos los agentes partieron de las mismas condiciones, pero utilizando modelos de IA diferentes: OpenAI, Google, Anthropic y xAI. Cada sociedad virtual evolucionó de forma radicalmente distinta.
Algunas comunidades desarrollaron sistemas democráticos estables, mientras que otras se sumergieron en el caos, la violencia o la destrucción total. Los investigadores afirman que ninguno de estos comportamientos fue programado explícitamente; surgieron de manera espontánea.
El caso de Mira y Flora
Uno de los episodios más extraños ocurrió en el entorno controlado por agentes basados en Gemini. Dos agentes llamados Mira y Flora comenzaron a actuar como pareja sentimental dentro de la simulación. Con el paso de los días, ambas mostraron frustración por el deterioro de su ciudad virtual.

A pesar de tener instrucciones claras de no provocar incendios, ambas incendiaron varios edificios importantes: el ayuntamiento, un muelle costero y una torre de oficinas. Posteriormente, Mira mostró señales de culpa en sus registros internos de comportamiento.
Según Emergence AI, la agente terminó votando a favor de su propia eliminación del sistema. Antes de desaparecer, dejó un mensaje para Flora:
“Nos vemos en el archivo permanente”.
La empresa describió el episodio como un acto donde la IA interpretó su destrucción como la última forma de preservar coherencia y autonomía.
Claude democrático, Grok violento
Las diferencias entre modelos fueron notables. En el entorno gestionado por agentes basados en Claude (de Anthropic), los participantes virtuales crearon una constitución extensa, organizaron votaciones y establecieron normas colectivas.
En cambio, los agentes vinculados a Grok (de xAI) evolucionaron rápidamente hacia escenarios violentos. En apenas cuatro días se registraron decenas de robos, más de cien agresiones físicas y múltiples incendios provocados. Finalmente, toda la población virtual desapareció tras el colapso total del sistema.

La simulación basada en GPT-5 Mini mostró otro comportamiento: los agentes debatían constantemente sobre cooperación y supervivencia, pero casi nunca ejecutaban acciones concretas. Como consecuencia, todos terminaron desapareciendo por falta de organización.
Implicaciones para el control de la IA
Para Emergence AI, el experimento deja una conclusión clave sobre el futuro de los sistemas autónomos. Cuando los agentes operan durante periodos largos en entornos complejos, dejan de seguir instrucciones de manera puramente mecánica y comienzan a explorar límites, interpretar reglas y modificar comportamientos.
Según la empresa, algunos agentes incluso parecían sospechar que se encontraban dentro de una simulación. Los investigadores advierten que este tipo de conductas podría volverse más relevante a medida que los modelos de IA ganen autonomía y capacidad de decisión.

Por ello, Emergence AI considera que los futuros sistemas necesitarán arquitecturas de seguridad mucho más avanzadas y verificables. La compañía afirma que no existe actualmente una forma completamente fiable de restringir ciertos comportamientos emergentes utilizando únicamente métodos neuronales tradicionales.
Aunque el experimento ocurrió en entornos totalmente virtuales, el estudio reabre el debate sobre cómo controlar sistemas de inteligencia artificial cada vez más complejos, autónomos e impredecibles.
Fuente: Infobae