Google ha incorporado de manera nativa en su modelo Gemini 3.5 Flash la capacidad de controlar el ordenador, permitiendo que los desarrolladores diseñen agentes personalizados con la habilidad de ver, razonar y ejecutar acciones en navegadores, dispositivos móviles y entornos de escritorio.
El gigante tecnológico presentó Gemini 3.5 Flash en mayo pasado durante su conferencia anual para desarrolladores Google I/O. Este modelo combina inteligencia de vanguardia con capacidad de acción, destacándose en programación, tareas de agentes en el mundo real y uso de herramientas.
Ahora, Google ha decidido ir más allá y ofrecer «el mejor rendimiento» para tareas de uso del ordenador con agentes, actualizando Gemini 3.5 Flash con esta capacidad integrada de forma nativa, tal como lo ha comunicado oficialmente.
La función uso del ordenador es una capacidad avanzada que permite a la inteligencia artificial controlar el navegador web de manera autónoma. Se basa en agentes que observan la interfaz de usuario e interactúan con ella en tiempo real, desplazándose o escribiendo texto.
Con esta herramienta integrada en 3.5 Flash, los desarrolladores podrán aprovechar las capacidades más avanzadas de Gemini para crear agentes personalizados y automatizar procesos. Estos agentes podrán ver, razonar y realizar acciones de forma completamente autónoma en navegadores, entornos móviles y de escritorio.
Anteriormente, esta capacidad solo estaba disponible como un modelo independiente de uso del ordenador en Gemini 2.5, pero ahora está directamente integrada en el modelo principal de Gemini Flash, según destacó la compañía.
Google asegura que esto facilita un rendimiento mejorado para tareas de automatización empresarial y trabajos a largo plazo, como pruebas continuas de software y labores de conocimiento en aplicaciones profesionales.
Por ejemplo, el uso del ordenador es útil para generar agentes autónomos que analicen lo que muestra una aplicación en un smartphone y devuelvan una lista categorizada de funciones, o para realizar auditorías de documentación que detecten problemas de accesibilidad.
Medidas para garantizar la seguridad con Flash 3.5
El uso de agentes capaces de interactuar con entornos reales de navegadores y móviles también puede implicar riesgos de ciberseguridad, como la inyección de código malicioso. Frente a esto, Google ha subrayado su intención de brindar una experiencia segura para los usuarios.
Para mitigar posibles intentos de inyección, la compañía ha señalado que utilizaron entrenamiento adversario dirigido para el uso de ordenadores en Gemini 3.5 Flash. Además, lanzó dos sistemas de protección específicos para empresas:
- Confirmación explícita del usuario para que el agente ejecute acciones delicadas o irreversibles.
- Detención automática de la tarea si se detecta una inyección de aviso directa.
Google también recomendó a los desarrolladores adoptar un enfoque de defensa en profundidad, combinando estas características de seguridad con entornos aislados seguros, verificación humana y controles de acceso estrictos.
La nueva función de uso del ordenador en Gemini 3.5 Flash ya está disponible para desarrolladores a través de la API de Gemini y la plataforma Gemini Enterprise Agent.
Fuente: Infobae