La herramienta Gemini API ha dado un paso significativo hacia la optimización operativa al habilitar nuevas opciones para la carga de datos. Entre las innovaciones más destacadas se encuentra la compatibilidad con archivos alojados en Google Cloud Storage (GCS) y vínculos externos públicos o privados a través de HTTPS y URLs firmadas. Además, la plataforma ha quintuplicado su capacidad de procesamiento, elevando el límite de tamaño por archivo de 20 a 100 megabytes.
De acuerdo con la información proporcionada por Google, estas actualizaciones están diseñadas para que los programadores utilicen archivos que ya se encuentran en otras infraestructuras sin requerir procesos de transferencia intermedios. Este avance busca agilizar de forma considerable la implementación de soluciones de inteligencia artificial en entornos productivos de escala real.
Flexibilidad en el manejo de datos externos
Anteriormente, los desarrolladores debían cargar obligatoriamente sus documentos en la Gemini Files API, un sistema que limitaba la permanencia de los datos a un máximo de 48 horas. Si bien este esquema era funcional para etapas de prueba, presentaba obstáculos para proyectos de mayor envergadura. Ahora, el sistema admite rutas de acceso directas a archivos situados en plataformas de terceros, tales como AWS S3 o Azure Blob Storage, siempre que se utilicen enlaces protegidos o ubicaciones públicas. Esto elimina la necesidad de realizar descargas previas hacia el backend, mejorando la gestión integral de la información.
La empresa también detalló que los archivos que ya forman parte de Google Cloud Storage pueden integrarse directamente mediante la API de archivos de Gemini. Esta funcionalidad evita la creación de duplicados innecesarios y la transferencia repetitiva de datos. Para acceder a este beneficio, se requiere una autenticación mediante credenciales OAuth y la configuración de permisos de lectura en los depósitos o buckets correspondientes de la nube.

Mayor capacidad para aplicaciones multimodales
Con la ampliación de la carga directa hasta los 100 MB (codificados en base64, dependiendo del formato), se abre un abanico de posibilidades para el desarrollo de prototipos y herramientas en tiempo real. Esto facilita el uso de imágenes de alta resolución y clips de audio de mayor duración. En este sentido, Google enfatizó que estas modificaciones constituyen un
“un conjunto robusto de herramientas adaptadas a las necesidades específicas de cada proyecto”
.
La implementación de estas características se gestiona a través de las versiones más recientes de los SDKs oficiales de la compañía. Por ejemplo, para trabajar con vínculos firmados de S3, la interfaz permite la vinculación de URLs generadas por servicios compatibles. En el caso de los registros desde GCS, es imperativo realizar la autenticación como un usuario IAM o un servicio debidamente autorizado por la organización.
Una ventaja adicional es que, tras completar el proceso de autenticación, los archivos pueden ser registrados para ser empleados en múltiples consultas futuras sin tener que ser enviados nuevamente a la plataforma. Google recuerda que la documentación oficial incluye guías pormenorizadas sobre la configuración de accesos, los formatos de archivo compatibles y las recomendaciones técnicas de uso.
Finalmente, la plataforma señaló que
“Eliminar estas barreras de entrada de datos ayuda a los desarrolladores a construir y escalar aplicaciones multimodales con menor sobrecarga”
. Las nuevas capacidades de Gemini ya se encuentran operativas y pueden ser testeadas mediante aplicaciones de demostración o consultando el material técnico actualizado de la firma.
Fuente: Infobae