No data was found

OpenAI revoluciona la comunicación con tres modelos de voz en tiempo real

La empresa OpenAI ha dado a conocer tres innovadores modelos de voz que operan en tiempo real, procesando información al mismo tiempo que el usuario se expresa. El objetivo es acelerar la ejecución de tareas, facilitar la traducción de diálogos y discursos, y ofrecer transcripciones instantáneas.

Bajo la denominación GPT-Realtime, estos sistemas están pensados para que los desarrolladores puedan construir nuevas aplicaciones de voz que brinden experiencias auditivas inmediatas, en lugar de limitarse a responder tras una petición. Para la compañía, esto representa un avance significativo en la interacción con agentes artificiales, los cuales deben comprender el contexto de la conversación en cada momento para adaptarse a cambios o imprevistos. Así lo detalla la empresa en un comunicado oficial.

Modelos especializados para distintas necesidades

El primero de ellos es GPT-Realtime-2, que ofrece una capacidad de razonamiento comparable a la de GPT-5. Está diseñado para gestionar solicitudes complejas —como analizar un pedido, invocar herramientas o manejar correcciones e interrupciones— mientras mantiene un diálogo natural.

Le sigue GPT-Realtime-Translate, un modelo enfocado en la traducción simultánea. Este sistema es capaz de convertir el habla desde más de 70 idiomas de entrada hacia 13 idiomas de salida, siguiendo el ritmo del usuario. OpenAI lo ha creado para desarrollar experiencias de voz multilingües en vivo, aplicables a sectores como:

  • Atención al cliente
  • Educación
  • Eventos
  • Medios de comunicación

El tercer modelo, GPT-Realtime-Whisper, es un sistema de conversión de voz a texto con baja latencia. Su función es transcribir el discurso en el mismo momento en que el usuario habla.

«Los modelos que estamos lanzando transforman el audio en tiempo real, pasando de un simple sistema de llamada y respuesta a interfaces de voz que realmente pueden realizar tareas: escuchar, razonar, traducir, transcribir y actuar a medida que se desarrolla una conversación», afirmó la compañía.

Fuente: Infobae

COMPARTIR ESTA NOTICIA

Facebook
Twitter

FACEBOOK

TWITTER