No data was found

IA cuántica: logran entrenar modelo más inteligente en computadora de IBM

Un equipo de investigadores ha alcanzado un hito sin precedentes al entrenar un modelo de inteligencia artificial en una computadora cuántica de IBM. Este logro abre interrogantes fundamentales sobre el futuro de la IA y el rol que la computación cuántica podría desempeñar en su desarrollo.

El experimento demostró que es factible incrementar la capacidad de predicción y respuesta de un modelo de lenguaje avanzado sin necesidad de expandir su tamaño ni su consumo de recursos clásicos.

¿Qué implica entrenar una IA con una computadora cuántica?

Hasta la fecha, los modelos de IA de gran escala —como los que alimentan asistentes de texto o sistemas de chat— se entrenan exclusivamente en infraestructuras basadas en procesadores tradicionales, como CPUs o GPUs.

El proceso consiste en ajustar billones de parámetros para que el modelo aprenda a anticipar la siguiente palabra en una frase, una labor esencial para la comprensión y generación de lenguaje natural.

El estudio reciente, desarrollado por Multiverse Computing y ejecutado en el procesador cuántico IBM Quantum System Two, introduce una innovación: en lugar de expandir el modelo base añadiendo enormes bloques de memoria y potencia clásica, los científicos incorporaron pequeños bloques cuánticos denominados adaptadores unitarios Cayley (CUA).

Estos módulos fueron insertados en una versión del modelo Llama 3.1 8B, que cuenta con 8 mil millones de parámetros y fue creado por Meta.

La diferencia clave con los métodos tradicionales es que la computadora cuántica no sustituye toda la infraestructura, sino que complementa el modelo base con módulos especializados, capaces de mejorar la predicción con una cantidad mínima de parámetros adicionales.

La relevancia de este avance radica en que, por primera vez, se consiguió un “mejoramiento cuántico de punta a punta” en un modelo de lenguaje de escala real, utilizando hardware cuántico comercial.

¿Es más efectivo que un computador tradicional?

El efecto de la integración cuántica se evalúa mediante un parámetro conocido como perplejidad. Esta métrica mide la capacidad del modelo para predecir la siguiente palabra de forma correcta: a menor perplejidad, mejor es la predicción del sistema.

En el experimento, el modelo híbrido logró reducir la perplejidad del Llama 3.1 8B en un 1,4 %, una mejora obtenida con solo 6.000 parámetros adicionales, equivalentes a apenas el 0,000075 % del total del modelo.

Para contextualizar, los grandes modelos de IA suelen aumentar su precisión añadiendo millones de parámetros, lo que implica un consumo mucho mayor de memoria y energía. En este caso, la mejora se alcanza con un incremento casi insignificante en la complejidad del sistema.

Aunque la mejora numérica pueda parecer modesta, el resultado es significativo: el modelo cuántico respondió correctamente preguntas que el modelo clásico no pudo resolver. Por ejemplo, en una prueba sobre astronomía, el modelo original contestó que solo Saturno tiene anillos, mientras que el modelo mejorado identificó correctamente que todos los planetas gigantes poseen anillos.

En otra pregunta de biología sobre genética de poblaciones, el modelo cuántico corrigió la respuesta a favor de la homogeneidad genética, donde el modelo base falló.

Estos resultados demuestran que la integración de componentes cuánticos puede alterar el comportamiento de la IA en la dirección deseada. Esto no implica todavía que las computadoras cuánticas puedan reemplazar a las clásicas en todos los aspectos, pero sí que pueden aportar mejoras puntuales con un costo computacional mucho menor.

¿Qué significa este avance para el futuro de la IA?

El experimento funciona como una prueba de concepto: evidencia que los bloques cuánticos pueden integrarse en modelos reales y generar mejoras medibles, aunque aún no estamos ante una revolución inmediata. La computación cuántica todavía enfrenta desafíos de hardware, como la necesidad de reducir el ruido y aumentar el número de cúbits útiles.

Sin embargo, el estudio abre la puerta a nuevas estrategias para mejorar modelos de IA sin depender únicamente de incrementar el tamaño y el costo de la infraestructura clásica. Si en el futuro se logran desarrollar circuitos cuánticos más robustos y eficientes, es posible que modelos híbridos como el presentado puedan superar los límites actuales y alcanzar una “ventaja cuántica”, es decir, resolver tareas imposibles para cualquier computador tradicional.

De momento, la lección más importante es estratégica: las empresas y startups que trabajan en IA deben prestar atención a la evolución de la computación cuántica, integrándola como una posibilidad para mejorar modelos sin multiplicar recursos. Por ahora, los procesadores clásicos siguen dominando, pero la frontera tecnológica comienza a desplazarse.

Fuente: Infobae

IA cuántica: logran entrenar modelo más inteligente en computadora de IBM

¿Qué implica entrenar una IA con una computadora cuántica?

¿Es más efectivo que un computador tradicional?

¿Qué significa este avance para el futuro de la IA?

COMPARTIR ESTA NOTICIA

FACEBOOK

TWITTER

Suscríbase a nuestra lista de lectores

MISIÓN Y VISIÓN KCH RADIO

DIRECCIÓN

EMAIL

TELEFONO

CELULAR

SIGUENOS EN REDES

DESCARGA LA APP

Copyright © 2023 Kch Comunicación