Amazon reveló Nova Act, un agente de inteligencia artificial de propósito general capaz de controlar un navegador web y realizar de forma independiente algunas tareas simples. Junto con este innovador modelo, Amazon también lanzó el Nova Act SDK, un kit de herramientas diseñado para que los desarrolladores puedan crear prototipos de agentes utilizando esta tecnología.
¿Qué es Nova Act?
Desarrollado por el recientemente inaugurado laboratorio de AGI (Inteligencia Artificial General) de Amazon en San Francisco, Nova Act es la apuesta de la compañía por competir con soluciones similares como Operator de OpenAI y Computer Use de Anthropic. Aunque Amazon no fue la primera en desarrollar esta tecnología de agentes inteligentes, su integración con Alexa+, la próxima gran actualización de su asistente de voz potenciando con IA generativa, podría darle una ventaja significativa en cuanto a alcance y uso.
Actualmente, Nova Act se lanza como una vista previa de investigación, es decir, una versión menos refinada destinada principalmente a desarrolladores y entusiastas de la IA. Quienes deseen probarlo o experimentar con él pueden acceder al SDK a través del sitio nova.amazon.com, donde también se muestran otros modelos fundacionales de la familia Nova.
¿Qué puede hacer Nova Act?
El objetivo de Nova Act es automatizar acciones básicas en nombre del usuario. Por ejemplo, el agente puede:
- Hacer pedidos de comida en sitios como Sweetgreen
- Reservar una cena en línea
- Navegar por páginas web
- Rellenar formularios
- Seleccionar fechas en calendarios
Todo esto gracias a un conjunto de herramientas incluidas en el SDK, que permite a los desarrolladores definir flujos de trabajo y puntos de intervención humana cuando sea necesario.
¿Qué tan bueno es frente a la competencia?
Amazon afirma que Nova Act supera a los agentes de OpenAI y Anthropic en varias pruebas internas. En la evaluación ScreenSpot Web Text, que mide cómo interactúa un agente con el texto en pantalla, Nova Act obtuvo un 94%, frente al 88% de CUA de OpenAI y el 90% de Claude 3.7 Sonnet de Anthropic.
Sin embargo, es importante señalar que Amazon no ha sometido a Nova Act a evaluaciones más estandarizadas como WebVoyager, utilizadas ampliamente en la comunidad investigadora para medir la eficacia de los agentes.
Detrás de Nova Act: un equipo con experiencia
El desarrollo de Nova Act es el primer gran producto del nuevo laboratorio de AGI de Amazon, liderado por dos ex investigadores de OpenAI: David Luan y Pieter Abbeel. Ambos tienen experiencia previa fundando startups en el ámbito de la inteligencia artificial: Luan fundó Adept y Abbeel cofundó Covariant. Su visión para Nova Act se alinea con una definición ambiciosa de AGI: “un sistema de IA que pueda ayudarte a hacer cualquier cosa que un humano hace en una computadora”.
¿Un paso hacia la superinteligencia?
Aunque pueda parecer trivial que un laboratorio de AGI desarrolle un agente que simplemente ordene ensaladas, para Luan esto es solo el inicio de un camino hacia sistemas más complejos e inteligentes. Según explicó a TechCrunch, estos agentes son pasos fundamentales para construir una IA verdaderamente útil y confiable, capaz de realizar tareas de forma autónoma pero con margen para intervención humana cuando sea necesario.
¿El futuro de Alexa?
Nova Act también representa una apuesta clave para Amazon en el desarrollo de la próxima generación de asistentes virtuales. Alexa+, que estará potenciada por la tecnología de Nova Act, podría marcar un antes y un después para la compañía en su competencia con otros gigantes tecnológicos.
En un entorno donde las soluciones de OpenAI, Google y Anthropic aún enfrentan desafíos como lentitud, errores frecuentes y poca autonomía sostenida, Nova Act tiene la oportunidad de demostrar si Amazon realmente ha encontrado la fórmula ganadora.