El panorama de los agentes de inteligencia artificial de propósito general se ha vuelto mucho más competitivo y ambicioso. Esta semana, la startup Genspark, con sede en Palo Alto, presentó su innovador sistema llamado Super Agent, un agente autónomo que puede encargarse de tareas reales en una amplia variedad de dominios, desde planificar viajes hasta realizar llamadas telefónicas a restaurantes utilizando una voz sintética sorprendentemente realista.
¿Qué hace especial a Super Agent?
El lanzamiento de Genspark representa un paso importante en la carrera por construir el primer agente confiable, flexible y realmente útil para múltiples propósitos. Super Agent no se limita a responder preguntas como los chatbots tradicionales, sino que ejecuta tareas complejas de principio a fin, combinando herramientas, datos y razonamiento lógico en un flujo automatizado.
Según su cofundador, Eric Jing, este agente se sustenta en tres pilares: una combinación de nueve modelos de lenguaje (LLMs), más de 80 herramientas externas y una decena de conjuntos de datos propietarios, todo coordinado para resolver tareas con autonomía.
Demostraciones impactantes
En sus demostraciones públicas, Super Agent ha demostrado capacidades que van desde:
- Planificar un viaje de cinco días a San Diego, calculando distancias a pie, opciones de transporte público y realizando reservas telefónicas teniendo en cuenta alergias alimentarias y preferencias de asiento.
- Crear un video de cocina, generando los pasos de la receta, escenas de video y superposiciones de audio.
- Producir un episodio animado al estilo South Park, basado en un escándalo político ficticio.
Aunque estas demostraciones parecen orientadas al consumidor, en realidad muestran el futuro de la automatización de tareas: procesos multimodales, en múltiples pasos, que integran creatividad y ejecución.
Transparencia y facilidad de uso
Una característica destacable es la visualización del razonamiento del agente, mostrando en tiempo real qué herramientas utiliza, por qué las elige y cómo decide cada paso. Esta trazabilidad no solo genera confianza, sino que podría servir de inspiración para que los desarrolladores empresariales implementen caminos de razonamiento similares en sus sistemas.
Además, Super Agent es fácil de probar: funciona directamente desde el navegador, sin necesidad de configuraciones técnicas ni credenciales personales. Esto lo diferencia de competidores como Manus, otra startup destacada que requiere una lista de espera y datos personales para acceder.
¿Cómo lo logra Genspark?
La clave del éxito de Genspark parece estar en su capacidad de orquestar herramientas a gran escala, superando uno de los desafíos más antiguos de la ingeniería en IA. Mientras que muchos agentes se complican al manejar múltiples APIs o servicios, Super Agent utiliza estrategias como el enrutamiento de modelos y la selección basada en recuperación de información para elegir herramientas de forma dinámica.
Esto se alinea con nuevas investigaciones como CoTools, un marco desarrollado por la Universidad de Soochow, que permite a los modelos utilizar herramientas externas sin necesidad de reajustar todo el modelo base.
Otro habilitador clave es el Model Context Protocol (MCP), un estándar poco conocido pero cada vez más adoptado que permite a los agentes llevar contexto de herramientas y memoria entre pasos. Combinado con los datos propietarios de Genspark, MCP podría explicar por qué este agente parece más flexible y adaptable que otros.
Genspark vs. Manus
La startup Manus, fundada en China, también atrajo la atención por su sistema multi-agente capaz de ejecutar tareas como edición de código, navegación web o análisis de hojas de cálculo sin supervisión directa. Aunque Manus usó herramientas y modelos open-source, logró superar a OpenAI en el benchmark GAIA (una prueba para medir automatización de tareas reales), con una puntuación de 86%.
Sin embargo, Genspark afirma haber ido más allá, obteniendo un 87.8% en GAIA, gracias a su arquitectura híbrida con componentes propietarios y una mayor cobertura de herramientas.
¿Y las grandes tecnológicas?
Por su parte, gigantes como Microsoft, Amazon y OpenAI siguen adoptando un enfoque más cauteloso. Microsoft con su Copilot Studio se enfoca en agentes verticales para Excel u Outlook; OpenAI ofrece un SDK de agentes sin lanzar un producto terminado; y Amazon acaba de anunciar Nova Act, más orientado al desarrollo modular.
Estas soluciones son más seguras y modulares, pero no muestran la ambición –ni la autonomía– que Genspark está demostrando.
¿Por qué debería importar a las empresas?
Si bien una empresa no necesita un agente que reserve restaurantes o cree dibujos animados, sí podría beneficiarse de un sistema que automatice tareas complejas como:
- Recopilar y dar formato a información de cumplimiento normativo.
- Orquestar procesos de incorporación de clientes.
- Generar contenido en distintos formatos de manera autónoma.
Super Agent demuestra que los agentes generalistas pueden empezar a competir con plataformas SaaS y sistemas RPA tradicionales, ofreciendo mayor flexibilidad y menor infraestructura.
La era de los agentes de inteligencia artificial de propósito general ya no es teórica: está aquí y avanza con rapidez. Genspark ha lanzado un poderoso contendiente que podría redefinir la forma en que interactuamos con la tecnología, automatizando no solo respuestas, sino también acciones reales.
Para empresas, desarrolladores y usuarios, este avance marca un punto de inflexión: ¿estamos preparados para colaborar con agentes autónomos que piensan, deciden y actúan como verdaderos asistentes digitales?