Google lanza Gemma 3: La nueva generación de modelos de IA generativa

Google presentó Gemma 3, la nueva generación de su familia de modelos abiertos, un día después de que OpenAI lanzara una serie de herramientas para la creación de aplicaciones de IA agentica. Esta competencia constante entre los gigantes de la IA generativa refleja la rápida evolución de la tecnología y el esfuerzo por mantenerse a la vanguardia.

Mayor eficiencia y accesibilidad

Gemma 3 representa un avance significativo en la mejora de los modelos de IA generativa, haciéndolos más accesibles y viables económicamente para empresas y desarrolladores. Según Google, los nuevos modelos pueden ejecutarse en una sola GPU o TPU, lo que reduce considerablemente los costos operativos.

“La reducción masiva en los requisitos de recursos es probablemente el componente más interesante de esto”, afirmó William McKeon-White, analista de Forrester Research.

Modelos ligeros y adaptables

Los modelos Gemma 3 han sido diseñados para ser portátiles y eficientes, pudiendo ejecutarse en dispositivos como teléfonos, computadoras portátiles y estaciones de trabajo. Están disponibles en diferentes tamaños de parámetros: 1, 4, 12 y 27 mil millones.

Google asegura que sus modelos han superado a alternativas como Meta’s Llama 3.1 405B, DeepSeek-V3 y OpenAI o3-mini en diversas evaluaciones humanas. Además, son multilingües, con soporte integrado para más de 35 idiomas y preentrenamiento en 140 idiomas.

Aplicaciones y beneficios empresariales

Los desarrolladores pueden utilizar Gemma 3 para crear aplicaciones que analicen texto y videos cortos. Además, admiten llamadas a funciones y salida estructurada, lo que facilita la automatización de tareas y la creación de aplicaciones agenticas.

Los modelos pueden descargarse y personalizarse desde plataformas como Hugging Face, Ollama y Kaggle. También están disponibles en Google AI Studio y Vertex AI.

McKeon-White enfatiza que esta accesibilidad permite a las empresas evitar la compra o alquiler de costosos GPUs, facilitando la adopción de IA generativa en diferentes sectores.

“Esto simplifica enormemente el inicio y reduce el costo continuo de operación”, agregó el analista.

Adaptabilidad para diferentes escenarios

Bradley Shimmin, analista de Futurum Group, destaca que la apertura y adaptabilidad de Gemma 3 son una de sus principales ventajas.

“Son extremadamente adaptables, no solo en lo que han sido entrenados para hacer, sino también en dónde pueden ejecutarse”, explicó Shimmin. Además, señaló que ha logrado ejecutar el modelo en su laptop con procesador AMD con un rendimiento ágil.

Sin embargo, Shimmin advierte que estos modelos no reemplazan a los modelos de razonamiento en tiempo de prueba como DeepSeek-R1, que priorizan el razonamiento durante la inferencia en lugar de depender solo de datos preentrenados.

“Cada innovación no es necesariamente la próxima fase de la IA, sino una refinación de cada tecnología”, afirmó.

Desafíos y futuro de la IA generativa

A pesar de sus ventajas, Google enfrenta retos similares a otros proveedores de IA. Muchas empresas aún no están listas para adoptar completamente estos sistemas.

“Este es el mayor obstáculo para el éxito de estos modelos. Se pueden lograr cambios empresariales notables con ellos, pero es difícil implementarlos correctamente”, señaló McKeon-White.

Otro desafío para Google es la necesidad de una arquitectura unificada que facilite la integración de sus proyectos de IA para clientes empresariales.

“Google tiene muchos proyectos que se superponen y podrían beneficiarse de una integración más estrecha”, comentó Shimmin.

Otras innovaciones de Google en IA

Junto con Gemma 3, Google también presentó ShieldGemma 2, un modelo de 4 mil millones de parámetros diseñado para la seguridad de imágenes. Este modelo proporciona filtros de seguridad en tres categorías: contenido peligroso, contenido sexualmente explícito y violencia.

Además, Google DeepMind lanzó dos nuevos modelos de IA basados en Gemini 2.0: Gemini Robotics y Gemini Robotics-ER.

  • Gemini Robotics es un modelo avanzado de visión-lenguaje-acción capaz de realizar tareas complejas, como empacar un snack en una bolsa con cierre hermético o doblar origami.
  • Gemini Robotics-ER permite la creación de nuevas capacidades en tiempo real, manejando percepción, estimación de estado, comprensión espacial, planificación y generación de código para el control de robots.

Con estos avances, Google refuerza su posición en la competencia por liderar el desarrollo de modelos de IA generativa, promoviendo soluciones más accesibles y eficientes para empresas y desarrolladores en todo el mundo.