Google lanza Diffusion Gemma: la IA que genera texto como si 'dibujara' palabras y supera la velocidad de ChatGPT
Google volvió a mover el tablero de la inteligencia artificial con la presentación de DiffusionGemma, un modelo que propone una forma completamente distinta de generar texto. En lugar del método tradicional que va construyendo una frase de manera secuencial, palabra por palabra, esta nueva tecnología apuesta por una lógica más parecida a 'dibujar' el contenido completo y después irlo refinando hasta que toma forma final.
La idea puede sonar abstracta, pero representa un cambio importante en cómo se entiende la generación de lenguaje en los modelos actuales. Y también abre la puerta a una nueva etapa donde la velocidad deja de ser un simple mejora técnica para convertirse en un factor que redefine la experiencia de uso.
¿Qué es exactamente DiffusionGemma?
DiffusionGemma forma parte de la familia Gemma, los modelos de inteligencia artificial de código abierto desarrollados por Google DeepMind. Estos modelos comparten base tecnológica con Gemini, pero se diferencian por su enfoque ligero, flexible y pensado para ejecutarse de forma local.
La familia Gemma fue diseñada con una idea clara: hacer que la inteligencia artificial sea más accesible y eficiente, sin depender necesariamente de servidores externos. Por eso, estos modelos pueden funcionar directamente en dispositivos como laptops, teléfonos o computadoras personales, lo que reduce la necesidad de conexión constante a internet y abre posibilidades interesantes en términos de privacidad y autonomía.
Dentro de este ecosistema aparece DiffusionGemma como una especie de experimento avanzado que no solo busca responder preguntas, sino replantear el proceso mismo de generación del texto.
¿Qué significa que el texto se 'dibuje' en lugar de escribirse?
La diferencia clave está en el método. Los modelos tradicionales de lenguaje, como ChatGPT y otros sistemas autorregresivos, construyen las respuestas de forma lineal. Es decir, predicen una palabra, luego la siguiente, y así sucesivamente hasta completar la idea.
DiffusionGemma rompe con ese patrón. En lugar de avanzar paso a paso, trabaja con una lógica de difusión, similar a la que se utiliza en modelos de generación de imágenes como Midjourney. En este caso, el sistema parte de una estructura más global y va ajustando el contenido completo de manera progresiva hasta llegar a una versión coherente.
Dicho de otra forma, no escribe como una persona tecleando, sino que 'imagina' la respuesta completa y luego la va afinando hasta que el resultado tiene sentido.
¿Por qué este enfoque puede ser más rápido?
El cambio de metodología tiene un impacto directo en la velocidad. Según información publicada por Google, DiffusionGemma puede alcanzar una eficiencia de inferencia hasta cuatro veces mayor en comparación con versiones previas de Gemma basadas en generación secuencial.
En entornos de alto rendimiento, como una GPU NVIDIA H100, el modelo ha llegado a superar los 1.000 tokens por segundo, una cifra que lo coloca aproximadamente diez veces por
