Vengo probando NANO BANANA desde hace 2 semanas y se notaba que algo grande estaba por llegar. La sensación fue directa: hay algo distinto. Sin exagerar: me pareció alucinante desde el primer minuto.
Hoy ya está claro: Nano Banana es el nuevo modelo de edición y generación de imágenes de Google, presentado oficialmente como Gemini 2.5 Flash Image e integrado en la app de Gemini con edición nativa mejorada
Este modelo marca un antes y un después en la edición con IA. Preserva la identidad de personas y mascotas, permite encadenar ediciones sin romper la escena y está disponible para usuarios (app de Gemini) y desarrolladores (Google AI Studio / Gemini API / Vertex AI).
¿Qué es Gemini 2.5 Flash Image (Nano Banana)?
“Nano Banana” fue el nombre coloquial que la comunidad usó durante las pruebas en LM Arena por su calidad y consistencia. Google lo integra ahora como Gemini 2.5 Flash Image dentro del ecosistema Gemini. En la práctica, edita por texto e imagen, mantiene los rasgos del sujeto y entiende el contexto para no “romper” la foto en cada iteración.
Capacidades clave
-
Generación de imágenes (texto → imagen)
Escribes una descripción clara y el modelo la crea con alta coherencia visual. -
Fusión de múltiples imágenes (multi-image fusion)
Combina hasta tres imágenes de referencia (persona, entorno, objeto) para una composición nueva y consistente.
Funciones de edición conversacional
-
Edición precisa con lenguaje natural
Cambia fondo, ropa, color, objetos o pequeños detalles con instrucciones sencillas (“quita a la persona del fondo”, “cambia la camisa a rojo”, “cielo de atardecer”, “añade gafas al perro”). -
Edición en múltiples pasos (multi-turn)
Recuerda el contexto. Puedes encadenar cambios sobre el resultado anterior (colores, mobiliario, encuadre, etc.) sin perder lo ya logrado.
Consistencia y coherencia
-
Consistencia de personajes y objetos
Mantiene identidad visual (rostro, rasgos, mascota, producto) a lo largo de múltiples escenas. -
Consistencia de estilo
Aplica y conserva un look (p. ej., cyberpunk, fotografía setentera, lápiz) de forma uniforme en una serie. -
Adherencia a plantillas (template adherence)
Sigue un diseño base para producir activos homogéneos (tarjetas, insignias, listados de catálogo, mockups de producto).
Comprensión y razonamiento
-
Razonamiento visual
Interpreta bocetos/diagramas, restaura fotos antiguas con lógica de escena y sigue instrucciones complejas con “sentido común” visual.
Seguridad y transparencia
-
Marca de agua (SynthID) + sello visible
Todas las salidas incluyen marca de agua invisible (SynthID) y marca visible, favoreciendo un uso responsable.
En resumen, Gemini 2.5 Flash Image va mucho más allá de la simple generación de imágenes, posicionándose como una potente herramienta de co-creación y edición visual que entiende el contexto, mantiene la coherencia y permite un control creativo sin precedentes a través del lenguaje natural.
¿Dónde y cómo usarlo?
App de Gemini (edición nativa).
Sube una foto e indica los cambios (vestuario, fondo, estilo). El modelo mantiene el parecido del sujeto entre ediciones.
Google AI Studio / Gemini API / Vertex AI.
Ideal para automatizar flujos, procesar lotes o integrar la edición en tus aplicaciones. El modelo aparece como Gemini 2.5 Flash Image.
LMArena
Aun sigues disponiendo de la web que dio a conocer al nuevo Gemini bajo el seudónimo de NANO BANANA sin ningún coste, ni registros previos.
Pasos rápidos en la app de Gemini
-
Abre Gemini → “Editar imagen”.
-
Sube tu foto base.
-
Escribe un prompt claro: “cambia la chaqueta a cuero negro; fondo de calle nocturna; mantén el rostro y la pose”.
-
Ajusta con ediciones encadenadas: añade objetos, varía encuadre, color o tipografía.
Tip. Si debes integrar texto (carteles, portadas), sé literal: contenido exacto, tipografía aproximada (sans/serif), color y ubicación (“superior centrado”, “inferior derecha”).
Buenas prácticas para resultados pro
-
Sé específico y breve: 2–4 frases claras mejor que un párrafo ambiguo.
-
Protege la identidad con instrucciones explícitas: “misma persona, peinado y maquillaje”.
-
Itera en ramas: guarda una versión estable y bifurca (color A/B, fondo A/B).
-
Pulido final en un editor clásico si el caso lo exige: borde, microcontraste y detalle fino.
¿Quieres profundizar en el diseño de prompts? Pasa por esta guía: Prompts para IA.
Gemini 2.5 Flash Image convierte la edición con IA en un proceso rápido y coherente. Acelera, no reemplaza. Trátalo como a un buen asistente de estudio: lo que pidas, sin perder la identidad del sujeto. Pruébalo en tu próxima portada de producto y cuéntame qué tal los resultados.