Gemini 2.5 Flash Image (Nano Banana): edición con identidad

Vengo probando NANO BANANA desde hace 2 semanas y se notaba que algo grande estaba por llegar. La sensación fue...

agosto 27, 2025

Escrito por

Picture of Lordwind E. Aguilar Ramírez
Lordwind E. Aguilar Ramírez
Fundador de Arca Artificial | Diseñador Visual Profesional

Compartir

Tabla de contenido

⏱️ Tiempo de lectura: 3 minutos

Vengo probando NANO BANANA desde hace 2 semanas y se notaba que algo grande estaba por llegar. La sensación fue directa: hay algo distinto. Sin exagerar: me pareció alucinante desde el primer minuto.

Hoy ya está claro: Nano Banana es el nuevo modelo de edición y generación de imágenes de Google, presentado oficialmente como Gemini 2.5 Flash Image e integrado en la app de Gemini con edición nativa mejorada

Este modelo marca un antes y un después en la edición con IA. Preserva la identidad de personas y mascotas, permite encadenar ediciones sin romper la escena y está disponible para usuarios (app de Gemini) y desarrolladores (Google AI Studio / Gemini API / Vertex AI).

¿Qué es Gemini 2.5 Flash Image (Nano Banana)?

Nano Banana” fue el nombre coloquial que la comunidad usó durante las pruebas en LM Arena por su calidad y consistencia. Google lo integra ahora como Gemini 2.5 Flash Image dentro del ecosistema Gemini. En la práctica, edita por texto e imagen, mantiene los rasgos del sujeto y entiende el contexto para no “romper” la foto en cada iteración.

Capacidades clave

  1. Generación de imágenes (texto → imagen)
    Escribes una descripción clara y el modelo la crea con alta coherencia visual.

  2. Fusión de múltiples imágenes (multi-image fusion)
    Combina hasta tres imágenes de referencia (persona, entorno, objeto) para una composición nueva y consistente.

Funciones de edición conversacional

  1. Edición precisa con lenguaje natural
    Cambia fondo, ropa, color, objetos o pequeños detalles con instrucciones sencillas (“quita a la persona del fondo”, “cambia la camisa a rojo”, “cielo de atardecer”, “añade gafas al perro”).

  2. Edición en múltiples pasos (multi-turn)
    Recuerda el contexto. Puedes encadenar cambios sobre el resultado anterior (colores, mobiliario, encuadre, etc.) sin perder lo ya logrado.

Consistencia y coherencia

  1. Consistencia de personajes y objetos
    Mantiene identidad visual (rostro, rasgos, mascota, producto) a lo largo de múltiples escenas.

  2. Consistencia de estilo
    Aplica y conserva un look (p. ej., cyberpunk, fotografía setentera, lápiz) de forma uniforme en una serie.

  3. Adherencia a plantillas (template adherence)
    Sigue un diseño base para producir activos homogéneos (tarjetas, insignias, listados de catálogo, mockups de producto).

Comprensión y razonamiento

  1. Razonamiento visual
    Interpreta bocetos/diagramas, restaura fotos antiguas con lógica de escena y sigue instrucciones complejas con “sentido común” visual.

Seguridad y transparencia

  1. Marca de agua (SynthID) + sello visible
    Todas las salidas incluyen marca de agua invisible (SynthID) y marca visible, favoreciendo un uso responsable.

En resumen, Gemini 2.5 Flash Image va mucho más allá de la simple generación de imágenes, posicionándose como una potente herramienta de co-creación y edición visual que entiende el contexto, mantiene la coherencia y permite un control creativo sin precedentes a través del lenguaje natural.

¿Dónde y cómo usarlo?

App de Gemini (edición nativa).
Sube una foto e indica los cambios (vestuario, fondo, estilo). El modelo mantiene el parecido del sujeto entre ediciones.

Google AI Studio / Gemini API / Vertex AI.
Ideal para automatizar flujos, procesar lotes o integrar la edición en tus aplicaciones. El modelo aparece como Gemini 2.5 Flash Image.

LMArena
Aun sigues disponiendo de la web que dio a conocer al nuevo Gemini bajo el seudónimo de NANO BANANA sin ningún coste, ni registros previos.

Pasos rápidos en la app de Gemini

  1. Abre Gemini → “Editar imagen”.

  2. Sube tu foto base.

  3. Escribe un prompt claro: “cambia la chaqueta a cuero negro; fondo de calle nocturna; mantén el rostro y la pose”.

  4. Ajusta con ediciones encadenadas: añade objetos, varía encuadre, color o tipografía.

Tip. Si debes integrar texto (carteles, portadas), sé literal: contenido exacto, tipografía aproximada (sans/serif), color y ubicación (“superior centrado”, “inferior derecha”).

Buenas prácticas para resultados pro

  • Sé específico y breve: 2–4 frases claras mejor que un párrafo ambiguo.

  • Protege la identidad con instrucciones explícitas: “misma persona, peinado y maquillaje”.

  • Itera en ramas: guarda una versión estable y bifurca (color A/B, fondo A/B).

  • Pulido final en un editor clásico si el caso lo exige: borde, microcontraste y detalle fino.

¿Quieres profundizar en el diseño de prompts? Pasa por esta guía: Prompts para IA.

Gemini 2.5 Flash Image convierte la edición con IA en un proceso rápido y coherente. Acelera, no reemplaza. Trátalo como a un buen asistente de estudio: lo que pidas, sin perder la identidad del sujeto. Pruébalo en tu próxima portada de producto y cuéntame qué tal los resultados.

 

prueba

¿Quieres la guía de referencia de este tutorial?

Artículos relacionados

Arca Artificial