8 Minuty
NanoBanana, generativní AI pro tvorbu a editaci obrázků postavená na technologii Gemini, se rozšiřuje mimo samostatnou aplikaci Gemini a dorazila přímo do Google Search a Google Lens. Uživatelé nyní mohou vytvářet, upravovat a stahovat obrázky přímo z vyhledávacího řádku nebo z prostředí fotoaparátu v Lens — bez potřeby spouštět jinou aplikaci. Tato integrace znamená jednodušší tok práce pro tvůrce obsahu, marketéry i běžné uživatele, kteří hledají rychlé generativní řešení v rámci vyhledávání a vizuálních nástrojů Google. Implementace kombinuje výhody generování obrázků (image generation) a lokální editace (image editing) s ergonomií Google Search a rozhraním Google Lens, což zvyšuje dostupnost funkcí generativní AI a zjednodušuje vytváření vizuálního obsahu.
Jak se NanoBanana zobrazuje v AI režimu Google Search
V AI režimu na Google Search se u textového pole v levém dolním rohu objevuje nový symbol plus (+), zatímco hlasové vyhledávání a Lens se přesouvají doprava. Tento nenápadný designový posun otevírá rychlý přístup k nástrojům pro tvorbu a editaci obrázků, aniž by uživatel musel opustit stránku výsledků. Z pohledu uživatelské zkušenosti (UX) jde o důležitý krok: integrace přímo do rozhraní vyhledávače snižuje tření mezi vyhledáním nápadu a jeho vizuální realizací, podporuje experimentování s generativní AI a zvyšuje produktivitu při práci se snímky.
- Nové menu nabízí přímé odkazy na galerii, fotoaparát a volbu Vytvořit označenou emoji banánu, což usnadňuje orientaci a rychlou akci.
- Po zvolení možnosti Vytvořit se zástupný text v poli změní na "Popište svůj obrázek", takže můžete zadat textový pokyn nebo nahrát fotografii pro editaci; tento přístup kombinuje textovou a obrazovou vstupní modalitu pro přesné řízení výstupu.
- Vygenerované obrázky mají stejné chování jako v aplikaci Gemini: jsou ke stažení, sdílení a jsou opatřeny vodoznakem s označením Gemini v rohu, což usnadňuje identifikaci AI-vytvořeného obsahu a plní požadavky na transparentnost.
![]() | ![]() | ![]() |
Z praktického hlediska to znamená, že uživatelé, kteří napsali dotaz nebo prohlížejí výsledky, mohou okamžitě přejít k vizuální tvorbě. Pro SEO a obsahové strategie to otevírá nové možnosti: editované nebo vygenerované obrázky lze rychle publikovat, sdílet na sociálních sítích nebo použít jako vizuální doplněk k textovému obsahu, přičemž Google zachovává informaci o AI původu pomocí vodoznaku.
Vytvářejte a upravujte přímo v Google Lens
Google Lens dostává novou kartu Vytvořit, kde je NanoBanana nativně integrována. Redesign umístil textové popisky pod ikonami, což umožňuje zobrazit více filtrů najednou a zrychlit výběr. Tlačítko závěrky nyní doprovází emoji banánu — vizuální indikátor, který dává jasně najevo funkci tvorby a upravování obrázků. Tento krok usnadňuje přístup k generativním funkcím pro uživatele, kteří pracují s fotoaparátem mobilního zařízení.
Ve výchozím nastavení filtr používá selfie kameru (na pravé straně lze přepnout mezi objektivy). Po pořízení snímku se fotografie přesune do vstupního pole AI režimu, kde můžete přidat textový prompt a zadat NanoBanana, aby obrázek vygenerovala nebo upravila podle vašich instrukcí. Takový pracovní tok zkracuje dobu mezi nápadem a výsledkem: objeví se možnost odstranit objekty, změnit pozadí, aplikovat stylizaci, nebo zcela vygenerovat nový snímek na základě popisu. Google tímto způsobem kombinuje praktické rozpoznávání objektů v Lens s generativními technikami, čímž se posouvá hranice běžných foto-nástrojů směrem k plnohodnotné vizuální tvorbě.
Pro uživatele znamená tento přístup snížení počtu aplikací v pracovním toku — stačí Search nebo Lens. To má dopad i na kreativní průmysl: fotografové, influenceři a kreativní týmy mohou rychle prototypovat vizuální nápady, přizpůsobit snímky pro sociální sítě či marketingové kampaně a experimentovat s různými styly bez nutnosti složitého postprocesu. Důležité je také to, že NanoBanana v Lens podporuje kombinaci textového promptu a obrazového vstupu, což rozšiřuje řízení výsledku a zvyšuje přesnost generovaných obrázků.
Pod kapotou: Gemini 2.5 Flash Image
Model, který pohání NanoBanana v Google, nese označení Gemini 2.5 Flash Image. Tento model je navržen pro podporu jak generování nových obrázků, tak editace existujících snímků přímo uvnitř Search a Lens. Gemini 2.5 Flash Image kombinuje multimodální architektury a optimalizace pro nízkou latenci, což umožňuje rychlé reakce uživatelského rozhraní při tvorbě a úpravách obrázků. Výstupy umožňují stažení i sdílení a zachovávají vodoznak Gemini, který napomáhá identifikaci obsahu vytvořeného umělou inteligencí.
Technicky lze Gemini 2.5 Flash Image popsat jako vývojový stupeň modelů Gemini zaměřený na obrazovou generaci a editaci s důrazem na rychlost a kvalitu. Model je optimalizovaný pro cloudové i hybridní provedení, kde část výpočtů probíhá na serverech a část je akcelerována na zařízení podle dostupnosti výpočetních prostředků. Díky tomu je možné dosahovat vyváženého poměru mezi kvalitou renderu, dobou odezvy a nároky na infrastrukturu. Model zahrnuje mechanismy pro udržení konzistence stylu, respekt k zadaným omezením (např. odstranění osobních údajů nebo explicitního obsahu) a schopnost provádět lokální úpravy (retuš, změna světla, přidání prvků) i rozsáhlé generace nových vizuálů.
Gemini 2.5 Flash Image také zahrnuje integrační vrstvy pro zachování metadat a sledovatelnosti tvorby obrázků — důležité pro auditovatelnost, soulad s pravidly platformy a transparentnost vůči uživatelům. Watermarking (vodoznak Gemini) slouží jako jednoduchý, ale účinný prostředek k označení AI-vytvořeného obsahu, což je v současném prostředí regulací a veřejné diskuze o umělé inteligenci klíčové. Pro vývojáře a firmy to znamená, že výsledné assety lze vkládat do pracovních procesů s jasným odlišením původu obrazu, čímž se zlepšuje důvěra a snižuje riziko nejasností při publikaci obsahu.
![]() | ![]() | ![]() |
Pro odborníky na AI a technické týmy jsou důležité metriky jako přesnost vykreslení, kontrola nad promptem, konzistence mezi zobrazeními a čas odezvy. Gemini 2.5 Flash Image byl podle dostupných informací navržen s ohledem na těmito požadavky a poskytuje nástroje pro jemnou kontrolu výsledků pomocí parametrů promptu a kombinace vstupních obrazů. To může zahrnovat i možnosti pro profesionální úpravy, jako jsou retuše obličejů, úprava barvy, změna hloubky ostrosti, nebo tvorba variací stávající kompozice.
Kdo si to může vyzkoušet nyní?
Funkce se dnes zavádí v USA pro uživatele Androidu, kteří jsou zapsaní do programu Search Lab a mají povolený AI režim. Pokud jste součástí této testovací skupiny, můžete očekávat, že se možnosti NanoBanana brzy objeví jak v Search, tak v Lens. Postupné rozšiřování do dalších regionů a na další platformy je pravděpodobné v závislosti na výsledcích testů, výkonu modelu a reakci uživatelů, což je běžný postup při zavádění nových funkcí z hlediska produktového řízení Google.
Představte si, že pořídíte fotografii, rychle napíšete stručný prompt a obratem získáte upravený nebo nově vygenerovaný obrázek, aniž byste museli přepínat mezi aplikacemi — NanoBanana si klade za cíl tento tok práce zjednodušit a zpřístupnit generativní vizuály do centra vyhledávání a nástrojů pro práci s fotoaparátem. Pro tvůrce obsahu to znamená snadnou prototypizaci nápadů, pro marketéry rychlé iterace vizuálních kampaní a pro běžné uživatele intuitivní způsob, jak upravit nebo vylepšit své snímky pomocí generativní AI.
Dále je důležité zmínit oblasti, které mohou mít dopad na přijetí této technologie: ochrana soukromí a bezpečnost (např. jak jsou zpracovávány nahrané obrázky), autorská práva (kdo vlastní AI-vytvořený obsah), a transparentnost (značení AI obsahu). Google zatím kombinuje technická řešení, jako je vodoznak, s politikami používání a možnostmi kontrol pro uživatele, aby minimalizoval rizika a podpořil zodpovědné používání generativní AI.
Chcete-li experimentovat s tvorbou obrázků přímo na místě, tato integrace přináší generativní vizuály do středu Google vyhledávání a kamerových nástrojů. Pro vývojáře a ekosystém to také otevírá nové příležitosti: integrace do pracovních toků, automatizace generování prostředků pro weby a aplikace a zjednodušení procesu tvorby marketingového obsahu. V dlouhodobém horizontu může jednotné rozhraní pro práci s textem i obrazem v Google posunout očekávání uživatelů o tom, jak rychle a pohodlně lze vytvářet vizuální obsah za pomoci umělé inteligence.
Zdroj: smarti






Zanechte komentář