AI Inspirace: Potřebujete upravit fotku nebo obrázek? Tajemný "banán", který poutal pozornost minulé dva týdny, je nový nástroj v Gemini od Googlu
Zajímá vás, jak nejlíp používat právě teď generativní AI? Přijďte na některý z našich workshopů. Na našem webu najdete jak prázdninové, tak i podzimní termíny. Rezervujte si místo hned teď.
O co jde: Dokáže vytváře nové fotky podle textových promptů, a stejným způsobem fotky i upravovat. Zároveň umí zkombinovat obsah až tří fotografií, které mu nahrajete. Když je na jedné pes, na druhé strom a na třetí vy, dokáže vás všechny dát do jednoho snímku, v požadované kompozici (například vy objímáte strom a pes na váš štěká).
Nový model se proslavil pod přezdívkou „Nano Banana“ na internetových fórech, kde v posledních týdnech ohromoval kvalitou úprav – Google následně potvrdil, že šlo o jeho projekt, a rovnou ho integroval do platformy Gemini. Oficiálně nese jméno Google Gemini 2.5 Flash Image, ale přezdívka Nano Banana mu už zůstala.
Google o něm hovoří jako o současné špičce v oboru – podle nezávislých testů (LMArena) dosahuje Nano Banana nejvyšších hodnocení mezi modely pro editaci obrázků. Model klade důraz na realistické výsledky a zachování detailů: umí provádět i složité změny ve fotografii, aniž by „rozbil“ původní vzhled lidí či objektů. Díky tomu si vysloužil pověst průlomového nástroje, který by mohl konkurovat i zavedeným programům pro úpravu fotek.
.
Jak to udělat: Nástroj je dostupný v aplikaci nebo web Google Gemini – stačí se přihlásit Google účtem a hned můžete začít tvořit. Pro úpravu vlastní fotky nahrajete obrázek do rozhraní Gemini (z menu vyberete nástroj “Create Images” nebo “Obrázek”) a jednoduše popíšete, co chcete změnit. Například můžete napsat „odstraň červené oči a rozmaž pozadí“ nebo klidně napsat celý příběh změn, které si přejete – AI vašim pokynům porozumí a během několika sekund vygeneruje upravený obrázek.
Prakticky tedy editace probíhá formou chatu: zadáte textový příkaz a model vrátí obrázek s provedenými změnami. Výsledek si můžete stáhnout nebo sdílet. Bezplatní uživatelé mají limit cca 100 obrázků denně, což asi bohatě stačí. Placený tarif (součást Gemini Premium) nabízí až 1000 úprav za den a případně rychlejší odezvu.
Nástroj funguje na mobilu (Android, iOS) i na počítači. Aktuálně se využívá přes samostatnou aplikaci Gemini (případně web), ale Google postupně jeho schopnosti začleňuje i do svých dalších produktů. Například na telefonech Pixel už dnes najdete funkci Magic Editor v aplikaci Fotky Google, která zvládá některé jednodušší AI úpravy (odstranění objektů, změnu pozadí) a je pravděpodobné, že právě technologie Nano Banana tyto možnosti v budoucnu ještě rozšíří.
.
Proč je to důležité: Nano Banana zvládne profesionálně vypadající úpravy na pár slovních příkazů, což může ušetřit hodiny práce ve Photoshopu. Nano Banana exceluje v manipulaci s objekty, změně pozadí, kolorování černobílých snímků či blendování více fotek dohromady do jedné scény. To vše s minimálním úsilím ze strany uživatele, který jen popíše, co chce.
Zásadní výhodou oproti předchozím generacím AI je schopnost udržet konzistenci detailů, hlavně u lidí a zvířat. Pokud tedy upravujete portrét (třeba měníte oblečení nebo účes), obličej zůstane pořád věrný původní osobě, nezdeformuje se a nepromění v někoho jiného ani po více zásazích. To byl dříve pro AI velký problém a konkurenční nástroje (včetně některých vestavěných v chatbotech) s tím zápasily.
Nano Banana díky výzkumu od DeepMind tento nedostatek výrazně potlačil – výsledné fotomontáže tedy vypadají uvěřitelněji a přirozeněji, i když na nich AI výrazně zapracovala. Ale stále to není dokonalé a pro profesionální použití to Photoshop samozřejmě nenahradí.
Možné použití: od zábavných úprav (nasadit si virtuální kostým, proměnit se v piráta či superhrdinu) přes vylepšování rodinných fotek (odstranit rušivé prvky, zkombinovat členy rodiny z více záběrů do jedné dokonalé momentky) až po praktické využití. Nástroj může pomoci třeba při plánování designu – rychle si vizualizujete, jak by váš pokoj vypadal s novou barvou stěn a nábytkem.
Google uvádí, že model byl od začátku navrhován s ohledem na běžné spotřebitele – má jim pomoci například představit si úpravy domova či zahrady, vytvářet koláže vzpomínek, nebo třeba snadno stylizovat vlastní fotky pro různá využití.
Příklad:
Prompt:
Obleč obě ženy do podobných modrých šatů (jako má žena vlevo) a muže do uniformy amerického námořnictva.
Výsledek:
Obleč obě ženy do elegantních dfresů sportovních cheerleaders a muže do uniformy amerického námořnictva.
Výsledek:
Obleč obě ženy jako astronautky a muže do uniformy amerického námořnictva.
Výsledek:
Odstraň z fotky ženu vlevo.
Výsledek:
.
Tipy a triky:
Buďte v promptech co nejvíc konkrétní a specifičtí: Čím přesněji zadáte svůj požadavek, tím lepší výsledek získáte. Uveďte co má být na obrázku a jak to má vypadat. Například místo vágního „žena v šatech venku“ zkuste raději detailní popis: „mladá žena v červených šatech běží parkem za slunečného dne“. Model Gemini lépe porozumí vaší představě a vytvoří odpovídající scénu.
Popište styl a kvalitu: Chcete-li určitý výtvarný styl nebo formát, zahrňte to do promptu vlastními slovy. Neexistují žádná “magická zaklínadla”, na druhou stranu se inspirujte prompty, které ostatní zveřejňují například na sociálních sítích. Buďte kreativní a nezapomínejte na kompozici, pokud o výsledku máte konkrétní představu.
Pracujte postupně: Nano Banana umožňuje “vícekolové” úpravy. Můžete tedy nejdřív zadat jednu změnu, počkat na výsledek, a pak na něj navázat dalším příkazem. Tento „multi-turn editing“ přístup vám dává větší kontrolu – například nejprve necháte vygenerovat prázdný pokoj, pak v dalším kroku řeknete „vymaluj stěny na modro“, poté „přidej do rohu pohovku“ atd. Výsledek bude asi lepší, než když to “nacpete” do jednoho promptu.
Nebojte se experimentovat: Pokud nejste s prvním pokusem spokojeni, zkuste formulaci trochu pozměnit nebo přidat detail, případně obrázek generujte znovu. Model Gemini často nabídne s každým vygenerováním trochu jinou variantu.
Využijte více vstupů: Máte-li dvě fotografie, které chcete spojit (osobu a pozadí, produkt a texturu apod.), nahrajte obě. Do instrukce jasně uveďte, co s nimi provést (např. „vlož objekt z druhé fotky do první scény“). Nano Banana dokáže porozumět více obrázkům naráz a zkombinovat je – maximální počet jsou tři.
.
Riziko dezinformací: Čím silnější nástroje na úpravu fotek jsou, tím větší je riziko zneužití k šíření falešných obrázků. Nano Banana dokáže velmi věrohodně změnit kontext fotky nebo vytvořit neexistující záběry, což může být zneužito k podvodům. Google si toho je vědom – všechny obrázky upravené či vytvořené tímto nástrojem mají proto viditelnou značku „AI“ a neviditelný digitální vodoznak SynthID v datech souboru. Tyto znaky by měly pomoci odhalit, že jde o výtvor AI.
Limity modelu: Ač je Nano Banana na špičkové úrovni, pořád to není dokonalé. U velmi složitých úloh může AI narazit – například jemné detaily jako mnoho postav na fotce, drobné nápisy nebo extrémně komplikované scény mohou obsahovat chyby. Někdy i velké.
Občas se může stát, že proklouzne nelogický prvek (např. ruka s nesprávným počtem prstů či podivný odraz v zrcadle). Testeři to zaznamenali a už spousty podobných obrázků zveřejňují. Berte to v potaz a pokud chcete výsledné obrázky použít (třeba v médiích nebo marketingu), pečlivě je zkontrolujte, než je použijete veřejně.
AI Inspirace je pravidelná rubrika pro ty, kteří chtějí z generativní AI vytěžit víc než jen pár vtipů na firemní poradu. Jsem rád, že je sledujete. A srdečně zvu na naše workshopy, kde vám ukážeme, jak gen AI používat zajímavě, zábavně a efektivně. Nejbližší workshop: tuto sobotu 30. srpna dopoledne. Registrujte se na http://inspiruj.se. Děkuju a těším se na vás!
Díky, zkoušel jsem, ale osobu přesunout z fotky na fotku se mi ho přemluvit nepodařilo:
"I can not move a person from one image to another. I can create a new image for you based on a description."
"I can create images of people, but not ones that portray a real person like that. Do you have another idea you'd like to try?"