AI Inspirace je pravidelná rubrika pro ty, kteří chtějí z generativní AI vytěžit víc než jen pár vtipů na firemní poradu. Najdete tu chytré tipy, triky a prompty, které vám pomůžou pracovat chytřeji, rychleji i zábavněji. Konkrétní způsoby využití AI v práci i v životě, od každodenních úkolů po kreativní experimenty. Nové nástroje, které stojí za pozornost, a originální nápady. Cíl je jediný: inspirace.
Cíl: Potřebujete vylepšit nebo nějak jinak upravit fotky? Například: odstranit nepohodlné lidi? Změnit barvu auta nebo bot lidí na fotce? Fotky upravit nebo na ně něco naopak přidat?
Jak to udělat: Nahrajte fotku do AI chatbota Gemini a zvolte model 2.0 Flash. Ale pozor, musíte použít VPN a nastavit spojení například z USA, protože v EU a některých dalších státech není dostupný. Lépe řečeno model 2.0 Flash dosupný je, ale bez zmíněné funkčnosti práce s fotkami.
Proč je to užitečné: Dokáže to rychle a kreativně upravovat fotky, a to tak, že to opravdu “poslouchá” zadání v promptech. Na srovnání mezi “americkým” a “evropským” fungováním je to krásně vidět. na druhé straně je třeba se mít na pozor: opravdu nejde o Photoshop, a i “americké” Gemini vygeneruje celou fotku znovu. Takže se od té původní liší, byť v detailech.
Poznámky:
Model Gemini 2.0 Flash, konkrétně ve variantě "gemini-2.0-flash-exp-image-generation", představuje zásadní posun v práci s fotografiemi. Uživatelům umožňuje intuitivně upravovat fotografie zadáváním jednoduchých textových instrukcí – bez nutnosti používat technické nástroje, jako jsou masky, výběrové rámečky nebo vrstvy. Model například zvládne odstranit nechtěné objekty, změnit barvy (např. nábytku), přidat nové prvky do scény, nebo barevně upravit staré černobílé fotografie. Klíčovou výhodou je, že úpravy mohou být prováděny interaktivně v několika krocích, přičemž systém si udržuje vizuální konzistenci napříč změnami.
Přestože je platforma Gemini obecně dostupná ve více než 230 zemích a teritoriích, funkce pro generování a úpravu obrázků prostřednictvím varianty "gemini-2.0-flash-exp-image-generation" jsou výrazně omezeny geograficky. Tato verze není podporována v mnoha zemích Evropy (včetně EU a Velké Británie), na Blízkém východě a v části Afriky. Vývojáři, kteří chtějí využít obrazové funkce, musí pracovat prostřednictvím Google AI Studia nebo Vertex AI, přičemž musí výslovně zvolit režim „Preview“ a nastavit výstupní formát na „Images and text“.
Gemini 2.0 Flash je postaven na nativně multimodální architektuře, která v jednom modelu spojuje porozumění textu, generování a analýzu obrazů, a v omezené míře také zvuku a videa. Zvládá zpracovat až 1 milion tokenů kontextu, což umožňuje velmi detailní a propojené prompty či příběhy s vizuálními výstupy. Ve srovnání s předchozími generacemi je zpracování vstupů zhruba dvojnásobně rychlejší. Přesto však zatím nedosahuje vizuální kvality špičkových specializovaných generátorů (např. Midjourney nebo DALL·E 3).
.
Konkrétní příklady (nejdřív zdrojová fotka a pak příklady, uvedeny vždy jednoduchým promptem, a v obou verzích):
Zdrojová fotka:
“Změň na fotce barvu bot na červenou.” (US verze)
“Změň na fotce barvu bot na červenou.” (EU verze)
“Odstraň z fotky ženu.” (US verze)
“Odstraň z fotky ženu.” (EU verze)
“Vytvoř fotku, na které pár stojí před Eiffelovou věží v Paříži.” (US verze)
“Vytvoř fotku, na které pár stojí před Eiffelovou věží v Paříži.” (EU verze)
“Vytvořo z fotky minimalistickou černobílou kresbu, tvořenou jedním tahem." (US verze)
“Vytvoř z fotky minimalistickou černobílou kresbu, tvořenou jedním tahem." (EU verze)
Poznámka na závěr: Generativní AI je - na rozdíl od běžných technologií - nekonzistentní a nespolehlivá. Chová se víc jako my lidi než jako technologie. Na stejnou otázku vám může dát jinou odpověď teď, za pět minut nebo zítra. To víme od první chvíle, co velké jazykové modely používáme.
AVŠAK POZOR, je tu ještě další riziko, a to tkví v tom, že my vlastně nevíme, jaké modely v AI chatbotech používáme. Lépe řečeno které mám v danou chvíli a na daném místě k dispozici, a klidně se pkaždé můžou jmenovat stejně. Je to omezující a matoucí.
Z čehož plyne: když zjistíme, že AI něco konkrétního umí, a dělá to dobře, nemáme žádnou garanci, že a) to bude umět i zítra, a b) to bude umět na jiném místě zeměkoule. Pozor na to!
Chcete používat gen AI chytře, originálně a zábavně? Využijte (možná unikátní) “okno”, ve kterém dnes jsme. K použití jsou dnes špičkové modely a nástroje, a i finančně velmi dostupné (často zadarmo). Zjistěte “co, jak a proč” na našich workshopech či přednáškách inspiruj.se. Přijďte například již 13. května odpoledne na workshop AI Pro, aneb jak používat gen AI na jaře 2025 naplno.