AI Inspirace: Chcete, aby za vás AI mluvila vztekle, šťastně nebo třeba i zpívala? Žádný problém, vzkazují z Elevenlabs
Zajímá vás, jak nejlíp používat právě teď generativní AI? Přijďte na některý z našich workshopů. Třeba 18. června na AI Masterclass (na Václavském náměstí v Diamantu). Rezervujte si místo hned teď. Během několika dní doplníme nové termíny na prázdniny a podzim.
O co jde: Nový model text-to-speech od ElevenLabs umí vygenerovat přirozeně znějící hlasový obsah s emocemi, dialogy a zvukovými efekty přímo z textu. Eleven v3 (alpha) umožňuje generovat hlasy, které nejen správně vyslovují slova, ale dokáží i šeptat, smát se, být smutné nebo nešťastné – a to všechno jen pomocí jednoduchých příkazů vložených do textu.
.
Jak to udělat: Přihlaste se do ElevenLabs a vyberte model "Eleven v3 (alpha)" z nabídky. Do textového pole napište svůj text a přidejte "audio tagy" v hranatých závorkách pro kontrolu emocí a efektů. Například:
"[whispers] Tohle je tajemství. [laughs] To byla ale sranda! [sad] Bohužel je to pravda."
Pro dialogy více postav jednoduše označte změnu mluvčích nebo využijte novou funkci pro automatické generování konverzací. Model podporuje přes 70 jazyků včetně češtiny. Pokud potřebujete konkrétní hlas, doporučuje se používat předpřipravené hlasy nebo rychlé klony (Instant Voice Clone), protože profesionální klony hlasu nejsou zatím plně optimalizované.
Generování trvá déle než u předchozích modelů, takže v3 není vhodný pro real-time aplikace. Pro ty použijte model v2.5 Turbo.
.
Proč je to užitečné: Eleven v3 revolučně mění způsob tvorby audio obsahu. Je jasné, že výhledově nhradí herce (pokud s tím posluchači budou v pohodě, a nebudou vyžadovat skutečné hlasy), a už dnes je jasné, že bude možné vytvořit profesionální audioknihu, reklamní spot nebo vzdělávací video jen s pomocí textu a AI modelu. Eleven v3 (alpha) dokáže automaticky přizpůsobit emoce podle kontextu a vytvořit přirozené dialogy mezi postavami.
Zejména pro malé tvůrce, pedagogy a firmy to znamená demokratizaci kvalitního audio obsahu. Během června 2025 je navíc používání ve studiu zlevněno o 80 %, takže můžete experimentovat za minimální náklady. Multijazyčná podpora umožňuje vytvářet obsah pro globální publikum se zachováním konzistentní hlasové identity.
.
Proč je to užitečné: V tomhle konkrétním případě třeba dobrá zpětná vazba na to, jak my sami vypadáme. Obecně pak ukázka toho, že velké jazykové modely nejsou v principu “podlézavé” nebo neupřímné. Ano, v systémových promptech mají většinou napsáno, aby se vždy maximálně snažili spolupracovat a vycházet vstříc. Ale vy jim pak v promptu můžete napsat, jak chcete, aby se chovaly konkrétně.
.
Příklady:
Audiokniha pro děti: Napište pohádku a pomocí tagů jako [excited], [whispers] nebo [giggles] vytvořte poutavé vyprávění s různými emocemi pro každou postavu. Můžete dokonce přidat zvukové efekty typu [door creaks] nebo [footsteps].
Firemní prezentace: Vytvořte profesionální prezentaci produktu s nadšeným hlasem
“[happily] Představujeme naši novou službu!"
a zdůrazněte důležité body
"[seriously] Toto je klíčová výhoda našeho řešení."
Vzdělávací obsah: Učitel může vytvořit interaktivní lekci s dialogy mezi historickými postavami nebo simulovat vědecké experimenty se zvukovými efekty. Například:
"[curious] Co se stane, když smícháme tyto látky? [explosion] Wow, to je reakce!"
.
Konkrétní příklad:
Nahrávka povídky “z fleku”
1. Napsal jsem povídku o muži, který se probudí, a zjistí, že na rameni jeho ženy je (pravděpodobně) vytetovaný QR kód.
2. Jdu na ElevenLabs, otevřu “Playground” a kliknu na “Text to Speach”. V pravém menu vyberu v “Settings” model “Eleven v3 (alpha)”. Vyberu svůj ionstantně naklonovaný hlas a vložím do okna text povídky.
3. Kliknu dole na tlačítko “v3 Enhance (alpha)”, a na základě kontextu se automaticky nabídnou styly v hranatých závorkách. Pak ručně projdu text a případně doplním další, nebo umažu ty, které navrhla AI. Cílem je co nejvíc zpřesnit styl, jakým chci, aby audio vzniklo.
Takto vypadá povídka včetně stylových “hranatých závorek”:
Advokát Skřivan se ráno probudil a pohlédl na svou ženu, která spala vedle něj. Ležela zády k němu.
Zamžoural na její rameno a spatřil na něm QR kód. Rychle zamrkal, jestli to není nějaký přelud. Nebyl.
Zatřásl s ní. Probudila se, neochotně a naštvaně.[surprised] "Ty sis nechala udělat tetování?!" [annoyed] "Zbláznil ses?!", zeptala se? Pak vytřeštila oči. [shocked] "TY sis nechal udělat tetování?!"
Ukázalo se, že Skřivan má na rameni taky QR kód.
[disbelief] "To není možný," řekl Skřivan a vyskočil z postele. Běžel do koupelny k zrcadlu.
QR kód vypadal jako nějaká prasklina v realitě.
Jeho žena přišla za ním, v ruce držela mobil. [curious] "Počkej, zkusím to naskenovat," řekla. [alarmed] "Zbláznila ses?! Co když je to virus?!"
Než stačil protestovat, ozvalo se cvaknutí fotoaparátu.
[satisfied] "Už to mám," řekla. "Vede to na nějakou stránku.
"Skřivan jí nakoukl přes rameno. Na displeji se objevil text:
[matter-of-factly]"Svou ženu nemiluju, i když jsem si to namlouval. Vzal jsem si ji jen proto, abych se stal partnerem v advokátní kanceláři svého šéfa."
[outraged] "Co to je za hovadinu?!", vykřikl.
Jeho žena na něj zírala s otevřenou pusou. Teď on namířil mobil na její rameno.
Cvak.
[matter-of-factly]"Jsem svému muži nevěrná. Miluju ho, ale v posteli je tak špatný, že prostě musím mít jiné milence."
Podívali se na sebe.
[shocked] "To není pravda," řekli oba současně.
Z ulice se ozval křik. Vyběhli na balkon. Dole stály hloučky lidí, všichni měli na sobě QR kódy. Někteří plakali, jiní se hádali. Mladá žena v županu běžela po chodníku a křičela: [distraught] "Já to tak nemyslela! Fakt ne!
"Telefon Skřivana začal zvonit. Volal jeho společník z kanceláře. [urgent] "Viděls to? Všichni mají na sobě ty kódy! A když je naskenuješ..."
[resigned] "Já vím," přerušil ho Skřivan. [concerned] "Je to naprostá katastrofa. Lidi se budou hádat, nenávidět i rozvádět. A to ani nemluvím o tom, jak vyskočí násilí. Napadá tě, co se s tím dá dělat?"
[disbelief] "Zbláznil ses?!", řekl jeho společník. [cunning] "Nic se s tím dělat nedá, a právě proto je to skvělý. [excited] Uvědomuješ si, jaké to pro naši advokátní kancelář bude znamenat kšefty?!
"V tu chvíli to došlo i Skřivanovi.Když položil telefon, podíval se na svou ženu. V těch pohledech, které si vyměnili, asi bylo něco jiného než normálně. Protože oba se automaticky zvedli a odešli do ložnice.[exhales and says happily] "Tohle byl nejlepší sex mého života," vydechla, když pak leželi vedle sebe.
[sincere] "Miluju tě," řekl Skřivan, a věděli, že mluví pravdu. Oba.
Když se oblékali, všimli si, že kódy zmizely.
4. Nechám vygenerovat audio. Vygenerují se automaticky dvě verze, celkem odlišné. Jak je u Elevenlabs běžné, mám bezplatně nárok na dvě “regenerace” audia, pokud mi kvalita nevyhovuje. Doporučuju si audio přesto uložit, kdyby další verze byly ještě horší.
5. Když jsem spokojený, můžu ještě vygenerované audio v mp3 formátu doeditovat nebo “vyšperkovat” (například přidáním hudby) v nějakém dalším programu, já používám audacity.
.
A jak to dopadlo? Poslechněte si:
.
AI Inspirace je pravidelná rubrika pro ty, kteří chtějí z generativní AI vytěžit víc než jen pár vtipů na firemní poradu.Jsem rád, že je sledujete. A srdečně zvu na naše workshopy, kde vám ukážeme, jak gen AI používat zajímavě, zábavně a efektivně. Děkuju a těším se na vás!
Hlas je napodoben velmi slušně (zde velký respekt), ale chybí zatím jakákoliv práce s pauzami a výsledek působí nepřirozeně ve stylu ejáj. O herce, kteří budou namlouvat, bych se zatím nebál.