AI Inspirace: Potřebujete přepsat záznam porady, kde mluvilo hodně lidí? Použijte Elevenlabs
AI Inspirace je pravidelná rubrika pro ty, kteří chtějí z generativní AI vytěžit víc než jen pár vtipů na firemní poradu. Najdete tu chytré tipy, triky a prompty, které vám pomůžou pracovat chytřeji, rychleji i zábavněji. Konkrétní způsoby využití AI v práci i v životě, od každodenních úkolů po kreativní experimenty. Nové nástroje, které stojí za pozornost, a originální nápady. Cíl je jediný: inspirace.
Cíl: Pořídili jste si zvukový záznam porady, a chcete s ním teď dál pracovat? Třeba napsat strukturovaný zápis (“meeting minutes”), najít nejzajímavější myšlenky, pořídit seznam úkolů pro účastníky?
Nic z toho není problém, všechny AI chatboty dokáží skvěle pomoct. Přepis můžete udělat různými nástroji, některé jsou už přímo integrované do softwaru (Teams atd.). Já pro přepis doporučuju bezplatný NotebookLM (od Googlu), který zvládne i několikahodinový záznam. Mám s ním dobrou zkušenost.
Problém může být, když na záznamu mluví víc lidí (obecně víc než tři až čtyři), a někdy mluví i přes sebe. Běžné modely pro přepis na text nepracují s hlasy, a texty pak účastníkům podle kontextu “přiřadí” velký jazykový model. Jde mu to dobře. Ale když je pro vás důležitá přesnost, doporučuju použít software, který mezi hlasy rozlišuje. Výbornou zkušenost jsem udělal se službou speech-to-text na ElevenLabs.
Jak to udělat: Jednoduše, uděláte si registraci na ElevenLbas a otevřete službu speech-to-text. Tam nahrajete soubor. V bezplatném plánu máte k dispozici 10 tisíc kreditů (měsíčně), což odpovídá asi 30minutovému záznamu. To není moc, s tím si asi nevystačíte. Když se stanete předplatiteli, vychází cena za přepis asi na cca 10 korun za hodinu záznamu. Vzhledem k tomu, že si většinou vystačím s NotebookemLM, mi to pro občasné použití přijde zcela OK.
.
Konkrétní příklad:
Na konferenci ISSS v Hradci Králové jsem moderoval panelovou debatu o tom, jestli Česku ujel “AI vlak”. Zúčastnilo se šest lidí: jeden ministr, dva náměstci jiných ministrů, poslanec, generál z Armády ČR a ředitel české pobočky Microsoftu.
Zde je záznam cca hodinové debaty:
Soubor ve formátu mp3 jsem nahrál do Elevenlabs, zpracování trvalo asi dvě minuty. Takto vypadá rozhraní, kde lze pojmenovat a označit hlasy. Model zároveň umí rozeznat potlesk, smích či další běžné zvuky:
Text lze v případě potřeby “ručně” editovat, stejně tak řečníky. Když se sejdou dva lidé s podobnými hlasy, může se stát, že je model bude rozpoznávat s nějakou chybovostí. Ale stává se to z mé zkušenosti naprosto výjimečně.
Výsledný přepis můžete exportovat do šesti různých formátů:
Co dál: já obvykle vyexportuju do TXT a “přenesu” do AI chatbotu, nejradši mám Claude. Tam pak použiju některý z promptů. V tomhle případě jsem chtěl udělat lehce zkrácený záznam debaty, s “vyleštěnými” texty (aby texty byly spisovné a aby zmizela “plevelná slova”) a s nejzajímavšjčími momenty.
Prompt:
Jsi zkušený editor pracující v prestižním zpravodajském médiu, vycházejícím na webu i na papíře. Vezmi přepis panelové debaty a uprav ho tak, aby byl ve stejné délce, ale odpovídal nárokům publikace. Přepiš řeč na spisovnou, uprav formulace, odstraň tzv. plevelná slova. Přepis debaty dej do dalšího dokumentu.
S výsledkem jsem byl spokojený. Pokud by to někoho zajímalo, publikoval jsem ho s volným přístupem na webu.
.
Chcete používat gen AI chytře, originálně a zábavně? Využijte (možná unikátní) “okno”, ve kterém dnes jsme. K použití jsou dnes špičkové modely a nástroje, a i finančně velmi dostupné (často zadarmo). Zjistěte “co, jak a proč” na našich workshopech či přednáškách inspiruj.se. Přijďte například 20. května odpoledne na AI Masterclass do Impact Hubu v Ostravě.