Stručně: Gemini v posledních týdnech rychle dohání náskok konkurence. Google konečně ukazuje a potvrzuje, že je ve výzkumu a vývoji AI jedním z nejsilnějších hráčů. Nedávno představil novou sadu modelů Gemini 2.0, a mezi nimi je i Deep Research. Tento týden přibyly dvě zajímavé funkce: “canvas”, kdy Gemini otevře text nebo kód ve speciálním okně. Na rozdíl od canvasu v ChatGPT v něm nelze text editovat, připomíná tak spíš tzv. artifact v Claudeovi. No a druhou funkcí je vygenerování stručného shrnutí textu ve formátu podcastu (v angličtině). Nic podobného přímá konkurence nenabízí, ale umí to ElevenLabs, specialisté na klonované a umělé hlasy. Všechno vám teď ukážu.
Pojďme si zahrát hru. Dám vám text napsaný výhradně v tzv. emojis. Vytvořil ho ChatGPT, když jsem mu zadal úkol, ať přeloží článek na Wikipedii právě do těchto znaků. Zde je výsledek:
Dokázali byste pozat, o jaký článek se jedná? Nebo jinak řečeno, čí životopis - přeložený do 98 malých obrázků to je?
Ne?
Asi bych si taky netroufl.
(Je to můj životopis, to už víte z titulku. Ale pojďme předstírat, že nemáme tušení.)
Zvládla by to AI? Poprosil jsem Gemini, konkrétně nový Gemini 2.0 v režimu Deep Research. Jde o podobnou funkci, jakou nabízí například ChatGPT ( a další), a která dělá promyšlený a detailní průzkum online zdrojů. Zjednodušeně řečeno, vyhledává podobně jako člověk, a ano, občas dělá chyby a ne vždycky odvede skvělou práci. Ale to my lidi taky ne.
Jak to dopadlo?
Překvapilo mě to. Ale od začátku. Prompt byl jednoduchý a zkopíroval jsem do něj emoji životopis z ChatGPT.
Gemini navrhl tento postup, který jsem odsouhlasil:
Gemini prohledával a “přemýšlel” zhruba 12 minut. Výsledek?
S podrobným vysvětlením:
Atd. Nebudu vás unavovat, zde je naznačen celý postup v tabulce řádek po řádku:
Celá zpráva má 12 stránek, a můžete si ji přečíst, ale dopředu varuju, že vás to nebude zajímat, protože je to celé o mně. Ani mě to nezajímalo, takže jsem to jen zběžně přelétl. Ale pozoruhodné je to z pohledu toho, jak detailně a systematicky AI při Deep Research postupuje.
Novou funkcí v Gemini je vygenerování “podcastu”, v angličtině. Dopadlo to zajímavě. Tuhle funkci už známe déle než půlrok z nástroje NotebookLM, teď je však implementovaníá přímo do Gemini.
Můžete si poslechnout:
Jak jsem už napsal, podcast je v angličtině. Nechal jsem si ho na ElevenLabs “nadabovat” do češtiny. Místy je to komické, ale funguje to taky:
A to je vše. Pokud vás zajímají novinky či praktické rady k AI, zvu na naše workshopy či pravidelnou měsiční inventuru. Nejbližší akce:
21. března, 9:00 - 13:00, AI MASTERCLASS
25. března, 18:00 - 21:00, INVENTURA AI
27. března, 18:00 - 21:00, AI KREATIVITA s Čermákem a Staňkem
1. dubna, 17:00 - 21:00, AI MASTERCLASS
2. dubna, 13:00 - 16:00, AI PRO
8. dubna, 17:00 - 2O:00, AI PRO
9. dubna, 13:00 - 17:00, AI MASTERCLASS
12. dubna, 9:00 - 12:00, AI MASTERCLASS pro děti (10 až 15 let)
15. dubna, 9:00 - 12:00, AI MASTERCLASS v Brně
28. dubna, 13:00 - 13:00, AI LEADERSHIP
30. dubna, 13:00 - 17:00, AI MASTERCLASS