AI Inspirace: Grok 4 je tady. A uvedl se dobře, za 422 sekund spočítal BEZ CHYBY letošní písemnou maturitu z matematiky

Jul 10, 2025

Zajímá vás, jak nejlíp používat právě teď generativní AI? Přijďte na některý z našich workshopů. Na našem webu najdete jak prázdninové, tak i podzimní termíny. Rezervujte si místo hned teď.

Grok 4 je nejnovější velký jazykový model vyvinutý společností xAI, což je firma založená Elonem Muskem v roce 2023. Elon Musk představil Grok 4 veřejnosti během živého přenosu 9. července 2025 na X/Twitteru. Oznámení proběhlo pouhých pět měsíců po uvedení předchozí verze Grok 3 v únoru 2025.

Musk označil Grok 4 za „nejchytřejší AI na světě“ a zároveň přiznal, že je z jeho schopností „trochu nervózní“, protože vykazuje inteligenci převyšující lidskou. Model Grok 4 Musk popisuje jako „super-géniální dítě“, kterému je třeba vštípit správné hodnoty, aby jeho ohromná inteligence sloužila lidstvu.

Grok 4 se od svého předchůdce liší výrazným výkonovým posunem – je větší, chytřejší a má více funkcí. Pro srovnání, Grok 3 byl již trénován s masivní výpočetní silou (~200 000 GPU) v superpočítači Colossus, ale u Groku 4 xAI detailní údaje o parametrech a tréninku nezveřejnila. Skok ve výkonu však naznačuje, že i Grok 4 využil ještě větší výpočetní infrastrukturu.

Oproti Groku 3, který položil základy (včetně režimu „Think“ a „DeepSearch“ pro vyhledávání), přináší Grok 4 hlubší uvažování (vždy zapnuté), dvojnásobnou paměť, multimodální vstupy, aktuální data z internetu a vyladěnou architekturu. Pokud byl Grok 3 už konkurenceschopný s GPT-4 a dalšími modely v roce 2025, Grok 4 nyní míří na pozici „nejvýkonnějšího AI modelu na světě“. Samotná xAI prohlašuje, že Grok 4 představuje „kvantový skok“ v jejich AI technologii oproti verzi 3.

Grok 4 byl podroben řadě standardních benchmarků a v mnoha dosáhl rekordních výsledků. Musk dokonce tvrdí, že Grok 4 je „lepší než absolvent Ph.D. v každém oboru“ a dosahuje perfektních skóre v testech, včetně tzv. “Humanity’s Last Exam” (HLE). Ten míchá extrémně obtížné otázky z různých oborů (právo, medicína, filosofie, ekonomie atd.) do jednoho testu a vyžaduje skutečnou syntézu znalostí – nejen paměť faktů, ale aplikaci logiky na komplexní, vícevrstvé problémy.

Grok 4 v HLE dosáhl ~25,4 % bodů bez nástrojů (tj. čistě vlastním uvažováním), čímž překonal předchozí špičkové modely Google Gemini 2.5 Pro (21,6 %) i OpenAI “o3 (high)” model (21 %). To znamená, že v souhrnném testu lidských znalostí a rozumu Grok 4 mírně převyšuje konkurenci. Ve variantě s použitím nástrojů (kdy AI může např. prohledávat web či používat kalkulačku) si verze Grok 4 Heavy polepšila až na 44,4 % – což je téměř dvojnásobek skóré Gemini 2.5 Pro s nástroji (26,9 %).

Prakticky to ukazuje, že Grok umí lépe řešit komplexní, reálné problémy, které vyžadují kombinaci faktů, logiky a úsudku – tedy to, co by v praxi dělal odborník řešící nový zapeklitý úkol.

Co to znamená pro běžného uživatele?

Celkově vzato, špičkové skóre Groku 4 ukazují, že model překročil dosavadní limity AI v oblastech jako matematika, logika, věda a programování. Nejde už jen o to, že umí plynně konverzovat nebo přeložit text.

Grok 4 dokáže řešit problémy, které byly navrženy tak, aby byly nad síly umělé inteligence a často i lidí. Pro uživatele to znamená, že v praktických úlohách – ať už je to pomoc s těžkou domácí úlohou z fyziky, nalezení chyby v kódu, nebo zodpovězení zapeklité znalostní otázky – má Grok vysokou šanci uspět tam, kde jiné modely (nebo průměrný člověk) tápe.

Samozřejmě, ne každý úkol v reálném životě vypadá jako soutěžní benchmark; nicméně tyto testy jsou dobrým prediktorem, že Grok zvládá komplexní vícekrokové uvažování, syntézu informací z různých oblastí a adaptabilitu na nové problémy. Uživatel to pocítí v tom, že Grok umí dát promyšlenější odpovědi s hlubším zdůvodněním – nejde jen o povrchní konverzaci, ale často o expertní radu.

Na druhou stranu, některé uživatelské ohlasy upozorňují, že ačkoli Grok 4 drtí benchmarky, v reálném dialogu může působit až příliš „ukecaně“ nebo ne vždy chápe kontext tak přirozeně jako člověk. Například jeden uživatel na Redditu si stěžoval, že Grok 4 „používá příliš mnoho slov a zahlcuje informacemi, a není zatím tak odladěný jako Claude nebo ChatGPT“.

To naznačuje, že extrémní výkon v testech nemusí vždy znamenat nejpříjemnější uživatelský zážitek – model sice ví hodně a vyřeší hodně, ale může být méně stručný či elegantní v komunikaci.

Pro běžného uživatele z toho plyne ponaučení: benchmarks jsou cenné vodítko, že Grok 4 má obrovský potenciál, ale důležitá je i reálná zkušenost. Je možné, že v některých každodenních dotazech nebude rozdíl oproti osvědčeným konkurentům tak dramatický, a kvalita odpovědi bude záviset na kontextu a formulaci promptu.

Ale není to zadarmo.

Přístup ke Groku 4 je vázán na předplatné na platformě X. Standardní verze Grok 4 je dostupná v rámci plánu "SuperGrok" za 30 dolarů měsíčně. Pro přístup k pokročilejšímu modelu Grok 4 Heavy je vyžadováno předplatné "SuperGrok Heavy" za 300 dolarů měsíčně. Ceny za použití API jsou stanoveny na 3 dolary za milion vstupních tokenů a 15 dolarů za milion výstupních tokenů, což je identické se starším modelem Grok 3.

Cenová politika jasně segmentuje trh. Cena 300 USD za měsíc je výrazně vyšší než u konkurence (nejvyšší předplatné ChatGPT a Claude je 200 USD) a jednoznačně cílí na podnikové uživatele a výzkumníky, kteří vyžadují špičkový výkon pro řešení komplexních úloh. Pro běžného uživatele je relevantní cena 30 USD měsíčně, která je rovněž vyšší než prémiové tarify jako ChatGPT Plus nebo Claude Pro (20 USD).

Závěr:

Grok 4 je model plný rozporů. Na jedné straně přichází s velkými fanfárami (zejména od svých tvůrců), špičkovým výkonem v benchmarcích zaměřených na abstraktní uvažování a unikátním přístupem k datům v reálném čase.

Na druhé straně trpí smíšenými výsledky v praktickém použití a je zatížen vážnými problémy s důvěryhodností a bezpečností (den před uvedením vychvaloval jeho předchůdce Hitlera). Není to univerzální nástroj pro každého, ale spíše specializovaný produkt s jasně definovanými silnými a slabými stránkami.

Pro koho je Grok 4 ideální:

Pro techno-nadšence a výzkumníky: Ti, kteří chtějí experimentovat s hranicemi AI, testovat komplexní logické problémy a nevadí jim občasná nespolehlivost v běžných úlohách.

Pro analytiky sociálních sítí a marketéry: Uživatelé, jejichž primárním cílem je analýza dění na platformě X v reálném čase, zde najdou unikátní nástroj, který konkurence nenabízí.

Pro uživatele a obdivovatele “nekorektní” AI: Ti, kteří jsou frustrováni přílišnou opatrností a cenzurou jiných modelů a jsou ochotni akceptovat s tím spojená rizika.

Grok 4 není jen další model v řadě. Je to spíše manifest odlišné filozofie vývoje AI – filozofie, která upřednostňuje syrový výkon a menší omezení před bezpečností a spolehlivostí. Zda se tato sázka na "reasoning" a "nekorektnost" stane vítěznou strategií, nebo slepou uličkou, ukáže až čas.

Prozatím platí, že Grok 4 je nepochybně nepřehlédnutelný, ale problematický vyzývatel, který nutí celé odvětví přemýšlet o tom, jaké vlastnosti jsou u umělé inteligence skutečně ty zásadní a nejdůležitější.

Příklad:

Nechal jsem Grok 4 spočítat písemnou maturitní zkoušku z matematiky, nahrál jsem mu PDF zadání didaktického testu z matematiky rozšiřující jarní termín 2025.

S promptem:

Prosím vyřeš všechny úlohy v PDF, zamysli se nad všemi, žádnou nevynechej.

Dal jsem Grokovi jeden pokus, s tím, že ho víckrát opakovat nebudu. Když jsem maturitu z matematiky (verze základní) nechal v dubnu řešit model o3-pro v ChatGPT, tak uspěl cca na 60 procent.

Jak dopadl Grok 4? Překvapil! S výjimkou úlohy 8, kde je součástí správného výsledku nákres, vyřešil všechny příklady BEZ CHYBY. Pokud vás to zajímá, podívejte se.

Poznámka: Grok 4 umí prohledávat web, takže samozřejmě nedokážu vyloučit, že nenašel stránku s výsledky a správným řešením. Ale z toho, jak u některých příkladů zapisoval postup, a jak se někdy formulace či zápis výsledků lišily, to nepovažuju za moc pravděpodobné.

AI Inspirace je pravidelná rubrika pro ty, kteří chtějí z generativní AI vytěžit víc než jen pár vtipů na firemní poradu.Jsem rád, že je sledujete. A srdečně zvu na naše workshopy, kde vám ukážeme, jak gen AI používat zajímavě, zábavně a efektivně. Děkuju a těším se na vás!

Jedno procento

Discussion about this post

Ready for more?