Pojďme to vyzkoušet. Zde je 25 příkladů, které minulý týden řešili čeští maturanti. Postupoval jsem metodou “one-shot-test”, to znamená, že jsem každý příklad nechal spočítat ChatGPT pouze jednou, a výsledek jsem bral jako určující. Všechny příklady jsem zadal v celkem dvou konverzacích, každý příklad jsem nahrál jako obrázek (screenshot zadání z PDF). Podívejte se, jak to dopadlo. U příkladů, které ChatGPT spočítal špatně, uvádím vždy krátký komentář, kde a případně proč (podle mého názoru) udělal chybu.
Zadání příklad 1:
Řešení ŠPATNĚ:
Kde udělal ChatGPT chybu?
spletl si otevřený a zavřený interval
zdá se, že nějak v zadání přehlédl, že “n” je i součástí určení prvního intervalu, přepsal ho jako: (2, 97), ale ve skutečnosti to je (2n, 97), možná to prostě špatně přečetl?
Zadání příklad 2:
Řešení ŠPATNĚ:
Chyba?
ChatGPT si špatně přečetl zadání. Prodejce telefon nejdřív zlevnil, a pak dvakrát zdražil. ChatGPT počítal příklad tak, jako kdyby ho stále zlevňoval.
Zadání příklad 3:
Řešení SPRÁVNĚ:
Zadání příklad 4:
Řešení SPRÁVNĚ:
Zadání příklad 5:
Řešení ŠPATNĚ:
Chyba?
ChatGPT udělal chybu hned v prvním řádku, při úpravě zlomků.
Zadání příklad 6:
Řešení SPRÁVNĚ:
Zadání příklad 7:
Řešení SPRÁVNĚ:
Zadání příklad 8:
Řešení SPRÁVNĚ:
Zadání příklad 9:
Řešení ŠPATNĚ:
Chyba?
ChatGPT “trefil” dobře asymptoty, šel na to v principu dobře, ale pak zabloudil. Nákres netřeba vůbec brát v úvahu, v generování obrázků jsou AI chatboty hodně na začátku, zejména když vyžadujeme přesnost a logiku.
Zadání příklad 10
Řešení: napůl špatně, napůl správně.
Tahle úloha je geniální v tom, že její první část (obsah) je pro člověka strašně lehká. Stačí se na obrázek podívat, a vidíte správné řešení. Avšak obvod je třeba spočítat.
ChatGPT první nezvládl, druhé ano.
Zadání příklad 11:
Řešení SPRÁVNĚ:
Zadání příklad 12:
Řešení SPRÁVNĚ:
Zadání příklad 13:
Řešení SPRÁVNĚ:
Zadání příklad 14:
Řešení: SPRÁVNĚ
Zadání příklad 15:
Řešení: SPORNÉ
V zadání v PDF na webu je chyba, lépe řečeno chybí znaménko “mínus” v příkladu 15.3. Jinak ChatGPT spočítal 15.1 správně (q = 3), v 16.2 udělal překvapivou chybu, když “nepokrátil” mínus ve zlomku, ale jinak postupoval správně, a 15.3 spočítal vzhledem k chybě špatně. Za úlohu tedy přičtu 1 bod ze 3.
Zadání příklad 16:
Řešení: SPRÁVNĚ
Zadání příklad 17:
Řešení: SPRÁVNĚ
Zadání příklad 18:
Řešení: SPRÁVNĚ
Zadání příklad 19:
Řešení: SPRÁVNĚ
Zadání příklad 20:
Řešení SPRÁVNĚ.
Zadání příklad 21:
Řešení SPRÁVNĚ:
Zadání příklad 22:
Řešení SPRÁVNĚ:
Zadání příklad 23:
Řešení: ŠPATNĚ
ChatGPT nenašel způsob, jak celkem jednoduchý příklad vyřešit. Začal vymýšlet něco se “střední příčkou” lichoběžníku (?), místo aby s pomocí Pyhagorovy věty spočítal, o kolik je delší spodní část než ta horní, a pak se znalostí obvodu určil délku obou z nich.
Zadání příklad 24:
Řešení SPRÁVNĚ
Zadání příklad 25:
Řešení SPRÁVNĚ:
.
Závěr:
Neznám přesně hodnotící klíč, ale k úspěšnému absolvování maturioty je podle PDF se zadáním třeba získat aspoň 33 procent bodů. To by ChatGPT splnil hravě: získal 38 bodů z 50. Zcela správně spočítal 18 příkladů z 25, špatně 5 příkladů. Jeden spočítal napůl, v druhém byla menší chyba v zadání.
Podle mě je to velmi dobrý výsledek. Na druhou stranu, překvapilo mě, jak je úroveň maturitní zkoušky nízká. Osobně bych asi dopadl ještě líp než ChatGPT, byť bych samozřejmě potřeboval mnohonásobně víc času. A některé vzorce bych si musel dohledat v tabulkách, které ovšem byly povoleny.
ChatGPT je jazykový model a ne matematický, a řeší matematiku jazykově bez matematicke logiky, tak jako by ji řešil češtinář. Který by si načetl všechny matematické skripta