Jaký velký jazykový model používáte, a který považujete za nejlepší? GPT-4, nebo Claude? Případně Gemini?
Často kladená otázka, zejména na workshopech. Jednoduchá otázka, těžká odpověď.
Dva parametry jsou u tzv. velkých jazykových modelů (LLM) důležité. Celkový počet parametrů (v tuto chvíli se v “extralize” pohybuje v řádu biliónů), který nám říká (velmi zjednodušeně řečeno), na jak velkém vzorku textů a jak důkladně byl daný LLM “natrénován”.
Druhým důležitým parametrem je velikost tzv. kontextového okna. Rovněž velmi zjednodušeně řečeno udává, jak velký text je schopen LLM na “jeden zátah” přečíst, a to tak, aby tento text dokonale “pochopil” a byl schopen zcela porozumět kontextu.
Čteme: verze Gemini 1.5 má kontextové okno milión tokenů. Je to pětkrát (!) víc než dosud největší okno, které má 200 tisíc tokenů (Claude 3).
Co to znamená? Opět jednoduše: dokáže přečíst a perfektně pochopit kontext v textu, který je dlouhý až 700 tisíc slov v angličtině a cca 350 tisíc slov v češtině.
Pro…