Takhle "hustý" týden jsme v generativní AI asi ještě nezažili. Co všechno se stalo?

Tohle není newsletter, který vám slíbí, že vám NIC neuteče. Protože rychlost, s jakou generativní AI nastupuje, je bezprecedentní. Ale NĚCO vám neuteče, a jsem si skoro jistý, že se vám TO může hodit.

Feb 17, 2024

Zde je přehled nejzajímavějších událostí, novinek a tipů z oboru generativní AI za poslední týden. Mimo jiné se dočtete:

OpenAI šokuje modelem text-to-video Sora
Google vyroloval Gemini Ultra a spustil službu Gemini Advance
(Bard je mrtev, ale “Ať žije Bard!” asi nikdo z Googlu volat nebude)
a taky: nový model se bude jmenovat Google 1.5
a bude mít kontextové okno MILIÓN tokenů
Stable Diffusion taky představili nový model
Nvidia má chatbota, kterého si (zadarmo) stáhnete
(ale musíte mít jejich grafickou kartu a PC s W11)
Elon Musk trolí Sama Altmana
… plus mnoho dalšího

Ve středu večer se na vás těšíme na Inventuře AI!

Představíme: všchny novinky, které se staly od začátku roku, a že jich je docela hodně. Svůj pohled i názory prezentují také naši hosté. Přijďte!

Ale taky zajímavé lidi, pozoruhodné události. Účast potvrdil Josef Šlerka, budou ještě další.

Stručné, rychlé a informativní prezentace: přednášet budu já a dva nebo tři hosté.

Na závěr je debata, panelová diskuse, networking a brainstorming

Kde, kdy, jak: ve čtvrtek 22. února, od 18:00, v Presscentru ČTK

Události:

OpenAI opět všem vyrazila dech, “bez varování” představila model pro generování videa z textových promptů. Sora je naprosto famózní, jakkoli k ní zatím nemáme veřejný přístup. Ale z průběžně zveřejňovaných videí je zřejmé, že dosavadní AI modely pro generování videí jsou jen dětskými hračkami.

Sora umí vytvářet videa nejen z textu, ale i z fotografií. A zároveň umí sama generovat fotografie, údajně lepší než poslední model DALL-E 3. Počet vydaných pozvánek je omezený (OpenAI říká těmto lidem “red testeři”), cílem je prý najít všechna možná bezpečnostní rizika a zajistit model proti možným zneužitím.
Co si pod tím OpenAI představuje, není jasné. Že generování videí půjde zneužít snadno (stejně jako generování fotografií), je zřejmé. Že model bude cenzurovaný tak, aby nebylo možné například vytvářet pornografii nebo generovat ve videích veřejně působí osoby, je taky zřejmé. Co dál chce OpenAI udělat, a kdy tihle “hračku” dostaneme do ruky? Nevíme. Jednoznačné ovšem je: profesionální tvůrci videa, televize a filmu čelí disrupci, která se dala čekat, avšak nikdo netušil, že přijde tak rychle a výrazně.
Google minulý týden “nasadil” Gemini Ultra a definitivně “pohřbil” Barda. Tohle jméno pro chatbot bude nadále už jen připomínat “revoluční rok” 2023, který ovšem pro Google nebyl moc lichotivý. Od startu ChatGPT v listopadu 2022 Google “dobíhal” za OpenAI, což není spravedlivé už jen proto, že ve vývoji velkých jazykových modelů i obecně v AI patří Google nezpochybnitelně k světové špičce.
Smaže Gemini loňské rozpaky? První srovnávací testy jsou nejednoznačné. Zdá se, že GPT-4 je lepší v úkolech, které vyžadují vysokou kreativitu a analytický přístup. Gemini Ultra je srovnatelný nebo lepší v práci s texty, možná v psaní. Výhodou je také dobré propojení s různými službami a také asi lepší práce s informacemi na webu (ano, přece Google!). Můj osobní dojem po týdnů používání obou modelů: GPT-4 mi přijde stále o něco lepší, rozdíl je však velmi malý.
Ještě jednou Google: šéf Google DeepMing Demis Hassabis představil model Gemini 1.5. Zatím ho mají k dispozici vývojáři a testeři, takže si na něj ještě počkáme. Je výrazně výkonnější než předchozí verze Gemini 1.0.
Využívá efektivnější architekturu zvanou Mixture-of-Experts. Díky ní se může rychleji učit a být efektivnější při trénování a nasazení. Tou zásadní změnou je ovšem rekordně dlouhé kontextové okno až 1 milion tokenů. To mu umožňuje zpracovat mnohem více informací najednou a dělat komplexnější úsudky. Kontextové ono je délka textu (či obecně velikost obsahu na vstupu), který jazykový model dokáže zpracovat v rámci jednoho promptu.
Pro srovnání: loni měl ChatGPT po většinu roku pouhých 8000 tokenů, model GPT-4 Turbo má 128 tisíc tokenů a Claude 2.1 200k (jak z názvu napovídá) 200 tisíc tokenů. Jeden token je cca jedno anglické slovo, přesněji je to asi tak, že 100 tokenů je zhruba 75 anglických slov. V češtině je to cca 2,5x méně, tedy asi 32 slov. (Délka povídky Stařec a moře od Hemingwaye je pro srovnání cca 32 tisíc slov). “Miliónové” Gemini tak bude možné “nakrmit” cca 750 tisíc slov, či také hodinovým videem nebo 11 hodinami audia.
Na Twitteru nový model promoval sám šéf Googlu Sundar Pichai, a to včetně porovnání s konkurencí. Což ukazuje, že Google bere nápravu pověsti, lehce pošramocené Bardem, velmi vážně a prestižně.
Mimochodem, to, že Google představil nový model týden poté, co ho “vyroloval” veřejně, naznačuje to, že firma chce ve vývoji AI hodně “šlapat na plyn”. Na co teď nedočkavě čekáme: samozřejmě na GPT-5, na Llama 3.0 (od Facebooku či Mety), a na další modely od Anthropicu, Mistralu, xAI a dalších. Čekají nás celkem vzrušující týdny a měsíce, o tom není pochyb!
Nespí nikdo, viz třeba Stability AI představila nový model nazvaný Stable Cascade, který generuje obrázky na základě textových příkazů. Stable Cascade je rychlejší a výkonnější než předchozí model Stable Diffusion od Stability AI. Dokáže generovat fotky a jejich variace rychleji, je rozdělen na 3 modely místo jednoho velkého. To umožňuje efektivnější trénování a využití výpočetního výkonu. Model je zatím dostupný pro výzkumníky na GitHubu, ale ne pro komerční využití. Stability AI se snaží financovat výzkum komerčními licencemi.
Lze ho vyzkoušet, a generování obrázku vidět v reálném čase. Zde je výsledek, s promptem: “Padesátník zvaný Boomer Hooligan jde po ulici.” Mimochodem, kdyby ten chlápek byl o dvacet kilo hubenější,tak vypadá jako můj otec, ovšem v sedmdesáti.
Elon Musk opět trolí na Twitteru (X) šéfa OpenAI Sama Altmana. Co mu vadí, víme dlouho: Altman původně neziskovou společnost, která vznikla právě za Muskovy peníze, přetvořil v běžnou firmu usilující o zisk. (A výhledově zatraceně úspěšnou, OpenAI oznámila v právě končícím týdnu roční příjmy na úrovni dvou miliard dolarů!). Musk sdílel screenshot jiného uživatele, který reagoval žádost Altmana, ať lidé vymýšlejí prompty pro nový model Sora pro generování videa. Návrh promptu: “Chlápek mění neziskovou open source společnost a ziskovou uzavřenou společnost.”
Muskovi vývoj OpenAI vadí dlouhodobě, a je otázka, zda se tak vyhraňuje vůči konkurenci (založil přece společnost xAI), anebo je jeho postoj principiální. OpenAI vznikla s cílem být protiváhou velkých technologických firem (Google, Microsoft atd.), dnes je však jednou z nich. A je celkem jedno, že s jednou je v přímé konkurenci (Google), a s druhou spolupracuje.
Muskův postoj taky není konzistentní: sice stále varuje před riziky a nebezpečími AI, zároveň však provozuje na Twitteru vlastní chatbot. Kloním se k názoru, že Muska prostě baví trolit, a jako malé plus beru to, že si jako cíl nevybírá žádné bezvýznamné pišišvory. Sam Altman dnes v technologickém průmyslu patří k nejvlivnějším lidem, a Muskovy tweety nepochybně přežije.
Microsoftu se vyplácí jeho sázka na AI a firmu OpenAI. Firma oznámila rekordní tržby, se společností Apple se přetahuje o první místo na žebříčku firem podle tržní hodnoty. Momentálně (data k 16. únoru) je Microsoft je jedním ze sedmi členů exkluzivního “klubu biliónových firem”, s tržní hodnotou přesně 3 bilióny. Plánuje posílit svou pozici i ve vyhledávání, kde zatím výrazně dominuje Google.
Je to velký osobní úspěch šéfa Satyi Nadelly: když v roce 2014 do pozice nastoupil, byly vyhlídky Microsoftu slabé. Cena akcií stagnovala, firmy neuspěla s cílem předchozího šéfa Steva Ballmera prosadit se na trhu s chytrými telefony.
Nadella provedl odvážné změny, strategické akvizice a vsadil na umělou inteligenci. Jeho největším úspěchem je úspěšný přechod Microsoftu k cloudovým službám. Akvizice jako GitHub a LinkedIn pomohly rozšířit dosah Microsoftu do vývoje softwaru a profesních sítí. Agresivní investice do herního průmyslu také posílily pozici Microsoftu. Investice 1 miliardy dolarů do startupu OpenAI se ukázala jako vizionářská.
Studie společnosti Zetwerk: většina amerických spotřebitelů (68 procent) se domnívá, že by firmy měly dobrovolně zveřejňovat informace o tom, jak a kde používají AI. Významná část (59 procent) soudí, že by to mělo být ze zákona povinné, píší Fox News. Mělo by se to týkat zejména odvětví jako: zdravotnictví, monitorování zdraví a bezpečnosti, finanční služby, marketing či nabídka virtuálních asistentů. Politici se k problému staví různě. Republikáni jsou benevolentnější (47 procent si myslí, že by to firmy měly dělat, ale jen 16 procent by to nařídilo zákonem), demokraté přísnější (60 procent podporuje dobrovolné i povinné zveřejňování).
To je častá otázka na workshopech: je použití AI například pro psaní dopisů, tiskových oznámení atd. legální? Chystá se v této věci nějaká úprava zákonů? Bude existovat povinnost oznámit (= přiznat), že člověk nebo firma použili k jeho napsání AI? A pokud to bude legální, bude se to považovat za etické? Důležité otázky. Můj názor: žádná taková povinnost nebude, ale některé obory (například žurnalistika) se k této povinnosti dobrovolně přihlásí v rámci svých etických kodexů.
Bidenova administrativa jedná s Intelem o poskytnutí dotací přes 10 miliard dolarů na výstavbu továren na čipy, píše Reuters. Jednání stále probíhají, ale balíček pro Intel bude pravděpodobně obsahovat jak půjčky, tak přímé granty. Ministerstvo obchodu USA, které dotace na základě CHIPS Act schvaluje, zatím oznámilo dva menší granty. Celkem je v rámci tohoto vládního programu k dispozici 39 miliard dolarů. Kromě Intelu žádají o dotace také další firmy jako TSMC, Micron a Samsung, které staví továrny na čipy v USA.
Nvidia vydala demoverzi nového AI chatbota, který běží lokálně na PC. Aplikace Chat with RTX je zdarma ke stažení a umožňuje spustit chatbota přímo na počítači uživatele. Chatbot se softwarem Nvidia TensorRT-LLM běží lokálně, takže nepotřebuje připojení k internetu a data uživatele zůstávají v bezpečí. Avšak háček: je třeba grafická karta řady GeForce RTX 30 nebo vyšší s minimálně 8GB VRAM a počítač s Windows 10 nebo 11.
Nvidia řeší problém, na který se lidé na workshopech ptají skoro nejčastěji. Totiž: je bezpečné nahrávat do online chatbotů jako Gemini nebo ChatGPT svoje dokumenty? Odpověď: bezpečné to asi celkem je, ale pokud budete nahrávat dokumenty s neveřejnými, osobními či jinak citlivými daty, můžete se dostat do konfliktu se zákony (protože GDPR) či smlouvami (pracovními, NDA atd.). Zcela bezpečné je mít chatbota za firewallem či na vlastním počítači, případně používat nějakou službu s bezpečným zasíláním dat (ChatGPT Enterprise).
A co vy, koupili jste v lednu 2023 akcie Nvidia, jak někteří doporučovali?
Kdyby to někoho zajímalo: ANO, já to DOPORUČOVAL. Dokonce několikrát. No a NE, sám jsem si žádné akcie této firmy nekoupil.

Přijďte na naše akce a workshopy:

20. února, 17:00-21:30, MASTERCLASS AI
22. února, 18:00 - 21:30, INVENTURA AI
23. února, 9:00 - 13:00, LEADERSHIP AI
19. března, 18:00 - 21:00, INVENTURA AI
25. března, 9:00 - 13:00, MASTERCLASS AI
9. dubna, 9:00 - 13:00, MASTERCLASS AI
11. dubna, 13:00 - 17:00, MASTERCLASS AI (VŠE)
12. dubna, 9:00 - 13:00, AI LEADERSHIP
22. dubna, 18:00 - 21:00, INVENTURA AI
2. května, 9:00 - 13:00, MASTERCLASS AI
3. května, 9:00 - 13:00, AI LEADERSHIP
22. května, 18:00 - 21:00, INVENTURA AI
24. května, 9:00 - 13:00, MASTERCLASS AI
10. června, 13:00 - 17:00, AI LEADERSHIP
17. června, 13:00 - 17:00, MASTERCLASS AI
20. června, 18:00 - 21:00, INVENTURA AI.

A to je vše.

Děkuji, že čtete. Jestli chcete newsletter podpořit (a číst i starší vydání v archivu), staňte se platícím předplatitelem Jednoho procenta.

Jedno procento

Discussion about this post

Ready for more?