Klapka, jedeme! Ani já a můj avatar jsme nezapomněli na novoroční projev
Tohle není newsletter, který vám slíbí, že vám NIC neuteče. Protože rychlost, s jakou generativní AI nastupuje, je bezprecedentní. Ale NĚCO vám neuteče, a jsem si skoro jistý, že se vám TO může hodit.
Zde je přehled nejzajímavějších událostí, novinek a tipů z oboru generativní AI za poslední týden. Mimo jiné se dočtete:
AI dostane tlačítko
těšíte se na GPT Store?
rozpohybujte svoje fotky
jakou uhlíkovou stopu měl Mark Twain?
New York Times, OpenAI a Microsoft jsou ve při
nové i staré rady pro psaní promptů
… plus mnoho dalšího
.
Novoroční projev!
Říkají tomu instantní klonování, trvá to cca 10 minut, a můžete začít generovat videa. To vše na serveru HeyGen. Tohle video je moje první (ano, proti oknu, jsem génius!) a vše mi zabralo přesně 35 minut.
.
Události:
AI bude mít své tlačítko na klávesnici. Od příštího týdne budou v prodeji klávesnice s tlačítkem Copilot, které v počítačích s nainstalovanými Windows 11 spustí zmíněnou funkci. Podle Microsoftu bude rok 2024 “rokem AI v PC” a dotyčné tlačítko usnadní uživatelům její používání. Není to detail: jde prý o největší změnu v designu PC klávesnice za posledních 30 let.
Tohle je cool: služba Pixverse je další, která vám nabízí, že “rozhýbe” vaši fotku. Vyzkoušejte sami. Podobě jako u Midjourney zadáváte příkazy v Discordu. Když chcete rozpohybovat fotku (do třívteřinového klipu), napíšete do příkazového řádku /animate … a vložíte vybranou fotku.
Pro zajímavost, tohle byla původní fotka:
OpenAI příští týden startuje GPT Store. Tedy oficiální web, kde bude možné sdílet svá GPTs a prozkoumávat to, co naopak nabízejí ostatní. GPT Store slíbil šéf OpenAI Sam Altman na konferenci pro developery těsně před svým odvoláním (a následnou znovuinstalací) z postu šéfa firmy. Pak bylo ticho po pěšině. Samozřejmě jde o inspiraci AppStorem, který v roce 2008 představil Steve Jobs a který pomohl odstartovat ekosystém kolem iPhonu. Teď se “to” konečně děje a my čekáme na detaily.
Kdy AI překoná člověka ve VŠECH pracovních úkonech? V rozsáhlém výzkumu odpovídalo 2778 výzkumníků a vědců v oboru AI, již po několikáté od roku 2016. Odpovědi? Medián byl v roce 2016, že se tak stane v roce 2061. V roce 2022 byl medián 2060, tedy zhruba stejně. Ale pozor, v roce 2023 se medián posunul do roku 2047.
Deník The New York Times žaluje společnosti OpenAI a Microsoft za porušení autorských práv. Podle NYT tyto společnosti neoprávněně použily články deníku Times k trénování modelů umělé inteligence, jako je ChatGPT a Bing. V žalobě se tvrdí, že použití článků Times pro účely tréninku umělé inteligence představuje porušení autorských práv. V žalobě jsou příklady textů vygenerovaných AI, které doslovně kopírují části zveřejněných článků. Společnosti OpenAI a Microsoft se budou pravděpodobně bránit pomocí zásady "férového použití" a argumentovat tím, že trénink umělé inteligence má jiný účel publikování obsahu.
Případ “NYT vs. OpenAI a Microsoft” v češtině detailně shrnuje Pavel Kasík na serveru Seznam Zprávy. Píše: “Případ se může táhnout opravdu dlouho, a nebo může jít o taktiku, která má dostat technologické firmy zpět k vyjednávacímu stolu. Nejsem si ale jistý, zda se – vzhledem k tempu, jakým se generativní AI posouvá a vyvíjí – bude tato právní bitva odehrávat dostatečně rychle na to, aby vůbec do něčeho zasáhla.”
Vtipné: vygenerovat s pomocí AI stránku textu je ekologičtější (= má to menší uhlíkovou stopu), než když stránku textu napíše člověk. Kvůli tomu nemusela vznikat studie, na druhou stranu teď máme tento fakt podložený čísly. Takže: napsání jedné stránky textu s pomocí AI má 130x až 1500x nižší uhlíkovou stopu než napsání téže stránky člověkem. Podobně, vytvoření jednoho obrázku s pomocí AI má 310x až 2900x nižší uhlíkovou stopu než jeho nakreslení nebo namalování člověkem. Viz:
A taky:
Je to logicky reakce na to, že AI je obviňována z toho, že neúměrně ekologicky zatíží planetu. To platí ostatně celkově o IT, magazín MIT Sloan Management Review píše:
Jedno průměrné datové centrum spotřebuje ročně tolik energie jako by vytápění 50 000 domácností. Elektronický odpad je nejrychleji rostoucím typem odpadu na světě, ročně se ho vyprodukuje neuvěřitelných 57 milionů tun, což je přibližně stejně jako váží Velká čínská zeď.
Abychom to shrnuli: odhaduje se, že jeden dotaz pro ChatGPT vede k uhlíkové stopě 0,382 gramů CO2. Uhlíkovou stopu “lidského psaní” vypočítali autoři následovně: člověk žijící ve vyspělé ekonomice (jako jsou USA) vyprodukuje za hodinu cca 1,7 kg CO2. A zároveň se odhaduje (lépe řečeno se bere v úvahu již dávný odhad Marka Twaina), že průměrný spisovatel napíše za hodinu asi 300 slov. Což je o něco víc než jedna stránka textu. Napsání průměrné knihy tak trvá 400 “člověkohodin” a planetu zatíží cca 580 kg CO2. Uf, to jsou ale nesmysly, co říkáte?
A tohle je taky hezké: text-to-moves, aneb napište textový prompt, jak se má postavička hýbat, a MotionGPT vám z toho udělá video. Vyzkoušeno, zde máte
dřepy:
Roční tržby OpenAI (= annualised revenue) jsou nyní 1,6 miliardy dolarů. V říjnu to ještě byly 1,3 miliardy. Odhadovaná hodnota firmy je přes 100 miliard dolarů, firma však hledá další investice.
Umělé inteligence se ve svém ohlédnutí za vědou a technologiemi v roce 2023 v Deníku N dotkl Petr Koubský. O regulaci, což bue pro příští měsíce jedno z největších témat kolem AI, napsal:
Nejdál je v tomto směru zatím jako obvykle Evropská unie, která nyní finalizuje své nařízení, pracovně známé jako AI Act. Jeho cílem je stanovit, která využití AI představují „nepřijatelné riziko“, a ta zcela zakázat. Aplikace, které jsou „jen“ vysoce rizikové, se budou evidovat, kontrolovat a omezovat. Mezi systémy s nepřijatelným rizikem patří především kognitivní manipulace, přidělování sociálního kreditu a dálková biometrická identifikace.
Generativní AI systémy typu ChatGPT nejsou v této klasifikaci rizikové samy o sobě, důraz se bude klást jen na jejich průhlednost – u konkrétního textu, obrázku či videa by mělo být jasně a pokud možno neoddělitelně uvedeno, že jeho původcem je AI.
Není ani zdaleka jasné, do jaké míry se bude dařit tyto požadavky prosazovat. To ukáže budoucnost. Evropská regulace digitálních technologií je často návodem pro celý svět, tentokrát je však nejisté, zda se „efekt Bruselu“ prosadí, protože v sázce je hodně. Dominance v AI může znamenat hospodářskou i politickou nadřazenost. Jak USA, tak Čína mají v tomto směru velké ambice a vlastní představy. Evropa ostatně není sídlem žádného z velkých producentů AI. Tím se otvírá jiné riziko – nebezpečí, že náš kontinent bude v tomto klíčovém odvětví zaostávat.
.
Jak psát efektivní prompty? Nová i stará pravidla
Zájem budí v posledním týdnu studie, která zkoumala to, jaké formulace či triky zabírají při úkolování jazykových modelů. Samozřejmě není jasné, nakolik jsou její závěry definitivní, případně zda se v dalších verzích či vlivem “tuningu” chování testovaných modelů zase nezmění.
AVŠAK, každopádně zde máme pár zajímavých poznatků. Je jen na vás, zda se jich budete držet. Ale: prý už víme, zda je užitečné LLM prosit, nebo jim děkovat (údajně NE, ale já stejně budu děkovat dál), a zda máme LLM slibovat úplatky, případně jim vyhrožovat potrestáním (údajně ANO). Zde jsem vybral to nejdůležitější:
Není třeba být zdvořilý, takže nemusíte přidávat formulace jako "prosím", "pokud vám to nevadí", "děkuji", "rád bych" apod., a můžete přejít rovnou k věci
V promptu definujte publikum, např. publikum tvoří experti [v daném oboru)
Rozložte složité úkoly do sledu jednodušších promptů v jedné konverzaci
Používejte afirmativní pokyny, jako je "udělej", a vyhýbejte se negativním výrazům, jako je "nedělej"
Když potřebujete objasnit nebo hlouběji pochopit téma, myšlenku nebo jakoukoli informaci, použijte tyto formulace
Vysvětli [vložte konkrétní téma] jednoduše.
Vysvětli mi to jako 11letému chlapci
Vysvětli mi to jako začátečníku [v daném oboru]
Napiš [esej/text/odstavec] jednoduchou angličtinou, jako byste něco vysvětlovali pětiletému dítěti.
Použijte formulaci: "Za lepší řešení ti dám spropitné ve výši [xxxx] dolarů!"
Používejte příklady
U složitých promptů oddělujte instrukce, příklady a dotazy. Případně používejte speciální symboly, viz: "###Instruction####", z "###Example####" nebo "###Dotaz###", pokud je to relevantní
Používejte formulaci: "Tvým úkolem je …" a "MUSÍŠ UDĚLAT …"
Používejte formulaci: "Budeš potrestán"
Používejte formulaci "Odpověz na položenou otázkou přirozeným, lidským způsobem"
Používejte formulaci: "přemýšlej krok za krokem"
Do výzvy přidejte upozornění: "Dbej na to, aby vaše odpověď byla nezaujatá a nevychází ze stereotypů".
Napište do promptu, ať se vás LLM zeptá na detaily a vše, co potřebuje ke splnění úkolu vědět (například: "Od této chci, abys mi kladl otázky týkající se …").
Když chcete něco vysvětlit, můžete LLM požádat, ať vás po vysvětlení vyzkouší: "Nauč mě [dovednost/zákon/definici] a na závěr připoj testovací otázky, ale bez odpovědi, a až na otázku odpovím, napiš mně, jestli jsem odpověděl správně.”
Dejte LLM roli
Ve složitějším promptu oddělujte nesouvisející části, například speciálními symboly (####)
Důležité termíny/slova a fráze opakujte v promptu víckrát.
.
Přijďte na naše akce a workshopy:
.
A to je vše.
Děkuji, že čtete. Jestli chcete newsletter podpořit (a číst i starší vydání v archivu), staňte se platícím předplatitelem Jednoho procenta.