Americká společnost OpenAI, která stojí za jazykovým modelem ChatGPT, oficiálně spustila produktovou sérii dosud známou pod interním označením Strawberry (jahoda). O projektu, který byl zpočátku neveřejný, už dříve informovala agentura Reuters. Cílem autorů je, aby uvažování a argumentace systémů umělé inteligence (AI) překonaly dosavadní limity a přiblížily se lidským schopnostem.
Zatímco Strawbery bylo dosavadní interní označení, oficiálně bude OpenAI nové modely nabízet pod názvy o1 a o1-mini. Model o1 je od čtvrtka k dispozici v aplikaci ChatGPT i jejím rozhraní pro programátory.
Výzkumný pracovník OpenAI Noam Brown na síti X potvrdil, že nová produktová série je totožná s projektem Strawberry. „Prostě jsme vybrali náhodné slovo. Pokud víme, byla to naprostá náhoda,“ napsal.
Společnost OpenAI uvádí, že nový model o1 dosáhl v kvalifikační zkoušce pro mezinárodní matematickou olympiádu úspěšnosti 83 %, zatímco úspěšnost dosavadního nejpokročilejšího modelu GPT-4o činila jen 13 %. Model se také podle OpenAI výrazně zlepšil v soutěžních otázkách z programování a v řešení přírodovědných problémů překonal úspěšnost doktorandů.
Podle Browna se modelům podařilo zlepšit skóre v testech díky technice známé jako „řetězec myšlenek“ (chain of thought), která spočívá v rozdělení složitých problémů na menší logické kroky.
Reuters se v květnu dostal k nedatovanému internímu dokumentu, podle nějž na projektu Strawberry v OpenAI pracovalo několik týmů. Cílem mělo být umožnit umělé inteligenci nejen generovat odpovědi na dotazy, ale plánovat dostatečně dopředu, aby se mohla nezávisle a spolehlivě pohybovat po internetu a provádět něco, co OpenAI označuje za „hloubkový výzkum“.
Řešení jednoduchých logických problémů
Takzvané velké jazykové modely (LLM) umějí shrnout hutné a náročné texty a sestavit elegantní jazykové útvary mnohem rychleji než člověk. Dosud ale zaostávaly v řešení jednoduchých logických problémů, které lidé řeší intuitivně, například rozpoznávání logických chyb nebo hraní piškvorek.
V tomto případě se modely často uchylují k takzvaným halucinacím. Halucinace jsou označení vygenerované odpovědi, která obsahuje nepravdivé nebo zavádějící informace. Může jít rovněž o výsledek nedostatečných, neaktuálních nebo zkreslených trénovacích dat.
Strawberry má být podle zdroje agentury Reuters klíčovou součástí plánu OpenAI problémy překonat. Dokument, ke kterému se agentura v květnu dostala, potom sice popisuje, čeho má projekt dosáhnout, ale ne jak.
Součástí nové technologie má být podle dřívějších interních informací rovněž takzvaný „posttrénink“ generativních modelů AI. To znamená jejich přizpůsobení, aby se mohly dodatečně zdokonalit k výkonu specifických úloh už po základním tréninku na spoustě obecných dat.
Napsat komentář