OpenAI spouští sérii Strawberry, má přiblížit AI schopnostem lidí

Americká společnost OpenAI, která stojí za jazykovým modelem ChatGPT, oficiálně spustila produktovou sérii dosud známou pod interním označením Strawberry (jahoda). O projektu, který byl zpočátku neveřejný, už dříve informovala agentura Reuters. Cílem autorů je, aby uvažování a argumentace systémů umělé inteligence (AI) překonaly dosavadní limity a přiblížily se lidským schopnostem.

Zatímco Strawbery bylo dosavadní interní označení, oficiálně bude OpenAI nové modely nabízet pod názvy o1 a o1-mini. Model o1 je od čtvrtka k dispozici v aplikaci ChatGPT i jejím rozhraní pro programátory.

Výzkumný pracovník OpenAI Noam Brown na síti X potvrdil, že nová produktová série je totožná s projektem Strawberry. „Prostě jsme vybrali náhodné slovo. Pokud víme, byla to naprostá náhoda,“ napsal.

Believe it or not, the name Strawberry does not come from the “How many r’s are in strawberry” meme. We just chose a random word. As far as we know it was a complete coincidence.
— Noam Brown (@polynoamial) September 12, 2024

Společnost OpenAI uvádí, že nový model o1 dosáhl v kvalifikační zkoušce pro mezinárodní matematickou olympiádu úspěšnosti 83 %, zatímco úspěšnost dosavadního nejpokročilejšího modelu GPT-4o činila jen 13 %. Model se také podle OpenAI výrazně zlepšil v soutěžních otázkách z programování a v řešení přírodovědných problémů překonal úspěšnost doktorandů.

Podle Browna se modelům podařilo zlepšit skóre v testech díky technice známé jako „řetězec myšlenek“ (chain of thought), která spočívá v rozdělení složitých problémů na menší logické kroky.

Reuters se v květnu dostal k nedatovanému internímu dokumentu, podle nějž na projektu Strawberry v OpenAI pracovalo několik týmů. Cílem mělo být umožnit umělé inteligenci nejen generovat odpovědi na dotazy, ale plánovat dostatečně dopředu, aby se mohla nezávisle a spolehlivě pohybovat po internetu a provádět něco, co OpenAI označuje za „hloubkový výzkum“.

Řešení jednoduchých logických problémů

Takzvané velké jazykové modely (LLM) umějí shrnout hutné a náročné texty a sestavit elegantní jazykové útvary mnohem rychleji než člověk. Dosud ale zaostávaly v řešení jednoduchých logických problémů, které lidé řeší intuitivně, například rozpoznávání logických chyb nebo hraní piškvorek.

V tomto případě se modely často uchylují k takzvaným halucinacím. Halucinace jsou označení vygenerované odpovědi, která obsahuje nepravdivé nebo zavádějící informace. Může jít rovněž o výsledek nedostatečných, neaktuálních nebo zkreslených trénovacích dat.

Recepty od AI – Mohou pomoci restauracím navařit či jim zavařit?

Restaurace, bufet, jídlo, vaření, stravování (Ilustrační foto)

Strawberry má být podle zdroje agentury Reuters klíčovou součástí plánu OpenAI problémy překonat. Dokument, ke kterému se agentura v květnu dostala, potom sice popisuje, čeho má projekt dosáhnout, ale ne jak.

Součástí nové technologie má být podle dřívějších interních informací rovněž takzvaný „posttrénink“ generativních modelů AI. To znamená jejich přizpůsobení, aby se mohly dodatečně zdokonalit k výkonu specifických úloh už po základním tréninku na spoustě obecných dat.

Čtenáři nedůvěřují využívání AI ve zpravodajství

AN
Zdroje a obrázky: OpenAI; Síť X; Pixabay

OpenAI spouští sérii Strawberry, má přiblížit AI schopnostem lidí

Řešení jednoduchých logických problémů

Komentáře

Napsat komentář Zrušit odpověď na komentář