Umělá inteligence (AI) a čtení myšlenek pomocí dekodéru a magnetické rezonance. Tak to je možné nejnovější využití umělé inteligence, která by mohla pomáhat lidem, kteří přišli o schopnost mluvit. Vědci na Texaské univerzitě vyvinuli dekodér, který umožní takzvaně neinvazivní čtení myšlenek. Zařízení fungující pomocí umělé inteligence dokáže podle deníku The Guardian převádět myšlenky na text pomocí snímku mozku z funkční magnetické rezonance (fMRI).
Analýza obrovského množství dat a hledání souvislostí a vzorců v nich, to je ideální úkol pro systémy strojového učení s umělou inteligencí. Tudíž nepřekvapuje, že umělá inteligence našla uplatnění i v neurovědě při čtení myšlenek. Zmiňovaný dekodér byl schopen rekonstruovat řeč s neuvěřitelnou přesností pouze pomocí snímků. Účastníci studie přitom poslouchali příběh, nebo si jej dokonce jen tiše představovali. Podobná zařízení do této chvíle vyžadovala zavedení chirurgického implantátu, nový způsob je však neinvazivní a přináší naději, že vzniknou nové metody, jak vrátit řeč lidem, kteří o schopnost mluvit přišli, například v důsledku mrtvice či amyotrofické laterální sklerózy (ALS).
Neurolog šokován přesností zařízení
Neurolog, který studii vedl, Alexander Huth, poznamenal, že jej přesnost zařízení velmi překvapila. „Docela nás šokovalo, že to tak dobře funguje. Pracuji na tom 15 let, takže bylo šokující a vzrušující, když to konečně začalo fungovat,“ uvedl. Tento úspěch překonává zásadní omezení fMRI, které spočívá v tom, že tato technika sice dokáže zachycovat mozkovou aktivitu v konkrétním místě, a to s neuvěřitelně vysokým rozlišením, avšak má časovou prodlevu, která znemožňuje sledování mozkové aktivity v reálném čase. Zpoždění vzniká proto, že fMRI mapuje neuronální aktivitu nepřímo v návaznosti na změny v prokrvení. „Je to hlučný a pomalý zástupce nervové aktivity,“ řekl Huth.
Toto omezení ztěžuje schopnost interpretovat mozkovou aktivitu v návaznosti na přirozenou řeč, protože poskytuje „změť informací“ rozloženou do několika sekund. Rozvoj takzvaných velkých jazykových modelů, tedy takových, na kterých je založen například chatbot ChatGPT společnosti OpenAI, však otevírá novou cestu. Velké jazykové modely jsou schopny číselně reprezentovat sémantický význam řeči, což vědcům umožnilo sledovat, které vzorce neuronální aktivity odpovídají řetězcům slov s určitým významem, místo toho, aby se pokoušeli číst aktivitu slovo po slově.
Postup byl náročný, každý ze tří dobrovolníků musel strávit 16 hodin v přístroji magnetické rezonance a poslouchat podcasty. Dekodér se naučil přiřazovat k mozkové aktivitě význam pomocí velkého jazykového modelu GPT-1, předchůdce modelu ChatGPT. Později byli stejní účastníci snímáni při poslechu jiného příběhu nebo při představě, že vyprávějí příběh, a dekodér byl použit k vytvoření textu pouze na základě mozkové aktivity. Přibližně v polovině případů se text shodoval, někdy velmi přesně, se zamýšleným významem původních slov.
Systém zachycuje podstatu sdělení
„Náš systém pracuje na úrovni myšlenek, sémantiky, významu,“ řekl Huth s tím, že zařízení zachycuje nikoliv přesná slova, ale podstatu sdělení. Kupříkladu, když účastník slyšel větu „Ještě nemám řidičský průkaz“, dekodér to přeložil jako „Ještě se ani nezačala učit řídit“. Jindy naopak slova „Nevěděla jsem, zda mám křičet, brečet, nebo utéct. Místo toho jsem řekla: ‚Nech mě být!‘“ přeložil jako „Začala křičet a plakat a pak jen řekla: ‚Říkala jsem ti, abys mě nechal na pokoji‘“.
Účastníci studie také sledovali krátká videa a zařízení je poté na základě jejich mozkové aktivity popsalo. V některých případech se stroj spletl, potíže má zejména s osobními zájmeny. Dekodér byl rovněž personalizovaný, takže měl nesrozumitelný výstup při použití na jiném člověku. Účastníci také mohli systém obelhat tím, že si představovali zvířata či jiný příběh.
Napsat komentář