Digitální demence. Umělá inteligence vykazuje známky kognitivního úpadku

19. 12. 2024 – 15:35 | Technologie | Radek Chlup | Diskuze:

Digitální demence. Umělá inteligence vykazuje známky kognitivního úpadku
Jazykové modely se stále více podobají lidskému mozku | zdroj: Pixabay

Jazykové modely trpí podobnými problémy jako lidé ve stáří. 

Umělé inteligence (AI) se stále více podobají lidskému mozku, mají tedy i podobné „stařecké problémy“. Téměř všechny velké jazykové modely vykazují známky mírné kognitivní poruchy, zjistila studie publikovaná v odborném časopisu BMJ.

Vědci přistupovali k chatbotům jako ke starším lidským pacientům a hodnotili jejich kognitivní schopnosti s pomocí testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA), který se používá k odhalování demence hodnocením schopností jako pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další prostřednictvím drobných úkolů.

Experti dávali chatbotům stejné pokyny jako lidem, bodování se drželo oficiálních pokynů a výsledky vyhodnocoval neurolog, shrnul server SciTechDaily.

Nejlepšího skóre dosáhl jazykový model ChatGPT 4o vyvinutý start-upem Open AI (26 bodů), následovaly modely ChatGPT 4 a Claude 3.5 „Sonnet“ (25 bodů) – Cloude vyvinula společnost Anthropic – a nejnižší skóre obdržel Gemini 1.0 od společnosti Google (16 bodů). Maximální skóre bylo 30 bodů a za běžné skóre se normálně považuje 26 bodů a více.

Lékaři o práci nepřijdou

Chatboti měli podle odborníků problémy s vizuálně-prostorovými dovednostmi a exekutivními úkoly, jako je například úloha vytváření stop (spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování ciferníku s konkrétním časem). Model Gemini přitom neuspěl ani ve zpožděném vybavování, což spočívalo v zapamatování si sekvencí pěti slov.

V čem se chatbotům dařilo, bylo pojmenovávání, pozornost, jazyk a abstrakce. Chatboti nicméně nedokázali projevit empatii a přesně interpretovat složité vizuální scény s výjimkou ChatGPT 4o, který uspěl v takzvané inkongruetntní fázi Stroopova testu využívajícího kombinace názvů barev a barevného písma k měření interference na reakční dobu.

Autoři práce sami uznávají obrovský rozdíl mezi lidským mozkem a velkými jazykovými modely, jako zvláštní však spatřují selhání všech jazykových modelů v úlohách, jež vyžadují vizuální abstrakci a exekutivní funkce. Umělá inteligence tedy nenahradí lidské lékaře, alespoň ne neurology, vyplývá z výzkumu. 

Jiná studie nedávno zjistila kanibalské chování AI. Chatboti se stále více „krmí“ vlastními daty obsahujícími chyby, což vede k jejich degeneraci.

Hloupne nám umělá inteligence před očima?

Zdroje:
BMJ, SciTechDaily

Nejnovější články