Umělé inteligence jsou nám bližší, než si myslíme. Jazyk se učí jako lidé

5. 6. 2023 – 20:11 | Technologie | Ladislav Loukota |Diskuze:

Mozek s vytištěnými obvody symbolizující sbližování umělé inteligence s inteligencí lidskou.zdroj: Profimedia

Vědci objevili pozoruhodné podobnosti ve způsobech, jakými si lidé a modely strojového učení osvojují jazykové dovednosti.

Zdokonalující se umělá inteligence může vrhnout nové světlo na naší biologii. Ukazuje se, že neuronové sítě v našem mozku se mohou učit podobně jako umělé neuronové sítě tvořící jádro umělé inteligence.

Naznačuje to studie týmu výpočetního lingvisty Gašpera Beguše z Kalifornské univerzity v Berkeley zveřejněná v magazínu Scientific Reports.

Podobnost čistě náhodná?

Ve studii výzkumníci srovnávali mozkové vlny lidí poslouchajících zvuk se signálem, který vytváří neuronová síť analyzující stejný zvuk. A výsledky byly překvapivě podobné.

„Podle našich poznatků jsou pozorované reakce na stejný podnět nejpodobnějšími dosud zaznamenanými signály mozku a umělých neuronových sítí,“ píší vědci ve studii.

Vědci během experimentu přehrávali čtrnácti anglicky mluvícím a patnácti španělsky mluvícím jednotlivcům ve dvou osmiminutových blocích opakovaně jedinou slabiku - „bah“. Během přehrávání zaznamenávali u každého posluchače výkyvy elektrické aktivity neuronů v mozkovém kmeni – v části mozku, kde se zvuky zpracovávají jako první.

Stejnou slabiku „bah“ potom výzkumníci přiváděli do dvou různých sad neuronových sítí. Jedna byla trénovaná na anglické zvuky, druhá na španělské.

„Ze studie je patrné, že obecné neuronové sítě, ačkoli nemají vyvinuté žádné specializace pro řeč nebo jiné zvuky, vykazují shodu s lidským neuronovým kódováním.“ Gary Lupyan, psycholog z Wisconsinské univerzity

Potom vědecký tým zaznamenával aktivitu neuronové sítě při zpracování zvuku. Při tom se výzkumníci zaměřili na umělé neurony ve vrstvě sítě, kde jsou zvuky před zpracováním analyzovány. Tato vrstva zhruba odpovídá našemu mozkovému kmeni. A právě signály z ní odpovídaly lidským mozkovým vlnám.

Jak to funguje

Výzkumníci zvolili druh architektury neuronové sítě známé jako generativní adverzní síť (GAN), která byla původně vytvořena v roce 2014 pro vytváření obrázků. GAN se skládá ze dvou neuronových sítí –diskriminátoru a generátoru. Generátor vytváří vzorek, kterým může být obrázek nebo zvuk. Diskriminátor určí, jak blízko je tréninkovému vzorku, a nabídne zpětnou vazbu, což má za následek další pokus generátoru. Tento postup se opakuje.

Ve zmíněné studii byl diskriminátor zpočátku trénován na kolekci anglických nebo španělských zvuků. Poté musel generátor, který tyto zvuky nikdy neslyšel, najít způsob, jak je vytvořit.

Zpočátku stroj vytvářel náhodné zvuky, ale po zhruba 40 000 interakcích s diskriminátorem se zlepšil a nakonec vyluzoval správné zvuky. V důsledku tréninku se diskriminátor také zlepšil v rozlišování mezi skutečnými a generovanými zvuky.

V okamžiku, kdy byl diskriminátor plně vycvičen, mu výzkumníci přehráli zvuky „bah“. Tým měřil kolísání průměrné úrovně aktivity umělých neuronů diskriminátoru, které vytvářely signál tolik podobný lidským mozkovým vlnám.

„Ze studie je patrné, že obecné sítě, ačkoli nemají žádné vyvinuté specializace pro řeč nebo jiné zvuky, vykazují shodu s lidským neuronovým kódováním,“ říká v časopise Quanta recenzent studie Gary Lupyan, psycholog z Wisconsinské univerzity v Madisonu.

Srovnání způsobů aktivity člověka a stroje naznačuje, že oba systémy vykonávají podobné činnosti. U lidí to ale nemusí být uvnitř mozku, ale v komunikaci několika jedinců.

‚Bah‘, anebo ‚pah‘

„Tato studie jasně naznačuje, že přirozené a umělé sítě se učí jazyk podobně,“ cituje Quanta Vsevoloda Kapatsinského, lingvistu z Oregonské univerzity.

„Podobnost mezi úrovní aktivity člověka a stroje ukazuje, že zatímco mluva rodičů utváří zvukovou odezvu kojenců, zpětná vazba od diskriminační sítě modeluje zvuky generátorové sítě,“ upozorňuje Kapatsinski.

Experiment odhalil další podobnost mezi lidmi a stroji. Mozkové vlny ukázaly, že anglicky a španělsky mluvící účastníci slyšeli zvuk „bah“ odlišně. Španělsky mluvící jedinci ho vnímali spíš jako „pah“. Také signály strojového učení ukázaly, že anglicky trénovaná síť zpracovávala zvuky odlišně než síť trénovaná španělsky.

Lingvista Noam Chomsky v padesátých letech minulého století formuloval hypotézu, podle níž se lidé rodí s vrozenou a jedinečnou schopností rozumět jazyku. Tvrdil, že tato schopnost je v lidském mozku pevně zakódována. Zmíněná studie naznačuje pravý opak.

„Tato studie poskytuje indicie proti názoru, že řeč vyžaduje speciální stavěný hardware a další charakteristické vlastnosti,“ podotýká jazykový expert Kapatsinski.

Tagy:

Zdroje:

Scientific Reports, Quanta