Digitální avatarka vrátila hlas ochrnuté ženě

30. 8. 2023 – 22:41 | Technologie | Ladislav Loukota | Diskuze:

Digitální avatarka vrátila hlas ochrnuté ženě
Ochrnutá žena mluví pomocí avatarky. | zdroj: Profimedia

Nová technologie vrátila ochrnuté ženě schopnost mluvit pomocí systému kombinujícího neurovědu s umělou inteligencí, který ze signálů v mozku vytvořil digitální kopii jejího hlasu.

„Co si myslíš o mém umělém hlase?“ ptá se žena na obrazovce počítače a její zelené oči se mírně rozšiřují.

Na jejím obraze je patrné, že ho zpracoval počítač. Chvílemi se zastavuje. Je to však památný okamžik.

Tvář a její hlas je digitálním avatarem (avatarkou) ženy, která před 18 lety ztratila schopnost mluvit po mrtvici. Nyní, jako součást experimentu, který zahrnuje mozkový implantát a algoritmy umělé inteligence, může mluvit replikací vlastního hlasu, a dokonce prostřednictvím avatarky předávat ostatním lidem omezený rozsah výrazů obličeje.

Když umělá inteligence čte myšlenky…

Kombinace mozkového čipu a několika umělých inteligencí pomocí čtení mysli „rozmluvila“ Američanku Ann Johnsonovou, která ochrnula a ztratila schopnost mluvit, když v roce 2005 ve svých třiceti letech prodělala mozkovou mrtvici.

Není to poprvé, co věda dokázala „číst myšlenky“. Už posledních několik let se zlepšuje schopnost techniky rozpoznávat a tlumočit mozkové signály do řeči počítačů.

Lidé upoutaní na lůžko tak v experimentálních studiích dokázali znovu ovládat kurzor počítačové myši (zde) nebo psát jednotlivá slova (tady).

Strojová učení se dají vycvičit tak, aby v chaosu mozkových signálů uměla odhalit skrytý řád. V tomto případě řád související s výrazy obličeje a řečí.

„Naším cílem je obnovit plnohodnotný, ztělesněný způsob komunikace. To je pro nás skutečně nejpřirozenější způsob, jak mluvit s ostatními,“ říká o technologii, kterou vědci vyzkoušeli na bývalé učitelce Johnsonové doktor Edward Chang, vedoucí katedry neurologické chirurgie na Kalifornské univerzitě v San Francisku, který experiment popisuje univerzitním časopise.

Zevrubnou zprávu o jeho výsledcích podali vědci v odborném magazínu Nature.

Několik týdnů tréninku

Ještě významnější, než přetlumočení řeči těla tentokrát byla rychlost systému. V minulých letech bylo úspěchem, pokud pacient dokázal vytvořit několik slov za hodinu. Nynější zařízení dokáže mozkové signály převést do textu rychlostí téměř 80 slov za minutu.

Stejně jako u jiných obdobných experimentů v minulosti, také nyní vědci spoléhali na implantovaný čip zaznamenávající mozkovou aktivitu. Výzkumníci implantovali do mozku ženy obdélník tenký jako papír s 253 elektrodami. 

Elektrody na čipu zachytily mozkové signály, které by u zdravého člověka směřovaly do svalů jazyka, čelisti a hrtanu a také do obličeje. Kabel, zapojený do portu připevněného na hlavě pacientky, propojil elektrody s počítačem. Algoritmus umělé inteligence poté dokázal signály přeříkávat.

Trénink umělé inteligence zabral několik týdnů. Mozkové signály jsou na tom podobně jako otisky prstů, pro každého člověka jsou jedinečné. Nelze tedy vytrénovat jeden univerzální algoritmus, který by sloužil pro všechny pacienty.

Pro vytrénování strojového učení proto pacientka musela v duchu opakovat různé fráze z konverzačního slovníku o 1 024 slovech, dokud si počítač její mozkovou aktivitu se slovy nespojil.

Půjde to i bez čipu?

Zmíněný systém je pokrokový i v tom, že dekóduje slova z fonémů. To jsou dílčí jednotky řeči, které tvoří mluvená slova stejným způsobem, jako písmena tvoří psaná slova.

Například v češtině se slova „les“ a „los“ odlišují od sebe fonémy „e“ a „o“ – jednoduchý rozdíl jednoho zvuku tak mění význam slova. Tento fonetický přístup se ukázal být účinnější, než rozeznávání výsledných slov jako u dřívějších experimentů. Počítač díky němu dokázal dekódovat slova až třikrát rychleji.

Avatarku vědci rozpohybovali pomocí softwaru, který simuluje a animuje pohyby svalů obličeje. Program, vyvinutý společností Speech Graphics, řídilo jiné strojové učení než to, které bylo použito pro hlas.

Propojení strojových učení umožnilo mozkové signály využít k mimice digitální postavy tak, aby se čelist i rty avatara otevíraly v souladu s řečí. Avatarka také vytvářela výrazy obličeje znázorňující štěstí, smutek nebo překvapení.

„Nahrazujeme spojení mezi mozkem a hlasivkami, které přerušila mrtvice. Když pacientka poprvé použila náš systém, aby v tandemu promluvila a pohybovala tváří avatara, věděl jsem, že to bude něco, co bude mít dopad,“ cituje magazín Kalifornské výzkumníka Kaylo Littlejohna, postgraduálního studenta na Univerzitě v Berkeley.

Vědci už oznámili, že se v budoucnu zaměří na verzi systému, který by dokázal totéž i bez mozkového čipu.

Zdroje:

Nejnovější články