Umělá inteligence překonala lékaře v diagnostice urgentních případů. Co to znamená pro budoucnost pohotovostní medicíny?
2. 5. 2026 – 9:24 | Člověk | Miroslav Krajča |Diskuze:
Urgentní příjem je jedním z nejnáročnějších klinických prostředí, jaká existují: lékaři rozhodují pod časovým tlakem, s neúplnými informacemi, v přeplněném prostředí o tom, kdo potřebuje péči okamžitě a kdo může čekat. Triáž — třídění pacientů podle naléhavosti stavu — je prvním a kriticky důležitým krokem celého procesu. Nová generace AI systémů trénovaná na statisících urgentních případů nyní v klíčových parametrech překonává tradiční skórovací systémy i výkon juniorních lékařů. Výsledky otevírají zásadní otázku: jakou roli by měla umělá inteligence v urgentní medicíně hrát?
Série výzkumů publikovaných v průběhu posledních dvou let maluje konzistentní obraz. Modely umělé inteligence, trénované na rozsáhlých klinických datech a schopné zpracovat symptomy, vitální funkce a anamnézu současně, dosahují v triáži a diagnostice urgentních stavů výsledků, které kladou do stínu jak konvenční skórovací systémy, tak výkon méně zkušených klinických pracovníků.
NEJM AI: 174 000 urgentních příjmů a o třetinu kratší čekání
Jedním z nejrozsáhlejších dosud publikovaných výzkumů v tomto poli je studie publikovaná v NEJM AI, která sledovala implementaci AI-asistovaného triážního nástroje na třech pracovištích urgentní medicíny v USA celkem při 174 648 návštěvách. Výsledky jsou konkrétní: identifikace pacientů vyžadujících intenzivní péči vzrostla z 78,8 na 83,1 procenta. Střední doba od příjmu do zahájení péče v příslušné zóně klesla z 12 na 8 minut — tedy o 33 procent. Jde o rozdíl, který v prostředí urgentního příjmu může rozhodovat o přežití.
Tento výsledek byl dosažen prostřednictvím AI jako nástroje klinické podpory rozhodování — tedy ne jako náhrady lékaře, ale jako systému, který lékaři a sestře v reálném čase předkládá doporučení na základě analýzy příznakového profilu pacienta.
GPT-4 vs. rezidenti: retrospektivní audit v Mnichově
Odlišný přístup zvolili výzkumníci LMU University Hospital v Mnichově ve studii publikované v Journal of Medical Internet Research v červenci 2024. Zpětně vyhodnotili 100 skutečných urgentních případů z interního příjmu — kardiovaskulárních, endokrinologických, gastrointestinálních a infekčních — a srovnali diagnostické závěry rezidentů urgentní medicíny s výsledky GPT-3.5 a GPT-4, testovanými na stejných klinických prezentacích.
GPT-4 statisticky významně překonal GPT-3.5 v diagnostické přesnosti (p < 0,001). Klíčovým výsledkem byla přesnost GPT-4 ve srovnání se závěrečnými propouštěcími diagnózami — referenčním standardem — ve srovnání s diagnózami rezidentů. AI model dosáhl vyšší přesnosti než primárně ošetřující lékaři. Autoři přitom zdůrazňují kontextuální omezení: model pracoval s písemnou anamnézou, bez fyzikálního vyšetření, přímé komunikace s pacientem nebo klinické intuice.
Karolinska a KTH: triáž za 3,7 minuty s citlivostí 84,8 procenta
Dalším výzkumným uzlem je Skandinávie. Tým z KTH Royal Institute of Technology a Karolinska Institute vyvinul a validoval AI triážní nástroj na téměř 3 000 skutečných urgentních případů ze tří švédských nemocnic. Výsledky studie ukázaly senzitivitu 84,8 procenta a specificitu 76,1 procenta v identifikaci akutních stavů vyžadujících okamžitou péči — oproti výkonu juniorních lékařů, jejichž senzitivita v srovnatelném testování dosahovala přibližně 66 procent. Střední čas do triážního rozhodnutí byl 3,7 minuty u AI oproti 6,1 minuty u lidských zdravotníků. V zaměřené analýze bolestí na hrudi dosáhl model hodnoty plochy pod ROC křivkou 0,91 při detekci infarktu myokardu — výsledek výrazně převyšující klinický výkon.
Kde AI selhává a proč to záleží
Vědecký obraz není jednosměrný. Závěry z kongresu Evropské společnosti urgentní medicíny (EUSEM) 2025 přinesly varování z opačné strany. Litevský tým testoval ChatGPT verze 3.5 na 44 sestrách, 6 lékařích a AI modelu při třídění urgentních případů podle Manchester Triage System. Celková přesnost AI dosáhla 50,4 procenta — oproti 65,5 procenta u sester a 70,6 procenta u lékařů. Senzitivita AI byla 58,3 procenta, u lékařů 83,0 procenta. AI si vedla lépe jen v jedné oblasti: v nejvyšší kategorii urgentnosti dosáhla vyšší přesnosti než sestry.
Autorka studie doktorka Jukneviciene výsledky uzavřela přesně: „AI by neměla nahradit klinický úsudek, ale mohla by sloužit jako nástroj podpory rozhodování ve specifických klinických kontextech a v přetížených urgentních přijmech." Pokud je poučení z tohoto srovnání jedno, pak právě toto: kvalita AI modelu záleží dramaticky na jeho architektuře, trénovacích datech a způsobu implementace. Obecné chatboty nejsou totéž co klinicky validované systémy.
Stanford a Harvard: obraz z roku 2026
Zpráva Stanford-Harvard State of Clinical AI z ledna 2026 zmapovala stav oboru komplexně. V kontextu diagnostického výkonu zaznamenala, že v roce 2025 publikované studie velké jazykové modely opakovaně srovnávají nebo překonávají lékaře v diagnostickém uvažování a plánování léčby při hodnocení fixních klinických případů. V jedné ze studií AI systém analyzující komplexní urgentní případy vybíral správné diagnózy ve specifických rozhodovacích bodech častěji než ošetřující lékaři. Zpráva zároveň upozorňuje na klíčový rozdíl mezi výzkumným nastavením a reálnou klinickou praxí: v prvním prostředí AI pracuje s čistými, standardizovanými prezentacemi, v druhém musí čelit nekompletním datům, komunikační nejistotě a systémovým komplikacím.
Proč triáž není jen otázka přesnosti
Debata o AI v urgentní medicíně se neodehrává jen v rovině diagnostické přesnosti. Je to otázka systematické nerovnosti, odpovědnosti a integrity klinického procesu. Triáž je v mnoha zemích prostředím, kde se chronicky projevují rasové a socioekonomické disproporce v péči — pacienti z minorit jsou systematicky podhodnocováni v naléhavosti svého stavu. AI systémy, trénované na historických datech, mohou tyto disproporce reprodukovat nebo zesilovat, pokud nejsou aktivně auditovány.
Zároveň algoritmická předpojatost — bias — v triáži může mít přímé letální důsledky. Výzkum v tomto ohledu teprve začíná systematicky mapovat, jak konkrétní modely fungují napříč demografickými skupinami.
Závěr, ke kterému se sbíhá vědecká komunita, je pragmatický: AI v urgentní triáži a diagnostice je reálně funkční technologie, která v konkrétních aplikacích překonává tradiční metody i méně zkušené lékaře. Není náhradou klinického úsudku — je jeho zesilovačem. Její implementace ale vyžaduje přísnou klinickou validaci, průběžný audit a jasné vymezení odpovědnosti. Urgentní medicína patří k oblastem, kde tyto podmínky nejsou akademickou formalitou, ale otázkou přežití.