Дата публікації: 01/10/2025, 7:00 GMT+2
Невелике дослідження виявило, що інструменти штучного інтелекту (ШІ) демонструють гірший результат за медиків у пріоритетизації пацієнтів у відділеннях невідкладної допомоги. Отримані результати свідчать, що, незважаючи на значний потенціал ШІ у сфері медицини, медичний персонал не повинен передавати на розсуд автоматизованих систем рішення, які стосуються лікування пацієнтів із загрозою для життя.
Д-р Рената Юкневічене, дослідниця Вільнюського університету (Литва) та одна з авторок дослідження, зазначила: «З огляду на стрімкий розвиток інструментів ШІ на кшталт ChatGPT, наша мета полягала у дослідженні можливості підтримки процесу сортування пацієнтів, підвищення ефективності роботи та зниження навантаження на персонал у відділеннях невідкладної допомоги».
Дослідження, яке наразі не пройшло рецензування та не опубліковане у фаховому медичному журналі, було представлено в рамках Європейського конгресу з медицини невідкладних станів.
Хід експерименту полягав у тому, що шість лікарів невідкладної допомоги та 44 медсестри аналізували випадкові клінічні випадки, відібрані з онлайн-медичної бази, і здійснювали їх класифікацію за ступенем терміновості за п’ятибальною шкалою. Паралельно AI-бот ChatGPT опрацьовував ці ж випадки.
Результати продемонстрували:
1. Загальна точність ChatGPT становила 50,4%, тоді як серед медсестер – 65,5%, а серед лікарів – 70,6%.
2. Чутливість системи — здатність правильно ідентифікувати справді термінові випадки — була на рівні 58,3% для ChatGPT, 73,8% для медсестер і 83% для лікарів.
3. Проте ШІ перевищив показники медсестер у ідентифікації найбільш критичних або загрозливих життю станів, демонструючи кращу точність і специфічність.
За словами Юкневічене, ці дані свідчать, що штучний інтелект «може більш стабільно допомагати у визначенні пріоритетних випадків і підтримувати новоспечених або менш досвідчених співробітників». Водночас, ChatGPT частіше, ніж люди, відносить випадки до категорії високої термінової необхідності, що підкреслює значущість «людського контролю» для запобігання неефективному використанню ресурсів.
Вчена наголосила: «Впровадження ШІ у лікарнях слід здійснювати обережно, акцентуючи увагу на підготовці персоналу до критичного осмислення рекомендацій ШІ».
Дослідження має обмеження, насамперед невелику вибірку та проведення у межах одного медичного закладу в Литві. Використаний у експерименті варіант ChatGPT не був спеціалізовано навчений для медичних завдань, тож вузькоспеціалізовані ШІ-системи могли б показати вищі результати.
Інші дослідження демонструють, що штучний інтелект має істотні переваги у сфері охорони здоров’я, серед яких:
– Вища точність діагностики складних медичних випадків.
– Прискорене і більш достовірне зчитування рентгенівських знімків.
– Можливість прогнозування майбутніх медичних проблем.
Водночас науковці застерігають, що надмірна довіра до ШІ може призвести до поступового зниження професійних навичок у медичних працівників.
Юкневічене та її команда планують подальші дослідження із застосуванням новіших моделей штучного інтелекту, більш масштабних груп пацієнтів і різноманітних сценаріїв, включно з навчанням медсестер та аналізом електрокардіограм (ЕКГ) для виявлення аномалій у роботі серця.
Поки що вона підкреслила: «ШІ не повинен заміняти клінічне судження, проте може виконувати функцію підтримки прийняття рішень у певних клінічних умовах та в перевантажених відділеннях невідкладної допомоги».