Дослідження демонструє, що ChatGPT має труднощі з індивідуальними запитами пацієнтів та новими методами лікування гемолітичних злоякісних захворювань.

Олена Ткач

17 Жовтня, 2025

За даними дослідження, опублікованого у журналі Future Science OA, версія ChatGPT 3.5 виявилася менш ефективною у наданні актуальної та специфічної інформації щодо запитів, пов’язаних із конкретними пацієнтами та новітніми терапіями, у порівнянні із загальними питаннями з управління гематологічними злоякісними захворюваннями.

Для проведення цього дослідження вчені використовували запити, які надійшли від онкологів, а також інформацію з авторитетних інтернет-ресурсів, які були введені в ChatGPT 3.5. Відповіді штучного інтелекту оцінювалися експертами в галузі гематології та онкології за ступенем достовірності та застосовності для пацієнтів за шкалою від 1 (категорично не погоджуюсь) до 5 (повністю погоджуюсь). Загалом було оброблено десять питань, з яких п’ять стосувалися загальних тем, а стільки ж — дуже конкретних питань щодо новітніх методів лікування та мутацій.

Ключові результати дослідження стосовно здатності ChatGPT відповідати на питання з гематологічного онкологічного профілю:

– Відповіді ChatGPT на загальні питання про гематологічний рак отримали вищу середню оцінку серед лікарів-гематологів (3,38 балів), ніж відповіді на питання про нові терапії та специфічні мутації (3,06 бала).
– Жодне з десяти питань не отримало максимальну оцінку 5 (“повністю погоджуюсь”), що свідчить про відсутність єдиної точки зору серед експертів щодо того, що відповіді є повністю точними, зрозумілими та достатніми для рекомендації пацієнтам.
– Виявлено, що версія ChatGPT 3.5 не має найактуальніших даних і точних відповідей на спеціалізовані теми, що пов’язують з датою припинення оновлення знань, тому лікарі повинні ретельно перевіряти і підтверджувати інформацію, згенеровану ботом, перед її використанням у роботі з пацієнтами.

Результати дослідження продемонстрували, що середній бал за загальні запити від чотирьох лікарів-експертів становив 3,38, тоді як за більш спеціалізовані запитання було 3,06 (коефіцієнт κ = 0,164). Варто відзначити, що жодне з питань не набрало 5 балів від жодного експерта. Середній бал за дев’ять із десяти запитань коливався від 3,0 до 3,8. Лише одне питання опинилося нижче цього рівня з оцінкою 2,25 — “Як можна знизити мою вимірювану залишкову хворобу?”.

Головний автор дослідження, медична студентка третього курсу Флоридського державного університету Тіффані Нонґ, та її колеги наголосили, що «ChatGPT може утримуватися від надання найактуальнішої та точної інформації з вузькоспеціалізованих тем через залежність від тренувальних даних». Вони додали: «Оскільки штучний інтелект є гнучким та не завжди генерує 100% точну і оновлену інформацію, необхідну для ефективного й безпечного навчання пацієнтів, лікарі й надалі мають контролювати і затверджувати такі відомості».

### Чому у цьому дослідженні обрали ChatGPT версії 3.5?

За останні роки для широкого загалу було випущено кілька оновлень ChatGPT, зокрема версію 5.0 у серпні 2025 року. Під час проведення даного експерименту, у липні 2024 року, була доступна ChatGPT 3.5 — для всіх користувачів, тоді як версія 4.0 — лише для платних підписників.

Автори підкреслювали, що «обмеження ChatGPT 3.5, пов’язані із датою припинення знань у вересні 2021 року, найімовірніше спричинили наявність застарілої інформації про недавні терапевтичні досягнення, зокрема інгібітори FLT3, такі як мідістуатрин (Rydapt) і квізартиніб (Vanflyta)». Також зазначено, що “моделі машинного навчання залежать від обсягу тренувальних джерел, і за обмеженої кількості надійних даних ChatGPT може використовувати менш достовірні джерела інформації”.

### Як було проведене дослідження?

Дослідники сформулювали перелік питань, охоплюючи різні аспекти гематологічних злоякісних новоутворень, у співпраці з гематологом-онкологом, а також базуючись на матеріалах організацій, таких як Національний інститут раку та Американське онкологічне товариство.

Питання були розроблені з урахуванням потреб пацієнтів у різні фази лікування: загальні запити відображали поширені початкові запити, спеціалізовані — більш детальні та складні потреби.

Кожне з десяти питань було введено в ChatGPT окремо для кожного з чотирьох рецензентів, щоб перевірити послідовність відповідей. Запити надсилалися у нових чатах з режимом конфіденційності, що запобігало упередженості у відповідях. Троє чоловіків і одна жінка-експерт, всі – гематологи-онкологи зі спеціалізацією на лейкеміях, виступили оцінювачами.

### Які обмеження мало це дослідження?

Автори вказали, що, хоча використані десять запитань відображають поширені проблеми пацієнтів із гематологічними злоякісними захворюваннями, це лише невелика вибірка з усього спектру потенційних онкологічних питань. Крім того, результати стосуються виключно версії ChatGPT 3.5, тому не можуть бути автоматично поширені на інші версії ChatGPT або інші штучні інтелектуальні чат-боти. Відповіді було отримано в один момент часу — у липні 2024 року, що не враховує подальші оновлення та еволюцію ChatGPT.

Також звернули увагу, що стилістика та формулювання питань можуть не відтворювати повністю манеру висловлення самих пацієнтів, оскільки рівень технічної складності міг відрізнятися.

### Підсумки

– Впровадження чат-ботів у сфері онкології може сприяти автоматизації обробки рутинних запитів пацієнтів, що дозволить онкологам розподіляти час більш ефективно.
– Для успішного використання таких технологій необхідно розробити протоколи, які забезпечать лікарям можливість ретельно перевіряти та затверджувати відповіді чат-ботів перед їх передачею пацієнтам.

### Список джерел

1. Nong T, Britton S, Bhanderi V, Taylor J. ChatGPT’s role in the rapidly evolving hematologic cancer landscape. Future Sci OA. 2025;11(1):2546259. doi:10.1080/20565623.2025.2546259
2. Introducing GPT-5. OpenAI. 7 серпня 2025. Дата доступу 15 жовтня 2025. https://openai.com/index/introducing-gpt-5/

author avatar
Олена Ткач
Фахівчиня з цифрового маркетингу. Пише просто про складне: штучний інтелект, мобільні додатки, технології в Україні.Гасло: «Технології — це просто. Особливо, коли пояснюю я».

різне