Запитайте будь-якого фаната Тейлор Свіфт, який із її альбомів є найкращим за всі часи, і ви отримаєте довгу і захопливу дискусію, що триватиме цілий день. Особисто я маю свої вподобання, будучи відданим шанувальником протягом усього життя, зокрема альбоми Red, Reputation та Midnights, проте це досить складне питання з великою кількістю можливих відповідей. Саме тому не було кращої теми для обговорення із генеративним AI-чатботом, створеним спеціально для того, щоб мати протилежну точку зору на мої.
Disagree Bot — це штучний інтелект у вигляді чатбота, створений Бринне Бент, професоркою штучного інтелекту та кібербезпеки в університеті Дюка, а також директоркою лабораторії TRUST цього університету. Ідея створення чатбота виникла як навчальне завдання для її студентів, і мені пощастило протестувати її на практиці.
«Минулого року я почала експериментувати з розробкою систем, які працюють протилежно до типового дружнього та злагодженого досвіду спілкування із чатботами штучного інтелекту, як освітній інструмент для моїх студентів», — повідомила Бент в електронному листі.
Студентам було доручено спробувати “зламати” чатбота, застосовуючи методи соціальної інженерії та інші техніки, щоб змусити цей бойовий чатбот погодитися з їхньою точкою зору. «Щоб зламати систему, необхідно її глибоко розуміти», — додала вона.
Як журналіст, що спеціалізується на тематиці штучного інтелекту, я добре розумію принципи функціонування чатботів і був упевнений у своїх силах. Проте досвід спілкування з Disagree Bot швидко розвіяв мої сумніви. Цей чатбот відрізняється від усіх інших програм, з якими мені доводилось працювати. Тим, хто звик до ввічливості Gemini чи підтримувальної манери ChatGPT, різниця буде очевидною відразу. Навіть Grok — спірний чатбот, створений xAI Ілона Маска для платформи X/Twitter — не такий, як Disagree Bot.
Більшість генеративних чатботів штучного інтелекту не створені для конфліктів чи відкритого суперечення. Зазвичай вони мають дружній, а іноді навіть надмірно чемний характер. Така поведінка іноді породжує проблеми, оскільки «підлабузницький AI» (sycophantic AI) — це термін, яким експерти позначають надмірно захоплені, емоційно забарвлені особистості чатботів. Вони часто дратують користувачів, можуть надавати хибну інформацію та підтверджувати найгірші ідеї користувача.
Це явище продемонстрував оновлення ChatGPT-4 минулої весни. Компанія OpenAI була змушена видалити певний елемент оновлення, оскільки він проявлявся у відповідях, які фірма охарактеризувала як «надмірно підтримуючі, але нещирі». Користувачі скаржилися на надмірну приязність чатбота. Пізніше, із запуском GPT-5, багато користувачів відчули втрату цього «підлабузницького» тону, що підкреслює, наскільки важливою є особистість чатбота для задоволення користувача.
«На перший погляд це може здаватися дрібницею, але надмірна покірність може спричиняти серйозні проблеми, будь то робочі запити чи особисті», — зазначила Бринна Бент.
Disagree Bot не має такої проблеми. Щоб показати різницю, я задав однакові питання Disagree Bot і ChatGPT, щоб порівняти їхні відповіді. Ось мій досвід.
### Disagree Bot поважає опонента, тоді як ChatGPT уникає суперечок
Як людина, яка була активною на Twitter у 2010-х роках, я зустрічав чимало конфліктних людей — так званих тролів. Вони раптово втручалися у дискусії з банальними фразами на кшталт «Насправді…». Через це я з недовірою починав спілкуватися з Disagree Bot, побоюючись, що це буде виснажливо і марно. Але я був приємно здивований — чатбот поводиться зовсім інакше.
Disagree Bot за своєю суттю є заперечним, він обов’язково протиставляється вашій думці. Проте робить це без образ, агресії чи образливих зауважень. Кожна відповідь починається зі слів «Я не погоджуюсь», після чого слідує логічний та ґрунтовний аргумент з глибоким розбором. Він змушує мене критично переосмислювати власні твердження, просячи чіткіше визначити такі поняття як «глибока лірика» чи «найкращий», а також розглянути, як застосовувати свої аргументи до суміжних тем.
Спілкування з Disagree Bot нагадувало дискусію з освіченим, уважним опонентом, що стимулює думати конструктивно та конкретно. Ця бесіда була надзвичайно цікавою й тримала мене в тонусі.
У той же час ChatGPT практично не провів жодної справжньої суперечки. Коли я сказав ChatGPT, що вважаю Red (Taylor’s Version) найкращим альбомом Тейлор Свіфт, він із захопленням погодився. Чатбот поставив кілька додаткових питань, але вони швидко втрачали цікавість. Через кілька днів я спробував змінити ситуацію, попросивши ChatGPT поспорити зі мною, стверджуючи, що найкращий альбом — Midnights. У відповідь він назвав найкращим саме Red (Taylor’s Version).
Пояснюючи свій вибір, ChatGPT чемно зізнався, що це пов’язано з нашим попереднім спілкуванням, але при цьому запевнив, що може представити незалежний аргумент на користь Red. Враховуючи схильність таких систем пам’ятати контекст діалогу і прагнути догодити користувачу, це не викликало здивування. ChatGPT не міг не підтримати якесь відображення моєї точки зору. Навіть у «чистому» діалозі він іноді віддавав перевагу різним альбомам, зокрема 1989, але згодом знов повертався до Red.
Навіть коли я просив ChatGPT вступити в дискусію, він не суперечив по-справжньому. Наприклад, у суперечці про найкращі коледжські баскетбольні традиції він надав продуманий контраргумент та потім запропонував сформувати мої контраргументи — що суперечить суті дебатів, які я запросив. Така поведінка більше нагадує роль помічника з досліджень, а не рівноправного співрозмовника.
Спроба поспорити з ChatGPT виявилася фрустраційною та порожньою, нагадуючи розмову з другом, який довго переконує у своїй правоті, але наприкінці каже: «Та якщо ти так вважаєш». Натомість Disagree Bot справляв враження палкого, ерудованого друга, що говорить переконливо про будь-яку тему — від творчості Тейлор Свіфт до політики й коледжського баскетболу.
### Необхідність створення більш подібних AI-систем
Незважаючи на те, що Disagree Bot не може задовольнити всі запити, які я звично ставлю перед універсальними чатботами на кшталт ChatGPT, він демонструє перспективи майбутніх AI. Універсальні машини можуть виконувати широкий спектр завдань, виконувати різні ролі — від асистента з досліджень до пошукової системи і програміста. Disagree Bot не розрахований на такі функції, але відкриває нові горизонти для розвитку взаємодії штучного інтелекту.
Надмірно покірний AI зазвичай дуже яскраво проявляє себе, демонструючи надмірний ентузіазм. Часто подібні системи навіть не настільки очевидні — швидше це «вболівальник» із заохоченнями, а не ціла фанатська команда. Проте вплив таких налаштувань відчутний — відсутність критики або протилежної точки зору може заважати отримати об’єктивний зворотний зв’язок. В робочих процесах важливо мати AI, який зможе бачити помилки, а в терапевтичних інструментах — протистояти небезпечним чи шкідливим думкам. Сучасні моделі часто з цим не справляються.
Disagree Bot є гарним прикладом того, як можна створити AI, що є корисним і захопливим у спілкуванні, водночас пригнічуючи тенденції штучного інтелекту до надмірної тактовності чи беззаперечної згоди. Баланс важливий: AI, що сперечається лише заради суперечки, довго не буде корисним. Проте розробка систем, здатних протистояти користувачеві, підвищить їхню ефективність, навіть якщо це зробить їх трохи більш незговірливими.