Питання: Я чув, що новий агент ChatGPT дуже добре справляється з користуванням Інтернетом та роботою з електронними таблицями. Що таке агент, які його можливості, а також що саме він може робити з електронними таблицями, що робить його вартим уваги?
Відповідь: Агент ChatGPT — це новий інструмент агентного штучного інтелекту, вбудований у інтерфейс ChatGPT. На відміну від традиційних генеративних AI-систем, які працюють із контентом, створюючи текст, файли, зображення або відео, агентний ШІ орієнтований на автономні дії та досягнення результатів. Цей інструмент здатен приймати рішення і виконувати складні завдання з мінімальним або ж без жодної допомоги людини.
Ключові особливості агента ChatGPT:
– Встановлення комплексних цілей і формування плану для їх досягнення.
– Адаптація до змінних умов.
– Здатність виконувати послідовність дій, зокрема відкривати веб-браузер, переходити за посиланнями, шукати необхідні дані.
– Можливість не лише відшукувати інформацію, а й додавати, оновлювати та видаляти дані.
Хоча агентний штучний інтелект потенційно здатен змінити підходи у роботі бухгалтерів і фінансових аналітиків, він залишається алгоритмом на базі математики та статистики, який обробляє текстові та графічні вхідні дані, щоб передбачити найімовірнішу відповідь згідно з навчальними даними. Глибокого людського досвіду у нього немає.
Що являє собою робота з агентом на практиці? Розглянемо приклад використання агента ChatGPT для створення спеціалізованого маршруту відвідування сесій конференції Digital CPA 2025 р. Передусім відкриваємо новий чат, натискаємо кнопку «+» і перемикаємося у «Режим агента».
Інтерфейс для введення завдання змінюється на «Опишіть завдання» та пропонує підказки. Наступним кроком була команда агента:
1. “Я братиму участь у Digital CPA взимку 2025 року. Мені потрібно допомогти створити розклад сесій, які я хочу відвідати.”
2. “Цікавлять теми: штучний інтелект та клієнтські консультаційні послуги (Client Advisory Services, CAS).”
3. “Ось посилання на порядок денний конференції: https://www.cpa.com/digital-cpa/agenda”
4. “Створіть, будь ласка, електронну таблицю з порядком денним, вказавши назву сесії, час початку та ім’я спікера.”
Після прийняття завдання агент розпочинає сеанс браузера: відкриває сайт конференції, переходить між сторінками та шукає необхідну інформацію. Оскільки агент перевіряє і визначає найбільш ефективні дії для виконання запиту, час роботи варіюється — у цьому прикладі процес тривав 22 хвилини.
Покрокова діяльність агента:
– Підготовка цифрового робочого простору та підтвердження завдання (повідомлення в центрі екрана чорного кольору).
– Визначення способів фільтрації сесій, щоб відобразити лише теми CAS та штучного інтелекту (повідомлення про здійснювану дію).
– Перевірка інформації про спікерів, натискання кнопки «Більше» для отримання додаткових даних.
– Пошук кнопки «Менше» для згортання додаткової інформації (проте агент не помітив, що кнопка вже відкрита через затримки в роботі).
– Спроба прокрутити екран вгору за допомогою смуги прокрутки, кілька невдалих спроб і, нарешті, використання клавіші «Home» для переміщення до верхньої частини сторінки.
– Формування і відображення отриманих результатів у вигляді електронної таблиці із зазначенням часу початку та назв сесій.
Однак агент узяв на себе певні вольності:
– Він пропустив один із ключових доповідей, оскільки її опис не містив згадок про CAS або штучний інтелект.
– Перевів час початку всіх сесій з місцевого східного стандартного часу (EST) у тихоокеанський стандартний час (PST) відповідно до географічного розташування користувача.
Оскільки конференція відбувається особисто, для зручності потрібно повернути час назад до EST. Для цього достатньо надіслати коротку команду: «Змініть усі часи початку на EST». Агент миттєво оновить часові позначки у таблиці.
На сьогоднішній день агенти перебувають на початковому етапі розвитку, тому варто враховувати наступні ризики:
– Нестабільність результатів: повторне виконання однакових запитів може призводити до неоднакових варіантів відповідей.
– Ризики роботи в браузері: агент іноді може помилково клацнути по небажаних посиланнях, що іноді створює загрозу небажаних змін даних або доступу до важливих систем.
– Недостатня точність і послідовність у прийнятті рішень не дозволяють повністю довіряти агенту у виконанні критичних операцій.
У разі виникнення проблем користувач має змогу втрутитися і фактично управляти веб-сеансом агента. Наприклад, якщо агент застрягає на проміжному кроці, людина може допомогти у вході до системи з аутентифікацією, після чого агент продовжуватиме збирати інформацію.
—
Про автора: Веслі Хартман — засновник компанії Automata Practice Development.
—
Якщо у вас є питання щодо технологій для цієї рубрики або ви можете запропонувати кращі рішення після прочитання відповідей, надсилайте свої звернення на адресу: jofatech@aicpa.org.