Розробка штучного інтелекту в ChatGPT ‣ ZNAJ.ORG

Питання: Я чув, що новий агент ChatGPT дуже добре справляється з користуванням Інтернетом та роботою з електронними таблицями. Що таке агент, які його можливості, а також що саме він може робити з електронними таблицями, що робить його вартим уваги?

Відповідь: Агент ChatGPT — це новий інструмент агентного штучного інтелекту, вбудований у інтерфейс ChatGPT. На відміну від традиційних генеративних AI-систем, які працюють із контентом, створюючи текст, файли, зображення або відео, агентний ШІ орієнтований на автономні дії та досягнення результатів. Цей інструмент здатен приймати рішення і виконувати складні завдання з мінімальним або ж без жодної допомоги людини.

Ключові особливості агента ChatGPT:

– Встановлення комплексних цілей і формування плану для їх досягнення.
– Адаптація до змінних умов.
– Здатність виконувати послідовність дій, зокрема відкривати веб-браузер, переходити за посиланнями, шукати необхідні дані.
– Можливість не лише відшукувати інформацію, а й додавати, оновлювати та видаляти дані.

Хоча агентний штучний інтелект потенційно здатен змінити підходи у роботі бухгалтерів і фінансових аналітиків, він залишається алгоритмом на базі математики та статистики, який обробляє текстові та графічні вхідні дані, щоб передбачити найімовірнішу відповідь згідно з навчальними даними. Глибокого людського досвіду у нього немає.

Що являє собою робота з агентом на практиці? Розглянемо приклад використання агента ChatGPT для створення спеціалізованого маршруту відвідування сесій конференції Digital CPA 2025 р. Передусім відкриваємо новий чат, натискаємо кнопку «+» і перемикаємося у «Режим агента».

Інтерфейс для введення завдання змінюється на «Опишіть завдання» та пропонує підказки. Наступним кроком була команда агента:

1. “Я братиму участь у Digital CPA взимку 2025 року. Мені потрібно допомогти створити розклад сесій, які я хочу відвідати.”
2. “Цікавлять теми: штучний інтелект та клієнтські консультаційні послуги (Client Advisory Services, CAS).”
3. “Ось посилання на порядок денний конференції: https://www.cpa.com/digital-cpa/agenda”
4. “Створіть, будь ласка, електронну таблицю з порядком денним, вказавши назву сесії, час початку та ім’я спікера.”

Після прийняття завдання агент розпочинає сеанс браузера: відкриває сайт конференції, переходить між сторінками та шукає необхідну інформацію. Оскільки агент перевіряє і визначає найбільш ефективні дії для виконання запиту, час роботи варіюється — у цьому прикладі процес тривав 22 хвилини.

Покрокова діяльність агента:

– Підготовка цифрового робочого простору та підтвердження завдання (повідомлення в центрі екрана чорного кольору).
– Визначення способів фільтрації сесій, щоб відобразити лише теми CAS та штучного інтелекту (повідомлення про здійснювану дію).
– Перевірка інформації про спікерів, натискання кнопки «Більше» для отримання додаткових даних.
– Пошук кнопки «Менше» для згортання додаткової інформації (проте агент не помітив, що кнопка вже відкрита через затримки в роботі).
– Спроба прокрутити екран вгору за допомогою смуги прокрутки, кілька невдалих спроб і, нарешті, використання клавіші «Home» для переміщення до верхньої частини сторінки.
– Формування і відображення отриманих результатів у вигляді електронної таблиці із зазначенням часу початку та назв сесій.

Однак агент узяв на себе певні вольності:

– Він пропустив один із ключових доповідей, оскільки її опис не містив згадок про CAS або штучний інтелект.
– Перевів час початку всіх сесій з місцевого східного стандартного часу (EST) у тихоокеанський стандартний час (PST) відповідно до географічного розташування користувача.

Оскільки конференція відбувається особисто, для зручності потрібно повернути час назад до EST. Для цього достатньо надіслати коротку команду: «Змініть усі часи початку на EST». Агент миттєво оновить часові позначки у таблиці.

На сьогоднішній день агенти перебувають на початковому етапі розвитку, тому варто враховувати наступні ризики:

– Нестабільність результатів: повторне виконання однакових запитів може призводити до неоднакових варіантів відповідей.
– Ризики роботи в браузері: агент іноді може помилково клацнути по небажаних посиланнях, що іноді створює загрозу небажаних змін даних або доступу до важливих систем.
– Недостатня точність і послідовність у прийнятті рішень не дозволяють повністю довіряти агенту у виконанні критичних операцій.

У разі виникнення проблем користувач має змогу втрутитися і фактично управляти веб-сеансом агента. Наприклад, якщо агент застрягає на проміжному кроці, людина може допомогти у вході до системи з аутентифікацією, після чого агент продовжуватиме збирати інформацію.

—

Про автора: Веслі Хартман — засновник компанії Automata Practice Development.

—

Якщо у вас є питання щодо технологій для цієї рубрики або ви можете запропонувати кращі рішення після прочитання відповідей, надсилайте свої звернення на адресу: jofatech@aicpa.org.

Олена Ткач

Фахівчиня з цифрового маркетингу. Пише просто про складне: штучний інтелект, мобільні додатки, технології в Україні.Гасло: «Технології — це просто. Особливо, коли пояснюю я».

Переглянути повну біографію

На тлі відкриття арени: коли Барселона проведе перший поєдинок на реновованому Камп Ноу.

Половина житлових будинків у місті вже опалюється, але кияни нарікають на жару.

Андрій Лунін висловився щодо червоної картки в поєдинку з Барселоною

Першість першої ліги: ЮКСА віддаляється від зони плей-офф на крок ближче до спокою.

початкові команди на гру

ChatGPT Порадив Мені Переїхати до Вілмінгтона. Тож Я Це Зробив. Адам ЛеМір

Розробка штучного інтелекту в ChatGPT

різне