Google відкрив публічну бета-версію Interactions API і фактично переписав правила взаємодії з великими мовними моделями. Для розробників це означає відхід від коротких запитів і відповідей та перехід до довготривалих, станоорієнтованих AI-систем.
Ключова зміна непомітна ззовні, але фундаментальна за наслідками. Моделі більше не існують як ізольовані функції, що відповідають на окремі запити.
Вони отримують пам’ять, власний стан і можливість працювати у фоновому режимі.
Упродовж останніх років індустрія жила у парадигмі completion. Запит пішов – відповідь прийшла – контекст зник. Якщо потрібно більше, історію діалогу доводилося знову і знову передавати у вигляді громіздких структур.
Цей підхід був зручним для чатів. Але він почав ламатися, щойно з’явився попит на агентів – системи, здатні виконувати багатокрокові завдання, користуватися інструментами та працювати з довгими часовими горизонтами.
Interactions API закриває це вузьке місце на рівні інфраструктури. Замість повного контексту розробник передає лише previous_interaction_id.
Усе інше – історія діалогу, виклики інструментів, проміжні міркування – зберігається на серверах Google. Модель перестає бути просто генератором тексту. Вона поводиться як віддалена обчислювальна система.
Саме це відкриває шлях до фонового виконання. Довгі сценарії більше не впираються в обмеження HTTP.
Агент можна запустити з параметром background=true, від’єднатися від нього і повернутися за результатом пізніше. Фактично Google перетворює Interactions API на чергу завдань для інтелектуальних обчислень.
На цій же архітектурі компанія запускає свого першого вбудованого агента – Gemini Deep Research.
Це не черговий чат-бот. Агент працює циклічно: шукає інформацію, читає джерела, синтезує висновки і лише після цього формує відповідь. Він може працювати тривалий час без втручання користувача.
Ще один важливий сигнал для ринку – підтримка Model Context Protocol.
Завдяки MCP Gemini може напряму викликати зовнішні сервіси та інструменти, розміщені на віддалених серверах. Без проміжного коду. Без складної логіки обгорток.
Це крок у бік відкритої агентної екосистеми, де моделі інтегруються з реальними системами – базами даних, API, сервісами – майже без додаткового “клею”.
У ширшому контексті Google наздоганяє OpenAI, яка ще у березні 2025 року першою відійшла від stateless-підходу, запустивши Responses API.
Втім, філософії компаній різні. OpenAI активно стискає контекст, замінюючи історію взаємодій непрозорими compaction items, щоб зменшити витрати на токени. Google, навпаки, зберігає повну історію та дозволяє її аналізувати і налагоджувати.
Це дорожче. Але прозоріше.
Interactions API вже працює у Google AI Studio і підтримує актуальні моделі Gemini, зокрема:
- Gemini 3 Pro Preview
- Gemini 2.5 Flash
- Gemini 2.5 Pro
Модель оплати залишається токенною. Проте серверний стан створює ефект неявного кешування.
Оскільки контекст зберігається на стороні Google, розробники не платять за повторне надсилання великих історій взаємодії. Для production-систем це може означати відчутне зниження витрат.
Є і зворотний бік. Дані взаємодій зберігаються на серверах компанії.
Для безкоштовного рівня – до одного дня. Для платного – до 55 днів. Це покращує продуктивність, але створює питання комплаєнсу та політик конфіденційності. На відміну від Zero Data Retention у корпоративних пропозиціях OpenAI, тут компроміс доведеться зважувати самостійно.
Експерти також звертають увагу на сирість окремих деталей. У Deep Research агенті джерела часто повертаються як внутрішні Google-редиректи, а не чисті URL. Для звітів і цитування це незручно.
Дрібниця. Але показова.
У підсумку Interactions API – це не просто новий endpoint. Це сигнал, що великі мовні моделі виходять за межі чатів і стають довготривалими автономними системами.
Для команд, які будують агентів, це означає простішу архітектуру, нижчі витрати і водночас новий рівень складності та відповідальності.








Залишити коментар