OpenAI презентувала нове покоління своїх моделей – лінійку GPT-5.2, яку в компанії вже називають проривом на шляху до загального штучного інтелекту. Оновлення обіцяє глибше міркування, точніший аналіз та помітно кращу роботу з великими масивами даних.
У реліз увійшли три версії – Instant, Thinking і Pro. Вони відкриті для користувачів ChatGPT Plus, корпоративних клієнтів та доступні розробникам через API.
Найпомітніший акцент – це можливості Thinking-моделі. Саме вона стала головною демонстрацією технологічного стрибка.
У бенчмарку GDPval, де фахівці оцінюють професійні навички у 44 спеціальностях, GPT-5.2 Thinking уперше отримала показники на рівні професіоналів або вище. За результатами сліпих порівнянь модель досягла переваги чи паритету з людьми у 70,9% ситуацій – від складних таблиць до технічних інструкцій.
Швидкість виконання задач зросла в 11 разів. Вартість – менше 1% від роботи експерта.
Особливо відчутний крок уперед стався у програмуванні. У тесті SWE-Bench Pro нова модель здобула 55,6% – найвищий бал серед моделей OpenAI. Більше того, компанія окремо підкреслює, що саме ця версія демонструє найкращі агентні можливості, коли ШІ самостійно виконує складні багатокрокові сценарії з використанням набору інструментів.
Серйозні зміни торкнулися й роботи з візуальними даними. Точність аналізу діаграм, схем та інтерфейсів помітно підросла – кількість помилок скоротилася майже удвічі. Модель краще розуміє складні технічні зображення, включно з деталями материнських плат.
Головне оновлення мислення – це робота з довгим контекстом. У тестах MRCRv2 GPT-5.2 Thinking майже безпомилково знаходила й систематизувала інформацію в документах обсягом до 256 000 токенів. Це відкриває можливості для застосування моделі у сферах, де критичні точність і велика кількість даних – юридичній, фінансовій, науковій.
До того ж OpenAI повідомляє про зменшення галюцинацій на 30% у Thinking-версії – один із ключових запитів користувачів.
Корпоративні платформи вже почали впроваджувати новинку у свої сервіси. Серед перших інтеграторів Notion, Zoom, Shopify та Databricks. За їхніми оцінками, GPT-5.2 демонструє виняткову продуктивність у сценаріях, де модель виконує роль агента, керує інструментами та завершують складні проєкти автономно.
Попри масштабний реліз, GPT-5.1 поки залишається в роботі. OpenAI зберігатиме попереднє покоління моделей ще щонайменше три місяці, щоб користувачі могли поступово перейти на нову лінійку.
З виходом GPT-5.2 гонитва за універсальним інтелектом отримала новий темп. І, схоже, галузі лише починають усвідомлювати масштаби цих змін.








Залишити коментар