Технологічний гігант Microsoft зробив рішучий крок до технологічної автономності, презентувавши MAI-Image-2. Ця розробка знаменує собою початок стратегічного відходу компанії від повної залежності від рішень OpenAI у сфері візуального контенту. Дебют виявився надзвичайно успішним: за даними рейтингу Arena.ai, нова модель одразу закріпилася на третій позиції серед усіх наявних сімейств генеративних ШІ.
Тривалий час ключові сервіси корпорації, як-от Copilot та Bing Image Creator, функціонували виключно на базі алгоритмів OpenAI. Проте запуск власного продукту змінює правила гри. Тепер Microsoft отримує повний контроль над витратами, темпами впровадження інновацій та глибиною інтеграції штучного інтелекту у свою екосистему.
Цілком імовірно, що абревіатура MAI (Microsoft AI) стане фундаментом для створення окремого суббренду, під яким компанія випускатиме майбутні внутрішні розробки.
Хоча в загальному заліку Arena.ai модель поки що пропускає вперед лише фаворитів від Google та OpenAI, у специфічних сценаріях вона демонструє лідерство. Найсильнішими сторонами MAI-Image-2 стали фотореалістичність та робота з текстом всередині зображень – напрямки, які традиційно вважаються “ахіллесовою п’ятою” більшості сучасних генераторів.
Технологічні переваги та залучення експертів
У Microsoft наголошують, що в процесі навчання моделі брали участь професійні фотографи та дизайнери. Такий підхід дозволив досягти високих результатів у кількох аспектах:
- досконалий фотореалізм із деталізованими текстурами та природною грою світла;
- висока якість відтворення написів для створення постерів та інфографіки;
- здатність точно генерувати складні багатофігурні сцени з високим рівнем деталізації.
Попри технологічний прорив, користувачі зіткнуться з певними експлуатаційними рамками. Наразі діють суворі контент-фільтри, що іноді блокують навіть нейтральні запити. Крім того, встановлено ліміт на 15 генерацій на добу, а між створенням окремих зображень необхідно витримувати паузу тривалістю до 30 секунд.
Функціонал моделі поки що обмежений лише квадратним форматом (1:1), а можливості працювати з референсами, редагувати окремі області (inpainting) або використовувати режим image-to-image відсутні.
Новинка вже доступна на платформі MAI Playground, а її поетапне впровадження в Copilot та Bing Image Creator уже розпочалося. Корпоративні клієнти отримали доступ до API, тоді як ширше розгортання через Microsoft Foundry заплановано на найближчий час.
Варто зазначити, що мешканці Європейського Союзу на поточному етапі скористатися сервісом не зможуть.








Залишити коментар