NVIDIA зробила черговий хід у великій грі за майбутнє штучного інтелекту. На CES 2026 компанія представила Rubin – платформу суперкомп’ютерів, яку називає основою наступного технологічного циклу в ШІ.
Йдеться не про окремий чип чи сервер. Rubin – це цілісна архітектура, створена для того, щоб прискорити навчання моделей, здешевити інференс і відповісти на вибухове зростання попиту на обчислення.
Ключ платформи – радикально новий підхід до спільного проєктування. NVIDIA зібрала Rubin як єдиний організм із шести спеціалізованих компонентів:
- CPU Vera
- GPU Rubin
- NVLink 6 Switch
- ConnectX-9 SuperNIC
- BlueField-4 DPU
- Spectrum-6 Ethernet Switch
У компанії стверджують: така конфігурація знижує вартість інференсу та обробки токенів до 10 разів у порівнянні з поколінням Blackwell. Для моделей класу Mixture-of-Experts потрібно у чотири рази менше GPU. А мережа Spectrum-X Ethernet підвищує енергоефективність у п’ять разів.
Це принципова зміна економіки ШІ.
Засновник і CEO NVIDIA Дженсен Хуанг прямо пов’язує появу Rubin із темпами розвитку індустрії:
“Rubin з’являється саме тоді, коли попит на обчислювальні ресурси для ШІ стрімко зростає”, – наголосив Хуанг, пояснюючи щорічний цикл оновлення ШІ-суперкомп’ютерів та екстремальне спільне проєктування шести чипів.
Окрема ставка зроблена на міжз’єднання. Шосте покоління NVLink забезпечує безперервний обмін даними між GPU – критичний фактор для масштабних MoE-моделей. Один GPU отримує пропускну здатність 3,6 ТБ/с, а стійка Vera Rubin NVL72 – до 260 ТБ/с. За твердженням NVIDIA, це більше, ніж сумарна пропускна здатність усього інтернету.
CPU Vera розроблений для агентного мислення. Він має 88 ядер Olympus, сумісний з Armv9.2 і підтримує NVLink-C2C. GPU Rubin оснащений Transformer Engine третього покоління та апаратним адаптивним стисненням, забезпечуючи 50 петафлопс NVFP4 для задач ШІ.
Rubin також уперше для стійкових систем NVIDIA отримав повноцінний Confidential Computing. Дані захищені на рівнях CPU, GPU та NVLink. Друге покоління механізмів RAS контролює справність процесорів і міжз’єднань у реальному часі, дозволяючи проактивне обслуговування та підвищену відмовостійкість.
Конструкція теж змінилася. Модульні безкабельні лотки дають змогу збирати й обслуговувати систему до 18 разів швидше, ніж Blackwell.
NVIDIA пропонує Vera Rubin NVL72 як єдину захищену систему з 72 GPU та 36 CPU, об’єднаних через NVLink 6, ConnectX-9 і BlueField-4. Для генеративних платформ на базі x86 передбачена серверна плата HGX Rubin NVL8 із вісьмома GPU.
Платформа вже перебуває у виробництві. Перші продукти очікуються у другій половині 2026 року. Серед партнерів і ранніх користувачів NVIDIA називає:
- AWS
- Google Cloud
- Microsoft
- Oracle
- CoreWeave
- Meta
- OpenAI
- Anthropic
- xAI
Rubin чітко сигналізує: NVIDIA не просто продає залізо. Компанія формує інфраструктурний фундамент для нового витка розвитку штучного інтелекту.








Залишити коментар