英伟达CEO黄仁勋在拉斯维加斯2026国际消费电子产品展(CES)发表主题演讲,正式推出新一代极端协同设计AI平台Rubin,宣布该平台已全面量产,并发布面向自动驾驶、医疗、机器人等领域的开源模型,同时披露多项行业合作,推动AI向物理世界与普惠化落地。

据悉,Rubin平台是英伟达首款整合六颗核心芯片的AI超级计算解决方案,包含Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU及Spectrum-6以太网交换机,覆盖计算、网络、存储全链路。相较于前代Blackwell架构,Rubin平台将 AI推理token生成成本降低至原来的1/10,训练混合专家MoE模型所需GPU数量减少 4 倍,同时实现训练性能提升3.5倍、推理性能提升5倍;其NVL72机架级系统采用模块化液冷设计,组装时间从2 小时缩短至5分钟,已获微软、AWS、Google、CoreWeave等头部云厂商与OpenAI、Meta等AI实验室支持,微软下一代Fairwater AI超级工厂将搭载该系统,规模可扩展至数十万颗Vera Rubin超级芯片,首批产品预计2026年下半年交付。

在AI模型生态方面,英伟达重点发布开源模型家族,涵盖六大领域:面向自动驾驶的Alpamayo系列(含首款开源推理视觉语言动作模型 Alpamayo R1及高保真仿真框架AlpaSim,支持 L4 级自动驾驶)、医疗领域的Clara模型、气候科学的Earth-2模型、机器人与仿真的 Cosmos模型、embodied intelligence的GR00T模型,以及多模态推理的Nemotron模型。其中,搭载Alpamayo技术的梅赛德斯-奔驰全新CLA车型,将于2026年第一季度在美国上市,成为首款采用该开源自动驾驶方案的量产车,且该车已获EuroNCAP五星安全评级。

此外,英伟达还加码“物理 AI”布局,推出Inference Context Memory Storage AI原生存储平台,提升长上下文推理效率;展示DGX Spark 桌面超算,支持本地运行个性化AI代理,并通过Reachy Mini机器人实现物理交互,该超算对大型模型性能提升达2.6倍,还将支持 Lightricks LTX-2与FLUX图像模型。同时,英伟达宣布与西门子深化合作,将CUDA-X、Omniverse及AI模型整合至工业软件,覆盖设计、仿真到生产全生命周期,助力解决全球劳动力短缺下的工业智能化需求。

黄仁勋表示,AI正从数据中心走向每一台设备、每一个行业,Rubin 平台与开源模型的推出,旨在让全球企业与开发者参与AI革命,推动“每一辆车、每一台机器人都实现自主智能”的愿景落地。目前,思科、戴尔、联想等厂商已计划推出基于Rubin的服务器产品,进一步扩大该平台的行业应用范围。
原创文章,作者:航旗,禁止转载:https://youxichaguan.com/archives/184198
