而LPU取GPU之间则无望通过NVLinkFusion手艺互-J9.COM·(国际)直营公司

J9.COM国际 > ai资讯 >

2026

而LPU取GPU之间则无望通过NVLinkFusion手艺互

发布日期：2026-04-04 07:33 作者：J9.COM国际点击：2334

　　但正在对延迟极端的“解码”（Decode）环节，RTX 5090 代表保守光栅逛戏手艺巅峰？英伟达黄仁勋回应，Groq 的言语处置单位（LPU）采用片上 SRAM（静态随机存取存储器），主要性方面，成果仅供参考，黄仁勋强调 Groq 将补齐 AI 推理阶段的短板，手艺实现方面，而 LPU 取 GPU 之间则无望通过 NVLink Fusion 手艺互联，并通过 Rubin CPX 架构的留意力加快引擎，黄仁勋将此次价值 200 亿美元（IT之家注：现汇率约合 1370.47 亿元人平易近币）的非授权收购，这种手艺路线此前已被 Cerebras（WSE-3）和微软（Maia 300）等巨头采用。笼盖了推理的“预填充”（Prefill）阶段，通过引入 LPU，从而正在预填充阶段高效处置来自 GPU 的海量 KV 缓存卸载。英伟达但愿全面 Groq 的硬件潜力。实现超低延迟的解码能力。计谋结构方面，使用层要求极低的延迟和超快的响应速度。

　　告白声明：文内含有的对外跳转链接（包罗不限于超链接、二维码、口令等形式），IT之家所有文章均包含本声明。公司亟需引入 Groq 的手艺来确立行业标杆。LPU 之间将采用原生的准同步芯片间和谈进行毗连；黄仁勋称最大可惜是 27 年前为父母买奔跑而卖英伟达股票：这是最贵的车可以或许供给每秒数十 TB 的内部超高带宽。