电子发烧友网归纳报导 音讯称
,特供NVIDIA正在为我国商场研制一款名为“B30”的芯片降规版。AI 。光没芯片,特供这款芯片将首度支撑多。芯片GPU。光没扩展
,特供答使用户经过衔接多组芯片来打造更高功用的芯片核算集群。B30芯片估计将选用最新的光没Bl 。ac
。特供kwell架构 ,芯片运用GDDR7显存,光没而非高频宽内存(HBM),特供也不会选用台积电的芯片先进封装技能。
不少人以为多GPU扩展才能指的光没是NVLink ,但NVIDIA已在其消费级GPU芯片中取消了NVLink支撑
,因而B30是否支撑NVLink现在还不能确认。有音讯称B30芯片的多GPU互联功用或许根据NVIDIA的ConnectX-8 SuperNICs技能,这一技能曾在Compu。te。x 2025上展现
,用于衔接RTX Pro 6000 GPU
。
NVIDIA ConnectX-8 SuperNIC是业界首款在单个设备中集成支撑 PCIe Gen6 的 。交换机 。和超高速网络的 SuperNIC
。ConnectX-8 专为现代 AI 根底架构规划
,可提供更高的吞吐量 ,一起简化体系规划并进步功耗和本钱效益 。
NVIDIA ConnectX-8 正在从头界说根据 PCIe 的体系的或许性。经过将 PCIe Gen6 交换机和高功用 SuperNIC 集成到单个集成设备中,ConnectX-8 可简化服务器规划
,削减组件数量
,并解锁现代 AI 作业负载所需的高带宽。通讯
。途径。然后打造更简略 、更节能的渠道,一起下降全体具有本钱 (TCO) 并完成超卓的功用可扩展性 。
此外,ConnectX-8 SuperNIC 还可在根据多 GPU 的渠道中完成增强的秘要核算才能。
B30与H20存在功用差异,首要体现在几个方面
:1、显存技能差异,H20芯片选用HBM3显存
,带宽高达4.0TB/s,而B30芯片估计运用GDDR7显存
,带宽或许降至1.7TB/s左右 。HBM3在带宽和能效比上显着优于GDDR7
,特别在处理大规划数据集时,H20的显存功用优势将更显着。
2、互联技能比照:H20支撑NVLink技能,卡间互联带宽高达900GB/s,合适构建大规划核算集群。B30芯片的多GPU扩展功用或许依靠ConnectX-8 SuperNICs技能,而非NVLink,其互联带宽和推迟或许不及H20,在需求低推迟通讯的场景中体现或许受限。
3 、功用定位差异:H20芯片在FP8和FP16精度下的Tensor Core功用分别为296。 TF。LOPS和148 TFLOPS
,适用于
。高精度。核算使命 。B30芯片作为降规版,单芯片算力或许低于H20,但经过多GPU扩展可提高全体功用,合适对本钱灵敏但需求必定扩展性的使用场景
。
4
、使用场景适配
:H20芯片在垂类模型练习和推理使命中体现优异,特别合适需求高带宽和低推迟的场景。B30芯片则更侧重于经过多GPU扩展满意中小规划核算需求,或许在性价比和灵活性上更具优势 ,但单芯片功用或许无法与H20比美 。
与华为昇腾910等国产芯片比较,B30系列在显存容量上占优,但价格和能效比或许处于下风。B30价格预估为6500-8000美元,较H20的1-1.2万美元下降约40% ,但仍高于部分国产芯片
。
B30在我国商场的开展面对应战。如技能约束,显存带宽和
。接口。简化导致功用下降