性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行电脑DIY圈-电脑DIY,一个分享电脑DIY硬件,电脑软件,软件素材资源,各类教程的博客-鑫屿翔网络电脑DIY圈

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行

4年前发布

01270

登录送积分签到积分加倍可免费下载软件，如果下载链接失效可以直接评论，我们第一时间更新或者说明原因更多问题可以联系我们客服

3月21日，中国本土AI创新企业寒武纪正式发布了新款训练加速卡“MLU370-X8”，搭载双芯片四芯粒封装的思元370，集成寒武纪MLU-Link多芯互联技术，主要面向AI训练任务。

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行

寒武纪MLU370-X8智能加速卡首次整合了双芯片四芯粒的思元370，也就是每张卡两颗芯片，每颗芯片内封装两个Die，因此可提供两倍于思元370加速卡的内存、编解码资源。

架构基于Cambricon MLUarch03，支持AI训练加速中常见的FP32、FP16、BF16、INT16、INT8、INT4数据格式计算，峰值性能分别为32TFlops、96TFlops、96TFlops、128Tops、256Tops、512Tops。

该卡采用7nm制造工艺，集成48GB LPDDR5内存，内存带宽614.4GB/s，PCIe 4.0 x16系统接口，整卡最大训练功耗250W，全高全长双插槽设计，系统被动散热。

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行
单卡架构图

通过MLU-Link多芯互联技术，提供卡内、卡间互联功能，并专门设计了MLU-Link桥接卡，可实现4张加速卡为一组、8颗思元370芯片全互联。

每张加速卡通讯吞吐性能200GB/s，带宽为PCIe 4.0的大约3.1倍，可高效执行多芯多卡训练、分布式推理任务。

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行
4卡桥接

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行
单机8卡部署配置

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行
4卡桥接拓扑

根据官方数据，Cambricon NeuWare SDK实测，在常见的4个深度学习网络模型上，MLU370-X8单卡性能与主流350W RTX GPU相当。

多卡加速，借助MLU-Link多芯互联技术、Cambricon NeuWare CNCL通讯库的优化，8卡环境下达到更优的并行加速比，YOLOv3、Transformer、BERT、ResNet101训练任务中，8卡并行平均性能达350W RTX GPU的155％。

寒武纪未透露对比的NVIDIA 350W RTX GPU是哪一款，从规格来看，350W功耗的目前只有RTX 3090、RTX 3080 Ti。

当然，一个是专用AI加速卡，一个是GPU通用游戏卡，其实没有太大可比性。

MLU370-X8产品定位中高端，与高端训练产品思元290、玄思1000相互结合，进一步丰富了寒武纪的训练算力交付方式，同时与基于思元370芯粒(chiplet)技术构建的MLU370-X4、MLU370-S4智能加速卡协同，形成完整的云端训练、推理产品组合。

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行
单卡性能对比

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行
8卡性能对比

性能1.55倍于NV 350W RTX！寒武纪发布全新AI训练GPU：8卡并行

会员信息

登录可免费下载软件

VIP可高速下载，支持百度、123网盘、蓝奏网盘等全站资源。

永久VIP可加入专属群，享受群内福利，享受1对1服务。

非VIP会员类型

分普通会员、黄金会员、钻石会员，不同会员的下载次数各不相同。

可通过积分兑换及签到获取积分。

联系客服

如链接失效或有其他问题，请联系客服微信：

diannaodiyquan 或 diannao10zv或者diy10zv

（备注：“电脑DIY圈”以防封号）

© 版权声明

免责声明

免责声明

1. 软件全部来源于网络，如有侵权请联系客服。

2. 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。

3. 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报。

4. 本站资源大多存储在云盘，如发现链接失效，直接跟帖催更我们会第一时间回复。

THE END

DIY新闻
# 显卡

喜欢就支持一下吧，VIP享受专门通道可进VIP群

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容