体育游戏app平台多卡间的互联带宽也有784GB/s-kaiyun(欧洲杯)app-kaiyun欧洲杯app(中国)官方网站-登录入口

发布日期:2026-03-26 07:47    点击次数:113

体育游戏app平台多卡间的互联带宽也有784GB/s-kaiyun(欧洲杯)app-kaiyun欧洲杯app(中国)官方网站-登录入口

2月12日音讯体育游戏app平台,智谱发布新一代大模子GLM-5之后,摩尔线程立即晓喻,在旗舰级AI训推一体全功能GPU MTT S5000上完成了Day-0全经由适配与考证,第一期间提供解救。

MTT S5000是摩尔线程专为大模子造就、推理及高性能筹画想象的全功能GPU智算卡,基于第四代MUSA架构“平湖”,原生适配PyTorch、Megatron-LM、vLLM、SGLang等主流框架。

它早在2024年就依然低调推出,然而具体造型、参数、性能一直莫得对外公开,十分奥密。

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次

此次在晓喻适配GLM-5的同期,摩尔线程初次公布了MTT S5000的部分参数和性能,十分惊喜!

据悉,MTT S5000单卡配备多达80GB显存,显存带宽高达1.6TB/s,对比上代MTT S4000差异擢升了67%、113%,多卡间的互联带宽也有784GB/s。

它完好意思解救从FP8到FP64的全精度筹画,何况是国内最早原生解救FP8精度的造就GPU之一,成立了硬件级FP8 Tensor Core加快单位。

FP8比较BF16/FP16可将数据位宽减半、显存带宽压力裁汰50%、表面筹画迷糊量翻倍,并全面解救DeepSeek、Qwen等架构,造就性能可擢升30%以上。

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次

MTT S5000的单卡FP8 AI算力最高可达1000 TFLOPS,初次达到PFLOPS级别,也便是每秒1千万亿次筹画。

比较之下,MTT S4000的算力为INT8 256 TOPS、BF16 128 TFLOPS、FP32/64 32/64 TFLOPS。

据业内东说念主士称,MTT S5000实测性能不错对标NVIDIA H100,尤其是在多模态大模子微调任务中,部分性能更是特地H100,以致启动接近最新的Blackwell架构。

2026年1月,智源有计划院基于MTT S5000千卡集群,完成了前沿具身大脑模子RoboBrain 2.5(数千亿参数)的端到端造就与对王人考证,MTT S5000推崇出了与H100集群极高的铁心一致性,练亏空值(loss)各异仅为0.62%,举座造就成果以致完满小幅特地。

另据互联网厂商的场景实测,MTT S5000在典型端到端推理及造就任务中,性能不错达到NVIDIA H20的2.5倍左右。

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次

当今,基于MTT S5000的夸娥万卡集群依然落地,浮点运算才调达到10Flops(每秒1千亿亿次筹画),在Dense繁荣模子造就中MFU达到60%,在MoE大家模子中守护在40%左右,灵验造就期间占比进步90%,造就线性推广遵循达95%。

基于原生FP8才调,它能完好意思复现顶尖大模子的造就经由,Flash Attention算力行使率进步95%,多项要道打算均达到海外主活水平。

值得一提的是,MTT S5000在集群通讯层面弃取创始的ACE工夫,将复杂通讯任务从筹画中枢卸载,大幅擢升模子算力行使率(MFU)。

实测表露,MTT S5000从64卡推广至1024卡,系统的线性推广遵循保执在90%以上,造就速率随算力加多险些同步倍增。

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次

MTT S5000在推理场景相通推崇优异,比如在2025年12月,摩尔线程联接硅基流动基于MTT S5000完成了对DeepSeek-V3 671B满血版的深度适配与性能测试。

实测单卡Prefill迷糊进步4000 tokens/s,Decode迷糊进步1000 tokens/s,刷新了国产GPU的推理记录。

摩尔线程MTTS5000参数:80GB显存 单卡算力1千万亿次体育游戏app平台