算力密度栽培50%,摩尔线程全功能GPU道路图初次公开
发布日期:2025-12-22 15:11 点击次数:162
12月20日,摩尔线程首届MUSA迷惑者大会(简称:MDC 2025)在北京开幕,系统展示了摩尔线程以自主MUSA斡旋架构为中枢的全栈期间效率,全面展现公司在高端全功能GPU领域的过失拦截与前瞻布局。

其中,全功能GPU架构“花港”,支抓FP4到FP64的全精度谋略,算力密度栽培50%,遵守栽培10倍。
摩尔线程首创东谈主、董事长兼CEO张建中还发布AI算力本MTT AIBOOK条记本。现在该条记本已在京东通达预售,32GB、1TB 版块预售价9999元。
揭晓新一代全功能GPU架构“花港”
MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元谋略斡旋谋略架构,遮掩从芯片架构、辅导集、编程模子到软件启动库及驱动枢纽框架等的全栈期间体系。
基于MUSA斡旋体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在谋略密度、能效、精度支抓、互联能力及图形期间等方面达玉成面拦截。
谋略性能权贵栽培:基于新一代辅导集,算力密度栽培50%,能效大幅优化;支抓从FP4到FP64的全精度端到端谋略,新增MTFP6/MTFP4及搀和低精度支抓。
异步编程与超大范畴互联:集成新一代异步编程模子,优化任务诊治与并行机制;通过自研MTLink高速互联期间,支抓十万卡以上范畴智算集群扩张。
图形与AI深度交融:内置AI生成式渲染架构,增果断件色泽跟踪加快引擎,圆善支抓DirectX 12 Ultimate,达成图形渲染与智能谋略的高度协同。
基于“花港”架构,摩尔线程公布了往日将发布的两款芯片晌间道路:
“华山”专注AI训推一体与超大范畴智能谋略。集成新一代异步编程与全精度张量谋略单位,支抓从FP4至FP64的全精度谋略,为万卡级智算集群提供肃肃高效的算力复旧,是构建下一代“AI工场”的坚实底座。
“庐山”专攻高性能图形渲染。其图形性能达玉成面进步:AI谋略性能栽培64倍,几何惩处性能栽培16倍,色泽跟踪性能栽培50倍,并权贵增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE斡旋渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供重大算力支抓。
智算集群复旧万亿参数模子磨真金不怕火
本次大会发达发布了“夸娥万卡”智算集群。该集群具备全精度、全功能通用谋略能力,在万卡范畴下达成高效肃肃的AI磨真金不怕火与推理。

其中枢拦截包括:浮点运算能力达到10Exa-Flops,磨真金不怕火算力期骗率(MFU)在Dense大模子上达60%,MOE大模子上达40%,灵验磨真金不怕火时期占比特别90%,磨真金不怕火线性扩张效率达95%,与海外主流生态高度兼容,并在多项筹商上具备权贵能效上风。
在磨真金不怕火侧,基于原生FP8能力圆善复现顶尖大模子磨真金不怕火经由,并在多项过失精度筹商上达到海外主活水平。期间层面达成过失优化:Flash Attention算力期骗率超95%,并拦截FP8累加精度等过失期间瓶颈,充分开释国产GPU在大模子磨真金不怕火中的性能后劲。
在推理侧,摩尔线程联结硅基流动,经过系统级工程优化与FP8精度加快,在DeepSeek R1 671B全量模子上达成性能拦截:MTT S5000单卡Prefill否认拦截4000 tokens/s、Decode否认拦截1000 tokens/s,缔造国产推感性能新标杆。
9999元AI算力本支抓国产操作系统
会上,还发布了AI算力本,提供“开箱即用”的迷惑体验:动作合并迷惑者与MUSA生态的中枢进口,MTT AIBOOK搭载自研“长江”智能SoC,提供高达50TOPS的端侧AI算力,初次达成从芯片、驱动到迷惑环境的全栈整合。

该条记本集迷惑、办公、文娱就是一体,支抓Windows杜撰机、Linux、安卓容器以及总计的国产操作系统。
大会同期预报了基于“长江”SoC打造的迷你型谋略成立MTT AICube,进一步丰富端侧谋略家具形式。
现场还共享了面向下一代超大范畴智算中心的MTT C256超节点架构,着眼高密硬件架构,达成极致智算性能。
系列效率的发布,意味着摩尔线程已构建起一套以自主斡旋架构为根基、合并“芯-边-端-云”的圆善期间栈,达成了从底层硬件到表层应用的系统化闭环。该体系为国产智能谋略生态的抓续演进与产业交融,提供了平台级复旧。
南边+记者 郜小平

