12nm战胜4nm|权威AI测试MLPerf放榜,单卡算力超H100

创享投

creationventure

本文中「墨芯人工智能」为创享投资已投项目:

640 (4).png

墨芯人工智能是稀疏化计算的全球引领者,以稀疏化算法为核心,打造云端和终端AI计算加速方案,可广泛应用于数据中心、互联网、运营商、生命科学等场景,推动稀疏化计算生态建设。浪潮是墨芯人工智能的战略投资者和生态合作伙伴。

640 (6).png

9月9日,全球权威AI基准评测MLPerf Inference v2.1榜单公布结果。
MLPerf是业内公认的国际权威AI性能基准评测,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、英伟达 、英特尔、Facebook、浪潮等全球AI领军企业,以及来自哈佛大学、斯坦福大学等学术机构的研究人员创立。
该测评以其标准严格、测评严谨而著称,英伟达、高通等国际AI芯片企业均携最强产品参加测评,竞争十分激烈,各赛道均有数百项产品提交成绩。
中国AI芯片企业首次超越英伟达“史上最强GPU”、未来4nm产品——H100:中国AI芯片明星创业公司——墨芯人工智能(以下简称“墨芯”)S30计算卡以95784 FPS的单卡算力,夺得Resnet-50模型算力全球第一。




墨芯首次参赛 单卡算力全球第一

众所周知,“单卡算力”是检验AI计算产品的“真标准”。
墨芯夺冠项目是数据中心最常用主流模型ResNet-50,该赛道竞争尤为激烈,竞争者包括H100、A100。
S30以ResNet-50 95784 FPS的单卡算力夺得第一,是英伟达未来4nm产品——H100的1.2倍,是A100的2倍。


同时,墨芯S30运行BERT-Large是A100的2倍,仅次于H100,在Bert-large高精度模型(99.9%),单卡算力达3,837 SPS。


值得强调的是此次是“12nm”战胜“4nm”。


从竞争者角度看,墨芯参与的ResNet-50和BERT-Large都是数据中心最常用主流模型,因此竞争尤为激烈。特别是竞争者包括H100,是英伟达迄今推出的最强大的GPU,据悉使用台积电最新的4纳米工艺,可谓“最强王者”。而战胜“最强王者”,足以体现墨芯S30采用12nm,性能已经站在世界顶尖水平。

精度要求99%以上,经受严格检验

更值得一提的是,MLPerf的测试要求非常严格:不仅考验各产品算力,同时设置精度要求在99%以上,主要为了考察AI推理精度的高要求对计算性能的影响。换句话说,参赛厂商无法以牺牲精度的方式换取算力提升,在这种严要求下夺冠,表明了墨芯的硬核技术实力。