创享投资资讯动态

创享投资

creationventure

本文中「墨芯人工智能」为创享投资已投项目：

640 (4).png

墨芯人工智能是稀疏化计算的全球引领者，以稀疏化算法为核心，打造云端和终端AI计算加速方案，可广泛应用于数据中心、互联网、运营商、生命科学等场景，推动稀疏化计算生态建设。浪潮是墨芯人工智能的战略投资者和生态合作伙伴。

640 (6).png

9月9日，全球权威AI基准评测MLPerf Inference v2.1榜单公布结果。

MLPerf是业内公认的国际权威AI性能基准评测，由图灵奖得主大卫·帕特森（David Patterson）联合谷歌、英伟达、英特尔、Facebook、浪潮等全球AI领军企业，以及来自哈佛大学、斯坦福大学等学术机构的研究人员创立。

该测评以其标准严格、测评严谨而著称，英伟达、高通等国际AI芯片企业均携最强产品参加测评，竞争十分激烈，各赛道均有数百项产品提交成绩。

中国AI芯片企业首次超越英伟达“史上最强GPU”、未来4nm产品——H100：中国AI芯片明星创业公司——墨芯人工智能（以下简称“墨芯”）S30计算卡以95784 FPS的单卡算力，夺得Resnet-50模型算力全球第一。

墨芯首次参赛单卡算力全球第一

众所周知，“单卡算力”是检验AI计算产品的“真标准”。

墨芯夺冠项目是数据中心最常用主流模型ResNet-50，该赛道竞争尤为激烈，竞争者包括H100、A100。

S30以ResNet-50 95784 FPS的单卡算力夺得第一，是英伟达未来4nm产品——H100的1.2倍，是A100的2倍。

同时，墨芯S30运行BERT-Large是A100的2倍，仅次于H100，在Bert-large高精度模型（99.9%），单卡算力达3,837 SPS。

值得强调的是此次是“12nm”战胜“4nm”。

从竞争者角度看，墨芯参与的ResNet-50和BERT-Large都是数据中心最常用主流模型，因此竞争尤为激烈。特别是竞争者包括H100，是英伟达迄今推出的最强大的GPU，据悉使用台积电最新的4纳米工艺，可谓“最强王者”。而战胜“最强王者”，足以体现墨芯S30采用12nm，性能已经站在世界顶尖水平。

精度要求99%以上，经受严格检验

更值得一提的是，MLPerf的测试要求非常严格：不仅考验各产品算力，同时设置精度要求在99%以上，主要为了考察AI推理精度的高要求对计算性能的影响。换句话说，参赛厂商无法以牺牲精度的方式换取算力提升，在这种严要求下夺冠，表明了墨芯的硬核技术实力。