
微软发布了最新芯片Maia 200,该芯片被公司称作硅基工作马,主要用于提升AI推理能力。
这款Maia 200芯片是公司继2023年发布的Maia 100之后推出的又一重要产品,在技术层面已能够以更快的速度和更高的效率运行强大的AI模型。据公司介绍,Maia 200搭载了超1000亿个晶体管,可提供超过10 petaflops的4位精度性能以及约5 petaflops的8位精度性能,相比上一代产品有明显提升。
推理指的是模型运行时的计算过程,这和训练模型时所需的计算并不相同。随着AI企业不断发展成熟,推理成本在其整体运营成本里所占的比重越来越大,这也使得人们重新开始关注如何优化推理过程。
微软期望Maia 200能够成为这类优化的一环,让AI业务在运行过程中减少中断,同时降低功耗。该公司称:“在实际使用场景里,单个Maia 200节点就能顺畅运行当前最大的模型,并且为未来更大型的模型预留了足够的空间。”
微软的新芯片也属于科技巨头纷纷转向自研芯片以降低对英伟达依赖这一趋势的范畴,毕竟英伟达的高端GPU已是AI企业发展的核心要素。像谷歌就拥有自己的TPU(张量处理单元),这类芯片并不直接对外销售,而是通过其云服务提供相应的计算能力。另外,电商巨头亚马逊也推出了AI加速芯片Trainium,其最新的Trainium3版本已于12月正式发布。在这些案例中,TPU等自研芯片都能分担原本由英伟达GPU承担的部分计算任务,进而帮助企业降低整体硬件成本。
微软正借助Maia来明确自身与这些替代方案展开竞争的定位。在周一发布的新闻稿里,该公司提到,Maia的FP4性能达到了亚马逊第三代Trainium芯片的3倍,其FP8性能则超越了谷歌第七代TPU。
微软称,Maia 已在为公司超级智能团队的 AI 模型提供支持,同时也支撑着 Copilot 聊天机器人的运行。截至周一,该公司表示已邀请开发者、学者以及前沿 AI 实验室等多方,使用其 Maia 200 软件开发工具包开展工作负载相关工作。